Sensitive Data Services – uusi ympäristö sensitiivisen datan käsittelyyn ja jakoon

18.03.2022

Kuva: geralt, Pixabay

CSC on avannut TKI-toiminnan käyttöön uuden arkaluonteiselle datalle soveltuvan palvelukokonaisuuden: Sensitive Data Services -palvelun. Palvelusta on julkistettu toistaiseksi kaksi osaa: SD Connect ja SD Desktop. Yhdessä palvelut muodostavat TKI-toimintaan saumattomaksi tarkoitetun etäkäyttöympäristön.

Tieteen tietotekniikan keskus oy CSC on pitkään kehittänyt tutkijan työpöytää, joka toimisi yhtenä kokonaisuutena ja helpottaisi datanhallintaa arkipäivässä. Tarve on ollut lisäksi palveluille, jotka soveltuvat myös terveystietoja sisältävän tai muun arkaluonteiseksi määritellyn datan säilöntään ja käsittelyyn. Nyt ympäristö on valmis ja käyttöönotettavissa.

Kokonaisuuden kehittämistä on rahoittanut OKM ja palvelukokonaisuuden käyttö on ainakin toistaiseksi maksutonta loppukäyttäjälle eli yksittäiselle tutkijalle ja TKI-toimijalle. Ideana on tehdä datanhallinnasta helppoa yhdessä toimintaympäristössä ja ne on suunniteltu organisaatiorajat ylittäviin tarpeisiin.Vaikka palvelut onkin suunnattu lähinnä akateemiseen tutkimukseen, voi tutkimushankkeessa olla yhteistyökumppanina mukana myös yrityksiä. 

Ammattikorkeakouluille tehdyssä kyselyssä 2021 sensitiivisen datan keräämisestä ja käsittelystä nousi esille, että kaikilla tieteenaloilla syntyy sensitiivistä dataa, todettiin tarve analysoida datan käsittelyjen riskejä ja tarve turvallisille datan käsittelyalustoille. 

Millainen on SD-palvelukokonaisuus?

Sensitive Data Services -palvelu koostuu toistaiseksi kahdesta osasta:

  • Sensitive Data Connectin (SD Connectin) avulla arkaluoteista dataa voi tallentaa tietoturvalliseen käyttöympäristöön ja jakaa kumppaneiden käyttöön. 
  • Sensitive Data Desktop (SD Desktop) on verkkoselaimen kautta käytettävä etätyöpöytä, joka mahdollistaa tietoturvallisen sensitiivisen datan käyttöympäristön. 

TKI-toimijat pääsevät käyttämään uusia palveluita CSC:n MyCSC-portaalin kautta Haka-kirjautumisen avulla, myös Virtu- ja ELIXIR-kirjautuminen toimivat. Yritysten ja kansainvälisten kumppanien  tulee puolestaan rekisteröityä CSC:n palveluiden käyttäjäksi ja hakea erillistä käyttäjätunnusta. Desktop ja Sensitive Data Connect ovat olleet 22.6.2021 alkaen saatavilla beta-versioina avoimeen testikäyttöön. Niitä voi jo alkaa käyttää, vaikka varsinaiset tuotantoversiot julkaistaan loppukeväästä tai alkukesästä.

Kehitystyön alla ovat vielä seuraavat osat:

  • Sensitive Data Submit datan ja metadatan julkaisemiseen
  • Sensitive Data Apply

Kaikki kehitettävät palvelut toimivat itsenäisenä kokonaisuutena ja ne ovat käytettävissä verkon yli omalta koneelta. Dataa ei pysty vielä lataamaan talteen omalle koneelle (palvelu on tulossa) tai esimerkiksi jakamaan internettiin.

Palveluista on tarkoitus julkistaa täydet versiot (ns. release-versiot) syksyllä 2022. Ympäristöjen tietoturvallisuus todennetaan jatkossa auditoimalla ne eri vaatimuksia vasten, esim. ISO 27001, KATAKRI, Findatan vaatimukset.

Kuva 2. Mitä on sensitiivinen data? Sensitiiviseksi dataksi luetaan aineisto, joka käsittelee tietosuojalainsäädännön mukaisiin erityisiin henkilötietoryhmiin lukeutuvia tietoja. Lisäksi sensitiivisiä ovat aineistot, joihin liittyy riski fyysisestä tai taloudellisesta haitasta.

Miten ottaa palvelut käyttöön?

Tässä perusasiat siitä, kuinka palvelun saa otettua käyttöön. Aloita luomalla tunnukset ja CSC-projekti.

  • Tunnukset ja sopimukset
    Palvelujen käyttöönotto lähtee MyCSC-palvelussa. Kirjaudu HAKA-kirjautumisen kautta ja luo uusi CSC-projekti. Jos käsittelet henkilötietoja, täytä datankäsittelylomake ja täytä datankäsittelysopimus. Hae pääsyä Allas- ja SD Desktop-palveluihin.
  • Kryptaa data
    Kun olet luonut tunnukset ja saanut pääsyn palveluun, voit ladata dataa palveluun. Lataa CSC:n kryptaustyökalu ja valtise haluamasi datatiedosto. Kryptaa data CSC:n kryptaustyökalulla, samalla saat kryptausavaimen. Kun kryptaus onnistuu, tiedoston loppu muuttuu muotoon .c4gh. Jatkossa kryptaus voidaan tehdä järjestelmässä myös automaattisesti.
  • Datan lautaus SD Connectiin
    SD Connect-palvelussa lataa data haluamaasi projektiin kohdasta tiedoston lataus tai käytä drag-and-drop-toimintoa.
  • Datan käsittely-ympäristön lataaminen
    Lataa yksityinen datan käsittelyyn tarkoitettu virtuaaliympäristö SD Desktopista. Klikkaa Go to launch a Page -ikoonia. Valitse haluamasi CSC projekti. Kaikki ne käyttäjät, joilla on pääsy kyseiseen CSC:n projektiin, pääsevät myös samaan virtualitilaan.
  • Datan siirto SD Connectista
    Avaa SD Desktop ja SD Connect Downloader. Valitse CSC:n projekti ja oikeat tiedostot. Sovellus tekee datasta kopion, dekryptaa sen ja tuo Desktopiin.
  • Hankkeen jälkeen
    Hankkeen jälkeen siirrä data pois ja tuhoa työtila.

Jatkossa tämän vuoden aikana datan (< 100 GB) kryptaus voidaan tehdä järjestelmässä myös automaattisesti. Automaattinen datan kryptaus tulee ominaisuudeksi SD connectiin. Samoin palvveluun on tulossa uusi käyttöliittymä.

 

Allaoleva CSC:n video kertoo käyttöönotosta vaihe vaiheelta.

 

 

Miten järjestää datatukea tutkijoille CSC:n SD-palveluista? 

Data-arkistojen toiminnan vahvistuessa,  saatavilla olevien tutkimusaineistojen määrä on huimassa kasvussa. Esimerkiksi Tietoarkisto sisältää jo lähes kaksi tuhatta aineistoa, joiden uudelleenkäyttö on mahdollista määrättyjen saatavuusehtojen mukaisesti. Osa aineistoista on vapaasti käytettävissä ilman rekisteröitymistä, mutta osaa aineistoista pääsee käyttämään vain luovuttajan luvalla. Tällaisten aineistojen käsittelyyn tuleekin kiinnittää erityistä huomiota ja esimerkiksi analysoida niitä riittävän turvallisessa paikassa. 

CSC:n tarjoamia palveluja voidaan jo tällä hetkellä käyttää esimerkiksi suostumuksella kerätyn potilasdatan käsittelyssä. Vaikka palveluja ei toistaiseksi ole vielä sertifioitu, ovat ne riittävän tietoturvalliset esimerkiksi suurteholaskentaan. Datan voi siirtää CSC:n palveluihin kryptattuna.

On tärkeää kiinnittää huomiota siihen, miten opiskelijoita, tutkijoita ja TKI-henkilöstöä voidaan tehokkaasti tukea vastuullisessa aineistonhallinnassa. Jokaisen käyttäjäryhmän tarpeiden mukaan suunniteltu peruskoulutus onkin tärkeää. Oleellista on, että aineistonhallinnan suunnittelussa voidaan antaa tukipalveluita tutkimusaineiston elinkaaren eri vaiheisiin. Myös CSC tarjoaa tulevan vuoden aikana koulutusta näiden uusien palveluidensa käyttöön verkkokurssien muodossa.

Kirjoittajat

Anne Kärki

Tutkija ja yliopettaja

Satakunnan ammattikorkeakoulu

Kirjoittajan muut artikkelit

Seliina Päällysaho

tutkimuspäällikkö

Seinäjoen ammattikorkeakoulu

Kirjoittajan muut artikkelit

Minna Marjamaa

asiantuntija

Laurea-ammattikorkeakoulu

Kirjoittajan muut artikkelit

Kommentit

Jätä kommentti