Theseuksen ajankohtaisia asioita: katkoviestintä, tietosuojaseloste, Justuksen uusien tietotyyppien siirrot ja nimenmuutokset

17.10.2023

Photo by Stephen Arnold on Unsplash

Theseus-toimisto tekee taustalla töitä, vaikka varsinaisia näkyviä tuloksia tai uusia palveluita ei jatkuvasti valmistu. Tänä syksynä on rakennettu tietosuojailmoitusta ja opiskelijan saamaa tallennuksen julkaisuviestiä uusiksi ja selvitelty Justuksen uusien attribuuttipohjaisten tietotyyppien siirtoa Theseukseen. Tässä artikkelissa tarkastellaan syksyn ajankohtaisia asioita.

Theseus-toimisto selvittää koko ajan amkien opiskelijoilta ja henkilökunnalta tulevia kysymyksiä. Osaan kysymyksistä löytyy jo ratkaisu Theseuksen FAQ:sta. Välillä isommat ja laajemmat kysymykset vaativat pitkää, jopa kuukausien tai vuosien selvittämistyötä.

Katkoviestinnässä katkoja

Theseuksessa on ollut tänä vuonna pari pidempää odottamatonta katkoa. Näistä on hankala viestiä kirjastoihin, kun ei tiedetä, kuinka pitkään käyttökatkot jatkuvat ja mistä ne johtuvat. Tällöin usein myöskään Kansalliskirjasto ei tiedä katkon tarkempaa syytä vaan ryhtyy selvittämään asiaa.

Theseus-laatupalaverissa Kansalliskirjaston kanssa AMKIT-konsortio otti katkoviestinnän esille.

Ongelmia Theseus-toimiston kannalta tiedottamisessa on kaksi:

  1. Ei useinkaan nopeasti tiedetä, onko katko hetkellinen vai jatkuuko se pitkään ja mistä se johtuu. Tästä on hankala tiedottaa kirjastoihin, ellei Kansalliskirjasto ehdi vastata.
  2. Theseus-toimisto voi tehdä häiriöilmoituksen submissions-sivulle, mutta varsinaiselle Theseus-sivulle ei ole pääsyä tekemään tiedotetta.

Laatupalaverissa kävi ilmi, että Theseus-toimiston pääkäyttäjäoikeuksilla pääsee laittamaan häiriöilmoituksia submissions-sivun lisäksi myös käyttöliittymän kautta Theseuksen varsinaiselle pääsivulle. Käyttöliittymän kautta tehtynä häiriöviesti näkyy kuitenkin vain toisella edustakoneella, jolloin Kansalliskirjaston täytyisi lisätä se toiselle edustakoneelle. Jatkossa Theseus-toimistoa perehdytetään tähän.

Jatkossa häiriötiedottamisen osalta pyritään nopeuttamaan toimintaa.

Tietosuojailmoituksen ja julkaisuviestin uusiminen

Theseuksesta lähtee opiskelijalle automaattinen viesti, kun työ on käsitelty kirjastossa. Tätä viestiä on päivitetty sujuvammaksi ja ymmärrettävämmäksi.

Samoin Theseuksen tietosuojailmoitusta on päivitetty ja se tulee lähipäivinä Arenen sivuille sekä Theseukseen näkyviin. Uutta asiaa tietosuojailmoituksessa on käyttörajattua kokoelmaa ja vapaakappalekirjastoja koskevat asiat.

  • Käyttörajattujen kokoelmien opinnäytetöitä luovutetaan niitä pyytävälle viranomaisten toiminnan julkisuudesta annetun lain mukaisesti. Opinnäytteet ovat julkisia asiakirjoja. (Laki viranomaisten toiminnan julkisuudesta)
  • Lain kulttuuriaineistojen tallettamisesta ja säilyttämisestä 28.12.2007/1433 mukaisesti julkaisuarkistossa olevia opinnäytetöitä ja julkaisuja voidaan tallentaa vapaakappaleina vapaakappalekirjastoihin.

Justuksen uuden tietomallin kentät

Justukseen on syksyn aikana tulossa loput julkaisutiedonkeruun laajennetun tietomallin mukaiset muutokset, eli siirtymä attribuuttipohjaiseen luokitteluun sekä avoimen saatavuuden tietoja koskevat muutokset. Syyskuussa CSC lähetti kyselyn julkaisutiedonkerääjille, mitä Justukseen kerättävistä tiedoista ja uusista julkaisutyypeistä toivotaan siirrettävän julkaisuarkistoihin. Asiaa on käsitelty myös Theseus-kehittäjäryhmässä julkaisuarkiston näkökulmasta.

Laajennetun tietomallin julkaisujen ja tietojen Justus-Theseus-siirto:

Posterien ja abstraktien, eli uuden muotoisten julkaisujen, joille ei löydy vastaavuutta vanhassa julkaisutyyppiluokituksesta, siirto Justuksesta Theseukseen mahdollistetaan tähän tarkoitukseen luotavan julkaisutyypin avulla.

Avoimen saatavuuden tiedot: Kustantajan version avoimen saatavuuden tiedot muodostuvat jatkossa kentistä "avoin saatavuus kustantajan palvelussa" + "julkaisukanavan avoimuuden tyyppi", eli nämä kentät korvaavat vanhan avoin saatavuus -tiedon. Kustantajan version avoimen saatavuuden tietoa ei ole toistaiseksi siirretty Theseukseen, eikä tätä siirtoa CSC:n kyselyn mukaan Theseusta käyttävissä organisaatioissa toivottu.

Theseusta käyttävät organisaatiot eivät myöskään toivoneet Theseukseen siirrettäväksi tietoa avoimesta saatavuudesta maksetusta julkaisumaksusta.

I-luokan julkaisut: I-julkaisut voivat periaatteessa siirtyä julkaisuarkistoihin normaaliin tapaan, sillä näille on mahdollista päätellä julkaisutyyppi vanhan julkaisutyyppiluokituksen mukaisesti. Toistaiseksi ei kuitenkaan mahdollisteta I-julkaisutyypin siirtymistä Justuksesta mihinkään julkaisuarkistoon.

Attribuuttipohjaiset tiedot (muotokoodi, yleisökoodi jne.) eivät tämän hetkisen suunnitelman mukaan tulisi ainakaan toistaiseksi siirtymään julkaisuarkistoihin, koska tämä aiheuttaisi isoja muutoksia julkaisuarkistoissa. Julkaisuarkistoihin siirretään ainakin toistaiseksi tieto julkaisutyypistä, jonka Justus tulee muutoksen jälkeen päättelemään attribuuttien perusteella Virta-julkaisutietopalvelun eDuunissa olevan taulukon mukaan.

Kansalliskirjaston mukaan tietojen ja uusien formaattien siirtyminen ei ole teknisesti ongelma. Asiaan liittyy lähinnä organisaatioissa ratkaistavia toiminnan periaatekysymyksiä ja esimerkiksi abstraktien osalta mahdollisesti tekijänoikeuskysymyksiä.

Rinnakkaistallentajien aamukahveilla 27.9.2023 keskusteltiin uusista siirrettävistä tiedoista ja julkaisutyypeistä ja kävi ilmi, etteivät ainakaan rinnakkaistallentajat (joista osa tekee julkaisutiedonkeruuta) kokeneet uusien julkaisutyyppien siirtoa Justuksesta Theseukseen tarpeelliseksi, mutta monessa organisaatiossa tähän olisi kuitenkin kiinnostusta. CSC:n etenemä Justus–Theseus-putken kehittämisessä näyttäisi siis noudattelevan laajennetussa tietomallissa pitkälti kentän ja ammattikorkeakoulujen toiveita.

Opiskelijan oikeus muuttaa tekijän nimeä jälkikäteen

Theseus-toimistolle on tullut kysymyksiä aliasten käytöstä, nimenvaihdoksista ja muista tekijöiden nimiin ja niiden muutoksiin liittyvistä asioista.

Jos tekijä muuttaa nimensä mutta vanha nimi esiintyy vielä opinnäytetyössä, saako uusi nimi olla tallennettu metadataan? Jos tekijä esimerkiksi itse laittaa uuden nimen sinne jo tallentamisvaiheessa, onko hyväksyttävää että metadatan nimi on eri kuin se nimi, joka esiintyy opinnäytetyössä? Voiko opiskelija käyttää aliasta oikean nimen sijasta?

Dspacessa on periaatteessa tuki Orcid-tunnisteen käytölle, ja Dspace 7-versiossa on vielä parempi tuki, mutta se tuskin on oikea tunniste opiskelijoille. Tieteellisen julkaisemisen puolella sekä TSV:llä on ollut keskustelua nimenvaihdoksista erityisesti sukupuolikysymyksiin liittyen. Pitäisi ratkoa, mikä on oikea tunniste opiskelijoiden käyttöön.

Kun opiskelijoille ei ole pysyvää tunnistetta tarjolla, Theseus-kehittämisryhmän ratkaisu on, ettei tekijän nimeä voi vaihtaa. Opinnäytetyö on samalla julkinen asiakirja. Julkisuuslaki edellyttää julkisen asiakirjan perustietojen olevan saatavilla. Kun opinnäytetyö on julkinen asiakirja, se ei voi olla muuta kuin omalla nimellä. 

Kirjautumisen ongelmat

Theseus-toimistoon tulee säännöllisen epäsäännöllisesti Haka-kirjautumiseen liittyviä yhteydenottoja niin opiskelijoilta kuin kirjastoilta. Ongelmavaihtoehtoja on yleensä kaksi: 1) kirjautuminen ei onnistu ollenkaan 2) kirjautuminen onnistuu, mutta kokoelmavalinnassa ei näy ollenkaan kokoelmia.

Ensimmäinen vaihtoehto eli varsinaisen Haka-kirjautumisen ongelmat liittyvät yleensä siihen, että opiskelijan Haka-tunnus ei ole enää voimassa. Opiskelijan HAKA-kirjautuminen on sidottu läsnäoloon.  HAKAn toiminta lakkaa 7 vrk läsnäolon päättymisen jälkeen (valmistuminen, opintojen lopettaminen, väliaikainen keskeyttäminen, läsnäoloilmoittautumisen puuttuminen). Theseuksen tallennuslomakkeelle kirjaudutaan HAKA-tunnuksilla, jotka yleensä ovat samat kuin oppilaitoksen käyttäjätunnukset ja joilla pystyy yleensä kirjautumaan oppilaitoksen muihin palveluihin, kuten sähköpostiin. Näiden osalta tunnukset toimivat yleensä pidempään, esimerkiksi Oamkissa 120 vrk.Tämä saattaa aiheuttaa sekaannusta tallentajassa.

Jos tunnus on voimassa mutta kirjautuminen ei onnistu, ongelma liittyy usein siihen, että  opiskelija on joskus aikaisemmin opiskellut ammattikorkeakouluissa ja hänen aiempi tunnuksensa aiheuttaa tunnusristiriidan. Tässä on mahdollista myös se, että opiskelijan tunnukset ovat lukittuneet monen epäonnisen kirjautumisyrityksen jälkeen. Tämä ongelma ratkeaa Kansalliskirjaston toimesta.

Toinen vaihtoehto eli kokoelmanvalinnassa tallentajalle ei näy kokoelmia (ei avointa eikä suljettua kokoelmaa) johtuu yleensä siitä, että HAKA-attribuuttien tiedot ovat vaillinaiset. Mahdollisia syitä ovat: 1) opiskelijan läsnäolon päättyminen 2) opiskelijalla ei ole tutkinto-opiskelijan statusta eli hän on avoimen ammattikorkeakoulun opiskelija tai tilauskoulutuksen opiskelija. Ongelma näyttäisi koskevan myös joidenkin tilauskoulutusten opiskelijoita.

Jos kirjautuminen tallennuslomakkeelle ei onnistu, opiskelijan HAKA-attribuutista EduPersonScopedAffiliation puuttuu arvo "student", joka vaaditaan tallennuksen tekemiseksi ja opiskelijan tunnistamiseksi olemaan tietyn ammattikorkeakoulun opiskelija. Asian pystyy tarkistamaan kirjautumalla HAKA-testipalveluun osoitteessa: https://firmitas.csc.fi/haka/.

Jos opinnäytetyö on jäänyt tallentamatta Theseukseen ennen valmistumista, sen pystyy siis tallentamaan vielä tuon seitsemän vuorokauden ajan. Theseus-toimisto ei vastaa HAKA-tunnuksen toimimisesta, vaan ongelmatilanteissa on oltava yhteydessä oman ammattikorkeakoulun opintotoimistoon tai tietohallintoon.

DSpace-päivitys

DSpace-versiopäivitystä valmistellaan ensi vuodelle. Theseuksen osalta mahdollisia päivitysajankohtia voisi olla alkusyksy 2024, myös vuosi 2025 on realistinen. Ensi vuoden alussa on asiasta on mahdollista antaa tarkempia arvioita kun julkaisuarkistopalveluilla on enemmän kokemusta päivityksestä. Asiassa vielä paljon tekemistä sekä muita näkymättömiä muutoksia. Paljon keskustelua tulee varmasti herättämään päivityksen ajankohta, johon vaikuttavat monet käytännön asiat myös Kansalliskirjaston puolelta.

Päivitykseen liittyvä katko tulee olemaan lähinnä syöttökatko. 

Loppusyksyn tilaisuudet

Loppusyksyllä järjestämme kaksi tilaisuutta: Keskustelutilaisuuden Theseus-tallentajille sekä webinaarin opinnäytetyön avoimuus -linjauksesta. Opinnäytetöiden avoimen saatavuuden osalinjaus on valmistumassa vielä ennen joulua, kun linjaus saadaan kommentointikierroksen jälkeen hyväksyttyä Avoimen tieteen yhteistyössä.

Tiedotamme lisää, kun tilaisuuksien ajankohdat selviävät.

 

Kirjoittajat

Tiina Tolonen

Informaatikko

Oulun yliopiston kirjasto

Kirjoittajan muut artikkelit

Antti Nyqvist

tietoasiantuntija

Haaga-Helia

Kirjoittajan muut artikkelit

Minna Marjamaa

asiantuntija

Laurea-ammattikorkeakoulu

Kirjoittajan muut artikkelit

Kommentit

Olli ma marrask. 20 20:33:12 2023

Theseuksessa pitäisi pitää huolta sinne tallennettujen PDF-tiedostojen otsikoista. Hyvin usein opinnäytetöitä lukiessa näkee PDF:n titlen olevan joko "Microsoft Word - Opinnäytetyö.docx" tai "opinnäytetyön malli" ja tämä teksti sitten esimerkiksi näkyy selaimessa välilehdessä avatun tiedoston nimenä.
Ihmettelen myös miksi Theseuksessa olevien .pdf:ien perässä on oletuksena ylimääräinen merkkijono "?sequence=1&isAllowed=y". Oikeaoppisesti tuollaisia ylimääräisiä merkkijonoja ei kuuluisi olla missään Cool URI -verkko-osoitteessa. Hyvin usein näkee myös PDF:ien URI-osoitteissa välilyöntejä. Välilyöntejä ei missään nimessä pitäisi koskaan sisällyttää osoitteisiin. Huonosti suunnitellut URI-rakenteet vaikeuttavat linkitystä, altistavat linkkirutolle ja sotkevat verkkoarkistoja.

Theseus-toimisto ti marrask. 21 12:55:00 2023

Kiitos palautteesta!

PDF-tiedostojen otsikot nousevat tiedoston properties-osion title-kentästä, jonka opiskelija itse syöttää tai jättää syöttämättä, jolloin se usein on korkeakoulun määrittelemä. Töiden tarkistuksen yhteydessä näitä on hankala korjata, koska tiedosto tulisi ladata ulos ja tallentaa uudestaan.

Dspace syötön yhteydessä ei ole turvallista tehdä automaattista pdf:ään kajoamista, siitä tulisi ongelmia eri pdf-versioiden yms. erojen kanssa ja ajan kanssa ongelmien määrä vain kasvaisi. Meillä on siis sen suhteen nollatoleranssi, että emme lähde muokkaamaan automaattisesti sisältöä, oli sitten kyseessä pdf/a-muunnos, lisenssin lisääminen yms. Ne kaikki sisältävät riskejä sisällön ei toivotusta muuttumisesta tai jopa tiedoston korruptoitumisesta. Pahimmillaan näitä ongelmia ei sitten edes huomata vuosikausiin, jolloin alkuperäistä ei viallista versiota ei olisi enää opiskelijalla saatavilla.

Theseuksen tiedostot eivät valitettavasti ole cool ureja, koska ne eivät ole luonteeltaan pysyviä. Pysyvyys lakkaa viimeistään siinä vaiheessa, jos palvelu siirretään johonkin toiseen palveluun ja versionvaihdoskin voi rikkoa linkit. Seiskapäivitys on ensimmäinen, jossa näin tulee käymään. Seuraavassa versiossa tiedostojen linkit eivät sisällä get-parametreja, mutta en näe niitäkään pysyvinä niin kauan, kun niitä ei ole liitetty URN- tai vastaavan resolvoinnin piiriin. Se on kuitenkin teknisesti mahdollista tehdä ja toivon mukaan nekin saadaan joskus URN:itettua.

Pysyvä tunniste Theseuksessa on tietueen URN, jota suositellaan käytettäväksi työtä jaettaessa.

Jätä kommentti