Theseus, mitä tapahtuu vuonna 2021?

15.12.2020

Theseus-vuosi lähestyy loppuaan. Tänä vuonna isoimpia asioita olivat Annifin käyttöönotto, saavutettavuusohjeiden luominen ja kouluttaminen sekä metadatanostojen teko, pienempinä asioina mm. sallittujen tiedostomuotojen rajaaminen. Ensi vuosi on uusien toimintamallien rakentamisen aikaa: käynnistetään Avoin TKIO -toimiston toimintaa, valmistellaan käyttörajattua kokoelmaa sekä rakennetaan Plan S-yhteensopivuutta.

Theseus-koordinaattorina on vuosien kuluessa saanut vastata niin asiakysymyksiin kuin vähän asiattomampiinkin tiedusteluihin. Yksi mieleenpainuvimmista on ollut: Miksi Theseus vaatii edelleen työvoimaa - eikö tietokanta ole jo pystyssä ja toiminta käynnissä?

Vaikka luulimme, että vuosi 2020 olisi ollut suvantovaihe vuoden 2019 Theseuksen annus horribiliksen jälkeen, työaikaa kului myös tänä vuonna kehittämiseen ja kouluttamiseen. Theseuksen kanssa on käyty lävitse samanlaista kehityskaarta kuin minkä tahansa uuden perheenjäsenen. Nyt jo lähes murrosikäinen Theseus toimii pohjimmiltaan hyvin, mutta vaatii edelleen koordinaattoreiden hellää huolenpitoa.

Annif paransi käyttäjäkokemusta, DSpace-päivitys siirtyi

Tänä vuonna otettiin käyttöön Kansalliskirjaston kehittämä automaattista sisällönkuvailua tuottava Annif-työkalu, joka perustuu kieliteknologiaan ja koneoppimiseen. Theseuksen syöttöprosessi muuttui käyttöönoton myötä niin, että ensin tallennetaan itse tiedosto ja sitten vasta tehdään kuvailu. Annif ehdottaa opiskelijalle asiasanoja, joista voi itse valita sopivat sekä lisäksi antaa toivomiaan Finto-asiasanoja.

Annifin käyttöönoton hyödyllisyydestä voidaan todeta, että se on huomattavasti vähentänyt Theseus-toimistoon tulevia kysymyksiä asiasanoituksesta eli varovaisesti voisi arvioida, että tallennus on helpottunut ja käyttäjäkokemus parantunut. Edelleen kuitenkin tulee viestejä opiskelijoilta, jotka haluaisivat tallentaa muita kuin Annifin ehdottamia termejä. Selkeä ongelmakohta on asiasanaston lievä jälkeenjääneisyys ja nyt jo normaaliin käyttöön vakiintuneiden termien puuttuminen.

Joskus tulee kysymyksiä myös siitä, miksi ei pysty Theseukseen tallentamaan samoja asiasanoja kuin mitä on kirjoittanut tiivistelmäsivulleen. Usein perusteluna on se, että kun sitä sanaa on joku jo Theseuksessa käyttänyt. Onkin ollut hieman haastavaa kertoa kaikista tapahtuneista muutoksista ja miten ne ovat vaikuttaneet esimerkiksi juuri tähän asiasanojen tallentamiseen. Kokoteksti-indeksointia ja sen suhdetta asiasanoihin saa myös säännöllisesti selittää.

DSpace 7:n beta-versio, jonka oli tarkoitus tulla saataville vuonna 2020 on myöhästynyt, ja julkistetaan alkuvuodesta 2021. Kansalliskirjaston arvion mukaan käyttöönotto suomalaisissa julkaisuarkistoissa alkaisi vuonna 2022. Uusi versio tulee muuttamaan DSpace-käyttöliittymää merkittävästi. Päivitys aloitetaan yleensä pienistä julkaisuarkistoista ja Theseus tulee päivitystyön loppuvaiheessa, kun ongelmakohdat on jo pienistä arkistoista opittu.

Saavutettavuus- ja metadatatyö jatkuu 

Theseuksen saavutettavuussivusto ja saavutettavuusseloste on loppuvuodesta käännetty kolmelle kielelle. Ohjeet on tarkistettu Celiassa ja ruotsinkielinen sivu Noviassa, kiitokset Rebekka Laaksoselle ja Gun Vestmanille. Saavutettavuusselostetta päivitetään edelleen sitä mukaa, kun ammattikorkeakoulujen saavutettavuustilanne paranee. 

Etusivujen nostojen tekemistä koulutettiin amk-kirjastolaisille koordinaattoreiden toimesta keväällä. Pitkin vuotta metadatan kehittämistä on jatkettu yhdessä ammattikorkeakoulujen kanssa, osin ohjaten ja osin ammattikorkeakoulujen puolesta tehden metadatan laadun parantamiseksi. Pyydettäessä on tehty suoraan etusivujen nostoja valmiiksi. Autamme edelleen ongelmakohdissa.

Theseus-toimistosta Avoin TKIO -toimisto

Ammattikorkeakoulujen Avoin TKI, oppiminen ja innovaatioympäristöt -hankkeessa on kehitetty  ammattikorkeakouluille yhteistä avoimen toimintakulttuurin palvelutoimistoa. Hanke päättyy alkuvuodesta 2021, jolloin palvelutoimisto jatkaa ammattikorkeakoulujen yhteistyötä Theseus-asiantuntijaresurssin varassa. Ensi vuonna Theseus-toimiston asiantuntijaresurssia on edelleen 3*0,2 htv.

Hankkeessa ideana oli aluksi kehittää Avoimen toimintakulttuurin helpdesk, joka olisi vastannut amk-kentältä tuleviin kysymyksiin samaan tapaan kuin Theseus-toimisto vastaa nyt niin opiskelijoiden kuin henkilökunnan kysymyksiin. Hankkeen edetessä havaittiin, että tarvetta on helpdeskin lisäksi ammattikorkeakoulujen yhteiselle asiantuntijaverkostolle ja yhteistyölle. Syntyi idea asiantuntijaverkostosta, joka edistää avointa toimintakulttuuria ammattikorkeakouluissa.

Alkuvuodesta lähtee käyntiin verkoston ohjausryhmä Ohjaamo ja ensimmäisiä työryhmiä aletaan muodostaa. Hankkeen tulokset kerätään kaikkien käytettäväksi järkeviksi kokonaisuuksiksi. Keväästä tulee hyvien käytänteiden webinaarien aikaa.  

Jos ammattikorkeakoulunne ei ole vielä verkostossa mukana, voitte ilmoittautua mukaan Theseus-koordinaattoreille (Theseus-rukkaset@lists.metropolia.fi). Myös rukkaspostin osoite toivon mukaan muuttuu keväällä.

Käyttörajattu kokoelma

Käyttörajattu kokoelma on osio, johon on tarkoitus tallentaa ne julkiset työt, joita ei tällä hetkellä tallenneta avoimesti julkaisuarkistoon vaan erilaisiin sisäisiin sähköisiin arkistoihin ja introihin. Theseuksessa ideana on ollut, että opinnäytetöiden arkistointi voidaan hoitaa kaikkien töiden osalta samalla tavalla Theseuksen kautta PAS-siirroilla – kaksi kärpästä yhdellä iskulla.

Vastaava käyttörajattuihin kokoelmiin perustuva ratkaisu on jo tällä hetkellä käytössä Lapin, Tampereen ja Vaasan yliopistojen julkaisuarkistoissa, jotka myös ovat Kansalliskirjaston ylläpidossa.

Käyttörajatusta arkistosta saatiin alkukesästä 2020 tarjous Kansalliskirjastosta ja tarjousta on käsitelty AMKIT-konsortion johtoryhmässä syksyllä. Tällöin kysyttiin myös kiinnostusta käyttörajattuun kokoelmaan kaikista ammattikorkeakouluista. Tulos oli seuraava:

Kiinnostus käyttörajattuun kokoelmaan syksyllä 2020:

 • 13 ammattikorkeakoulua oli kiinnostunut ottamaan kokoelman käyttöön jo kuluvana syksynä mikäli mahdollista
 • 2 ammattikorkeakoululla ei ollut kiinnostusta nyt, mutta mahdollisesti myöhemmin
 • 7 ammattikorkeakoululla ei ollut tarvetta kokoelmaan
 • 2 ei vastannut. 

Palveluun liittyviä käytänteitä selvitellään edelleen Kansalliskirjaston kanssa. Theseuksen käyttörajattuihin kokoelmiin tallennetut aineistot on tarkoitus olla lähtökohtaisesti käytettävissä kunkin ammattikorkeakoulun ilmoittamista IP-osoitteista, organisaation valinnan mukaan esim. korkeakoulun sisäverkosta tai yksittäisiltä kirjaston koneilta.

Ongelmana palvelun rakentamisessa on aineistojen haravointi ja PAS-siirrot. Kansalliskirjasto on suunnitellut Theseuksen aineistojen haravoinnin osana vapaakappalekokoelmaa Variaa. Tällöin myös käyttörajatun kokoelman opinnäytetyöt olisivat käytettävissä vapaakappaletyöasemilla, joita on muutamia vapaakappalekirjastoissa.

Suomessa on kuusi vapaakappalekirjastoa:

 • Kansalliskirjasto

 • Turun yliopiston kirjasto

 • Jyväskylän yliopiston kirjasto

 • Åbo Akademin kirjasto

 • Oulun yliopiston kirjasto

 • Itä-Suomen yliopiston kirjasto

Lisäksi verkkoaineistot ja Kansallisen audiovisuaalisen instituutin (KAVI) arkistoimat aineistot ovat käytettävissä vapaakappaletyöasemilla kaikissa vapaakappalekirjastoissa sekä Eduskunnan kirjastossa ja Kansallisessa audiovisuaalisessa instituutissa.

Ammattikorkeakoulukirjastot ovat selvittäneet asiaa lakimiesten kanssa ja kanta on, että asiassa ei voi edetä käyttörajatun kokoelman osalta siten, että pitkäaikaissaatavuuden mahdollistavan vapaakappalesiirron myötä käyttörajatut opinnäytetyöt tulevat vapaakappaleasemilla luettaviksi. Ammattikorkeakoulukirjastojen käsityksen mukaan opiskelijalla on tekijänoikeuteen perustuva oikeus määrätä opinnäytteensä jakelusta, eikä voida luoda palvelua, joka mahdollistaa tekijänoikeuden loukkauksen.

Teemme alkuvuodesta kyselyn ammattikorkeakoulujen kiinnostuksesta aloittaa käyttörajatun kokoelman käytön ja yksi ammattikorkeakoulu on jo ilmoittanut kiinnostuksensa toimia asiassa pilottina. Kansalliskirjasto on luvannut selvittää asiaa edelleen. Tiedotamme juridisten tulkintojen ja näkökulmien selkiytymisestä. Kukin korkeakoulu tekee omat ratkaisunsa palvelun käyttöönottamisesta ja aikataulusta.

Plan S ja Theseus 

Suurista tutkimusrahoittajista koostuvan cOAlition S:n  suunnitelma tieteellisen julkaisemisen avoimuuden edistämiseksi eli Plan S astuu voimaan tammikuussa 2021. Toimintaa koordinoi eurooppalaisten tutkimusrahoittajien yhteistyöelin Science Europe. Suomen Akatemia kuuluu koalition rahoittajiin, joten suunnitelman vaatimukset kohdistuvat myös ammattikorkeakoulujen julkaisuihin.

Plan S:n tavoitteena on, että kaikki koalition rahoittamat vertaisarvioidut tieteelliset julkaisut ovat 2021 alkaen välittömästi avoimesti saatavilla. Avoimeen julkaisemiseen on kolme vaihtoehtoa: Avoin julkaiseminen eli gold OA, rinnakkaistallentaminen eli green OA tai siirtymäkausisopimukseen sitoutunut hybridilehti. Tavallinen hybridimuotoinen avoin julkaiseminen ei täytä ehtoja.

PlanS asettaa ainakin kahdenlaisia vaatimuksia julkaisuarkistoille, joista seuraavat makrotason vaatimukset täyttyvät jo pitkälti Theseuksessa:

 • OpenDOAR-rekisteröinti: Julkaisuarkisto on rekisteröity OpenDOAR-rekisteriin.
 • Tuki pysyville tunnisteille: Julkaisuarkisto tarjoaa tuen PIDeille, joiksi PlanS:n mukaan listataan URN, DOI tai handle.
 • Vakaa saatavuus: Julkaisuarkisto on toiminnassa 99.7 % ajasta.
 • Toimiva palveluosoite: Julkaisuarkisto tarjoaa helpdesk-palveluita.

Mikrotason vaatimuksista taas osa jää toteutumatta tai on tulkinnanvaraisia isossa osassa kotimaisia julkaisuarkistoja. Vaikuttaa siltä, että esimerkiksi vaatimus lisenssitietojen sisältymisestä metadatan ohella myös itse julkaisutiedostoon saattaa lisätä rinnakkaistallentamiseen liittyvää käsityötä tai vaatia uusia automatisoituja ratkaisuja. Lisäksi Plan S:n vaatimuksista osa kohdistuu myös laajemmin julkaisemisen ohjeistamiseen ja rinnakkaistallennusperiaatteisiin: Julkaisun tekijän pitää säilyttää itsellään tekijänoikeudet ja julkaista vain niissä lehdissä, jotka mahdollistavat avoimuuden ilman embargoa sekä Plan S:n vaatiman CC-lisenssin sallimisen, myös rinnakkaistallenteelle.

Selvitämme Plan S-ehtoja yhdessä Kansalliskirjaston kanssa. Huomattavaa kuitenkin on, että Plan S-vaatimukset kohdistuvat 2021 alkavista rahoituksista syntyviin julkaisuihin ja sikäli kysymykset aktualisoituvat vasta vuoden tai kahden päästä.

Kirjoittajat

Tiina Tolonen

Informaatikko

Oulun yliopiston kirjasto

Kirjoittajan muut artikkelit

Antti Nyqvist

tietoasiantuntija

Haaga-Helia

Kirjoittajan muut artikkelit

Minna Marjamaa

asiantuntija

Laurea-ammattikorkeakoulu

Kirjoittajan muut artikkelit

Kommentit

Saila ke jouluk. 16 14:01:18 2020

Mielenkiintoista!

Jätä kommentti