Theseus-visio vuodelle 2018: Täyden palvelun avoimen julkaisemisen alustaksi

11.12.2017

Theseus-julkaisuarkisto täyttää ensi syksynä kymmenen vuotta. Toiminta on vakiintunutta: kaikki Suomen ammattikorkeakoulut tallentavat opinnäytetöitään Theseukseen ja rinnakkaistallentaminen on käynnistynyt tai käynnistymässä suurimmassa osassa amkeja. Lisäksi Theseus on keskeinen osa amkien verkkonäkyvyyttä. Millä mielellä lähdetään kohti juhlavuotta, mikä on Theseuksen tulevaisuuden visio?

AMKIT-konsortion toimintasuunnitelman liitteeksi Theseus-rukkaset tekivät Theseuksen toimintasuunnitelman vuodelle 2018. Tässä artikkelissa käydään läpi toimintasuunnitelman pääkohdat. Kuluvaan vuoteen on liittynyt paljon tekemistä ja suunnittelua rinnakkaistallentamiseen, järjestelmäpäivitykseen ja hankeasioihin liittyen. Tulevan vuoden suunnitelmaa onkin hyvä alustaa Theseus-visiolla, joka kertoo toiminnan tavoitteellisuudesta:

Theseus profiloituu ammattikorkeakoulujen täyden palvelun avoimen julkaisemisen alustaksi. Syksyllä 2018 Theseuksessa toimivat prosessit muihin tietojärjestelmiin ja -varantoihin  (mm Justus, Virta ja PAS). Palvelun etusivu tarjoaa kattavan näkymän amkien avoimeen julkaisemiseen.


Theseus suunnitelma vuodelle 2018 - visio ja kehitettävät kohteet.

Rinnakkaistallentamisen uudet tuulet: Justus ja metadatapäivitys

Visio nostaa esiin kehittämiskohteita, joiden toteuttamista ollaan aloitettu jo selvittää. AMKIT-konsortion toimeksiannosta keväällä 2017 alettiin kartoittaa mahdollisia uusia palveluntarjoajia Theseuksen ylläpitoon ja kehittämistyöhön. Toistaiseksi keskustelua on käyty CSC:n kanssa, ja heidän puoleltaan on kerrottu että olisi mahdollista rakentaa putki Justus -julkaisujen tallennuspalvelusta Theseukseen niin, että rinnakkaistallennusten tiedot siirtyisivät Theseukseen tarkistuksen jälkeen. Justus on julkaisutietojen tallennuspalvelu, johon syötetään tutkimusjulkaisujen tietoja. Justukseen tallennetut tiedot siirtyvät automaattisesti OKM:n vuosittaiseen julkaisutiedonkeruuseen ja ne huomioidaan korkeakoulujen rahoitusmallissa. Käytännössä tämä tarkoittaisi rajapinnan rakentamista Justus-palvelusta Theseukseen, Justuksen tallennuslomakkeen päivittämistä vastaamaan Theseuksen tarpeita sekä mahdollisuutta kokotekstidokumentin tallentamiseen.

CSC:n kaavio Justus palvelun yhteydestä Virtaan ja Vipuseen.

Justus-palveluun on tähän mennessä liittynyt 17 ammattikorkeakoulua. Ratkaistavaksi jää, mitä tapahtuu jos kaikki ammattikorkeakoulut eivät liity palveluun ja heitä varten tulisi kuitenkin olla mahdollisuus rinnakkaistallentamiseen Theseukseen. Onko tulevaisuudessa mahdollista tai edes järkevää ylläpitää kahta syöttölomaketta? Keväällä valmistuneen uuden metadatasuosituksen pohjalta tehtäväksi suunniteltu syöttölomakkeen kenttien päivitys on viivästynyt Kansalliskirjaston DSpace-päivityksen venymisen myötä. Lomaketta päästään päivittämään vasta helmikuun 2018 jälkeen, ehkä siinä kohtaa ollaan jo viisaampia senkin suhteen että mitä päivitetään ja millä tavalla.

Opinnäytteiden arkistointi ja PAS

Opinnäytetöiden arkistointi on ollut pitkään kuuma peruna. Arkistolaitos määrää arkistolain (831/1994) 8§:n nojalla pysyvään säilytykseen ammattikorkeakoulujen opinnäytetöiksi luokiteltavat opiskelijoiden opintosuoritukset. Kansallisarkiston tekemän arvonmäärityksen mukaisesti opinnäytteet ovat niin arvokasta amkien tehtävissä syntyvää tietoa, että ne on syytä säilyttää pysyvästi. Amkit ovat hoitaneet tätä velvoitetta eri tavoin, Theseukseen tallennetut työt on lisäksi arkistoitu joko painettuna tai sähköisenä arkistointijärjestelmään tai intraan eli tehty kaksinkertainen työ.

Verkossa julkaistut yliopistojen ja ammattikorkeakoulujen opinnäytteet käsitellään julkaisuina, joiden pitkäaikaissäilytys kuuluu Kansalliskirjaston lakisääteisiin tehtäviin ja jota varten se tarjoaa palvelun. Haravoidut opinnäytteet toimitetaan Kansallisen digitaalisen kirjaston pitkäaikaissäilytyspalveluun (KDK-PAS) edellyttäen, että tiedostot ovat sellaisenaan PAS-siirtokelpoisia. PAS-siirrot käynnistynevät 2018, pilotointi loppuvuonna 2017.

Ammattikorkeakouluissa on arkistointinäkökulmasta kolmenlaisia töitä:

  • Theseukseen tallennettuja PASiin siirtyviä töitä

  • Theseukseen tallennettuja julkisia töitä ja

  • salaisia töitä, joita yleensä on hyvin vähän.

Asiaa selvittämään perustettiin keväällä 2017 opinnäytetöiden arkistointi -työryhmä, jossa on mukana Kansalliskirjaston ja Kansallisarkiston edustus sekä osallistujia niistä korkeakouluista, joiden julkaisuarkisto on Kansalliskirjaston ylläpitämä. Amkien toive täyttyi, kun alkusyksystä Kansallisarkiston ylitarkastaja Vesa-Matti Ovaska antoi tiedoksi, että Theseukseen tallennettujen töiden osalta PAS-siirto riittää täyttämään arkistointivaatimukset. Opinnäytetöiden arkistointiryhmä on valmistellut ensimmäisen wikipohjaisen version Sähköisten opinnäytteiden arkistointiohjeesta  ja se löytyy Kansalliskirjaston wikistä.  Jos haluatte kommentoida ohjetta tai kysyä siitä, lähettäkää viestiä rukkaspostiin, me kokoamme kommentit eteenpäin.

Työryhmä järjesti Kirjastoverkkopäivillä lokakuussa työpajan, jossa kuultiin korkeakoulujen tuntoja opinnäytetöiden arkistoinnista. Syntyi konsensus siitä, että tarvitaan yhteinen ratkaisu julkaisuarkistoon tallentamattomien töiden arkistoimiseksi. Ei ole kustannustehokasta, että jokainen korkeakoulu hankkii oman arkistojärjestelmän opinnäytetöille ja luo prosessit sitä varten. Ongelmana on raha - OKM ei anna hankerahaa olemassa olevan järjestelmän parantamiseen.

Ulkoasu uusiksi - Theseuksesta näyteikkuna amkien julkaisuihin

Theseuksen etusivu ei nosta tarpeeksi hyvin esille julkaisuja ja ylemmän tutkinnon opinnäytetöitä. Lisäksi graafinen ulkoasu alkaa olla vanhahtava, se on uudistettu edellisen kerran vuonna 2013. Graafisen ulkoasun uudistaminen päästään toivottavasti käynnistämään ensi vuonna  ja etusivun rakennetta saadaan muutettua niin, että se tarjoaa rinnakkaistallenteita ja omia julkaisusarjoja paremmin esille. Theseuksesta tehdään kattavampi näyteikkuna amkien julkaisuihin.

Ensi vuonna seminaareja

Tavoitteena on järjestää Kansalliskirjaston kanssa Theseus-seminaari syksyllä 2018, aihepiiri selviää keväällä. Lisäksi järjestetään avoimen toimintakulttuurin työpajoja ja webinaareja keväällä ja syksyllä 2018. Webinaareissa käydään läpi rinnakkaistallennuksen ongelmakohtia. Tiedotamme näistä lisää, kun suunnittelu etenee.

Rukkastoiminnan satoa

Opinnäytetyöt nousevat Googlen hakutuloksissa ilmeisen hyvin esille ja korkealle, näin olemme päätelleet rukkasten sähköpostilistalle tulevien viestien perusteella. Palvelusta on mm. etsitty kadonnutta henkilöä, annettu palautetta erään leipomon tuotteista sekä kyselty tuotteiden hintoja. Joissakin palautteissa on ollut opinnäytetöiksi sopivia kehitysehdotuksia. Muu rukkaslistalle tuleva palaute liittyy useimmiten opiskelijan tallennuksessaan huomaamaan virheeseen ja sen korjaamiseen, usein heiltä jää hoksaamatta että nopeimmin asian voisi ratkaista ottamalla yhteyttä omaan amkinsa kirjastoon. Kaikkiin palautteisiin pyrimme vastaamaan tai ainakin ohjaamaan ne oikealle taholle.

Jonkin verran saadaan yhteydenottoja myös sellaisilta henkilöiltä, jotka haluavat opinnäytetyönsä poistettavaksi Theseuksesta, mutta tähänkin löytyy poikkeus. Olemme saaneet yhteydenoton henkilöltä, joka ihmetteli miksei hänen vuonna 1995 valmistunutta opinnäytettään löydy Theseuksesta!

Loppukevennys

Edellisessä Kreodissa kerrottiin kesällä tehdyn DSpace-päivityksen aiheuttamista ikävistä yllätyksistä Theseuksen toiminnassa. Joitakin parannuksia on nyt saatu tehtyä, mm. “kolmen tolpan” -suuntautumisvaihtoehto on nyt historiaa. Samaa virhettä löytyi pienemmässä mittakaavassa myös muista faseteista, mutta niiden korjaaminen on jo työn alla.

Theseuksen uusi hakukorostus aiheutti aluksi sitä, että tiedoston metadata tuli hämmentävästi koodin näköisenä sekamelskana hakutuloksen alkuun:

stream_size 46824 stream_content_type text/plain stream_name Sippola_Jonne.pdf.txt stream_source_info Sippola_Jonne.pdf.txt Content-Encoding UTF-8 Content-Type text/plain; charset=UTF-8...

Tämä ongelma on saatu nyt vähenemään jos ei kokonaan poistumaan. Kokotekstihakua on korjattu niin, ettei se ota header-osuutta mukaan haun piiriin. Jos huomaatte jotain outoa tai palvelu ei toimi kuten pitäisi, niin laittakaa viestiä Theseus-rukkasille.

Kirjoittajat:

Tiina Tolonen, informaatikko ja Theseus-koordinaattori, Oulun ammattikorkeakoulu
Minna Marjamaa, informaatikko ja Theseus-koordinaattori, Laurea

 

 

 

Kommentit

Jätä kommentti