Opinnäytetyökäsittelyn ja rinnakkaistallentamisen erityiskysymyksiä – toukokuun Theseus-webinaareissa oli vilkasta keskustelua

28.05.2021

Photo by Marília Castelli on Unsplash

Theseuksen kehitystyöhön, opinnäytetöiden käsittelyyn ja rinnakkaistallennukseen liittyy paljon yksittäisiä kysymyksiä toimintamalleista ja käytänteistä sekä näihin liittyviä päätöksiä. Lisäksi ammattikorkeakoulujen omat tavat toimia Theseuksen sallimissa puitteissa vaihtelevat.  Joskus on hyvä luoda katsaus yksityiskohtiin: Toisten tavoista toimia voi oppia ja saada apua askarruttaviin kysymyksiin.

Tässä artikkelissa käydään läpi kahden webinaarin satoa: Theseus-kyselytunti järjestettiin 21.5.2021 ja Amk-rinnakkaistallentajien aamukaffet 24.5.2021. Kummassakin tilaisuudessa käsiteltiin ajankohtaisia asioita ja etukäteen lähetettyjä kysymyksiä.

Lopuksi keskusteltiin yhdessä lähetettyjen kysymysten teemoista ja kirjattiin keskustelua Jamboardille. Asioita kertyi pitkä lista ja osa jäi vielä käsittelemättä. Tässä kooste webinaarien teemoista.

Miten vastuut jakautuvat Theseuksessa? 

Vastuu Theseuksesta jakautuu seuraavasti: 

 • Kansalliskirjasto vastaa käyttöliittymän teknisestä puolesta
 • AMKIT-konsortio ja Theseus-toimisto vastaavat ja koordinoivat toimintaa ja sisältöä.
 • Käytännössä kukin ammattikorkeakoulu vastaa itse omista sisällöistään omana oikeustoimihenkilönään.
 • Opiskelija vastaa viime kädessä omasta opinnäytetyöstään.

Tämä koskee mm. opinnäytetöiden sisältöjä ja esimerkiksi tutkimusetiikkaa ja henkilötietojen käsittelyä, opinnäytetyöpohjia, saavutettavuutta ja rinnakkaistallennusta.

Kuva 2. Suomessa on 24 ammattikorkeakoulua.

Mitä julkaistavasta työstä pitää tarkistaa?

Ammattikorkeakoulujen rehtoreiden kesäkuussa 2008 allekirjoittaman Theseus-sopimuksen mukaan opiskelijan tehtävä on päättää opinnäytetyönsä julkistamisesta. Opinnäytetyön ohjaajan tulee perehdyttää opiskelija verkkojulkaisemiseen liittyviin asioihin, kuten julkinen ja salassa pidettävä tieto, tekijänoikeudet, asiasanat, julkistamiseen liittyvä suostumus sekä Creative Commons -lisensointi. Kirjaston tehtäväksi määriteltiin opinnäytetyön bibliografisten tietojen tarkistaminen ennen julkistamista.

Theseus-kyselytunnilla 21.5. keskusteltiin vilkkaasti siitä, mitä opinnäytetyöstä pitää tarkistaa ennen kuin sen voi vapauttaa verkkoon. Koska jokainen ammattikorkeakoulu on itsenäinen oikeustoimihenkilö, on kukin taho itse määritellyt mitä julkaisuvaiheessa tarkistetaan.

Keskustelussa kävi ilmi, että tarkastustyön tarkkuudessa sekä tarkistettavissa asioissa oli isohkoa variaatiota ammattikorkeakoulujen kesken. Osa ammattikorkeakouluista ei metadatan tarkistuksen yhteydessä juuri tehnyt korjauksia ilman opiskelijan pyyntöä, osa tarkisti metadatan oikeinkirjoitusta ja tiivistelmän tavuviivoja ja tavutusta, työn kieltä ja osa vertasi tietoja Pepin tietoihin. Osalla ei ollut pääsyä Peppiin.

Kuva 3. Mitä korjauksia tehdään metadatan tarkistusvaiheessa? Keskustelua Jamboardilla.

Tässä kohtaa on hyvä huomioida se, mitkä asiat liittyvät suoraa opinnäytetyön ohjaukseen ja myös se, kuka vastaa esim. saavutettavuuden, tietosuojan tai tutkimusetiikan ohjeistamisesta – työn tallennusvaihe ei voi olla se vaihe, jossa aletaan opetella saavutettavuutta tai tieteellistä kirjoittamista.

Miten tehdään poistoja? 

Theseuksen toimintamalliin alusta asti on kuulunut, että opiskelija voi pyytää työnsä poistoa ilman perusteluja. Tämä mainitaan myös Theseuksen tietosuojailmoituksessa. Poistot on tehty ammattikorkeakouluissa eri prosessein osan pyrkiessä mahdollisimman helppoon prosessiin, osalla taas tarvitaan lupia koulutusalalta.

Kerran verkkoon ladattua pdf-tiedostoa voi olla mahdotonta varmuudella poistaa kaikkialta: Theseusta on haravoitu jo pitkään laillisin periaattein Coreen ja OpenAIREen ja toisaalta Googlen indekseissä tiedosto voi säilyä kauan. Lisäksi opinnäytetöitä löytyy usein Docplayeristä, jonka palvelimet sijaitsevat Venäjällä sekä Internet Archivesta.

Coresta, OpenAIREsta, Googlen indekseistä ja Internet Archivesta voi pyytää poistoa jälkikäteen. Periaatteena on, että opiskelija voi itse tekijänoikeuden omistajana pyytää poistoa.

Kuva 4. Poistoihin liittyvää keskustelua Jamboardilla.

Tuplat ja muut erikoiset tallennukset

Kysymyksiä oli tullut myös tuplien tarkistamisesta. Kuvassa neljä näkyy amk-tarkastajien näkökulmia tuplien syntymiseen ja niiden kontrollointiin.

Kuva 5. Tupliin liittyvää keskustelua. Ei havaintoja, kaikki hyvin?
Usein tuplat havaitaan jo tarkistamattomien töiden poolissa: opiskelija on tallentanut uuden version saman tien työstään. Tuplien tarkistamiseen ja poistamiseen ei ole ohjelmallista ratkaisua. Jos epäilee tuplatallennusta, kannattaa hakea tekijän nimellä ja/tai työn nimellä ja tarkistaa tietokannasta.

Jos metadataa haluaa käsitellä tarkemmin ja bongailla tuplia, Theseus-toimistosta voi pyytää oman ammattikorkeakoulunsa metadatan excel-muodossa ja lähteä käsittelemään dataa. Ohjeita käsittelyyn löytyy Kansalliskirjaston wikistä.

Joskus tuplien syntyminen on myös perusteltua. Theseus-toimisto on ohjeistanut, että jos ryhmä saman korkeakoulun opiskelijoita tekee yhdessä opinnäytetyön, vain yksi tallentaa sen ja siihen merkitään muiden nimet ja tarvittaessa käsittelijä lisää tallentamisen jälkeen koulutusohjelmat, jos opiskelijat ovat eri koulutusohjelmista. Sen sijaan jos opiskelijat ovat eri ammattikorkeakouluista ja työ halutaan kummankin ammattikorkeakoulun kokoelmiin, työ täytyy tallentaa erikseen kumpaankin kokoelmaan eli syntyy tupla.

Some-nappien poistot ja huoltokatko

Kyselytunnilla tehtiin myös päätöksiä ja sovittiin seuraavat neljä asiaa, joihin liittyvät muutokset Kansalliskirjasto on toteuttanut viikolla 21: 

 • Theseuksen huoltokatkot siirretään tiistaiaamuun klo 10–11.
 • Theseuksen tietueista poistetaan some-napeista: Facebook, LinkedIn, Twitter.
 • Refworks & Altmetrics saavat jäädä käyttöön, samoin Google Analytics.
 • Viittausboxi otetaan pois käytöstä Theseuksen tietueista.

Syynä some-nappien poistoon on evästeiden käyttöön liittyvän suostumuksen antamisen kiristyminen. Hallinto-oikeus kumosi huhtikuussa kaksi Liikenne- ja viestintävirasto Traficomin tekemää päätöstä, jotka koskivat verkkosivustojen tapoja pyytää käyttäjän suostumusta evästeiden käyttöön. Ratkaisuissaan hallinto-oikeus toteaa, että evästeiden käyttöön annettavan suostumuksen tulee olla yleisen tietosuoja-asetuksen suostumusta koskevien säännösten mukainen. Hallinto-oikeus katsoo, ettei suostumusta voida antaa pätevästi verkkoselainten asetuksilla.

Kuva 6.

Kansalliskirjaston mukaan Theseukseen ei ole tulossa cookieiden hyväksymiseen liittyvää pop upia ja siksi some-napit päätettiin poistaa. Theseuksesta tietoa siirtäviä nappeja ovat olleet: LinkedIn, Twitter ja Facebook. Refworks ja Altmetrics eivät siirrä käyttäjätietoja ja sillä perusteella niitä ei poistettu.

Viittausboxin poistamisen syy on se, että sitä ei ole toistaiseksi saatu toimimaan niin, että se vastaisi kunnolla viittauskäytänteiden mukaisesti. Viittausboxin käyttöönottoa selvitettiin Kansalliskirjaston koordinoimassa työryhmässä vuonna 2019 ja luotiin suositus, mutta se ei toiminut kaikissa tapauksissa.

Tiedonlouhinta Theseuksesta

Parin viime vuoden aikana Theseus on herättänyt kiinnostusta tiedonlouhinnan kohteena. 

Theseuksen tiedonlouhintaan liittyy kaksi periaatetta:

 • Theseuksen metadata on avointa ja siihen voi kohdistaa tiedonlouhintaa.
 • Sen sijaan Theseuksen lisensseissä ei ole kysytty lupaa tallentajilta kokotekstin käyttöön tiedonlouhinnassa ja lisäksi suurin osa opinnäytetöistä on lisensoitu All rights reserved -periaatteella. Nykyisen tekijänoikeuslain puitteissa kokotekstistä tehtävään tiedonlouhintaan ei näin ollen ole lupaa. 

Prosessiin liittyy monia tekijänoikeuslain kannalta ongelmallisia vaiheita, kuten louhittavan aineiston kopiointi, muuntelu ja tallentaminen yleisön saataville saatettavaksi tietokannaksi. Tekijänoikeuslain mukaan kaikkiin näihin toimenpiteisiin on saatava tekijänoikeuden haltijan lupa.

Oleellista on se, mihin louhimalla saatuja tietoja käytetään ja miten asia on informoitu rekisteröidyille. Theseuksen tietosuojailmoitus ei sisällä muuta käsittelyä kuin julkaisemisen ja käyttäjähallinnan. Jos kyse on alkuperäisen käyttötarkoituksen kanssa yhteensopimattomasta jatkokäytöstä, siihen pitäisi löytyä tietosuoja-asetuksessa mainittu oikeutus eli asetus rajoittaa jatkokäyttöä.

DSM-direktiiviin perustuvassa kansallisessa tekijänoikeuslain uudistuksessa tänä kesänä yksi osa-alue on tiedonlouhinnan mahdollistaminen tutkimusorganisaatioissa ja kulttuuriperintölaitoksissa (Tiedon louhinta artikla 3). Odotamme tekijänoikeuslain muutosta.

Theseus-toimisto seuraa tekijänoikeuslain muutosta ja tiedottaa lisää tiedonlouhinnasta, kun uusi tekijänoikeuslaki on astunut voimaan.

PDF-upotukset

Tänä keväänä on tullut paljon kysymyksiä PDF-upotuksista. Videota voi upottaa Theseukseen tallennettaviin PDF-tiedostoihin, mutta videoupotusten ongelma on tiedoston koko, joka aiheuttaa ongelmia työn lataamisessa ja muussa käytössä. Työn maksimikoko on Kansalliskirjaston mukaan 512 MB.

Theseukseen voi tallentaa myös HTML-tiedostoja, niitä ei ole estetty. HTML-tiedostojen osalta täytyy huomioida myös saavutettavuus eli HTML:n on täytettävä WCAG 2.1-kriteeristön A- ja AA-taso. Kriteeristö nähtävillä täällä: https://papunet.et/saavutettavuus/wcag-21-ohjeet

Jos videoupotuksia tiedostoon haluaa tehdä, suositellaan tehtäväksi mieluummin HTML-tiedostoa PDF-tiedoston sijaan.

PDF vai PDF/A?

Tiedostomuoto herätti myös paljon keskustelua.Toistaiseksi Theseukseen voi tallentaa työn niin PDF- kuin PDF/A-muodossa.

Kuva 7. Tiedostomuodon tarkistukseen liittyvää keskustelua.
Theseus-toimistossa päätettiin kesällä 2020, että toistaiseksi ei oteta PDF/A-validaattoria Theseukseen, joka estäisi työn tallennuksen, jos tiedosto on väärässä formaatissa.

Tämä seuraavista syistä:

 • PAS-siirtojen alku on koko ajan siirtynyt
 • kun PAS-siirrot alkavat, sillä hetkellä Theseuksessa olevat työt massakonvertoidaan PDF/A-versioon

Theseukseen ei toistaiseksi haluttu tehdä pullonkaulaa tallennukseen eli suurta härdelliä siihen, miksi työtä ei saa tallennettua ollenkaan. Sama koskee myös saavutettavuustarkistusta.

PDF/A-tallennukseen on kuitenkin hyvä opetella ohjeistamaan jo nyt, ennen kuin se on aivan pakollista.  Tiedossamme ei toistaiseksi ole olemassa muuta tapaa tarkistaa työn formaattia kuin ladata se ulos Theseuksesta ja tarkistamalla työn properties-kohdasta.

Audio- ja videoliitteet Theseuksessa


Theseukseen on ollut mahdollista tallentaa liitetiedostona mp3- ja mp4-tiedostoja syksystä 2019 lähtien. Liitetiedostot näkyvät Theseuksessa työn etusivulla striimausikkunoina, ks. kuva alla:

Kuva 8. Liitetiedostot näkyvät Theseuksessa työn etusivulla striimausikkunoina.

Tallennuslomakkeella on kenttä, johon pyydetään tallentamaan mahdollisten edellä mainittujen liitetiedostojen kestoajat pyöristettynä täyteen minuuttiin. Tämä sen vuoksi, että ainoastaan kyseisen kentän kautta pystytään seuraamaan sitä, kuinka paljon minuuttimääräisesti on striimattavaa aineistoa Theseukseen tallennettu huomioiden Teosto ry:ltä hankitun mediapienluvan laajuus.

Alla olevassa kuvassa on liitteenä olevan videotallenteen kestoaika merkitty ohjeen mukaisesti kenttään ja lisäksi lisätietokenttään avattu videotallenteen sisältö, kuten lomakkeella ohjeistetaan.

Kuva 9. Videotallenteita koskevat tiedot merkitään kenttiin dc.description.duration ja dc.description.notification.

Kyseinen kenttä (dc.description.duration) ei ole pakollinen kenttä, eikä sen sisältöä voida pakottaa tiettyyn muotoon. Tästä johtuen kenttään voi tallentaa mitä tahansa. Vaikka tallennuslomakkeella selvästi ohjeistetaan, että kenttään tallennetaan kestoaika ainoastaan siinä tapauksessa, että myös mp3- tai mp4 -liitetiedosto on tallennettu Theseukseen, on tuohon kenttään tallennettu tietoja vaikkei liitettä mukana olisikaan.

Syksyllä 2020 oli Theseuksessa 135 opinnäytetyötä, joissa tähän kenttään oli tallennettu tietoa. Kun nämä käytiin läpi, löytyi vain 55 opinnäytetöitä joihin oikeasti liittyi striimattava liitetiedosto. Kenttään oli kirjoitettu “ei ole” tai “-” tai mystinen numero, joka mahdollisesti tarkoitti työn liitesivujen määrää tai jotakin ihan muuta. Joissakin tapauksissa tieto viittasi muualle kuin Theseukseen tallennettuun opinnäytetyöhön liittyvään tallenteeseen.

Jotta seuranta olisi mahdollista ilman, että työt käydään aina erikseen läpi, olisi työn tarkastusvaiheessa kiinnitettävä huomiota siihen onko tätä kenttää käytetty. Helpoiten se tapahtuu siten, että klikkaa käsiteltäväksi ottamansa opinnäytetyön etusivulla kohdasta “Näytä kaikki julkaisun tiedot”. Siinä pystyy samalla myös katsomaan muut metatietokentät ja näkemään mahdolliset korjaustarpeet.

Theseusta käyttöön otettaessa ajateltiin, että suurin osa liitteinä olevista av-tallenteista liittyisi musiikin koulutukseen. Nyt kuitenkin vaikuttaa siltä, että suurin osa onkin sotepuolelta tulevia erilaisia ohje- ja opastusvideoita. Theseuksen lisäksi niitä tallennetaan esimerkiksi YouTubeen oppilaitoksen tai työn toimeksiantajan omalle kanavalle. 

YouTube -linkkien merkitseminen opinnäytetyön tietueeseen on ollut hyvin vaihtelevaa. Useimmiten tietoa ei ole löydettävissä metatiedoista, vaan ainoastaan joko työn tekstiosasta esimerkiksi liitesivulle merkittynä. Linkkitiedon merkitsemisestä on käyty keskustelua muutaman amk-opettajan kanssa ja päädytty siihen vaihtoehtoon, että ko. linkki olisi hyvä tallentaa tallennuslomakkeella Lisätiedot -kenttään ja avata siihen myös sisältöä, kuten seuraavassa kuvassa:

Kuva 10. Youtube-linkki merkitään Lisätiedot-kenttään (dc.description.notification).

Asiasta keskusteltiin myös Theseus-kehittämisryhmän kokouksessa 20.5.2021, ja todettiin tämä hyväksi käytännöksi. Ohjeistusta on tulossa myös Theseus-tallennussivulle.

Kuvat rinnakkaistallennuksessa

Amk-rinnakkaistallentajien aamukaffeilla pohdittiin kuvien käyttöä rinnakkaistallennuksissa ja erityisesti sitä, koskeeko kustantajan myöntämä rinnakkaistallennuslupa myös artikkeliin liitettyjä kuvia. Aamukaffeilla löydettiin enemmän kysymyksiä kuin vastauksia. Johtuneeko se ajankohdasta euroviisujen jälkeisenä maanantaiaamuna.

Esimerkkinä keskusteltiin kuva-arkistojen ja kuvapankkikuvien käytöstä julkaisuissa. Jos tekijä tai kustantaja on sopinut (ja maksanut) kuva-arkiston kuvan julkaisemisesta tietyssä yhteydessä, vaikkapa lehden printtiversiossa, onko rinnakkaistallentaminen digitaaliseen muotoon sallittua? Riippuko se siitä, onko rinnakkaistallennuslupa käsikirjoitusversioon vai kustantajan versioon?

Kuva 11. Photo by <a href="https://unsplash.com/@markuswinkler?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Markus Winkler</a> on <a href="https://unsplash.com/s/photos/copyright?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>

Tieteellisten artikkelien kuvat ovat yleensä olennainen osa artikkelin sisältöä, ja niiden julkaisemisesta sovitaan tekijöiden ja kustantajien välisessä julkaisu- ja oikeuksiensiirtosopimuksessa. Käytännöt kuvien lupien selvittämisessä rinnakkaistallentamisen yhteydessä vaihtelevat. Osassa ammattikorkeakouluja kirjoituksen tekijää pyydetään selvittämään kaikilta tekijöiltä luvat rinnakkaistallentamiselle, osassa katsotaan lähinnä kustantajan myöntämää lupaa ja toimitaan sen perusteella.

Välimallejakin varmasti on. Taustalla on organisaatiokohtaisia rinnakkaistallennuslinjauksia ja työajan käytön miettimistä: avoimuuden hinta nousee, jos rinnakkaistallentaja joutuu viettämään paljon aikaa julkaisulupaviidakossa ja katsomaan arvioivasti kustantajan myöntämää rinnakkaistallennuslupaa.

Ammattikorkeakouluissa rinnakkaistallennetaan myös muita julkaisuja kuin tieteellisiä artikkeleja. Näissä kuvien käyttö julkaisun yhteydessä voi olla monipuolista, kuvan yhteys artikkelin sisältöön lähinnä koristeellinen, eikä julkaisusopimuksia välttämättä aina tehdä. Kustantaja saattaa liittää taitto- tai verkkojulkaisuvaiheessa julkaisuun kuvituskuvia kuvapankeista. Pitääkö kysyä lupa rinnakkaistallentamiselle kuvapankista? Jos kuvat eivät liity olennaisesti rinnakkaistallennettavan artikkelin asiasisältöön, onko niiden tallentaminen julkaisun yhteydessä arkistoon tarpeellista?

Ehkä hyvä muistutus tulee Helsingin yliopiston rinnakkaistallentamisen oppaasta: “kirjoitukseen sisältyvien itsenäisten teosten tekijöiltä, kuten graafikoilta ja valokuvaajilta, pitää saada lupa heidän teoksensa tallentamiseen julkaisuarkistoon. Jos lupaa ei saada, kirjoitus voidaan tallentaa ilman kuvia.” (Salokannel 2011, 4).

Kysymykseksi taitaa kuitenkin jäädä, että voiko rinnakkaistallentaja olettaa, että kustantaja myöntäessään rinnakkaistallennusluvan ottaa huomioon myös kolmansien osapuolien kanssa tehdyt julkaisusopimukset? Miten julkaisujen tekijöitä voisi kuvien käytöstä informoida, jotta mahdollisilta epäselvyyksiltä vältyttäisiin?

Entä jatkossa?

Theseus-kyselytunnin jälkeen on herännyt huolta, mitä asioille tehdään jatkossa. Osallistujien toiveen mukaisesti järjestämme Theseus-kyselytunteja ja AMK-rinnakkaistallentajien aamukaffeja lisää syksyllä. Amk-rinnakkaistallentajien aamukaffien ajankohta päätettiin siirtää syksyllä pois maanantai-aamusta, mahdollisesti tämän kuva-keskustelun johdosta. Tiedotamme, kun aikataulut on sovittu.

Jos haluat mukaan opinnäytetöitä koskevaan keskusteluun (theseus.yhteydenpito@lists.metropolia.fi) tai amk-rinnakkaistallentajien listalle (amk-rinnakkaistallentajat@lists.metropolia.fi), laita viestiä osoitteeseen theseus.rukkaset@lists.metropolia.fi.

 

Lähteet

Kirjoittajat

Tiina Tolonen

Informaatikko

Tiina Tolonen on informaatikko Tiedekirjasto Pegasuksessa, joka palvelee Oulun yliopistoa ja Oulun ammattikorkeakoulua.

Kirjoittajan muut artikkelit

Antti Nyqvist

tietoasiantuntija

Haaga-Helia

Kirjoittajan muut artikkelit

Minna Marjamaa

tietoasiantuntija

Laurea-ammattikorkeakoulu

Kirjoittajan muut artikkelit

Kommentit

Jätä kommentti