Totuus on tarua ihmeellisempää – selvitys Theseukseen tallennetuista mp3- ja mp4 -liitetiedostoista

16.11.2020

Vuoden harmain päivä. Kuva: Tiina Tolonen

Kauan odotettu ja Iisakin kirkon lailla rakennettu striimauspalvelu otettiin Theseuksessa käyttöön syksyllä 2019. Nyt on tullut aika selvittää, kuinka paljon tätä mahdollisuutta on käytetty hyväksi opinnäytetyöraporttien tallennuksen yhteydessä. Toinen kiinnostava asia selvitettäväksi on se, onko tallennustarve edelleen samanlainen kuin vuonna 2010, jolloin liitteiden ajateltiin enimmäkseen olevan kulttuurialan opintoihin liittyviä tallenteita kuten opinnäytekonsertteja. Tutkimustulokset yllättivät myös kirjoittajan.

Aika lailla tasan vuosi sitten Kreodissa uutisoitiin, että opinnäytteiden liitteiksi tulevien mp3-ja mp4 -tiedostojen tallentaminen oli lopultakin mahdollista Theseuksessa. Työn alla asia ehti olla vain yhdeksisen vuotta eli verrattuna Olkiluoto 3 -ydinvoimalaan, se valmistui suhteellisen ripeästi. Alun perin ajatuksena oli tarjota mahdollisuus tallentaa Theseukseen kirjallisen raportin liitteenä olevat opinnäytekonsertti yms. audio- tai videomateriaalia sisältävät tallenteet, jotka tuossa vaiheessa toimitettiin erillisinä liitteinä ammattikorkeakoulujen kirjastoihin, ja olivat käytettävissä ainoastaan niiden tiloissa. Tätä silmällä pitäen oli jo varhaisessa vaiheessa ryhdytty selvittämään palvelua varten tarvittavia sopimuksia tekijänoikeusjärjestöjen, kuten Teoston ja Gramexin kanssa. 

Kun striimaustoiminto lopulta oli mahdollista ottaa käyttöön myös Theseuksessa, solmittiin Teoston kanssa sopimus Mediapienluvasta sekä piensynkronointiluvasta, jotta mahdollisia av-tuotantoja pystyttäisiin kattavasti tallentamaan kirjallisten raporttien yhteyteen. Mediapienlupa mahdollistaa yhden tunnin verran tarjolle saatettua musiikkia per kuukausi. Teosto ei vaadi erillistä kirjanpitoa äänitiedostojen minuuttimääristä, mutta mediapienluvan oikean koon varmistamiseksi päätettiin tallennusten kestoja ainakin ensi alkuun seurata. Theseuksen syöttölomakkeelle oli näitä striimattavia liitetiedostoja varten lisätty kenttä, johon liitteenä olevan tallenteen kestoaika pyydettiin tallentamaan pyöristettynä täyteen minuuttiin. Tätä kautta oli mahdollisuus kerätä tiedot tehdyistä tallennuksista ja niiden kestoista.

Tallennusmäärien tutkailua

Ensimmäinen tarkistus tehtiin kesäkuussa 2020. Hakutulos osoitti, että tuossa vaiheessa Theseuksesta löytyi 97 opinnäytetyötä, joissa oli em. kenttään tallennettu jokin tieto, oletettavasti siis kestoaika. Kun näitä ryhdyttiin käymään systemaattisesti läpi, totuus olikin toisenlainen. Hakutuloksen 97 opinnäytetyöstä liitetiedoston sisälsi vain 43 opinnäytetyötä. Monessa opinnäytetyössä oli kyllä kirjallisen raportin lisäksi tuotettu video, mutta se oli tallennettu Youtubeen tai vastaavaan palveluun Theseuksen sijaan. Opinnäytetyö sisälsi linkin videoon ja tallennuslomakkeelle oli tallennettu tieto sen kestosta. Näinhän ei kuitenkaan ollut tarkoitus toimia, vaan kestoaika tuli merkitä ainoastaan siinä tapauksessa, että mp3- tai mp4-liite oli tallennettu Theseukseen. Kestoaikakenttää oli käytetty myös jonkun muun tiedon tallentamiseen, ja tämän vuoksi nekin tulivat tässä hakutuloksessa esille, vaikka kirjallisen raportin lisäksi ei siis mitään muuta ollut tallennettu. Theseukseen on tallennettu myös videoliitteitä mpg-tiedostoina. Tämä tarkoittaa sitä, että liitetiedostosta ei muodostu ns. striimausikkunaa Theseuksen etusivulle, vaan tiedosto latautuu käyttäjän koneelle ja avautuu mediasoittimella. Tällöin saattaa kuulua ainoastaan ääniraita ja jää epäselväksi, oliko tarkoituksena olla myös jotain katsottavaa sisältöä.

Seuraava tarkistus tehtiin lokakuussa 2020. Tällöin kestoaikakenttään tallennetun merkinnän mukaisen hakutuloksen kokonaismäärä oli 113 opinnäytetyötä. Työt käytiin yksitellen läpi, jotta saatiin käsitys siitä, minkälaisia striimattavia tiedostoja Theseukseen oli tallennettu ja kuinka suuri osa niistä olisi sellaista aineistoa, joka Teostoa kiinnostaa tekijänoikeusasioiden vuoksi. Hakutuloksesta vain 55 eli alle puolet opinnäytetöistä sisälsi Theseukseen tallennetun liitetiedoston. Suurimmassa osassa opinnäytetöistä oli tiivistelmätekstissä maininta liitteenä olevan tallenteen sisällöstä ja alla olevaan taulukkoon on koottu ne, jollaisia oli tallennettu enemmän kuin yksi.

Taulukko.Theseuksen sisältämien mp3- ja mp4-tiedostojen sisältöjä per 1.10.2020

Opetusvideo 10
Animaatio 8
3D-mallinnus 3
Äänite  3
Videoesittely 1

Loput olivat erilaisia yksittäisiä tallenteita, kuten perehdytysvideo, demovideo, lyhytelokuva, opinnäytekonsertti sekä karjan kutsuntaa ja lehmilauluja. 

Syylliset esille

Miksi sitten hakutulos antoi paljon suuremman tuloksen kuin tosiasiallisia tallennuksia oli? Tehdyt tallennukset kerättiin ao. kentän avulla. Jos siis tähän oli tallennettu jotakin, se tuli hakutulokseen.

Theseuksen dc.description.duration -metadatakenttä

Koska kyseisen metadatakentän sisältöä ei voi validoida eli ei pystytä pakottamaan, että siihen tallennettaisiin ainoastaan numeraalista tietoa, siihen on mahdollista kirjoittaa mitä tahansa. Kun tallennuksia käytiin läpi, havaittiin että kenttään oli merkitty esimerkiksi viiva (-) tarkoittaen sitä, ettei liitetiedostoa ole. Kenttään oli myös saatettu merkitä opinnäytetyötiedoston koko kilotavuina tai sen sivumäärä. Muutamassa tapauksessa kenttään oli kirjoitettu jotakin, esimerkiksi ”ei ole”. Tämän vuoksi tallennusohjeita on nyt muokattu niin, että siellä lukee kenttään tehtävän merkinnän ainoastaan siinä tapauksessa, että mp3- tai mp4 -liitetiedosto on oikeasti tallennettu Theseukseen. Tässä kohtaa olisi myös hyvä opinnäytetöiden tarkastajien kiinnittää huomiota siihen, että jos kenttään on tallennettu jotain, se vastaa myös tallennuksen sisältöä. Tarkastuskierroksen yhteydessä on niistä opinnäytetöistä, joissa liitetiedostoa ei oikeasti ollut, poistettu tuon kentän sisältö.

Mihinkäs me tallennettiin silloin kun ei vielä ollut Theseusta… Kuva: Tiina Tolonen

Maailma muuttuu, Theseukseni

Tarkistuskierros osoitti myös sen, että kuten muukin maailma, on opinnäytetöiden maailma muuttunut suuresti viimeisen 10 vuoden aikana. Alun perin enimmäkseen opinnäytetyökonsertteja ja tanssiesitysten taltiointeja varten suunniteltu striimauspalvelu onkin tuonut Theseukseen aivan muuta sisältöä. Uusimuotoiset opinnäytetyöt ja vaihtoehtoiset suoritustavat tuovat painetta myös kehittää opinnäytetöiden tallentamis- ja erityisesti arkistointimahdollisuuksia niin, että kaikki saadaan tallennettua ja siirrettyä myöhemmin pitkäaikaissäilytykseen. Kun kesällä 2010 oltiin varmoja, että jo muutaman kuukauden päästä pystyttäisiin tallentamaan konserttitaltioinnit Theseukseen ei pystytty todennäköisesti edes kuvittelemaan, että menisi lähemmäs 10 vuotta ennen kuin se oikeasti tapahtuisi. Ja että tallennukset olisivat jotakin ihan muuta mitä niiden ajateltiin olevan. Todennäköisesti sosiaali- ja terveysalan opiskelijoiden tekemien erilaisten opastusvideoiden määrä tulee varmasti lähivuosina kasvamaan voimakkaasti.

Toinen seikka mikä oli havaittavissa otoksen läpikäytyään, ettei kaikkialla ole aivan tarkkaa käsitystä siitä minkälaisia mp3- ja mp4 -tallenteita Theseukseen yleensä kannattaa tallentaa. Osa tallenteista oli selkeästi opinnäytetyön taustamateriaalia, esimerkiksi muutaman sekunnin mittaisia ääninäytteitä tai muuten väärässä paikassa.

Tarkistuksia on syytä tehdä ja jatkaa säännöllisin väliajoin. Tämä jo pelkästään siitä syystä, että jo aivan Theseus-palvelun alkuajoista saakka on yksi sen menestyksen kulmakivistä ollut yhtenäinen metadata, joka varmistaa myös onnistuneiden hakujen tekemisen. Metadatauudistuksen yhteydessä sen laatua saatiin varmasti vielä parannettua ja siitä kannattaa pitää kiinni myös tulevaisuudessa.

 

Kirjoittajat

Tiina Tolonen

Informaatikko

Tiina Tolonen on informaatikko Tiedekirjasto Pegasuksessa, joka palvelee Oulun yliopistoa ja Oulun ammattikorkeakoulua.

Kirjoittajan muut artikkelit

Kommentit

Jätä kommentti