Tiedonlouhinnasta, tekoälystä ja rahojen riittämättömyydestä

01.11.2018

Kuva: Pixabay CC0

Osallistuin toukokuussa Suomen tieteellisen kirjastoseuran järjestämään seminaariin, jossa esiteltiin mitä on tiedonlouhinta, kurkattiin tulevaisuuden tiedonhankintaan ja keskusteltiin kirjastoaineistojen hankinnan haasteista.

Tiedonlouhinta ja sen mahdollisuudet

Tutkija Henry Joutsijoki Tampereen yliopistosta puhui tiedonlouhinnasta ja koneoppimisesta. Tiedonlouhinnan avulla pyritään löytämään suurista tietomassoista ja raakadatasta oleellista ja uutta tietoa; jotakin mitä ei ole ennen havaittu. Tiedonlouhinta lisää tietämystä: ymmärrys datasta lisääntyy ja dataa voidaan hyödyntää uusilla tavoilla.

Arkipäivän esimerkki tiedonlouhinnasta on ostoskorianalyysi. Jos asiakas ostaa ruokakaupassa kurkkua, hän ostaa myös tomaattia, ja kauppa tietää järjestää tuotteet sen mukaan, että ne löytyvät helposti lähekkäisistä hyllyistä. Myös tiedonhankinta avainsanojen perusteella on tiedonlouhintaa.

Tiedonlouhinta vie aikaa ja sisältää myös riskejä, kaikki data ei aina tuota uutta tietoa. Haasteena on tiedon visualisointi: mitä enemmän muuttujia on, sen vaikeampaa visualisointi on. Kuvittele tuhatulotteinen avaruus ja miltä se näyttäisi!

Koneoppimisessa keskeistä on yleispätevyys. Koneoppiminen hyödyntää algoritmien kykyä tehdä ennustuksia. Sovelluskohteita löytyy joka alalta. Koneoppimista hyödynnetään mekaanisen työn korvaamisessa, turvallisuuden parantamisessa, diagnostiikassa ja kohdennettujen palvelujen tarjoamisessa eri asiakasryhmille. Pörssikurssien ennustaminen ei vielä onnistu, joten kannattaa harkita miten rahansa sijoittaa.

Uhkakuvia ovat yksityisyyden rajojen rikkominen, liian älykkäät algoritmit ja  vastuukysymykset. Kuka vastaa, jos robottiauto kolaroi: ostaja, koodari vai auton valmistaja?

Tekoälyä tiedonhankintaan

Karita Kasurinen esitteli tekoälypohjaista tutkimusassistenttia nimeltään Iris.ai. Arvioiden mukaan maailmassa julkaistaan joka päivä yli 3000 tutkimuspaperia eri tieteenaloilta. Tiedonhankinnan ongelmia ovat oikeiden hakusanojen löytäminen, isot tulosjoukot ja epärelevantit, aiheeseen liittymättömät aineistot.

Iris perustuu neuromalleilla rakennettuun algoritmiin ja auttaa löytämään tietoa sekä säästämään aikaa tiedonhankinnassa. Tavoitteena on että tutkijoilla on enemmän aikaa käytettävissä sisältöjen ymmärtämiseen. Iriksen avulla voidaan hakea tutkimuksia monilta eri tieteenaloilta, koska tekoäly osaa yhdistellä eri alojen tutkimuksia toisiinsa.

Asiakas antaa tutkimusongelmansa Irikselle, tai vaihtoehtoisesti hyvän artikkeli, jota vastaavia haluaisi löytää (find similar). Iris alkaa etsiä sisältöä tutkimusongelman perusteella. Iris tunnistaa avainsanoja, ottaa mukaan synonyymit, luokittelee aiheita ja suodattaa epärelevantit aineistot pois. Iris luo tutkimusongelman pohjalta sormenjäljen, johon se vertaa aineistoja. Asiakas saa lukulistan niistä aineistoista, joihin kannattaa tutustua.

Iris toimii Core -tietokannassa, joka on laaja, monialainen, tieteellisiä open access -artikkeleja sisältävä tietokanta, mutta Iris voidaan integroida mihin tahansa tietokantaan. Iris toimii toistaiseksi vain englanniksi.

Lisätietoa https://iris.ai/

Linkki Iriksen avoimeen versioon https://the.iris.ai/ (edellyttää rekisteröitymistä).

Siirtyminen e-kurssikirjoihin – case Hanken

Kirjastonjohtaja Tua Hindersson-Söderholm esitteli miten Hankenissa on siirretty painetuista kurssikirjoista e-kirjoihin ja mitä haasteita e-kirjoihin liittyy.

Vain osa kurssikirjoista on hankittavissa organisaatiolisenssillä kirjaston käyttöön. Hankittavissa olevat kirjat ovat saatavissa kirjavasti eri palveluissa, eri lisensseillä (esimerkiksi yhtäaikaisten käyttäjien määrä voi olla rajoitettu) ja hinnoilla. Hankalia ovat myös e-kirjojen lisämateriaalit, jotka ovat saatavissa vain henkilökohtaisella lisenssillä ja tunnuksella. Lisämateriaaleja kirjasto ei hanki.

Opiskelijat joutuvat ostamaan ainakin osan kurssikirjoista itse. Hankenissa opiskelijat ovat tottuneet siihen, että kurssikirjat eivät välttämättä ole saatavilla kirjastossa, vaan osan joutuu ostamaan itse, koska Hankenissa on paljon vaihto-opiskelijoita ja lisäksi kaikkiin opintoihin sisältyy pakollinen vaihto tai harjoittelu ulkomailla. Kirjojen ostaminen lisää kuitenkin opiskelijoiden välistä epätasa-arvoa, koska kaikilla ei ole rahaa ostaa kirjoja.

E-kurssikirjojen hankinnassa yhteistyö opettajien kanssa on tärkeää. Valitettavasti yhteistyö toimii vaihtelevasti eri opettajien välillä. Kirjaston toive on, että tarvittavat kurssikirjat ilmoitetaan kirjastoon hyvissä ajoin, että ehditään selvittää, onko ne mahdollista saada e-kirjana. Vaihtoehtoisista kurssikirjoista hankitaan se, joka on parhaiten saatavissa e-kirjana.

Kuva: Pixabay CC0

Ostetaan avoimeksi?

Informaatikko Irene Ylönen Jyväskylän yliopiston Avoimen tiedon keskuksesta puhui avoimen aineiston hankinnan kriteereistä ja erityisesti hybridijulkaisuista.

Hybridijulkaisulla tarkoitetaan tieteellistä artikkelia, joka on ostettu avoimeksi tilausmaksulliseen (verkko)lehteen. Artikkelista maksetaan artikkelin kirjoittajamaksu (APC = article processing charge). Toisin sanoen: tutkija kirjoittaa artikkelin, josta maksetaan ensin lehden tilausmaksu ja erikseen artikkelin kirjoittajamaksu, että se saadaan oman organisaation tutkijoiden ja asiakkaiden käyttöön. Hybridimalli on käytössä isoilla tieteellisillä kustantajilla kuten Elsevier, Springer, Taylor & Francis ja Springer.

Hybridijulkaiseminen lisää yliopistojen kustannuksia ja tuo lisää tuloja kustantajille. Toki se myös lisää tutkimuksen avoimuutta, mutta halutaanko avoimuutta lisätä hinnalla millä hyvänsä?

Jyväskylän yliopisto on myöntänyt Avoimen tiedon keskukselle vuosittaisen summan open access maksuja varten. Summa on maltillinen eikä se riitä kaikkien yliopistossa julkaistavien artikkelien kirjoittajamaksuja varten, eikä siihen edes pyritä. Jyväskylän yliopiston ensisijainen avoimen julkaisemisen muoto on rinnakkaistallentaminen. Yliopistossa suositaan lisäksi full open access lehtiä niillä aloilla, joilla laadukkaita lehtiä on saatavilla.

Hankinnan haasteet

Seminaarissa pidettiin kaksi työpajaa, joissa keskusteltiin hankinnan haasteista. Ohjaako kirjastojen hankintaa harkitut hankintaperiaatteet, talous vai tarjonta?

Asiakkaille kirjastoissa tehtävä hankinta on enimmäkseen näkymätöntä työtä. Hankintaprosessi ja sen vaiheet jää piiloon, mutta toki asiakasta kiinnostaakin se, että hän saa tarvitsemansa aineistot helposti käyttöönsä. Kirjaston hankintaa ja kokoelmatyötä ei tehdä satunnaisesti, vaan kaikissa kirjastoissa on hankintapolitiikka, joka ohjaa mitä kirjastoon hankintaan, kenelle ja miten.

Haasteena kirjastoissa on hankinnan optimointi. Etenkin e-aineistojen hinnat nousevat vuosittain ja samalla kirjastojen hankintamäärärahoja on leikattu jopa kymmeniä prosentteja. Valintoja on tehtävä, mutta samalla pitäisi varmistaa hankinnan tasapuolisuus kaikille tiedekunnille tai koulutusohjelmille. Hankitaanko tasapuolisesti kaikille vai painotetaanko tiettyjä aloja?

E-aineistot hankitaan lisensseillä ja sopimuksen kesto voi olla vuoden tai useamman vuoden mittainen. Kun määrärahoja leikataan, jo tehdyistä sopimuksista on pidettävä kiinni, ja joudutaan karsimaan jostain muusta eli yleensä painetuista kirjoista ja lehdistä.

Kirjastojen tiloja on tiivistetty ja neliöitä vähennetty, mutta myös tilakustannukset nousevat vuosittain. E-aineistojen avulla voidaan vähentää fyysisen tilan tarvetta kirjastoissa, mutta e-aineistojen sopimukset, tarvittavat tietojärjestelmät ja käytön opastus vie aikaa ja työvoimaa.

Ratkaisuna rahojen niukkuuteen voisi olla open access -julkaiseminen, mutta toistaiseksi open access ei ole laskenut hankintakustannuksia, vaan päinvastoin jopa lisännyt niitä.

Kirjastoissa pitäisi tehdä enemmän arviointia ja tutkimusta, miten hankitut aineistot vaikuttavat opetukseen ja tutkimukseen. Mitä kannattaa hankkia ja mihin määrärahat kannattaa sijoittaa? Myös asiakkaiden tarpeiden ennakointi on tärkeää.

Korkeakoulujen yhdistymiset eivät ole säästäneet rahaa. Johdon näkemys on, että jos kirjastot yhdistetään, niin samalla säästetään. Todellisuudessa e-aineistojen lisenssimaksut nousevat.

 

Kirjoittaja

Kirsi Mononen, informaatikko, Karelia-ammattikorkeakoulu

 

Lähteet:

Seminaariohjelma http://www.stks.fi/news/2325 viitattu 1.6.2018

Ylönen I. 2018. Maksettua avoimuutta - hybridit tulevat. Jyväskylän yliopisto. https://osc.jyu.fi/fi/blogi/maksettua-avoimuutta-hybridit-tulevat

Kommentit

Jätä kommentti