Tiedonhaun kokeilukulttuuria: Tekoälyä käyttävät artikkelihaun työkalut

06.06.2023

Kuva on tuotettu DALL-E tekoälytyökalulla kehotteella "People doing article search in the style of starry night"

Laurean tieto- ja julkaisupalveluiden iskuryhmä lähti alkuvuodesta testaamaan tekoälytyökaluja ja uudistamaan tiedonhankinnan ohjausta. Tavoitteena oli luoda kokeilukulttuurin kautta uutta tiedonhankinnan ohjaukseen ja opetukseen. Mistä oli kyse ja missä nyt mennään? Tässä artikkelissa tarkastellaan toimintamalleja ja testattuja työkaluja: Semantic Scholar, Keenious, Elicit, LitMaps ja Research Rabbit.

Tämän kevään tekoälykeskustelua on dominoinut generatiivinen (sisältöä tuottava) tekoäly ja erityisesti ChatGPT. Samalla kun ChatGPT on hämmästyttänyt kyvykkyydellään luoda erilaisia tekstejä, sen tuottaman tiedon luotettavuuden ja lähteiden nimeämisen ongelmat on tuotu esille moneen kertaan. Tieteellisen tiedon keskiössä olevien tieteellisten artikkelien hakuun ChatGPT ei ainakaan tällä hetkellä sovellu, mutta tätä tarkoitusta varten on olemassa useita muita työkaluja, jotka hyödyntävät tekoälyä eri tavoilla.

Artikkelin sisältö:

Tekoälyn työkaluista kokeilukulttuuria
Semantic Scholar – tutkijoille ja asiantuntijoille
Keenious – opiskelijan työkalu
Elicit – kiinnostava tutkimustyökalu
Litmaps – kirjallisuudesta karttoja
Research Rabbit aka Spotify for papers
Kuinka ohjata ja opettaa työkaluja?

Tekoälyn työkaluista kokeilukulttuuria

Laurean tieto- ja julkaisupalveluissa lähdettiin monen muun korkeakoulun lailla vuoden alussa testaamaan ChatGPT:tä sekä akateemisia tekoälyn työkaluja ja miettimään, miten tämä vaikuttaa tiedonhakuun ja tiedonhankinnan ohjaukseen. Jos pitäydymme vanhoissa toimintamalleissa, pahimmillaan tulevaisuudessa tilanne on se, että kirjasto opettaa yhtä settiä käyttöliittymiä ja työtapoja, mutta opiskelijat ja tutkijat toimivat todellisuudessa täysin toisin.

Kuva 2. Tiedonhakinnan tulevaisuusdystopia ja mahdollinen ratkaisu.

Ajatuksena oli luoda aidosti kokeilukulttuuria tiimiin ja tähän saatiin johdon tuki. Kokeilukulttuurilla tarkoitetaan organisaation ajattelutapaa, jossa pitkän suunnittelujakson sijasta tehdään nopeita kokeiluja, jaetaan opittua ja tehdään opitun perusteella päätöksiä siitä, miten suuntaudutaan jatkossa. Pyritään luomaan aidosti lisäarvoa asiakkaalle, joka tässä tapauksessa on opiskelijat ja henkilökunta.

Toimintaa lähdettiin nopeasti viemään eteenpäin. Luotiin LibGuide-sivu testaamisen alustaksi. Sen sijaan, että opasta olisi hiottu pitkään ennen julkaisemista, se avattiin heti niin, että luotuja ohjeita pääsi heti testaamaan opiskelijoiden ohjauksessa.

Kuva 3. Kokeilukulttuuri. Demos Helsinki, 2015.

Tavoitteena on, että nostamme tieto- ja julkaisupalveluiden osaamista nopeasti tiedonhaun tekoälytyökaluista ja organisaation sisällä tuomme esille asiantuntijuutta aiheesta. Aktiivinen osallistuminen keskusteluun onkin tuottanut jo hedelmää, pääsimme vaikuttamaan muun muassa Laurean viittausohjeeseen sen osalta, miten tekoälyyn viitataan ja kuinka kielimallien luomaan tekstiin suhtaudutaan lähteenä.

Käymme seuraavassa läpi, mitä olemme oppineet artikkelitiedonhaun työkaluista.

Semantic Scholar – tutkijoille ja asiantuntijoille

Semantic Scholar on Allen Institute for AI -nimisen voittoa tavoittelemattoman tutkimuskeskuksen kehittämä tekoälyä hyödyntävä tieteellisen tiedonhaun väline. Semantic Scholar julkaistiin vuonna 2015 ja se on vapaasti kenen tahansa hyödynnettävissä. Palveluun rekisteröityminen ei ole välttämätöntä, mutta rekisteröitymällä saa käyttöönsä mm. viitetietojen tallentamisen kansioihin ja artikkelien suositustoiminnon. Semantic Scholarin omalla esittelyvideolla palvelulla mainitaan olevan kuukausittain miljoonia käyttäjiä.

Semantic Scholar ilmoittaa hakuindeksinsä (korpuksensa) kooksi tätä kirjoitettaessa yli 210 miljoonaa artikkelia. Korpuksen data on peräisin Semantic Scholarin sivuilta löytyvän tiedon mukaan yli viideltäkymmeneltä eri kustantajalta, datan tarjoajalta ja välittäjältä. Yhteistyökumppaneiden joukosta löytyy isojen tunnettujen kansainvälisten tiedekustantajien lisäksi mm. PubMedin ja arXivin kaltaisia toimijoita.

Semantic Scholar hyödyntää tekoälyä ja koneoppimista usealla eri tavalla. Keskeisenä tavoitteena on käyttää tekoälyä helpottamaan relevanttien artikkeleiden seulomista valtavasta yli 200 miljoonan artikkelin massasta. Tekoälyn avulla Semantic Scholar mm. luo lyhyitä artikkelikohtaisia yhden lauseen tiivistelmiä, lisää artikkeleille tieteenalatiedon, tarjoaa listoja samakaltaisista artikkeleista ja nostaa esille artikkeleita, joilla on ollut suuri merkitys niihin viitanneisiin artikkeleihin (Highly influential citations).

Ulkoisesti ja perustoiminnoiltaan Semantic Scholar muistuttaa monella tavalla perinteisiä artikkelihaun työkaluja. Hakusivu on googlescholarmaisen pelkistetty. Hakusanat kirjoitetaan hakulaatikkoon ilman kohdennuksia mihinkään tietokannan kenttään. Hakutuloslista pyrkii olemaan mahdollisimman helppolukuinen ja nopeasti selailtava. Viitetietojen generointi onnistuu neljällä eri viittausformaatilla.

Semantic Scholarin hakutoimintoa on kehitetty koneoppimista käyttäen. Mielenkiintoinen blogi-postaus hakutoiminnon kouluttamisesta löytyy palvelun sivuilta. Käytännön hakutilanteessa hakutuloksen relevanssijärjestyksen logiikkaa on hetkittäin vaikea tai mahdoton ymmärtää. Palvelun tiedoissa kerrotaan, että Boolen operaattoreita ei tueta, eikä isojen tai pienten kirjainten käytöllä ole väliä. Kuitenkin jos hakulauseessa on AND tai OR isoilla kirjaimilla kirjoitettuna, hakutulosten määrä on toinen kuin jos and tai or on kirjoitettu pienellä. Myös lainausmerkit, joiden käyttöä kerrotaan fraasihaussa tuettavan, toimivat yllättävällä tavalla. Haku “artificial intelligence” depression tuottaa 1 070 000 hakutulosta, kun taas artificial intelligence depression antaa 248 000 hakutulosta.

Hakea voi myös suomeksi. Tällöin hakutuloksiin tulee muun muassa Journal.fi -palvelun kautta luettavia suomenkielisiä artikkeleita.

Hakutuloksen järjestämiseen ja suodattamiseen Semantic Scholar tarjoaa paljon välineitä, joista useimmat ovat tuttuja monista tietokantapohjaisista artikkelihaun työkaluista. Hakutulos voidaan suodattaa tieteenalan, aikavälin, tekijän tai julkaisun mukaan ja se voidaan järjestää relevanssin, julkaisuajan, viittausmäärän tai artikkeleiden vaikuttavuuden (Sort by most influential papers) mukaisesti. Tekoälyyn pohjautuvan vaikuttavuusarvion taustalla on havainto siitä, että kaikki viittaukset artikkeleiden välillä eivät ole samalla tavalla merkityksellisiä. Vaikuttavuusarvion avulla Semantic Scholar pyrkii erottelemaan sellaiset viittaussuhteet, joissa “viitatulla julkaisulla on ollut merkittävä vaikutus viittaavaan julkaisuun”.

Kuva 4. Semantic Scholarin hakutulos järjestettynä ‘Most influential papers’ -mukaiseen järjestykseen. Listan kärjessä on artikkeli, johon on viitattu 78 kertaa ja jonka on tulkittu vaikuttaneen merkittävästi kuuteen siihen viittaavaan artikkeliin.

Kirjautuneelle käyttäjälle tarjotaan mahdollisuutta tietueiden tallentamiseen omiin kansioihin. Tallentamisen jälkeen käyttäjän ns. Research Dashboardille ilmestyy ehdotuksia käyttäjän tallentamien artikkelien kanssa samankaltaisista artikkeleista. Tallentamalla ehdotetuista artikkeleista itselle sopivat ja toisaalta merkitsemällä epäsopivat artikkelit epärelevanteiksi käyttäjä antaa Semantic Scholarille mahdollisuuden tuottaa jälleen uusi suosituslista. Ideana on, että tekoälyn tuottama arvio relevanteista artikkeleista tarkentuisi tällä tavalla käyttäjän tekemien arvioiden pohjalta.

Miten hyvin Semantic Scholarin tekoälyyn perustuvat ominaisuudet lopulta toimivat? Nopeasti katsottuna lyhyitä yhden lauseen tiivistelmiä kyllä generoituu, hakutulos on mahdollista järjestää Highly influential citations -logiikalla, artikkelisuosituksia ja tieteenalakategorisointeja syntyy, mutta kuinka tarkkaa, luotettavaa ja hyödyllistä tekoälyllä aikaansaatu tieto on? Kattavan arvion esittämiseen tämän artikkelin kirjoittajien käyttökokemus ei riitä, mutta selvää on, että aina ei kaikki mene ihan kohdilleen.

Kuluvana vuonna julkaistussa artikkelissa Dardas et al. tarkastelivat Semantic Scholarin Highly influential citations -toiminnon (HIC) onnistumista yhteensä 618 artikkelin yli 9000 viittaustiedon osalta. Kriittinen näkemys on kiteytetty artikkelin alaotsikkoon: “The Quest for Refined Measures Remains Illusive.” Semantic Scholarin sivuilla todetaan HIC-arvion perustuvan pitkälti viittaavien artikkeleiden kokoteksteihin, ja koska Semantic Scholarilla ei ole kaikissa tapauksissa pääsyä artikkeleiden kokoteksteihin, tulosten myönnetään jäävän toisinaan heikonlaisiksi.

Kenelle Semantic Scholaria voisi suositella amk-ympäristössä? Perustutkinto-opiskelijalle, joka odottaa löytävänsä kaiken tarvitsemansa yhdellä haulla suoraan ensimmäiseltä hakutulossivulta, kannattanee ennemmin tarjota Google Scholaria, PubMedia tai oman korkeakoulun Finnan artikkelihakua kuin Semantic Scholaria. Uskaltaisimme väittää, että GS:n ensimmäiset 10 hakutulosta keskimäärin päihittävät SS:n vastaavat. Semantic Scholar on parhaimmillaan sellaisten käyttäjien käsissä, joilla on kiinnostusta suodattaa ja järjestää hakutulosta ja tallentaa artikkeleita uusien artikkelisuositusten saamiseksi. Voi olla, että tämä tarkoittaa lähinnä kirjaston tietoasiantuntijoita ja joitain yksittäisiä hakupalveluista tai oman tutkijaprofiilin näkymisestä kiinnostuneita tutkijoita.

Artikkeleihin pääsy

Tärkeä seikka on myös korkeakoululle hankittujen artikkeleihin pääsy. Semantic Scholar tarjoaa linkkejä sekä vapaasti saatavissa oleviin että kustantajien sivuilta ostettaviin artikkeleihin. Hakutulos voidaan rajata vain vapaasti saatavissa oleviin artikkeleihin, mutta tällöin hakutuloksesta katoavat korkeakoululle lisensoitu sisältö. Maksullisen LibKey-palvelun liittäminen Semantic Scholariin on periaatteessa mahdollista, mutta se edellyttäisi korkeakoulun SSO-kirjautumisen integrointia palveluun.

Keenious – opiskelijan työkalu

Keenious on samannimisen Norjassa vuonna 2018 perustetun yrityksen tuote. Sitä on päässyt käyttämään vielä alkuvuonna 2023 ilmaiseksi, mutta on epäselvää, kuinka kauan tämä mahdollisuus on voimassa. Keeniousta myydään korkeakouluille FTE-lukuun perustuvalla hinnoittelulla.

Keeniouksen löytämät artikkelit ja artikkeleiden välinen viittaustieto on peräisin OpenAlexista, avoimesti hyödynnettävästä tutkimusjulkaisujen tietokannasta. OpenAlex kattoi vuonna 2022 tiedot yli 209 miljoonasta tieteellisestä julkaisusta (Priem et al. 2022). Haku- ja viittausindeksin koko on siis samaa luokkaa kuin Semantic Scholarilla.

Keenious on työkalu, joka etsii sille syötetyn valmiin artikkelin tai vaikkapa keskeneräisen tekstipätkän pohjalta samanaiheisia artikkeleita. Lisäksi Keenious tuottaa listan aiheista, joihin se tulkitsee sille syötetyn tekstin liittyvän.

Keeniouksen käyttö on helppoa, kunhan vain käyttäjällä on jokin teksti, jonka pohjalta artikkeleita lähdetään hakemaan. Ylärajaa tekstin pituudella ei ole. Jos lähdeteksti on kovin lyhyt, kuten esimerkiksi viiden sanan mittainen tutkimuskysymys, Keenious pyytää lisäämään tekstiä paremman tuloksen aikaansaamiseksi. Muutamalla hakusanalla operointikin on kuitenkin mahdollista.

Lähdetekstin voi syöttää palveluun joko sellaisenaan tai lataamalla pdf:n tai antamalla artikkeliin liittyvän verkko-osoitteen. Keeniouksen lisäosan voi myös ladata Google Docsiin tai MS Wordiin, jolloin artikkelisuosituksia voi hakea suoraan tekstinkäsittelyohjelmassa avoinna olevaan tekstiin tai valittuun tekstinosaan liittyen.

Lähdetekstin syöttämisen jälkeen käyttäjälle tarjotaan lista samanaiheisista artikkeleista. Listassa näkyy artikkeleiden otsikon lisäksi tiedot artikkeleiden tekijästä, julkaisusta, julkaisuvuodesta ja viittausten määrästä. Artikkeleiden tiivistelmät ovat yhden klikkauksen takana. Samalla aukeaa uusi lista artikkeleista, jotka Keenious tulkitsee samankaltaisiksi tiivistelmänäkymään avatun artikkelin kanssa. Artikkeleita voi filtteröidä julkaisuvuoden, viittausten lukumäärän tai aihesanojen mukaisesti.

Kirjautuneena käyttäjänä artikkeleita voi merkitä tähdellä suosikkilistaan, mutta ainakaan maksuttomassa versiossa ei ole samanlaista toimintoa kuin Semantic Scholarissa, joka osaisi hakea valittujen artikkelien perusteella uuden artikkelilistauksen.

Artikkelilistausten lisäksi Keenious pyrkii kielimallinsa avulla hahmottamaan syötettyyn tekstiin liittyviä aiheita. Kullekin löydetylle aiheelle Keenious antaa myös lyhyen käsitemäärittelyn. Käsitemäärittelyt näyttäisivät tulevan suoraan englanninkielisestä Wikipediasta, vaikka sitä ei erikseen määrittelyiden yhteydessä mainitakaan. Aiheiden pohjalta hakua voi jatkojalostaa ottamalla tietyt aiheet mukaan tai sulkemalla ne pois. Valintojen jälkeen Keenious tarjoaa uuden valintojen pohjalta täsmennetyn hakutuloksen.

Keenioukselle voi syöttää myös suomenkielisen lähdetekstin. Ei-englanninkieliset tekstit konekäännetään ensin englanniksi, jonka jälkeen varsinainen haku tapahtuu. Suomen kielellä tehty haku ei siis tuota hakulistaan suomenkielisiä artikkeleita, vaan tuloksena on samat kansainväliset artikkelit kuin englanniksi haettaessa.

Artikkeleihin pääsy ja suosittelu

Artikkeleiden kokotekstien löytämiseksi Keeniouksen listaamien artikkeleiden tietojen yhteyteen muodostuu linkkejä otsikoiden DOI, PDF ja LINKS alle. PDF-linkit vievät vapaasti saataviin artikkeleihin. DOI- ja LINKS-linkit saattavat avata kokotekstin tai sitten niistä päätyy kustantajan sivulle ja siellä odottavaan maksumuuriin. Em. linkkien yläpuolella tarjotaan kunkin artikkelin kohdalla vielä Access Full-Text -nappula. Jos käyttäjä on kirjautunut Keenioukseen ja määritellyt omissa tiedoissaan organisaation link resolver -osoitteen (SFX tms.), Access Full-Text -nappula pyrkii rakentamaan linkin artikkeliin tämän tiedon pohjalta. Mikäli link resolver -tietoa ei ole erikseen määritelty, Access Full-Text -nappula vie LibKey-palveluun, joka omalla organisaatiolla joko on käytössä tai sitten ei. Testissämme Laurean SFX-osoitteen antaminen ei luonut toimivia linkkejä. LibKey-linkitys sen sijaan toimi mainiosti.

Keenious miellyttää helppokäyttöisyydellään ja tietynlaisella yksinkertaisuudellaan. Pintapuolisella testauksella se kykeni minimaallisella vaivannäöllä löytämään lähdetekstin kanssa samankaltaisia artikkeleita aivan kelvollisesti. Keenious on tutkimistamme työkaluista selkeästi eniten opiskelijoille suunnattu väline, mikä näkyy mm. Wikipedian hyödyntämisenä käsitteiden määrittelyssä.

Tutkijoille ja esim. laajempien kirjallisuuskatsausten tekijöille Keeniouksesta voi toki myös olla hyötyä, vaikkapa oman puolivalmiin tekstin pohjalta tehtävän Keenious-tsekkauksen myötä. Toisaalta tapa, jolla Keeniouksen artikkelilistaus on ahdettu hyvin kapealle alalle sivun oikeaan reunaan, ei palvele parhaalla tavalla suurempien artikkelimäärien selaamista.

Kuva 5. Keeniuksen hakutuloslista ja haun suodatustyökalut sijaitsevat kapeana sarakkeena sivun oikeassa laidassa.

Elicit – kiinnostava tutkimustyökalu

Elicit on tutkimustyökalu, jota kehittää yhdysvaltalainen voittoa tavoittelematon ja lahjoitusvaroin toimiva Ought -tutkimuslaboratorio. Palvelu on vapaasti käytettävissä, mutta käyttö edellyttää kirjautumista.

Pelkän artikkelitiedonhaun lisäksi Elicit tarjoaa runsaasti myös muita apuvälineitä akateemiseen työskentelyyn. Elicit auttaa mm. tutkimuskysymyksen ideoinnissa ja muokkaamisessa sekä artikkelien analysoinnissa ja tiivistelmien luonnissa. Näiden aikaansaamiseksi Elicit käyttää mm. GPT-3 -kielimallia.

Elicitin artikkelihaun taustalla on Semantic Scholarin indeksi. Elicitin hakusivulla sen mainitaan etsivän artikkeleita 175 miljoonan artikkelin joukosta, joka on yli 30 miljoonaa vähemmän kuin Semantic Scholarin omilla sivuillaan ilmoittama luku. Joko Elicitin hakusivulle on jäänyt vanhentunut tieto artikkelikorpuksen koosta tai sitten Semantic Scholarin korpus ei ole kokonaisuudessaan käytössä.

Elicitin hakusivu on pelkistetty hakulaatikko. Hakulause ohjataan muotoilemaan luonnollisen kielen kysymyslauseena. Kun hakulaatikkoon kirjoittaa sanoja, esille tulee Brainstorming-nappula, josta klikkaamalla saa näkyviin viisi tekoälyllä luotua vaihtoehtoista tutkimuskysymystä tai näkökulmaa haettuun aiheeseen. Hakuun voi edetä valitsemalla joko oman muotoilunsa tai jonkin ehdotetuista hakulauseista.

Kuva 6. Braingstorming-toiminto luo vaihtoehtoisia tutkimuskysymyksiä.

Jos hakulauseen esittää suomeksi ja siirtyy suoraan hakuun, tuloksena on lista suomeksi kirjoitetuista artikkelista. Jos suomenkielisen tekstiin käyttää brainstorming-toimintoa, saa esille viisi englanninkielistä vaihtoehtoista tutkimuskysymystä ja sitä kautta hakutulokseen tulee englanninkielisiä artikkeleita.

Hakutulossivulla Elicit ei ilmoita perinteisistä hakupalveluista poiketen hakutulosten määrää, vaan näyttää seitsemän relevanteinta artikkelia. Show more -nappia klikkaamalla saa listan jatkoksi näkyville aina seitsemän artikkelia lisää. Artikkelien perustiedot esitetään omassa sarakkeessaan. Perustietojen oikealla puolella on toinen sarake, johon on generoitunut yhden lauseen mittainen tiivistelmän yhteenveto (abstract summary) kustakin artikkelista. Artikkelien perustietojen vasemmalla puolella on puolestaan sarake, johon generoituu lyhyt yhteenveto tai eräänlainen minikirjallisuuskatsaus neljän ensimmäisen artikkelin sisällöstä.

Tietojen esittäminen sarakkeissa on Elicitin erikoisuus. Sarakkeita on mahdollista lisätä näkyville vaikka toistakymmentä. Valittavana on erilaisia muuttujia, kuten tutkimukseen osallistuneiden määrä, ikäryhmä, maantieteellinen alue, rahoittajataho, mitatut tulokset, tutkimuksen rajoitteet jne. Oletuksena näytettävän yhden lauseen mittaisen tiivistelmän yhteenvedon lisäksi valittavana on myös hieman laajempi yksityiskohtainen tiivistelmän yhteenveto (‘detailed abstract summary’), jonka lukemista on helpotettu tummentamalla yhteenvedon keskeiset kohdat. Lopputulos saattaa näyttää vaikka tältä:

Kuva 7. Elicitin hakutulossivu. Vasemmassa reunassa on tekoälyn tekemä yhteenveto listan neljästä ensimmäisestä artikkelista. Artikkelin perustietosarakkeen oikealla puolella olevien sarakkeiden tiedot on kaivettu esiin tekoälyllä artikkelien tiivistelmistä tai kokoteksteistä.

Hakutuloksen voi järjestää aktivoitujen sarakkeiden tietojen, julkaisuvuoden tai viittausten määrän mukaan. On tärkeää huomata, että sorttaus toteutuu vain näkyville haettujen artikkeleiden osalta. Haun rajaus on mahdollista julkaisuvuoden, tutkimustyypin (randomized controlled trial, review, systematic review, meta-analysis, longitudinal) mukaisesti. Rajauksen voi tehdä myös kirjoittamalla sanoja, jotka joko löytyvät tai eivät saa löytyä artikkelin tiivistelmästä.

Relevantit artikkelit on mahdollista merkitä tähdellä, jonka jälkeen sivun alareunaan ilmestyy nappi, jota klikkaamalla voi hakea samankaltaisia artikkeleita tähdellä merkittyjen kanssa.

Elicitin analyysityökaluja voi käyttää myös ilman, että hakee artikkeleita palvelun sisällä. Tämä tapahtuu haun aloitussivulla raahaamalla pdf-muotoisia artikkeleita niille osoitettuun kenttään. Tämän jälkeen kyseisistä artikkeleista voi hakea omiin sarakkeisiinsa tiedot tutkimukseen osallistuneiden määrästä, rahoittajatahosta, mitatuista tuloksista, tutkimuksen rajoitteista jne. Palveluun raahattujen artikkelien avulla voi myös pyytää Elicitiä hakemaan lisää samanlaisia artikkeleita.

Omassa testissämme neljän artikkelin raahaaminen ei tuottanut vasempaan sarakkeeseen lyhyttä yhteenvetoa / minikirjallisuuskatsausta, mutta muuten eri sarakkeisiin generoitui aivan validin oloista sisältöä. Ennestään tuttujen artikkelien käyttäminen on kätevä tapa testata Elicitin onnistumista sisältöjen analysoinnissa. Toisaalta palvelu ei kerro, jäävätkö artikkelit Elicitin palvelimelle. Ainakaan niihin palaaminen ei vaikuttaisi olevan myöhemmin mahdollista.

Elicitin FAQ-osiossa kerrotaan palvelun toimivuuden rajoituksista. Aivan samoin kuin muidenkin generatiivisten tekoälyjen kohdalla, on täysin mahdollista, että myös Elicit tuottaa virheellistä tietoa, kuten esim. väärin painottuneita yhteenvetoja. Palvelun oma neuvo on, että sen generoimaan tietoon tulisi suhtautua 80–90 prosentin luottamuksella. Toisena rajoituksena todetaan, että toistaiseksi palvelu ei toimi yhtä hyvin kaikilla tieteenaloilla. Elicitin kehittämisessä painotus on toistaiseksi ollut empiirisissä tutkimuksissa, kuten satunnaistetuissa kontrolloiduissa tutkimuksissa yhteiskuntatieteiden ja biolääketieteen aloilla.

Artikkeliin pääsy ja suosittelu

Kenelle Elicitiä voi suositella? Sen kaikkien ominaisuuksien monipuolinen käyttö edellyttää palvelun käyttöön perehtymistä kohtalaisen paljon, eikä kirjautumispakkokaan ole omiaan alentaamaan tutustumiskynnystä. Toisaalta helppokäyttöisen brainstorming-toiminnon voisi ajatella olevan käyttökelpoinen työkalu kenelle tahansa ammattikorkeakoulun perustutkinto-opiskelijasta tutkijaan saakka.

Artikkelihaun näkökulmasta tärkein kysymys on, löytääkö Elicit relevantteja artikkeleita paremmin tai helpommin kuin esim. Google Scholar. Sikäli kun haussa käytetään täsmälleen samaa hakulausetta, eikä voimia riitä haun jälkeen tehtävään rajaamiseen ja uudelleenhakuun, vaaka kääntyy GS:n suuntaan. Toisaalta brainstorming-työkalun avulla Elicit saattaa joissakin tapauksissa onnistua ohjaamaan tiedonhakijan paremmille apajille ilman varsinaista vaivannäköä. Tutkijoille ja empiirisiin tutkimuksiin painottuvien kirjallisuuskatsausten tekijöille Elicit tarjoaa paljon sellaista, mitä monesta muusta hakutyökalusta ei löydy. Akateemisen tiedonhaun kehityksestä kiinnostuneille Elicit on melkeinpä pakollinen tutustumiskohde.

Litmaps – kirjallisuudesta karttoja

Litmaps on tekoälyä hyödyntävä työkalu, joka luo interaktiivisia visuaalisia kirjallisuuskarttoja: artikkelikokoelmia, joiden suhteet esitetään spatiaalisesti. Kirjallisuuskartoitus on tapa löytää tieteellisiä artikkeleita tutkimalla julkaisujen välisiä yhteyksiä.

Litmapsin perustivat vuonna 2016 Kyle Webster ja Axton Pitt. Kyle oli molekyylibiologian tohtorikoulutettava ja Axton neurotieteilijä, josta tuli ohjelmistokehittäjä. Molemmat olivat huomanneet tutkijoiden ja opiskelijoiden yleisesti kokeman ongelman: tieteellisen kirjallisuuden navigointi on työlästä. He päättivät perustaa yrityksen ratkaisemaan tämän ongelman uudella tavalla.

Litmapsin idea on, että löydettyämme yhden hyvän artikkelin, voimme tehdä hakuja sen perusteella. Palvelu luo tuloksen viittausverkoston avulla, ei vain hakusanojen tai viittausmäärien perusteella. Samankaltaiset artikkelit liittyvät usein yhteen viittausten, kirjoittajien, rahoittajien, avainsanojen ja muiden metatietojen perusteella. Näitä yhteyksiä voidaan tutkia manuaalisesti Scopuksen kaltaisessa tietokannassa tai käyttämällä ilmaisia selainpohjaisia työkaluja, kuten Connected Papers, LitMaps ja Open Knowledge Maps. Näistä jälkimmäinen on sikäli mielenkiintoinen, että se hakee avointa sisältöä joko BASE julkaisuarkistosta tai PubMedistä.

Litmaps sisältää omien sanojensa mukaan yli 200 miljoonaa artikkelia. Litmaps toimii avoimen metatiedon avulla. Tietojen tarjoajina ovat Crossref, Semantic Scholar ja OpenAlex. Lisäksi käytetään seuraavien palveluiden tietoja: PubMed, arXiv, bioRxiv, medRxiv, Microsoft Academic Graph.

Kuinka lähteä liikkeelle?

Aloita kirjoittamalla hakukenttään DOI, Pubmed ID hakusana tai kirjoittajan nimi. Litmaps luo joukon suositeltuja artikkeleita. Valitse luettelosta artikkeli (tai useita artikkeleita) luodaksesi Litmapin, joka käyttää valitsemaasi artikkelia "siemenenä".

Käytin siemenartikkelina Ramaswamyn ja Prahaladin kuuluisaa artikkelia Co-creation experiences: The next practise in value creation. Itselläni kesti hetken ymmärtää, että hakiessani artikkelin DOI:lla https://doi.org/10.1002/dir.20015 Litmaps hakee DOIn varsinaisella osalla eli numerosarjalla 10.1002/dir.20015 ei koko linkillä.

Kuva 8. Litmapsin hakusivu on hyvin googlemainen.

Litmaps näyttää siemenartikkeliin liittyviä viittauksia ja artikkelien väliset suhteita niitä yhdistävien viivojen muodossa, jotka jäljittävät viittaukset puolestasi. Kartassa siemenartikkeli on merkitty sinisellä. Kuvassa näkyvät artikkelit ovat niitä, jotka ovat viitanneet valittuun siemenartikkeliin, mutta ovat itsekin saaneet huomattavia määriä viittauksia. Käyttäjä voi liikkua kartan sisällä.

Kuva 9. Litmaps-haun ensimmäinen tulossivu, joka syntyy siemenartikkelin tärkeimmistä viittauksista.

Oletusarvoisesti viimeisimmät artikkelit näkyvät kuvaajan oikealla puolella ja eniten siteeratut artikkelit ylhäällä, joten viimeisimmät suositut artikkelit näkyvät oikeassa yläkulmassa.

Vedä artikkeleita hiirelläsi niin, että ne kertovat sinulle mieluisan tarinan. Voit luoda ryhmittelyjä tai artikkelien osajoukkoja eri väreillä, jotka auttavat kertomaan tutkimustarinasi.

Sinisellä näkyvän Search Further in Discover -linkin toiminnolla löytyy huomattavasti laajempi verkosto artikkeleita, jotka ovat viitanneet siemenartikkelin. Kuvassa käyttöliittymän yläosassa näkyvä Results tarkoittaa Search Further in Discover -toiminnolla löydettyjä uusia artikkeleita, Input Articles ovat ennen toiminnon käyttöä saatuja, niin sanotusti alkuperäisiä ja sillä tavalla siemenartikkeleita.

Voit tuoda kokoelman viitteidenhallintajärjestelmästä aloittaaksesi lähteiden hakemisen. Litmaps tukee BibTeX- ja RIS-tiedostoja ja voit Litmapsin avulla lisätä artikkeleita käyttämääsi viitteidenhallintajärjestelmään. Voit jopa aloittaa haun jo olemassa olevasta Litmapista.

Kun olet luonut yhden peruskirjallisuuskartan siemenartikkelin avulla, voit tutkia sitä ympäröivää tilaa ja etsiä siihen liittyviä artikkeleita. Voit liikkua kartassa tarkastella artikkeleiden suhteita. Voit myös lisätä hakuusi lisää artikkeleita, mikä tarkentaa Litmapsin antamia suosituksia.

Kenelle voi suositella ja kuinka saada artikkelit auki?

Litmaps on Google Scholarin käyttöön tottuneelle vaihtoehtoinen tavan hakea ja löytää omaan aiheeseen artikkeleita. Se tarjoaa mielenkiintoisen sananmukaisesti tietomaiseman, jota tarkastella ja jossa liikkua. Usein opiskelijalla on yksi tai muutama hyvä artikkeli, josta lähteä liikkeelle. Tällöin Litmaps voi olla hyvä keino päästä eteenpäin.

Litmapsia voi käyttää myös tiedonhankinnan opetuksessa havainnollistamaan, mitä viittauksilla tarkoitetaan. Sovellus on kiehtova visuaalisuudellaan.

Palvelun heikkous on se, että linkit artikkeleihin vievät suoraan tietokantojen etusivuille. Opiskelijan täytyy tämän lisäksi osata hakea artikkelit käyttöön esimerkiksi Google Scholarin tai Finnan Artikkelihaun avulla. Reitti kokotekstin äärelle suorenee, jos korkeakoululla on käytössä LibKey-palvelu, ja opiskelija on ymmärtänyt asentaa LibKey Nomad -lisäosan selaimeensa. Tätä kaikilla korkeakouluilla ei toistaiseksi ole.

Toinen palvelun heikkous on ilmaisversion käytön rajallisuus. Litmaps Free rajoittaa syötettävien artikkelien määrän 20:een artikkeliin kuussa, kun taas Litmaps Pro antaa rajoittamattoman hakuoikeuden. Litmaps Free -palvelussa sinulla voi olla enintään 100 tallennettua artikkelia yhdellä kartalla. Litmaps Pro -versiossa artikkeleiden tai karttojen määrää ei ole rajoitettu. Connected papers luo myös kirjallisuuskarttoja, mutta sen ilmaisversiossa on vielä tiukemmat käyttörajoitukset.

Research Rabbit aka Spotify for papers

Research Rabbit on innovatiivinen viittausten perusteella toimiva tutkimustiedonkartoitustyökalu, jonka avulla saa nopean käsityksen haetun aihepiirin ajankohtaisista tutkimustuloksista. Palvelu vaatii kirjautumisen ja on käyttäjälleen maksuton. Research Rabbitin haku kohdistuu Semantic Scholarin ja PubMedin tarjoamiin sisältöihin. Konsepti on yksinkertainen: aloitetaan yhdellä tai useammalla artikkelilla, sovellus löytää lisää aiheeseen liittyviä artikkeleita.

Tiedonhaku Research Rabbitilla alkaa kirjautumalla sisään ja luomalla kategoria/kategorioita tutkimusaiheelle. Artikkeleita voi hakea otsikolla, DOI-/PMID-tunnisteella tai hakusanoilla. Haun voi kohdistaa joko PubMedin sisältöön tai Semantic Scholarin laajempiin sisältökokonaisuuksiin. Hakutulokseen tulostuu lista artikkeleista, joiden relevanttiutta voi arvioida artikkelin viitetietojen ja tiivistelmän perusteella. Relevanteiksi arvioimansa artikkelit pääsee liittämään haluamaansa kategoriaan.

Kuva 11. Research Rabbitin haku.

Kategoriaan kannattaa lisätä tutkimuskysymyksen kannalta keskeisen tuntuisia artikkeleita. Kategoriaan voi lisätä vain yhden artikkelin tai useita. Research Rabbit käyttää kategoriaan valittuja artikkeleita apunaan löytämään niihin liittyviä artikkeleita. Saat ehdotuksia samankaltaisista (perustuu viittauksiin), edeltävistä ja seuraavista tutkimusartikkeleista, sekä tekijöiden ja linkitysten mukaan. Työkalu näyttää artikkelit visuaalisena karttana. Visuaalista karttaa selaamalla pystyy hahmottamaa artikkeleiden ja kirjoittajien välisiä viittaussuhteita.

Kuva 12. Research Rabbit luo kirjallisuudesta visualisointeja.

Kuva 13. Research Rabbitin luomaa visuaalisuutta viitteistä.

Research Rabbitilla on myös yhteys viitteidenhallintajärjestelmä Zoteroon. Zoteroon luotuja viitelistauksia voi tuoda Research Rabbitiin ja vastaavasti Research Rabbitiin luotuja artikkelikokoelmia saa vietyä Zoteroon, tutustu Research Rabbitin ohjeistukseen asiasta. Research Rabbitista saa myös jaettua omia artikkelikokoelmia.

Kuva 14. Research Rabbitin tulokset voi viedä viitteidenhallintajärjestelmä Zoteroon.

Kuinka ohjata ja opettaa työkaluja?

Korkeakouluissa on keskusteltu tänä keväänä siitä, kuinka kielimalleihin perustuvilla tekoälytyökaluilla suoraan tuotettuun testiin tulee suhtautua. Lähtökohta on sama kuin aiemminkin: lähteinä tulee käyttää primäärilähteitä, lähteet tulee tarkistaa ja kielimalleja voi käyttää lähinnä tekstityökaluina ja aiheen ideoinnissa.

Kuinka jatkossa voisimme opettaa ja ohjata tiedonhakua? Olemme pitkään ohjanneet seuraavia tiedonhaun käyttöliittymiä opiskelijoille:

Kuva 15. Laurean tiedonhaun käyttöliittymien kokonaisuus.

Jatkossa paketti varmasti muuttuu moninaisemmaksi. Ehkä kokonaiskuvaus voisi tulevaisuudessa olla jotain tämänkaltaista:

Kuva 16. Miten jatkossa ohjataan tiedonhaun työkaluja? Tässä mahdollinen visio tulevaisuuteen.

Olemme aloittaneet opiskelijoiden kanssa henkilökohtaisissa ohjauksissa akateemisten tekoälytyökalujen käytön. Usein ne tarjoavat toisenlaista näkökulmaa opiskelijalle, jos perinteiset käyttöliittymät eivät tunnu tuottavan tulosta.

Ongelmana jatkossa varmasti on, mistä päästä lähdetään opiskelijan kanssa liikkeelle. Ohjauksessa ja opetuksessa täytyy pystyä nopeasti luoda jonkinlainen yleiskuva siitä, miten paljon opiskelijat pystyvät ottamaan vastaan tietoa erilaisista käyttöliittymistä ja tiedonhaun mahdollisuuksista.

Toinen ongelma artikkelihaun työkaluissa on se, että ne eivät tarjoa suoraa SFX-linkkiä artikkeliin Google Scholarin tapaan. Opiskelijan täytyy osata työkalun lisäksi käyttää rinnalla Google Scholaria tai Finnan artikkelihakua sujuvasti. Tämän käyttöliittymäkokonaisuuden välittäminen voi osalle ryhmistä olla haaste. Maksullisen LibKey-palvelun käyttöönotto auttaa osittain tämän ongelman kanssa, mutta kaikilla korkeakouluilla LibKeytä ei ole vielä.

Tähän mennessä tehdyt kokeilut henkilökohtaisissa ohjauksissa ja työpajoissa ovat olleet lupaavia. Opiskelijat ja henkilökunta ovat eri tavalla innostuneita uusista työkaluista ja keskustelusta ChatGPT:n käytön rajoista kuin perinteisten kirjastokäyttöliittymien esittelystä. Uudet artikkelihaun työkalut eivät ainakaan vielä tällä hetkellä ole syrjäyttämässä kokonaan kirjaston opetuksessa ja ohjauksessa tiedonhankinnan nykyisiä työkaluja, mutta vakiintuneita käytäntöjä kannattaa niiden kautta lähteä ravistelemaan. Kannattaa seurata opiskelijoiden ja henkilökunnan arjen aitoja tiedonhankinnan työtapoja.

Ohjevideoita:

Elicitin Youtube-kanava: https://www.youtube.com/oughtinc
Semantic Scholarin ohjevideoita: https://www.semanticscholar.org/product/tutorials#Video-Search
Keenious Product video: https://youtu.be/UlXiiQdbT0E
A Total Beginners Guide to Research Rabbit: https://youtu.be/7yTs-jZygE0
Introduction to LitMaps: https://youtu.be/QTIZxc3BaGg

Lähteet

Dardas, L.A.; Sallam, M.; Woodward, A.; Sweis, N.; Sweis, N.; Sawair, F.A. (2023). Evaluating Research Impact Based on Semantic Scholar Highly Influential Citations, Total Citations, and Altmetric Attention Scores: The Quest for Refined Measures Remains Illusive. Publications 2023, 11, 5. https://doi.org/10.3390/publications11010005
Hannousse, A. (2021). Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role. IET Soft, 15: 126-146. https://doi.org/10.1049/sfw2.12011
Feldman, Sergey (2020). Building a Better Search Engine for Semantic Scholar. AI2 Blog. https://blog.allenai.org/building-a-better-search-engine-for-semantic-scholar-ea23a0b661e7 (luettu 11.5.2023).
Priem, J., Piwowar, H., & Orr, R. (2022). OpenAlex: A fully-open index of scholarly works, authors, venues, institutions, and concepts. ArXiv. https://arxiv.org/abs/2205.01833
Tay, A. (2021). A new literature mapping tool - ResearchRabbit. Singapore Management University (SMU). https://library.smu.edu.sg/topics-insights/new-literature-mapping-tool-researchrabbit
Tay, A. (2021). ResearchRabbit is out of beta - my review of this new literature mapping tool. Academic Librarians and Open Access. https://medium.com/a-academic-librarians-thoughts-on-open-access/researchrabbit-is-outof-beta-my-review-of-this-new-literature-mapping-tool-3c593d061c63