Theseus-opinnäytetöiden sisällön tarkastelu yhteissana-analyysillä

16.04.2018

Nick Youngson CC BY-SA 3.0 Alpha Stock Images

Tuli aika aktivoitua taka-alalla olleen opiskeluprojektin kanssa ja valita aihe informaatiotutkimuksen kandidaattiseminaariin Åbo Akademille. En lähtenyt merta edemmäs kalaan ja aloin miettimään, saisiko oman korkeakoulun Theseus-kokoelmista ainesta pienimuotoiseen tutkimusprojektin. Erityisesti minua kiinnosti se, millaisia bibliometrisiä menetelmiä voisi soveltaa Theseuksessa olevien opinnäytetöiden metadatan tarkasteluun. Lopulta valitsin seminaarityöhöni laadullisen bibliometriikan menetelmän nimeltä yhteissana-analyysi.

 

Yhteissana-analyysiä on käytetty erityisesti tutkittaessa tieteessä tapahtuneita muutoksia ja tutkimusverkostojen syntymistä (Forsman, 61). Menetelmä on syntynyt Ranskassa 1980-luvulla. Yhteissana-analyysissä rakennetaan termeistä kognitiivisia verkostoja sen perusteella, miten eri sanat esiintyvät yhdessä esimerkiksi julkaisujen otsikoissa, tiivistelmissä, avainsanoissa tai tekstissä. Tausta-ajatuksena on, että kuvailutermit ja niiden yleisyys heijastavat tekstien sisältöä ja että tarkastelemalla sanojen esiintymistä yhdessä voidaan tehdä havaintoja tutkimuksen rakenteista (Kärki & Kortelainen 1998, 31; Persson 1991, 51-52).

Menetelmää on pääasiassa käytetty tieteellisen aineiston kanssa, joten opinnäytetyöt tarjosivat mahdollisuuden tarkastella ammatillisempaa aineistoa. Tausta-ajatukseni oli, että opinnäytetöiden sisällöt heijastaisivat alan trendejä, ja että opinnäytetöiden aiheita kuvastavista asiasanoista näkisi myös muutoksen koulutusohjelman painopistealueissa. 

Tutkimusaineisto ja sen analysointi käytännössä

Tutkimusaineistoni koostui vuosina 2010-2016 Humakin Theseus-kokoelmiin tallennetuista kansalaistoiminnan ja nuorisotyön koulutusohjelman (yhteisöpedagogi) opinnäytetöistä. Tarkastelin opinnäytetöiden sisällönkuvailussa käytettyjä asiasanoja. Tällä ajanjaksolla Humakin opinnäytetöiden metatiedoissa oli vielä sekä opiskelijoiden itse määrittämät asiasanat (keywords) että informaatikoiden valitsemat YSA-asiasanat.  Opinnäytetöitä oli analyysin kohteena 880 kappaletta ja ne edustivat noin 90 prosenttia kaikista tuona ajanjaksona tehdyistä yhteisöpedagogikoulutusohjelman opinnäytetöistä. Tarkastelin aineistoa sekä kokonaisuutena että kahdessa erillisessä ajanjaksossa, 2010-2013 ja 2014-2016, jotta näkisin onko näiden ajankohtien välillä tapahtunut muutoksia opinnäytetöiden käsittelemissä aihealueissa.

Käytännön tasolla muokkasin ensin Theseus-ylläpidolta saamani Humakin Theseus-kokoelman metatiedot sisältävän excelin avain- ja asiasanakentät sopivaan muotoon. Sen jälkeen analysoin datan Bibexcel-ohjelmalla ja lopulta visualisoin tulokset Gephi-ohjelmalla. Visuaalisointeja voi tehdä monella muullakin ohjelmalla ja esimerkiksi VOSviewer olisi lopulta saattanut olla omaan tarkoitukseeni sopivampi, mutta kuulin ohjelman olemassa olosta hieman liian myöhään omaa projektiani ajatellen. Visualisointikartoissa sanojen suosituimmuutta ja niiden välisiä yhteyksiä voi tulkita esimerkiksi eri sanojen sijainnin keskeisyydestä, sanojen välisistä etäisyyksistä ja niitä yhdistävien viivojen paksuudesta (Eck & Waltman 2014, 286).
Tässä visualisoinnissa kuvataan opinnäytetöiden käytetyimpiä asiasanoja vuosina 2010-2016.

Opinnäytetöiden asiasanojen analyysi ei yllättänyt. Visualisointien keskiöstä löytyivät koulutusalan keskeiset painopistealueet kuten nuorisotyö, järjestötyö, yhteisöllisyys ja osallisuus. Laidoille reunoille sijoittui erilaisia keskeisiä, mutta kuitenkin harvemmin käytössä olevia termejä, kuten esimerkiksi usein yhdessä esiintyvät monikulttuurisuuden, kotoutumisen ja maahanmuuttajiin liittyvät asiasanat. Samat termit olivat keskeisimpien joukossa kumpanakin tarkastelemani ajanjaksoja, mutta 2014-2016 vuosien suosituimmissa asiasanoissa näkyi myös muutamia uusia termejä, kuten esimerkiksi sosiaalinen media ja sukupuolisensitiivisyys.

Eroja opiskelijoiden ja informaatikkojen tekemissä sisällönkuvailuissa

Aineistoni perusteella pystyi myös tekemään havaintoja opiskelijoiden ja koulutettujen sisällönkuvailijoiden tekemistä asiasanoista. Kuten arvata saattaa, opiskelijoiden tekemät sisällönkuvailut olivat vaihtelevan tasoisia, eivätkä kaikki olleet käyttäneet YSA-sanastoa suosituksesta huolimatta. Esimerkiksi YSAn järjestöt-sanaan viitattiin opiskelijoiden tekemissä avainsanakuvailuissa myös muodoissa yhdistykset, järjestö tai yhdistys, ja YSAn vapaaehtoistyö-termin synonyymi on vapaaehtoistoiminta. Toisaalta kontrolloidun sanaston käyttö voi hidastaa uusien ilmiöiden näkymistä kuvailussa koska usein kestää tovin, että termi pääsee sanastoon asti.

Aineistossani molemmissa kuvailuissa oli käytetty melko sama määrä termejä, informaatikot olivat käyttäneet keskimäärin viittä asiasanaa per opinnäytetyö kun taas opiskelijat käyttivät kuvailuun keskimäärin 4,7 termiä. Ammattilaisen tekemissä kuvailuissa käytettiin kuitenkin pienempää termien joukkoa: koko aineistossa informaatikot olivat käyttäneet yhteensä 1 101 eri kuvailutermiä kun taas opiskelijoiden käyttämiä eri termejä oli 1 555.

Keskeisin ero käytetyissä termeissä oli se, että informaatikot käyttivät selvästi enemmän alaan liittyviä yleistermejä. Esimerkiksi asiasana nuorisotyö esiintyi ammattilaisten sisällönkuvailuissa 217 kertaa kun taas opinnäytetöiden tekijät käyttivät termiä vain 103 kertaa. Joissain tapauksissa opiskelija oli käyttänyt ainoastaan suppeampaa alan termiä, kuten esimerkiksi koulunuorisotyö, joka saattoi myös puuttua YSAsta. On myös mahdollista, että alan yleistermi tuntui opiskelijasta niin itsestään selvältä että sen käyttö unohtui - tai ehkä informaatikko alan ulkopuolisena helpommin käyttää yleisemmän tason termiä.

Määrä

YSA-asiasana

Määrä

YSA-asiasana

238

nuoret

41

sosiaalinen vahvistaminen

217

järjestötyö

41

maahanmuuttajat

95

järjestöt

40

kehittäminen

81

osallisuus

34

syrjäytyminen

78

vapaaehtoistyö

30

vapaa-aika

67

järjestötoiminta

30

vertaistuki

55

yhteisöllisyys

30

ohjaus

52

lastensuojelu

30

nuorisotilat

50

lapset

29

hyvinvointi

43

yhteistyö

28

monikulttuurisuus

Taulukko: 20 käytetyintä YSA-asiasanaa koko aineistossa 2010-2016

Määrä

YSA-asiasana

Määrä

YSA-asiasana

126

osallisuus

32

monikulttuurisuus

103

nuorisotyö

31

yhteistyö

90

nuoret

29

vertaistuki

78

sosiaalinen vahvistaminen

28

vapaa-aika

70

yhteisöllisyys

26

vaikuttaminen

49

vapaaehtoistyö

26

sukupuolisensitiivisyys

47

kehittäminen

24

koulu

40

lastensuojelu

23

ehkäisevä päihdetyö

37

järjestötoiminta

23

hyvinvointi

33

syrjäytyminen

23

kansalaistoiminta

Taulukko: 20 opiskelijoiden eniten käyttämää avainsanaa koko aineistossa 2010-2016.

Yhteissana-analyysin mahdollisuuksia

Alkuperäinen ajatukseni uusien trendien havainnoinnista yhteissana-analyysin avulla ei täysin toiminut, sillä analyysin kohteena ollut ajanjakso oli lopulta melko lyhyt selkeiden muutosten tapahtumiseen, vaikka jonkun verran uusia termejä nousikin suosituimpien joukkoon. Lisäksi uudet nousevat kiinnostuksen kohteet eivät aina nouse kovinkaan nopeasti keskeisimpien kuvailusanojen joukkoon eivätkä täten näy tarkasteluissa, joissa keskitytään eniten käytettyihin sanoihin. Aina uusista nousevista aiheista ei myöskään heti nouse yksittäisiä paljon käytettyjä termejä.
Tässä sanaverkostokartassa näkyy Humakin suosituimpia informaatikkojen määrittämiä YSA-asiasanoja vuosilta 2014-2016.

Yhteissana-analyysin avulla on mahdollista saada kiinnostavia tuloksia eri koulutusalojen kehityksestä ja painopistealueista, mutta arkiseen käyttöön kirjastotyössä se on todennäköisesti monen kirjaston kannalta liian työläs ainakin jos menetelmä pitää opetella alusta asti. Myös visualisointien hiominen ja tulkitsemaan oppiminen vaatii työtä ja omassa seminaarityössäni pääsin tämän teeman suhteen vasta alkuun. Menetelmää olisi mahdollista käyttää myös ammattikorkeakoulujen julkaisutoiminnan tarkasteluun, eli sinänsä sen käytölle olisi paljon mahdollisuuksia.

Lähteet:

Forsman, Maria. 2016. Julkaisut ja tieteen mittaaminen: bibliometriikan käännekohtia. Tampere: Enostone.
Eck, Nees Jan van & Ludo Waltman. 2014.  ”Visualizing Bibliometric Networks”. Kirjassa Measuring Scholarly Impact, 285–320. Springer Netherlands.
Kärki, Riitta & Terttu Kortelainen. 1998. Introduktion till bibliometri. Helsingfors: Nordinfo.
Persson, Olle. 1991. Forskning i bibliometrisk belysning. Umeå: INUM.

Tietoa kirjoittajasta:

informaatikko Pirjo Kangas, Humak

 

Kommentit

Jätä kommentti