Tieteellisen tiedonhankinnan opas: Hakusanojen käyttö

Hakusanojen käyttö

Hakusanat ovat yksittäisiä sanoja tai kahden tai useamman sanan sanaliittoja eli fraaseja, joilla on vakiintunut merkitys.

Laaja hakusanavalikoima on tärkeä, koska samaa asiaa voidaan ilmaista usealla eri sanalla ja koska tietokanta hakee vain hakulaatikkoon kirjoitettua sanaa, eikä automaattisesti hae synonyymejä eikä ala- tai yläkäsitteitä. Huomaa myös, että samalla sanalla voi olla useita merkityksiä, esim. play = leikkiä, pelata, näytellä.

Tieteellisten tietokantojen hakusysteemi poikkeaa Googlesta. Google osaa hakea taivutusmuotoja ja johdoksia, jopa synonyymeja. Tieteelliset tietokannat eivät. Ne eivät myöskään herjaa kirjoitusvirheistä, joten oikeinkirjoituksen kanssa on oltava huolellinen.

Katkaisumerkki

Katkaisumerkillä haetaan katkaisumerkkiä edeltävillä kirjaimilla alkavia sanoja, jotta saadaan haettua erilaiset yhdyssanojen alkuosat, taivutusmuodot ja johdokset. Eli sanan lopusta poistetaan kirjaimia ja lisätään katkaisumerkki. Sanan katkaisu voi tuottaa myös epätoivottuja hakusanoja. 

employ* > employ, employees, employer, employment
kiusa* > kiusata, kiusaaja, kiusattujen, kiusaaminenkin, kiusaus
ohjelm* > ohjelma, ohjelmistoala, ohjelmoida, ohjelmoijien
päiväko* > päiväkotien, päiväkodeissa, päiväkotilapsille
sing* > sing, singer, singing, single, singularity, Singapore
änkyt* > änkytys, änkyttäjien, änkyttämistä.

Katkaisumerkki on yleensä tietokannoissa asteriski eli tähtimerkki, *. Katkaisumerkkiä käytettäessä haettavien kirjaimien määrä alkaa yleensä nollasta, joten sitä voi käyttää, vaikka tietokannassa ei katkaistua muotoa pitempiä sanoja olisikaan, esim. marketing*.

Lainausmerkit

Lainausmerkeillä etsitään peräkkäin esiintyviä sanoja tismalleen annetussa järjestyksessä ja kirjoitusasussa. Niitä käytetään sanaliittojen, fraasien ja julkaisujen nimien hakemiseen, esim.:

"social media"
"Publication manual of the American Psychological Association".

Useissa tietokannoissa myös lainausmerkkien sisällä voi käyttää katkaisua, esim.

"comput* think*" > "computational thinking", "computers think", "...computing: Thinkers...".

Lainausmerkit estävät erilaisten taivutusmuotojen automaattisen hakemisen esim. Oula-Finnassa ja Google Scholarissa. Esim. "sosiaalinen media" ei hae muotoa 'sosiaalisessa mediassa'. Koska näissä kahdessa tietokannassa lainausmerkkien sisällä ei voi käyttää katkaisumerkkiä, hae ilman lainausmerkkejä. 


Monet hakukoneet jättävät huomioimatta hakuun kirjoitetut prepositiot, konjunktiot yms. hyvin yleiset ns. "stop word" -sanat, joilla ei yleensä ole merkitystä hakutuloksen relevanssille. Tietokantojen ohjeista löytyy lista näistä sanoista, samoin kuin ohjeistus siitä miten tulee toimia, jos stop word on jostain syystä liitettävä hakuun esim. fraasin osana.

Kun olet löytänyt sopivat hakusanat, on aika yhdistää ne hakulauseeksi. Hakulauseen muodostamisessa käytetään Boolen operaattoreita (AND, OR, NOT), läheisyysoperaattoreita ja sulkumerkkejä.

 

Hakusanojen yhdistäminen

Hakusanojen katkaisulla saadaan mukaan sanan taivutusmuodot esim. monikko ja sijamuodot. 

Tavallisimmin käytetty katkaisumerkki on asteriski eli tähtimerkki *, joka korvaa 0…n merkkiä.

Yleensä katkaisumerkkiä käytetään sanavartalon lopussa, mutta joissakin tietokannoissa sen voi laittaa myös sanan alkuun tai keskelle.
Nykyisin jotkin tietokannat hakevat sanan eri taivutusmuotoja automaattisesti.

Korvausmerkki korvaa yleensä yhden merkin. 
Korvausmerkkiä käyttämällä saat hakuun mukaan sanojen eri kirjoitusmuodot.

Katkaisu- ja korvausmerkkien käyttö vaihtelee tietokannoittain, joten tarkista oppaista

Katkaisumerkin käyttö Scopus-tietokannassa:
Product* hakee mm.  products, production, producting, producted, productive

*behaviour* tuottaa esim. sanat neurobehaviour, biobehavioural

Korvausmerkin käyttö Scopus-tietokannassa:
organi?ation hakee organization ja organisation

 

Lainausmerkkejä käyttämällä (fraasihaku) voit hakea kahden tai useamman peräkkäisen sanan yhdistelmällä. Lainausmerkkien sisään kirjoitetut sanat esiintyvät hakutuloksissa kirjoitetussa järjestyksessä. Fraasihaussa on tietokantakohtaisia eroavaisuuksia, jotka voi tarkistaa tietokannan pikaoppaasta.  

 

Fraasihaku lainausmerkkien avulla: "plastic waste"

Haettaessa ilman lainausmerkkejä hakusanoja haetaan tietokannassa yksittäin AND-operaatiolla. Tällöin hakusanat voivat sijaita kaukana toisistaan, joten hakutuloksiin voi tulla tarpeetonta aineistoa.

litter plastic

 

Hakusanojen ja -lausekkeiden yhdistämiseen käytetään yleensä Boolen operaattoreita OR, AND ja NOT.

Joissakin tietokannoissa voidaan käyttää myös läheisyysoperaattoreita

Hakusanat katkaisumerkkeineen ja niitä yhdistävät operaattorit muodostavat hakulauseen, jonka esittämistapa vaihtelee tietokannoittain. Käytettävien operaattoreiden lisäksi hakusanojen ja -lausekkeiden yhdistämiseen vaikuttaa operaattorien suoritusjärjestys tietokannassa sekä sulkeiden käyttö. Operaattorit ja niiden toiminta kannattaa tarkistaa oppaista.