Tieteellisen tiedonhankinnan opas: Hakusanojen käyttö

Hakusanojen käyttö

Hakusanat ovat yksittäisiä sanoja tai kahden tai useamman sanan sanaliittoja eli fraaseja, joilla on vakiintunut merkitys.

Tieteellisten tietokantojen hakusysteemi poikkeaa Googlesta. Google osaa hakea taivutusmuotoja ja johdoksia, jopa synonyymeja. Monet tieteelliset tietokannat eivät. Ne eivät myöskään herjaa kirjoitusvirheistä, joten oikeinkirjoituksen kanssa on oltava huolellinen.

 

Katkaisumerkki

Katkaisumerkillä haetaan katkaisumerkkiä edeltävillä kirjaimilla alkavia sanoja, jotta saadaan haettua erilaiset yhdyssanojen alkuosat, taivutusmuodot ja johdokset. Eli sanan lopusta poistetaan kirjaimia ja lisätään katkaisumerkki. 

Katkaisumerkki on yleensä tietokannoissa asteriski eli tähtimerkki, *.

econom* > economy, economics, economically, econometrics...
employ* > employ, employees, employer, employment...
kiusa* > kiusata, kiusaaja, kiusattujen, kiusaaminenkin, kiusaus...
work* > work, workers, working, workplace...
änkyt* > änkytys, änkyttäjien, änkyttämistä...

Sanan katkaisu voi tuottaa myös epätoivottuja hakusanoja. Tällaisessa tilanteessa voi ottaa käyttöön OR-operaattorin. Lue lisää OR-operaattorin käytöstä

sing* > sing, singer, singing, single, singularity, Singapore

Tietokanta ei hae hakusanaa yhdyssanan loppuosana, esim. hakusana game ei löydä sanaa videogame. Tällaisessa tilanteessa voi ottaa käyttöön OR-operaattorin. Lue lisää OR-operaattorin käytöstä

Katkaisumerkkiä käytettäessä haettavien kirjaimien määrä alkaa yleensä nollasta, joten sitä voi käyttää, vaikka tietokannassa ei katkaistua muotoa pitempiä sanoja olisikaan, esim. marketing*.

 

Lainausmerkit

Lainausmerkeillä etsitään peräkkäin esiintyviä sanoja tismalleen annetussa järjestyksessä ja kirjoitusasussa.

Niitä käytetään, kun halutaan hakea

Useissa tietokannoissa myös lainausmerkkien sisällä voi käyttää katkaisua, esim.

"comput* think*" > "computational thinking", "computers think", "...computing: Thinkers...".

Lainausmerkit estävät erilaisten taivutusmuotojen automaattisen hakemisen esim. Oula-Finnassa ja Google Scholarissa. Esim. "sosiaalinen media" ei hae muotoa 'sosiaalisessa mediassa'. Koska näissä kahdessa tietokannassa lainausmerkkien sisällä ei voi käyttää katkaisumerkkiä, hae ilman lainausmerkkejä. 
 

Läheisyysoperaattori on parempi kuin fraasihaku, kun haettava asia voidaan ilmaista useammalla samankaltaisella ilmaisulla (esim. energy policy, policy on energy, policy for renewable energy).

Monet hakukoneet jättävät hakematta hakuun kirjoitetut prepositiot, konjunktiot yms. hyvin yleiset ns. "stop word" -sanat, joilla ei yleensä ole merkitystä hakutuloksen relevanssille. Tietokantojen ohjeista löytyy lista näistä sanoista, samoin kuin ohjeistus siitä miten tulee toimia, jos stop word on jostain syystä liitettävä hakuun esim. fraasin osana.

Kun olet löytänyt sopivat hakusanat, on aika yhdistää ne hakulauseeksi. Hakulauseen muodostamisessa käytetään Boolen operaattoreita (AND, OR, NOT), läheisyysoperaattoreita ja sulkumerkkejä.

 

Hakusanojen yhdistäminen

Hakusanojen katkaisulla saadaan mukaan sanan taivutusmuodot esim. monikko ja sijamuodot. 

Tavallisimmin käytetty katkaisumerkki on asteriski eli tähtimerkki *, joka korvaa 0…n merkkiä.

Yleensä katkaisumerkkiä käytetään sanavartalon lopussa, mutta joissakin tietokannoissa sen voi laittaa myös sanan alkuun tai keskelle.
Nykyisin jotkin tietokannat hakevat sanan eri taivutusmuotoja automaattisesti.

Korvausmerkki korvaa yleensä yhden merkin. 
Korvausmerkkiä käyttämällä saat hakuun mukaan sanojen eri kirjoitusmuodot.

Katkaisu- ja korvausmerkkien käyttö vaihtelee tietokannoittain, joten tarkista oppaista

Katkaisumerkin käyttö Scopus-tietokannassa:
Product* hakee mm.  products, production, producting, producted, productive

*behaviour* tuottaa esim. sanat neurobehaviour, biobehavioural

Korvausmerkin käyttö Scopus-tietokannassa:
organi?ation hakee organization ja organisation

 

Lainausmerkkejä käyttämällä (fraasihaku) voit hakea kahden tai useamman peräkkäisen sanan yhdistelmällä. Lainausmerkkien sisään kirjoitetut sanat esiintyvät hakutuloksissa kirjoitetussa järjestyksessä. Fraasihaussa on tietokantakohtaisia eroavaisuuksia, jotka voi tarkistaa tietokannan pikaoppaasta.  

 

Fraasihaku lainausmerkkien avulla: "plastic waste"

Haettaessa ilman lainausmerkkejä hakusanoja haetaan tietokannassa yksittäin AND-operaatiolla. Tällöin hakusanat voivat sijaita kaukana toisistaan, joten hakutuloksiin voi tulla tarpeetonta aineistoa.

litter plastic

 

Hakusanojen ja -lausekkeiden yhdistämiseen käytetään yleensä Boolen operaattoreita OR, AND ja NOT.

Joissakin tietokannoissa voidaan käyttää myös läheisyysoperaattoreita

Hakusanat katkaisumerkkeineen ja niitä yhdistävät operaattorit muodostavat hakulauseen, jonka esittämistapa vaihtelee tietokannoittain. Käytettävien operaattoreiden lisäksi hakusanojen ja -lausekkeiden yhdistämiseen vaikuttaa operaattorien suoritusjärjestys tietokannassa sekä sulkeiden käyttö. Operaattorit ja niiden toiminta kannattaa tarkistaa oppaista.