Tieteellisen tiedonhankinnan opas: Hakusanojen käyttö

Automaattinen sanahaku

Monissa tietokannoissa on käytössä automaattinen sanarunkohaku (stemming), joka tunnistaa sanojen rungon ja hakee kyseisen rungon sisältäviä sanoja. Jos esimerkiksi haetaan sanalla viewer, hakukone antaa tulokseksi viitteet, jotka sisältävät view -runkoisia sanoja, kuten view, viewing, preview jne. Usein ominaisuus on rajattu koskemaan vain yksikkö- ja monikkomuotoja, mutta jotkut tietokannat löytävät taivutusmuotoja ja jopa sanaliittoja ja synonyymejä hyvin monipuolisesti.

Oula-Finnassa hakukone etsii automaattisesti hakulaatikkoon kirjoitetun sanan eri taivutusmuodoilla.
Kuvan lähde: Oula-Finna <https://oula.finna.fi> 14.7.2017.

Taivutusmuotojen hakukäytännöt ovat tietokantakohtaisia ja ne on hyvä tarkistaa käytettävästä tietokannasta. Monissa tietokannoissa ominaisuus ei toimi fraasihaussa. Joissakin tietokannoissa sana on kirjoitettava perusmuodossa, jotta automaattinen sanarunkohaku toimii.

Mikäli taas haluaa etsiä sanaa ainoastaan täsmälleen kirjoitetussa muodossa, automaattisen sanarunkohaun voi usein kytkeä pois päältä käytettävän tietokannan ohjeiden mukaan.

Joissakin tietokannoissa ja internetin hakukoneissa käyttäjän käyttämät hakutermit analysoidaan vieläkin tarkemmin. Niitä voidaan verrata sanastoon tai tesaurukseen ja hakea siten myös sanan synonyymeilla ja vastaavilla kontrolloidun asiasanaston termeillä. Kirjoitusvirheille saatetaan ehdottaa korjauksia.

PubMed -tietokannassa hakukone vertaa oletusarvoisesti annettua hakusanaa lääketieteen asiasanaston MeSHin termeihin. Search Details -laatikosta voi tarkistaa, millä sanoilla haku on lopulta tehty ja muokata hakua tarvittaessa. Tarkistus kannattaa, sillä esimerkiksi tässä hakuasana barcode on tulkittu varsin laajasti.
Kuvan lähde: PubMed <http://www.ncbi.nlm.nih.gov/pubmed/> 14.7.2017.

Katkaisumerkit

Katkaisumerkit

Hakusanojen katkaisulla saadaan mukaan sanan eri taivutusmuodot. Katkaisuun on tietokannoissa eri käytäntöjä. Monet tietokannat vaativat erityisen katkaisumerkin käyttämistä. Yleensä katkaisumerkkiä käytetään sanavartalon lopussa, mutta joissakin tietokannoissa sen voi laittaa myös sanan alkuun. Katkaisumerkki vaihtelee tietokannoittain ja se tulee tarkistaa aina ohjeista. Tavallisimmin käytetyt katkaisumerkki on asteriski *

Kovin lyhyellä sanarungolla ei kannata hakea, sillä saman merkkijonon sisältäviä merkitykseltään erilaisia sanoja on silloin todennäköisesti enemmän, ja hakutulokseen tulee helposti mukaan epärelevantteja viitteitä. Joissakin tietokannoissa sanarungolle onkin asetettu vähimmäispituus. Katkaisun sijaan kannattaa kirjoittaa vaihtoehtoiset taivutusmuodot hakulauseeseen.

Joissakin tietokannoissa on käytössä automaattinen sanankatkaisu, joka hakee kaikki sanat, jotka sisältävät tai alkavat hakulaatikkoon kirjoitetulla merkkijonolla. Automattinen katkaisu ei kuitenkaan tunnista hakusanan runkoa kuten automaattinen sanarunkohaku, joten esim. viewer löytää viewers, mutta ei viewing.

Scopus-tietokannassa yksikkömuotoinen hakusana hakee useimmille sanoille automaattisesti myös sanojen monikko- ja possessiivimuodot, mutta ei muita sanarungon omaavia sanoja. Varsinainen katkaisumerkki on *. Kuvan lähde: Scopus <http://www.scopus.com> 18.7.2016

Korvausmerkit

Kirjaimien korvausmerkit

Korvausmerkki korvaa yleensä tasan yhden merkin. Jotkut tietokannat tarjoavat myös 0-1 merkkiä korvaavaa symbolia. Korvausmerkkiä käyttämällä välttyy kirjoittamasta erikseen sanojen eri kirjoitusmuotoja (organization-organisation) ja epäsäännöllisiä taivutuksia (woman-women). Korvausmerkin voi yleensä myös toistaa. Korvausmerkki on tietokantakohtainen ja sen käyttö tulee tarkistaa tietokannan ohjeista. Automatisoitu versio korvausmerkeille on sumea haku, joka hakee toisiaan läheisesti muistuttavia sanoja verraten samalla viitteiden muutakin sisältöä toisiinsa hyvän relevanssin säilyttämiseksi, mutta se on käytössä vielä hyvin harvoissa hakukoneissa.

Web of Science -tietokannassa yhden merkin korvaa ? kun taas $ voi korvata yhden tai puuttuvan merkin. Tässä on huomioitu amerikanenglannin ja brittienglannin mukaiset kirjoitusmuodot behavior ja behaviour sekä woman -sanan epäsäännöllinen monikko. Kuvan lähde: Thomson Reuters - Web of Knowledge (Web of Science) <http://apps.webofknowledge.com> 19.7.2013.

 

Usein korvausmerkin voi myös toistaa, kuten tässä Web of Sciencen esimerkissä.
Kuvan lähde: Thomson Reuters - Web of Knowledge (Web of Science) <http://apps.webofknowledge.com> 19.7.2013.

line above footer

Oulun yliopiston kirjasto
PL 7500
90014 OULUN YLIOPISTO
Vaihde: 0294 480000