Tieteellisiin julkaisuihin pohjautuva arviointi: H-indeksi

H-indeksi

H-indeksi tunnetaan myös nimillä Hirsch index ja Hirsch number.  Sen kehitti vuonna 2005 professori Jorge E. Hirsch Kalifornian yliopistosta. Hirschin artikkeli, jossa hän esittelee H-indeksin, on saatavana osoitteessa http://arxiv.org/PS_cache/physics/pdf/0508/0508025v5.pdf.

H-indeksi on lukuarvo, joka kuvaa tutkijan kumulatiivista tuloksellisuutta. Se määräytyy sekä tutkijan julkaisujen lukumäärän että julkaisujen vaikuttavuuden eli niiden saamien viittausten lukumäärän mukaan. H-indeksi on objektiivinen, yksinkertainen ja helposti laskettava indeksi, joka korjaa tutkijoiden arvioinnissa käytettyjen muiden viittauksiin perustuvien indikaattoreiden (artikkelien kokonaislukumäärä, viittausten kokonaislukumäärä ja artikkelikohtainen viittausten lukumäärä) puutteita. Esimerkiksi julkaisujen kokonaislukumäärän tarkastelu ei kerro mitään julkaisujen laadusta ja viittausten kokonaislukumäärään vaikuttaa kohtuuttomasti muutama erittäin paljon viittauksia tuottanut julkaisu. H-indeksin etu on sen vakaus, siihen ei vaikuta kovin suuresti muutama erittäin paljon viittauksia saanut julkaisu ja vähän tai ei lainkaan viittauksia saaneet julkaisut eivät vaikuta indeksin arvoon lainkaan. H-indeksin arvo on positiivinen kokonaisluku, eikä sen arvo voi ajan kuluessa laskea.

Yleensä H-indeksi lasketaan tutkijan koko uran ajalta, mutta se voidaan laskea myös rajatummin. Esimerkiksi jos on tarpeen verrata hyvin eri-ikäisiä tutkijoita keskenään, on tasapuolisuuden takia hyvä laskea H-indeksi kaikille samalta aikajaksolta.

H-indeksin avulla voidaan myös arvioida tutkimusryhmien, laitosten, yliopistojen, maiden ja tieteellisten lehtien tasolla niiden tuottavuutta ja vaikuttavuutta.

H-indeksi on saatavissa Web of Sciencesta, Scopuksesta, Publish or Perishistä ja SCImago Journal & Country Rank -sivustolta.

H-indeksin laskeminen

Tutkijan H-indeksin arvo on h jos h kappaletta hänen julkaisuistaan (Np) ovat jokainen saaneet vähintään h viittausta ja loput julkaisut (Np - h) ovat saaneet vähemmän kuin h viittausta.

H-indeksi lehtien arvioinnissa

H-indeksi on Impact Factorin vaihtoehto arvioitaessa lehtien vaikuttavuutta viittausaineiston perusteella. Se antaa karkean arvion lehden pitkän aikavälin tuloksellisuudesta. H-indeksin hyviä puolia IF:n verrattuna ovat sen vakaus ja tasapainoinen määrän ja laadun yhdistäminen, mikä vähentää review-artikkeleita julkaisevien lehtien yliarvostusta. H-indeksin arvoon ei vaikuta lehden muutaman artikkelin hyvin suuret viittausmäärät, koska se ei perustu artikkelien keskimääräiseen viittausten lukumäärään. Lehden julkaisemien artikkelien lukumäärä vaikuttaa jonkin verran sen H-indeksin arvoon. Paljon artikkeleita julkaiseva lehti saa todennäköisemmin suuren H-indeksin arvon kuin vähän artikkeleita julkaiseva, koska kaikki artikkelit ovat potentiaalisia viittausten kohteita. Vähän artikkeleita julkaiseva lehti ei yleensä saa korkeaa H-indeksin arvoa, vaikka suuri osa sen artikkeleista saisikin paljon viittauksia. H-indeksiä ei lasketa tietylle kiinteälle aikavälille, kuten IF, vaan se voidaan laskea mille tahansa aikavälille, esimerkiksi yhdelle tai viidelle vuodelle. Tämä antaa mahdollisuuden verrata toisiinsa lehtiä, jotka poikkeavat toisistaan siinä, kuinka nopeasti niiden artikkeleihin aletaan viitata. Kuitenkin myös H-indeksiä käytettäessä lehtien vertailu on syytä tehdä tieteenalakohtaisesti.

Publish or Perish laskee lehtien H-indeksin Google Scolarin viittausaineiston perusteella. Tämä antaa mahdollisuuden arvioida niiden lehtien vaikuttavuutta, jotka eivät sisälly Thomson Reutersin Web of Science -tietokantaan ja joille ei siten ole olemassa IF-arvoa. Google Scolarin Web of Sciencea laajempi viittausaineisto mahdollistaa myös sellaisten lehtien oikeudenmukaisen arvioinnin, joihin viitataan pääasiassa Web of Scienceen sisältymättömissä lähteissä, kuten kirjoissa ja Web of Scienceen kuulumattomissa lehdissä. Lisäksi lehtien H-indeksi on saatavissa SCImago Journal & Country Rank -sivustoilta.

Lehden H-indeksin arvo on h, jos h kappaletta sen artikkeleista on saanut vähintään h viittausta ja loput sen artikkeleista ovat saaneet vähemmän kuin h viittausta.

H-indeksin laskemisessa ei ole kiinteää viittausikkunaa, vaan viittausikkuna voidaan määritellä kuhunkin tilanteeseen sopivaksi. Lehden H-indeksiä laskettaessa viittausikkuna kannattaa yleensä määritellä lyhyemmäksi kuin lehden koko elinaika, koska tällainen H-indeksi suosii kohtuuttomasti kauan olemassa olleita lehtiä. H-indeksin hyviä puolia lehtien arvioinnissa on myös se, että sen avulla voidaan verrata toisiinsa myös monialaisia lehtiä, kuten Nature ja Science, tietyn alan lehtien kanssa ottamalla H-indeksin laskemiseen mukaan monialaisista lehdistä vain tarkasteltavaa alaa edustavat artikkelit. H-indeksi ei myöskään yliarvosta paljon review-artikkeleita julkaisevia lehtiä, kuten Impact Factor, koska tällaisissa lehdissä vuosittain julkaistavien artikkelien lukumäärä ei ole kovin suuri.

H-indeksin muunnelmat

  • Sidiropoulosin ym. artikkelissa, joka on saatavissa osoitteessa http://www.springerlink.com/content/u8g072hw8842415l/fulltext.pdf esitellään useita H-indeksin muunnelmia, kuten Contemporary H-index, joka ottaa huomioon viitattujen artikkelien iän painottamalla vähemmän vanhoja artikkeleita, trend H-index, joka ottaa huomioon julkaisujen saamien viittausten iän ja normalized H-index, joka ottaa huomioon eri tutkijoiden julkaisemien artikkeleiden lukumäärän vaihtelun.
  • m-index on tutkijan H-indeksi jaettuna vuosien lukumäärällä, joka on kulunut hänen ensimmäisen julkaisunsa ilmestymisestä.
  • a-index on H-indeksin laskemisessa huomioon otettujen artikkelien keskimääräinen viittausten lukumäärä.
  • Individual H-index ottaa huomioon yhteisjulkaisujen vaikutuksen H-indeksiin laskettavissa artikkeleissa, mikä helpottaa eri tieteenaloja edustavien tutkijoiden vertailua. Se lasketaan jakamalla H-indeksin arvo sen laskemisessa huomioon otettavien artikkelien keskimääräisellä kirjoittajien lukumäärällä. Tarkemmin  artikkelissa Batista ym., joka on saatavissa osoitteessa http://www.springerlink.com/content/a41351w08632151v/fulltext.pdf.

Esimerkki H-indeksin määrittämisestä. Kuvassa on esitetty Jorge E Hirschin H-indeksin määrittäminen  Web of Science -tietokannassa. Kun tutkijan julkaisut on asetettu viittausten lukumäärän mukaiseen alenevaan järjestykseen, näkyy tietokannan määrittämä H-indeksin arvo vihreänä viivana viimeisen paljon viitattujen artikkelien joukkoon laskettavan artikkelin jälkeen.
Kuvan lähde: Web of Knowledge (Thomson Reuters) <http://www.isiknowledge.com/> 6.11.2009.

H-indeksin tulkinnassa huomioon otettavaa

H-indeksin arvot vaihtelevat eri tieteenaloilla, joten sen avulla voidaan vertailla vain saman alan tutkijoita keskenään. H-indeksi ei ota huomioon julkaisujen kirjoittajien lukumäärää, jolloin se suosii aloja, joissa on suuret tutkimusryhmät ja tutkijoilla siten paljon julkaisuja.

H-indeksi ei ota huomioon arvioitavan tutkijan ikää tai uran pituutta. Varttuneemmalla tutkijalla on suurempi todennäköisyys saada korkea H-indeksin arvo kuin nuorella tutkijalla, koska hänellä on ollut enemmän aikaa julkaista ja julkaisuilla on ollut enemmän aikaa saada viittauksia. H-indeksi ei myöskään ota huomioon sitä, milloin tutkija on julkaissut tai onko hän jo lopettanut julkaisemisen.

H-indeksi ei erottele viittausten laatua eikä ota huomioon viittausten kontekstia.

Julkaisujen kokonaismäärä vaikuttaa melko voimakkaasti H-indeksin arvoon, joten se voi aliarvioida sellaisen tutkijan vaikuttavuutta, jonka ura on lyhyt tai jolla on vähän julkaisuja, vaikka julkaisut olisivatkin merkittäviä.

H-indeksi voi antaa kohtuuttoman vähän painoarvoa erittäin paljon viittauksia saaneille julkaisuille, vaikka ne voivat olla tutkijan vaikuttavuuden kannalta keskeisiä.

Omat viittaukset (self citations) vaikuttavat H-indeksiin vain vähän, koska indeksiin eivät vaikuta lainkaan julkaisut, jotka ovat saaneet vähemmän kuin h viittausta, eikä enemmän kuin h viittausta saaneiden julkaisujen viittausten todellinen lukumäärä vaikuta indeksiin.

Waltman & van Eck (2009) ovat havainneet, että H-indeksiin liittyy epäjohdonmukaisuutta, joka voi aiheuttaa yllättäviä tuloksia vertailtaessa tutkijoita H-indeksin avulla. Tämä ongelma liittyy kaikkiin H-indeksistä johdettuihin indikaattoreihin. Koko artikkeli on luettavissa osoitteessa http://publishing.eur.nl/ir/repub/asset/16556/ERS-2009-043-LIS.pdf

Esimerkkejä eri alojen tutkijoille lasketuista H-indekseistä

Kemia http://www.rsc.org/chemistryworld/News/2007/April/23040701.asp

Tietojenkäsittelytiede http://www.cs.ucla.edu/~palsberg/h-number.html

Arnetminer listaa tietojenkäsittelytieteen tutkijoita H-indeksin mukaan osoitteessa http://www.arnetminer.org/expertrank/list/hindex