지식 게시판

[연구 평가 지표] 2. 연구자 영향력 지수: h-index, g-index, i10-index

미레티아 2024. 11. 8. 13:18
반응형

저번 글인 「1. 저널 영향력 지수」에 이어, 오늘은 연구자 영향력 지수를 작성해보려고 한다.

저널 영향력 지수는 설명할 것이 많은데 연구자 영향력 지수는 종류가 많진 않아서 금방 이해할 수 있을 것이다.


0. 연구자 영향력 지수란?

어떤 연구자는 품질이 나쁜 논문을 여러 개 낸다.

반면 다른 연구자는 품질이 좋은 논문을 가끔 낸다. 

이 때, 어떤 연구자가 영향력이 더 클 것인가?

당연히 품질이 좋은 논문을 가끔 내는 분이 영향력이 클 것이다.

아무래도 사람들은 좋은 논문을 인용하려고 하니까...

그런데 세상은 그렇게 쉽지 않고, 대부분의 연구자들은 품질이 다양한 논문을 적당히 작성한다.

그렇다면 그들 중 누가 영향력이 클 것인가?

어떤 연구자가 연구 성과가 더 좋은 것일까?

이런 질문을 대답하기 위해 만들어진 지수가 연구자 영향력 지수이다.

보통 h-index를 가장 많이 쓰고, g-index는 별로 안 쓰는 것 같지만 일단 있다는 것을 알아두면 좋다.

 

1. h-index

h-index는 2005년에 조지 허쉬(Jorge E. Hirsh)라는 물리학자가 개발하셨는데,

아주 직관적이라 선풍적인 인기를 끌었다.

A라는 사람이 작성한 모든 논문을 인용 빈도 순으로 나열한 다음에,

논문의 인용 빈도가 논문의 순위보다 크거나 같은 마지막 논문의 순위가 h-index이다.

(즉, '논문의 순위 ≤ 피인용 횟수'인 개수를 센다고 생각하면 된다.) 

 

이렇게 말하면 어려우니까 예시를 들어보자.

올해 노벨 생리의학상을 받은 분 중 '게리 러브컨(Gary Ruvkun)'님이 구글 스칼라에 프로필이 있으니 그 분을 기준으로 설명하겠다.

 

구글 스칼라의 게리 러브컨의 프로필 (좌) 맨 위쪽 논문들 (우) 100번부터 111번 논문들

구글 스칼라 프로필은 알아서 인용수가 높은 논문을 맨 위로 올려서 보여준다. 

자, 그래서 쭉쭉 내리다보면 111번 논문이 111번 인용된 것을 볼 수 있다.

'논문의 순위(111) ≤ 해당 논문의 피인용수(111)'이고,

그 밑으로 내려가서 112순위 이상의 논문들은 111회보다 적게 인용되었을 것이므로

저 분의 h-index는 111인 것이다.

 

사실 구글 스칼라는 h-index를 그냥 제공해주므로 저렇게 계산할 필요가 없다.

게리 러브컨의 h-index가 우측에 나와있다

참고로 '2019년 이후'라는 항목이 따로 있는 것은 h5-index 때문이다.

h5-index란 5년 동안의 h-index를 의미한다.

(그리고 글을 쓰는 시점이 2024년이라서 2019년 이후가 기준인 것이다.

몇 개월 뒤면 2020년 이후라고 적혀있겠죠?? ㅎㅎ)

아무래도 h-index는 연구를 오래 할수록 수치가 올라가기 때문

신진 연구자들에게는 h5-index를 사용하는 경우가 많다.

 

이 지표의 좋은 점은 질 나쁜 논문을 많이 쓰거나 운 좋게 아주 좋은 논문을 쓴 사람에게 높은 수치가 나오지 않는다는 것이다.

다만, 자가인용이나 기여도(공저자, 주저자 여부 등)가 반영이 안 된다는 단점이 있다.

주저자 하나 없이 공저자만 많이 써도 좋은 연구자로 평가 될 수 있다는...

 

h-index를 확인하는 가장 쉬운 방법은 구글 스칼라 프로필을 확인하는 것인데,

Google Scholar의 경우는 프로필을 등록을 안 한 연구자들이 많고

구글 스칼라 피인용수를 뻥튀기하는 사기도 있어서 (관련 뉴스: https://www.nature.com/articles/d41586-024-01672-7)

다른 사이트에서 확인하는 방법도 소개하겠다.

 

아 참, 사이트마다 h-index가 조금씩 다르게 잡히는 것은 당연한 일이니

(검색엔진이 다르면 검색 결과가 다르듯이, 논문 저자 프로필도 마찬가지이다)

구글 스칼라보다 수치가 낮다고 해서 모두 피인용수 뻥튀기하는 사기를 한 건 아니다.

 

각설하고, Web of Science는 유료 사이트라서 소속 기관을 통해 접속하면 Researchers검색이 가능하다.

아까 예시로 든 게리 러브컨님을 찾아보면... 2개로 쪼개져서 나온다.

자세히 보면 둘 다 같은 사람인데, middle name을 썼냐 안 썼냐 때문에 Web of Science가 다른 사람으로 검색하는 것 같다. 

이래서 연구자 고유 식별코드(ORCID)가 필요함....ㅋㅋㅋㅋ

 

Web of science에서의 게리 러브킨님. (1) 검색창 (2) 두 명이 검색됨 (3) 맨 위에서 클릭 시 metrics에서 h-index 확인 가능 (4) 기타 Web of science가 제공하는 것

 

검색된 저자를 클릭하면 우측에 h-index가 뜬다.

아무래도 두 개로 쪼개져서 그런가, h-index가 90으로 아까의 111보다 낮게 잡힌다.

대신에 Web of Science의 장점은 Author position, 즉 1저자, 마지막 저자, 교신저자 비율을 알려준다는 것이고

Author impact beamplot summary라는 그림을 그려줘서 한 눈에 파악하기 쉽다.

해당 beamplot은 50점 넘으면 평균 이상이라는 뜻이다.

 

그 외에 SCOPUS에서도 확인이 가능하다.

물론 SCOPUS도 유료 서비스라 소속기관을 통해 접속하시길.

 

(좌) SCOPUS 검색 사이트. Author를 고르고 검색하면 된다 (우) 1명의 저자가 찾아졌다.

 

오, 이번에는 1명으로 잘 검색된다.

저기서 저자를 고르고 Citation overview를 누르면...

 

Citation overview를 보면 저자 이름 우측 끝에 h-index가 뜬다.

이렇게 h-index가 우측 끝에 표시된다.

 

2. g-index

h-index의 한계를 개선하기 위해 2006년에 레오 에게(Leo Egghe)에 의해 제안되었는데,

피인용 횟수가 많은 논문에 가중치를 부여하는 방식이다.

아까의 h-index처럼 논문의 인용 빈도대로 순서대로 나열한 다음

상위 x개의 논문의 피인용수 합이 x^2이상이 되는 x의 최댓값이 g-index이다.

 

예를 들어 아래와 같은 연구자가 있다고 하자.

A논문: 5회 인용 / B논문: 3회 인용 / C논문: 1회 인용 / D논문: 1회 인용 / E논문: 1회 인용
  • 상위 1개 논문의 피인용수 합: 5 → 1^2=1 ; 5 ≥ 1 
  • 상위 2개 논문의 피인용수 합: 8 → 2^2=4 ; 8 ≥ 4
  • 상위 3개 논문의 피인용수 합: 9 → 3^2=9 ; 9 ≥ 9
  • 상위 4개 논문의 피인용수 합: 10 → 4^2=16 ; 10 < 16

따라서 x의 최댓값은 3으로 예시로 든 연구자의 g-index는 3이다.

 

g-index의 단점은 운 좋게 아주 훌륭한 논문에 이름을 조그마한 기여를 한 공저자라도 넣게 된다면

수치가 커질 수 있다는 것이다.

예를 들어, A논문: 100회 인용 / B논문: 1회 인용 / C논문: 1회 인용 / D논문: 0회 인용 / .... 이런 분이 있다면

(별로인 논문을 9개 이상일 시) A논문 덕분에 g-index는 10이 된다.

 

g-index는 예전에 설명한 서지정보 몽땅 다운로드 하는 프로그램인 Publish or Perish라는 프로그램에서 볼 수 있다.

(관련 블로그 글: https://miretia.tistory.com/718)

프로필 검색을 하면 우측에 Citation metrics라고 뜨면서 h-index, g-index 등이 보인다.

Publish or Perish에서 g-index는 우측 citation metrics에서 확인가능하다. 게리 러브컨님을 예시로 듦.

 

그 외의 방법으로 g-index를 확인하는 방법은 아직 잘 모르겠다.

아마 활용도가 낮아서 잘 제공을 안 하는 것일 수도...?

 

3. i10-index

아마 제일 간단한 지표이지 않을까 싶은데,

최소 10번 이상 인용된 출판물의 개수를 의미한다.

이것도 h-index만큼 활용도가 좋지는 않지만

연구하는 입장에서는 왠지 뿌듯해지는 지표이다.

왜냐하면 i10-index가 1 늘어나면 구글 스칼라 접속 화면에서 축하해주기 때문이다.

저번에는 캡처하는 것을 까먹었는데 다음 논문이 10번 이상 인용되면 그때는 그 화면을 꼭 캡처해서 이 글에 첨부하겠다.

(언제쯤 가능하려나...홀홀...)


다음에는 논문 영향력 지수편으로 돌아오겠다.

잘 설명했는지 모르겠지만 유익한 글이었음 좋겠다!


[연구 평가 지표] 글 시리즈

  1. 저널 영향력 지수: 종류와 확인법 - Impact factor, CiteScore 등등
    (https://miretia.tistory.com/716)
  2. 연구자 영향력 지수: h-index, g-index, i10-index
    (https://miretia.tistory.com/720)
  3. 논문 영향력 지수: 피인용수(Citation impact), FWCI, CNCI
    (https://miretia.tistory.com/725)
728x90
반응형