美 시카고대 연구팀 연구 결과 발표… 상위 22% 논문이 인용의 80% 차지
논문간 상호 인용 등 연결성은 감소
데이터 많은 특정 주제로 몰리면서
연구주제 비슷해지고 다양성 줄어
인공지능(AI)이 개인의 연구 성과를 높이는 대신 과학 연구 주제가 비슷해지고 일부 연구에 인용이 쏠리는 ‘승자독식’ 구조를 강화한다는 연구 결과가 나왔다. 과학 발전을 위해 연구자는 물론이고 사회가 AI 활용의 방향과 균형을 바람직하게 잡아야 한다는 지적이 나온다. 생성형 AI로 제작한 이미지. 게티이미지뱅크
한국을 포함해 전 세계에서 과학 연구 현장에 인공지능(AI)을 어떻게 도입할지를 둘러싼 논의가 뜨겁다. AI 활용은 연구 현장에서 거스를 수 없는 대세이기 때문이다.
그러나 AI가 개인의 연구성과를 높이는 대신 과학 연구 주제가 비슷해지고 일부 연구에 인용이 쏠리는 ‘승자독식’ 구조를 강화한다는 연구 결과가 나왔다. 과학 발전을 위해 연구자는 물론이고 사회가 AI 활용 방향과 균형을 바람직하게 잡아야 한다는 지적이 나온다. 제임스 에번스 미국 시카고대 교수 연구팀은 AI 도구 사용이 과학 연구의 구조를 어떻게 바꾸고 있는지를 대규모 데이터 분석으로 규명한 연구 결과를 14일(현지 시간) 네이처에 발표했다.
● 연구성과 정량, AI 활용 효과 뚜렷
먼저 연구팀은 연구 데이터베이스 ‘오픈앨릭스(OpenAlex)’를 통해 1980년부터 2025년까지 출판된 전 세계 자연과학 논문 4130만 편을 조사했다. 논문의 제목과 초록을 통째로 읽는 AI 모델을 만들어 각 논문이 AI 도구를 써서 연구를 했는지, 다른 방법으로 연구를 했는지 분석했다. 그 결과 AI를 활용한 논문은 전체 논문 중 0.75%인 31만 편이었다.
연구팀이 AI 활용 논문과 각 논문의 저자, 인용도 등을 분석한 결과 AI가 연구자 개인의 성과를 크게 높였다. AI를 활용하는 연구자는 활용하지 않는 연구자보다 논문을 3.02배 더 많이 내고 논문 인용 수도 4.84배 더 많았다. 연구 프로젝트의 리더가 되는 시기도 AI를 활용한 연구자가 AI를 활용하지 않는 연구자보다 1.37년 더 빨랐다.
논문 단위에서도 AI 활용 효과는 뚜렷했다. 참고문헌 기록이 온전한 논문 2740만여 편을 분석한 결과 AI를 활용한 논문은 그렇지 않은 논문보다 연간 평균 인용 횟수가 약 98.7% 높았다. 연구팀 구성에는 변화가 나타났다. 같은 분야, 같은 시기, 비슷한 조건에서 AI를 쓰지 않은 연구팀과 비교했을 때 AI를 활용한 연구의 경우 팀 규모가 평균 1.33명(약 19.3%) 적었다. ● 연구주제 다양성 줄고 ‘승자독식’ 구조 강화
다만 AI 활용은 과학계 전체적으로 연구 주제가 점점 비슷해지는 결과를 낳았다는 분석이 나온다. AI를 활용한 논문의 연구주제 범위는 AI를 활용하지 않은 논문에 비해 4.63% 줄어들었다. AI를 활용한 경우 논문의 연구주제 다양성이 부족해졌다는 뜻이다.
AI를 활용한 논문은 연구논문 간 상호 인용과 연구자 협업을 나타내는 ‘연결성’도 상대적으로 22% 낮았다. AI 활용 연구에서 일부 논문만 인용되는 쏠림 현상이 강하게 나타나기도 했다. 상위 22.2% 논문이 전체 인용의 80%를 차지했다. 불평등을 나타내는 ‘지니계수’를 인용 수에 적용해 계산한 결과 AI 활용 논문의 지니계수는 0.754, AI 비활용 논문의 지니계수는 0.690이었다. 0∼1 사이의 숫자로 표시되는 지니계수는 1에 가까울수록 불평등 정도가 높은 상태를 의미한다.
연구팀은 AI 활용이 개인에게는 이득으로, 과학계 전체에는 손해로 나타나는 ‘역설’이 발생하는 이유에 대해 “AI가 데이터가 풍부한 영역에서 특히 높은 성과를 내기 쉬운 특성상 연구자들이 데이터가 많은 특정 문제로 몰리기 때문”이라고 설명했다. 또 AI를 활용하면 성능 지표가 명확해 초반에 좋은 성과를 낸 논문을 인용하는 비율이 높고 코드와 데이터가 공개된 기존 논문의 연구방법을 다른 주제에 적용해 따라 하려는 연구자가 많아진다.
연구팀은 “AI 시대, 과학 발전을 위해 AI의 분석 능력뿐 아니라 관측·실험 등 역량까지 사용되도록 AI 활용 방법을 다양화할 필요가 있다”며 “정부나 연구기관에서 데이터가 부족한 분야에 AI를 활용하는 연구자에게 인센티브를 제공하는 등 연구주제와 방법이 획일화되지 않도록 지원해야 한다”고 말했다.
이 같은 분석은 지난해 5월 중국 푸단대, 상하이 AI 과학 아카데미(SAIS), 네이처 리서치 인텔리전스 등이 발간한 보고서 ‘과학을 위한 AI 2025(AI for Science 2025)’의 내용과도 맞닿아 있다. 보고서는 “AI가 가설 생성·검증을 자동화하고 자율적 실험과 학제 간 연구를 촉진하면서 과학적 발견을 가속하고 있지만 동시에 데이터 편중과 방법론적 단일화 위험도 함께 키우고 있다”며 “이를 극복하기 위해 데이터가 부족한 분야에서도 작동하는 AI, 기존 지식을 바탕으로 더 큰 스케일의 현상을 이해하는 ‘다중 스케일 과학 AI 모델’, AI나 시뮬레이션 등으로 만든 합성 데이터 활용 등의 연구를 장려해야 한다”고 강조했다. AI를 기존 데이터를 효율적으로 해석하기만 하는 도구가 아니라 새로운 데이터를 탐색하고 수집하며 미지의 영역을 넓히는 도구로 재설계해야 한다는 것이다.
댓글 0