AI發 부실 논문 급증… 올해 1만건 취소, 작년 2배

  • 동아일보
  • 입력 2023년 12월 21일 03시 00분


코멘트

네이처誌 “전세계 ‘논문공장’ 기승”

생성형 인공지능(AI) 기술 확산 등의 부작용으로 올해 허위 조작(가짜) 또는 부실 논문이 급증했다. 특히 논문 대필 서비스업체, 일명 ‘논문 공장’이 기승을 부리면서 전 세계 과학계가 ‘학술 사기’에 휘말렸다는 우려도 나온다. 20일 국제 학술지 네이처에 따르면 전 세계 논문 취소(Retraction) 수는 8일 기준으로 1만 건을 넘어섰다. 네이처는 국제 논문 감시 웹사이트 ‘리트랙션 워치’ 등의 데이터를 분석해 이 같은 수치를 12일(현지 시간) 공개했다. 지난해 5380건의 두 배, 2014년 1073건의 10배에 달한다.

올해 취소된 논문 중 8000건 이상은 200여 개 학술지를 발간하는 인도 출판사 ‘힌다위’에서 발생한 사례다. 힌다위가 자체 조사를 진행하면서 생성형 AI를 활용한 사실 등이 적발된 것이다. 네이처는 “최대 수십만 개의 논문이 ‘논문 공장’에서 생산됐을 것”이라고 분석했다.

챗GPT ‘복붙’했다 논문 취소… ‘논문공장’서 가짜 논문 받아 게재


[AI發 논문 인플레]
AI發 부실논문 1만건, 작년 2배
“논문구매 가능, 비밀 보장” 유혹… 논문공장서 만든 부실 논문 급증
1~2년 걸리던 논문 한두달새 ‘뚝딱’
8월 국제 학술지 피지카 스크립타엔 복잡한 수학 방정식을 풀 새로운 해법을 제시한 논문이 발표됐다. 그러나 이 논문은 한 달 뒤 게재가 취소됐다. 논문 중간에 ‘응답 재생성(Regenerate response)’이라는 단어가 발견됐기 때문이다. 오픈AI의 생성형 인공지능(AI) 서비스인 ‘챗GPT’에서 답변을 얻기 위해 이용자가 누르는 ‘버튼’에 있는 문구다. 챗GPT로 논문을 쓴 뒤 이를 그대로 ‘복붙’했다가 탄로가 난 것이다. 이를 제보한 기욤 카바나크 프랑스 툴루즈대 컴퓨터과학과 교수는 ‘AI 언어 모델 이용 시 다음 사항에 유의하세요’ 등 챗GPT가 내놓는 문장이 그대로 실린 다른 의심 논문도 발견해 제보했다.

● ‘논문 공장’의 유혹에 부실 논문 확산
20일 과학계에 따르면 논문을 대신 써주는 이른바 ‘논문 공장’에서 생성형 AI 기술을 적극적으로 악용하고 있다는 의혹이 제기되고 있다. 영국 출판윤리위원회(COPE)에 따르면 논문 공장은 ‘저자의 지위나 전체 논문을 구매할 수 있고 비밀은 보장한다’는 식으로 광고를 한다. 연구자는 비용을 내고 그럴듯한 허위 조작(가짜) 논문을 받은 뒤 학술지에 게재하는 것이다. 논문 공장이 생성형 AI를 활용해 논문 초안을 넘어 아예 최종본까지 작성하는 경우도 발견되고 있다.

논문 공장에서 생산된 부실한 논문이 학술지에 다수 게재되고 있다는 사실은 이미 2∼3년 전부터 과학계에서 지적해 온 문제다. 중국에선 2020년 50여 도시의 병원과 의과대학 연구자들이 121개의 서로 다른 논문에서 같은 세포 이미지를 활용해 논문을 작성한 뒤 학술지에 게재한 사실이 뒤늦게 드러나기도 했다. 중국 연구자들은 세포 군집의 이동 경로를 포착한 하나의 이미지를 다른 것처럼 보이게 하려고 사진을 회전시키거나 일부만 잘라 활용하기도 했다. 국제 학술지 6곳에서 이들의 논문이 동료 연구자 평가를 통과했고, 한 논문은 50회 이상 인용되기도 했다. 조작된 논문에 애꿎은 동료 연구자들이 피해를 본 셈이다.

● 학술지들의 수익화 전략도 한몫
부실 논문이 최근 몇 년간 급증하고 있는 것은 국제 학술지의 수익성 확보 전략과도 연관이 있다. 과거 과학계에선 연구자들이 유력 학술지의 논문을 읽으려면 구독료를 내야 했다. 현재는 정보기술(IT)의 발전으로 논문을 무료로 외부에 공개해야 한다는 압력이 높아지며 ‘오픈 액세스 모델’이 자리 잡았다.

구독료를 대체할 수익이 필요한 학술지들이 논문을 게재하려는 연구자들에게 비용을 받기 시작하면서 과거보다 낮은 심사 기준을 적용한다는 주장이 설득력을 얻고 있다. 더 많은 논문을 게재해 성과를 증명해야 하는 과학계 연구자들과 ‘게재료’를 받아 수익을 내야 하는 학술지의 이해관계가 맞아떨어진 것이다.

세계 최대 학술지 데이터베이스(DB) ‘웹오브사이언스’가 논문 품질 하락을 이유로 올해 삭제한 학술지 중에는 스위스 온라인 학술지 출판연구소(MDPI)의 ‘환경적 연구와 공중보건에 관한 국제적 저널’과 힌다위의 ‘종양학 저널’이 포함돼 있다. 이 두 저널에 게재된 논문은 2015년 939건에서 지난해 1만6216건으로 17배로 늘어났다. 세계 3대 과학저널인 셀, 네이처, 사이언스의 논문 게재량이 같은 기간 1988건에서 2022건으로 1.7% 증가한 것과 대조적이다.

● 국내에서도 부실 학술지 문제 심화

국내 과학계에서도 심사 기준을 낮춰 비교적 쉽게 논문 게재를 허락하는 학술지는 ‘부실의심학술지’나 ‘약탈적 학술지’로 불리고 있다. 국회 과학기술정보방송통신위원회 소속 더불어민주당 이인영 의원이 한국연구재단으로부터 제출받은 자료에 따르면 2017∼2022년 국내 과학기술논문인용색인(SCI)급 논문 15만5002건 중 2만5581건(16.5%)이 부실의심학술지에 게재된 것으로 나타났다. 대학원에서도 교수와 대학원생의 이메일로 논문 공장 업체들이 ‘초고를 작성해주겠다’고 연락하는 사례가 있다고 한다. 국내 대학원생 A 씨는 “논문 공장 업체들이 기초적인 데이터를 넘겨 받아 초고까지 작성해 준 사례를 알고 있다”고 전했다.

박종일 대한수학회장(서울대 수리과학부 교수)은 “일반적으로 수학 논문이 출판되려면 1∼2년이 걸리는데 부실의심학술지에선 1∼2개월 만에 마무리된다”며 “젊은 연구자들이 유혹을 느낄 수밖에 없는 구조”라고 지적했다.

정기 발간물 대신 ‘특별호(Special issue)’를 대량으로 발간하는 방식으로 다량의 논문을 게재하는 경우도 많다. 한 국제 출판사의 경우 5년간 정기 발간물 수록 논문 수가 2.6배가량 증가할 동안 특별호에선 7.5배 늘어난 것으로 나타났다. 윤철희 과학학술지편집인협의회 출판윤리위원장(서울대 농생명과학부 교수)은 “학술지의 특별호는 전문가 심사의 질이 상대적으로 낮은 편”이라며 “투고한 논문이 한번 거절됐다가 편집 과정에서 투명한 절차를 거치지 않고 승인되는 사례도 있다”고 했다.

같은 출판사에서 발행하는 학술지끼리 실적을 높이기 위해 ‘논문 인용 품앗이’를 하는 문제도 나타나고 있다. 게재된 논문의 인용 수가 높아질수록 연구 성과를 높게 평가받는다는 점을 겨냥한 행위다. 지난해 포스텍과 숭실대 공동연구팀이 진행한 연구에 따르면 이러한 방식으로 내부 인용 비율을 20%까지 끌어올려 인용지수 상위권 학술지를 상당수 만들어 내는 등의 ‘인용 부풀리기’ 사례가 발견됐다.

전남혁 기자 forward@donga.com
지민구 기자 warum@donga.com


#네이처#논문공장#ai
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스