‘입다 발음은 임다’ 등 기본도 오류 “기존 학술자료와 똑같이 제공 문제”
서울대 정문 전경 2020.6.18/뉴스1
광고 로드중
“‘(옷을) 입다’에서 ‘ㅂ’이 ‘ㄷ’ 앞에서 ‘ㅁ’으로 변하여 ‘임다’로 발음되는 것은 단어 내부 규칙입니다.”
‘입다’를 “입따”로 읽는 건 웬만한 초등학생도 아는 발음이다. 하지만 이런 기본 사실조차 틀린 전자책이 서울대 도서관에 버젓이 비치돼 있다. 대학생과 연구자들이 인공지능(AI)으로 무분별하게 제작해 오류가 상당한 책들을 참고서로 쓸 환경에 노출된 것이다.
동아일보 취재에 따르면 서울대 도서관엔 AI로 전자책을 만드는 것으로 알려진 출판사 A와 B의 서적 약 9000권이 비치돼 있다. 업계에서 이른바 ‘딸깍 출판’(클릭하면 AI가 책을 만든다는 뜻)의 대표 사례로 꼽는 곳들이다. 다른 출판사들이 감수 없이 내놓은 AI 전자책들이 도서관에 더 있을 가능성도 적지 않다.
광고 로드중
전문가들은 AI 제작 전자책이 기존 학술자료와 똑같이 제공되는 점도 문제라고 지적했다. 한 서울대 연구자는 “AI 저작물로 명시하지 않으면 틀린 내용을 인용하거나 출처 표기를 잘못해 연구 윤리를 위반할 수 있다”고 지적했다.
서울대 측은 “해당 서적들은 대형 서점의 구독 플랫폼을 통해 소장한 것으로 파악됐다”며 “대학 내 관련 규범이 만들어지면 준수할 예정”이라고 밝혔다.
설국이 눈국? 칸트가 그리스 학자?… ‘AI 오류’ 범벅된 지식의 보고
AI로 찍어낸 전자책들, 서울대 도서관에 버젓이
‘음운론’ 전자책 기초문법 틀리고… 고전 오역 수두룩, 기본출처 누락도
서점 전자책 구독… 검증없이 유입, “대학-서점 걸러낼 시스템 마련해야”
‘음운론’ 전자책 기초문법 틀리고… 고전 오역 수두룩, 기본출처 누락도
서점 전자책 구독… 검증없이 유입, “대학-서점 걸러낼 시스템 마련해야”
광고 로드중
● 기본 국어 문법도 틀리는 AI 전자책
원래 출판사는 저자가 실수해도 편집팀이 교정하는 과정을 거친다. 한 출판사 관계자는 “책 한 권을 만들 때 최소 세 차례 교정을 거치는 ‘3교’가 관행”이라며 “사전 원고 검토까지 포함하면 편집자 손이 평균 4번은 닿는다. 게다가 분야 전문가를 감수자로 두는 경우가 많다”고 설명했다.
AI 출판 도서는 고전을 번역하면서 역자는 물론이고 원전을 표기하지 않은 경우도 적지 않았다. B 출판사는 독일 철학자 이마누엘 칸트의 ‘미래 형이상학을 위한 서문’ 번역본을 내면서 원전이 고대 그리스 역사가 헤로도토스의 저술이라고 표기했다. 칸트 연구로 박사 학위를 받은 김재호 서울대 학부교수는 해당 책을 검토한 뒤 “칸트의 ‘변증론’을 헤겔의 ‘변증법’이라 오역하는 등 내용에 대한 이해 없이 잘못된 번역어를 많이 사용했다”고 짚었다.
서울대 도서관은 전자책 규모를 확대하면서 A, B출판사의 AI 출판물을 소장하게 된 것으로 파악됐다. 서울대 측은 “A출판사 발행 전자책은 해당 출판사 외 다수의 도서를 제공하는 구독 전자책 플랫폼에 포함된 사항”이라고 설명했다. 해당 서점에서 서울대에 제공하는 전자책은 대략 15만 권이다.
광고 로드중
● AI 전자책 검증 ‘큐레이터’ 시스템 도입해야
이에 관련 윤리가 제대로 정립되지 않으면 ‘마구잡이 AI 도서’가 양산돼 출판계와 학계에 혼란을 초래할 수 있다는 지적도 나온다. 서울대 사회과학대 박사과정 연구자 C 씨는 “학생 다수가 학술적 목적에서 도서관 책들을 찾아보는데, 기본 출처 표시부터 제대로 안 된 책들이 섞여 있는 건 문제”라며 “AI로 썼다는 건 명확히 밝혀야 하고, 학교는 책들이 제대로 분류되고 있는지 관리해야 할 책임이 있다”고 했다.
전문가들은 AI 정보의 홍수 시대에 책과 글을 선별하고 검증하는 시스템을 마련해야 한다고 조언했다. 허위 정보를 걸러내는 ‘큐레이션’의 역할이 더 중요해진 것이다. 한 학술 출판사 관계자는 “AI 출판물이 서울대 도서관에 들어갔다는 건 사서들도 이를 거를 기준 자체가 없었다는 의미”라며 “대학과 공공도서관이 책 선정 기준을 다시 검토해야 한다”고 했다.
해외에선 이미 ‘AI 양산 도서’의 도서관 유입을 심각한 문제로 인식하고 있다. 유럽작가협의회(EWC)와 유럽문학번역가협회협의회(CEATL), 유럽출판사연합(FEP)은 4월 공동 성명을 내고 “생성형 AI로 만든 콘텐츠를 문화 자산으로 간주해선 안 된다”며 “공적 자금으로 운영되는 도서관은 이러한 종류의 산출물을 구매하지 않도록 주의해야 한다”고 밝혔다.
김소민 기자 somin@donga.com