[단독]설국이 눈국? 칸트가 그리스 학자?… ‘AI 오류’ 범벅된 지식의 보고

  • 동아일보

AI로 찍어낸 전자책들, 서울대 도서관에 버젓이
‘음운론’ 전자책 기초문법 틀리고… 고전 오역 수두룩, 기본출처 누락도
서점 전자책 구독… 검증없이 유입
“대학-서점 걸러낼 시스템 마련해야”

서울대 도서관에서 열람할 수 있는 A출판사의 한 전자책에는 “일본의 소설 ‘눈국’에서는…”이란 문장이 등장한다. 가와바타 야스나리(川端康成)의 유명한 소설 ‘설국(雪國)’을 인공지능(AI)이 ‘눈국’으로 잘못 번역한 것으로 보인다. 철학을 다룬 또 다른 전자책엔 “서로 다른 생각을 가진 사람들이 부딪히는 일은 우리 삐라에서 매우 흔한 일입니다”란 대목이 있다. ‘삐라’란 단어가 어떤 맥락에서 들어갔는지 전혀 알 수 없는 문장이다.

최근 학계나 출판계에서 AI를 활용하는 건 일상화됐다. 기획이나 자료 조사, 퇴고 등 저술 과정에서 AI를 적극적으로 쓰는 저자들도 적지 않다. 하지만 별다른 감수 과정도 거치지 않은 채 무더기로 만들어낸 AI 콘텐츠가 국내 대학 도서관 장서로 무분별하게 유입되는 건 심각한 문제라는 지적이 나온다.

● 기본 국어 문법도 틀리는 AI 전자책

해당 출판사가 펴낸 ‘음운론’을 다룬 책도 문제가 많았다. “‘신라’라는 단어에서도 ‘ㅅ’ 다음의 ‘ㄴ’은 ‘ㄹ’과 만나 ‘ㄹ’로 변해야 하지만, 실제로는 ‘실라’가 아닌 ‘신라’로 발음됩니다”라는 내용이 담겼다. ‘신라’를 ‘실라’라고 읽는 건 국어의 기초 문법인 ‘유음화(流音化) 현상’의 대표적인 사례다. 출판사는 이런 전자책을 ‘청소년을 위한 OO시리즈’라며 다량으로 출간했다. 이 시리즈만 서울대 도서관에서 약 1000권이 검색된다.

원래 출판사는 저자가 실수해도 편집팀이 교정하는 과정을 거친다. 한 출판사 관계자는 “책 한 권을 만들 때 최소 세 차례 교정을 거치는 ‘3교’가 관행”이라며 “사전 원고 검토까지 포함하면 편집자 손이 평균 4번은 닿는다. 게다가 분야 전문가를 감수자로 두는 경우가 많다”고 설명했다.

AI 출판 도서는 고전을 번역하면서 역자는 물론이고 원전을 표기하지 않은 경우도 적지 않았다. B 출판사는 독일 철학자 이마누엘 칸트의 ‘미래 형이상학을 위한 서문’ 번역본을 내면서 원전이 고대 그리스 역사가 헤로도토스의 저술이라고 표기했다. 칸트 연구로 박사 학위를 받은 김재호 서울대 학부교수는 해당 책을 검토한 뒤 “칸트의 ‘변증론’을 헤겔의 ‘변증법’이라 오역하는 등 내용에 대한 이해 없이 잘못된 번역어를 많이 사용했다”고 짚었다.

서울대 도서관은 전자책 규모를 확대하면서 A, B출판사의 AI 출판물을 소장하게 된 것으로 파악됐다. 서울대 측은 “A출판사 발행 전자책은 해당 출판사 외 다수의 도서를 제공하는 구독 전자책 플랫폼에 포함된 사항”이라고 설명했다. 해당 서점에서 서울대에 제공하는 전자책은 대략 15만 권이다.

서점 관계자는 “출판사들에 ‘생성형 AI로 만들었을 경우 표기를 해달라’는 지침을 전달하고 있지만, 표기 여부는 사실상 출판사 마음”이라며 “강제성이 없어 자체적으로 판단을 내려 제외시킬 근거가 약하다”고 했다. 출판사들은 수차례 연락을 시도했으나 닿지 않았다.

● AI 전자책 검증 ‘큐레이터’ 시스템 도입해야

이에 관련 윤리가 제대로 정립되지 않으면 ‘마구잡이 AI 도서’가 양산돼 출판계와 학계에 혼란을 초래할 수 있다는 지적도 나온다. 서울대 사회과학대 박사과정 연구자 C 씨는 “학생 다수가 학술적 목적에서 도서관 책들을 찾아보는데, 기본 출처 표시부터 제대로 안 된 책들이 섞여 있는 건 문제”라며 “AI로 썼다는 건 명확히 밝혀야 하고, 학교는 책들이 제대로 분류되고 있는지 관리해야 할 책임이 있다”고 했다.

전문가들은 AI 정보의 홍수 시대에 책과 글을 선별하고 검증하는 시스템을 마련해야 한다고 조언했다. 허위 정보를 걸러내는 ‘큐레이션’의 역할이 더 중요해진 것이다. 한 학술 출판사 관계자는 “AI 출판물이 서울대 도서관에 들어갔다는 건 사서들도 이를 거를 기준 자체가 없었다는 의미”라며 “대학과 공공도서관이 책 선정 기준을 다시 검토해야 한다”고 했다.

해외에선 이미 ‘AI 양산 도서’의 도서관 유입을 심각한 문제로 인식하고 있다. 유럽작가협의회(EWC)와 유럽문학번역가협회협의회(CEATL), 유럽출판사연합(FEP)은 4월 공동 성명을 내고 “생성형 AI로 만든 콘텐츠를 문화 자산으로 간주해선 안 된다”며 “공적 자금으로 운영되는 도서관은 이러한 종류의 산출물을 구매하지 않도록 주의해야 한다”고 밝혔다.

#AI 오류#전자책#AI 전자책#AI 양산 도서#서울대 도서관
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스