읽기모드공유하기
동아일보|경제

LG 초거대 AI ‘엑사원’, 학술달인 도전

입력 2022-01-20 03:00업데이트 2022-01-20 03:03
글자크기 설정 레이어 열기 뉴스듣기 프린트
글자크기 설정 닫기
학술지 ‘셀’ ‘랜싯’ 발간사와 손잡고, ‘심층 문서 이해’ 기술개발 나서
문헌 1억건 학습해 신약 DB 구축
물리, 생물, 수학, 기계 등 과학 분야의 논문을 쉽게 읽을 수 있는 사람은 많지 않다. 언어를 잘한다고 해서 전문 학술 용어까지 꿰고 있는 건 아니기 때문이다. 인공지능(AI)도 마찬가지다. 일반적인 AI가 학술 논문이나 특허 신청서에 포함된 전문 용어, 수식, 표, 그림 따위를 학습하려면 해당 분야 전문가들의 도움이 필요했다.

LG의 초거대 AI ‘엑사원(EXAONE)’이 그런 한계를 넘어서려는 시도에 나섰다.

LG AI연구원은 140년 전통의 네덜란드 출판사 엘스비어와 손잡고 초거대 AI의 ‘심층 문서 이해(DDU)’ 기술 개발을 위한 공동 연구에 나선다고 19일 밝혔다. 1880년 설립된 엘스비어는 세계 최고의 자연과학 학술지 ‘셀’과 의학 학술지 ‘랜싯’ 등을 발간하고 있다. 문헌 데이터만 1억 건이 넘는다. LG는 엑사원에 이 문헌들을 학습시켜 신약이나 신물질 개발을 위한 데이터베이스(DB)를 구축하겠다는 계획이다.

이런 정보들의 학습이 가능하려면 언어와 시각적 요소를 동시에 이해할 수 있는 ‘멀티 모댈리티’가 필수적이다. 모댈리티는 이미지를 텍스트로, 텍스트를 이미지로 구현할 수 있는 능력이다. LG가 이미지 데이터 플랫폼인 셔터스톡과 업무협약을 맺은 배경이다.

전 세계 1800만 명의 콘텐츠 제작자로부터 이미지를 모으고 있는 셔터스톡은 누적 3억8000만 개의 데이터를 확보하고 있다. 멀티 모댈리티 능력이 추가되면 ‘강아지’ 키워드를 입력했을 때 별도의 설명이 붙어 있지 않아도 강아지가 포함된 이미지를 모두 찾아낼 수 있다.

엑사원은 기존 AI 대비 뛰어난 연산 및 학습 능력을 가진 ‘초거대 AI’로 분류된다. 초거대의 기준이 되는 2020년 미국 AI연구소의 ‘GPT-3’는 1750억 개의 파라미터(매개변수)를 바탕으로 시나리오, 에세이, 소설 등의 창작이 가능한 정도다.

엑사원은 약 3000억 개의 파라미터를 갖추고 있다. 엘스비어와 함께 DDU 기술을 개발하면 전문 학술 서적을 스스로 이해하고 분석할 수 있을 것으로 보인다. 연구자들을 위한 데이터의 재가공도 가능해져 기초과학 발전에도 기여할 수 있다.

홍석호 기자 will@donga.com
당신이 좋아할 만한 콘텐츠
댓글 0
닫기
많이 본 뉴스
경제
베스트 추천