문헌 1억건 학습해 신약 DB 구축

LG의 초거대 AI ‘엑사원(EXAONE)’이 그런 한계를 넘어서려는 시도에 나섰다.
LG AI연구원은 140년 전통의 네덜란드 출판사 엘스비어와 손잡고 초거대 AI의 ‘심층 문서 이해(DDU)’ 기술 개발을 위한 공동 연구에 나선다고 19일 밝혔다. 1880년 설립된 엘스비어는 세계 최고의 자연과학 학술지 ‘셀’과 의학 학술지 ‘랜싯’ 등을 발간하고 있다. 문헌 데이터만 1억 건이 넘는다. LG는 엑사원에 이 문헌들을 학습시켜 신약이나 신물질 개발을 위한 데이터베이스(DB)를 구축하겠다는 계획이다.
전 세계 1800만 명의 콘텐츠 제작자로부터 이미지를 모으고 있는 셔터스톡은 누적 3억8000만 개의 데이터를 확보하고 있다. 멀티 모댈리티 능력이 추가되면 ‘강아지’ 키워드를 입력했을 때 별도의 설명이 붙어 있지 않아도 강아지가 포함된 이미지를 모두 찾아낼 수 있다.
엑사원은 기존 AI 대비 뛰어난 연산 및 학습 능력을 가진 ‘초거대 AI’로 분류된다. 초거대의 기준이 되는 2020년 미국 AI연구소의 ‘GPT-3’는 1750억 개의 파라미터(매개변수)를 바탕으로 시나리오, 에세이, 소설 등의 창작이 가능한 정도다.
엑사원은 약 3000억 개의 파라미터를 갖추고 있다. 엘스비어와 함께 DDU 기술을 개발하면 전문 학술 서적을 스스로 이해하고 분석할 수 있을 것으로 보인다. 연구자들을 위한 데이터의 재가공도 가능해져 기초과학 발전에도 기여할 수 있다.
홍석호 기자 will@donga.com