이강한 한국학중앙연구원 한국사학 전공 교수
서구 중심의 가치관과 데이터를 기반으로 작동하는 외국산 AI에 한반도의 독특한 역사적 맥락, 한국 사회만의 고유한 특질에 대한 이해까지 기대하긴 어렵다. 한국어 구사가 어려운 글로벌 생성형 AI에 높임말 문화, 공동체 중심 윤리 등에 대한 이해를 기대하기란 애초 어렵기 때문이다. 따라서 한국어 이해는 물론이고 한국의 문화, 윤리, 가치관 등 한국인의 정체성까지 이해하는 한국적 AI가 절실하다. 이제부터라도 글로벌 생성형 AI 언어 모델에 한국의 역사와 문화 사회적 맥락을 반영한 학습 데이터가 제공돼야 한다.
이를 위해서는 한국학에 종사하는 공공연구기관과 산업계 간의 협력이 필수적이다. AI 기술을 보유한 기업은 AI 모델을 개발하고 활용할 방안을 모색해야 한다. 또 연구기관은 고품질의 한국 관련 데이터를 제공하면서 글로벌 AI의 한국 친화성을 제고하는 동시에 궁극적으로 한국적 AI의 정확도를 높이는 역할을 해야 한다.
광고 로드중
이러한 콘텐츠들은 한국의 역사와 문화, 사상과 의식 세계를 고스란히 담은 지식 자산으로서, AI가 한국 사회의 복잡한 맥락과 문맥을 이해하는 데 핵심적인 역할을 할 수 있다. AI에 이런 데이터들을 단순 부여하는 것을 넘어 정보의 맥락까지도 학습시키는 노력이 필요하다. 한국의 역사와 문화에서 특정 용어가 갖는 미묘한 의미 차이를 AI가 인식할 수 있도록 구조화된 데이터가 요구된다. 향후에는 데이터 전문가뿐 아니라 일반 연구자들 스스로 연구 과정에서부터 다루는 자료를 AI 친화적으로 가공하는 역량을 키울 필요가 있다. 또 데이터가 체계적으로 축적될 수 있도록 연구기관과 기업 간 협력도 모색해야 한다.
한국적 AI를 구축하는 것은 단순한 기술적 도전이 아니라 이제 국가적 과제가 됐다. AI가 생성하는 콘텐츠가 한국을 정확하게 반영하고 나아가 글로벌 환경에서 한국을 올바르게 소개할 수 있도록, 학계와 산업계가 협력해 체계적인 데이터 구축과 AI 학습을 위한 전략을 수립해야 할 시점이다.
이강한 한국학중앙연구원 한국사학 전공 교수