KAIST는 김현우 전산학부 교수 연구팀이 고려대 연구팀과 공동연구를 통해 서로 다른 인공지능(AI) 모델 사이에서 학습된 지식을 이식할 수 있는 기술을 개발했다고 27일 밝혔다.
KAIST는 이 기술을 사용하면 마치 새 스마트폰을 구매했을 때 기존 스마트폰에 저장돼 있던 연락처와 사진을 옮기듯, 막대한 데이터와 비용을 들여 새 AI 모델을 다시 학습시킬 필요 없이 지식을 이식시킬 수 있다고 설명했다.
이 기술의 핵심은 한 AI가 학습하며 쌓은 ‘적응 경험’을 다른 AI 모델로 옮기는 것이다. 과거에는 ‘선배 AI’의 경험을 ‘후배 AI’에 전수해 주기 위해 선배 AI가 거쳐온 학습 과정을 후배 AI에게 반복시키는 절차가 필요했다. 모델 구조가 조금만 달라져도 이전에 쌓아놓은 경험을 그대로 활용하기가 어려웠기 때문이다.
하지만 연구팀의 기술을 활용하면 선배 AI의 경험이 축적된 인공신경망의 일부를 떼다가 후배 AI에게 이식하듯 지식을 전달할 수 있다. 이 방식을 활용하면 서로 다른 구조와 크기를 가진 AI 모델 사이에서도 정밀하게 지식을 이식할 수 있다는게 KAIST의 설명이다.
김 교수는 “이 연구를 확장하면 새로운 초거대언어모델이 등장할 때마다 반복해 수행해야 했던 ‘후학습’의 비용을 크게 줄일 수 있다”며 “특정 분야의 전문 지식을 손쉽게 추가하는 ‘지식 패치’도 가능해질 것”이라고 설명했다.
댓글 0