AWS 서밋 2026 서 ‘LLM-as-a-Judge’ 기반 검증 체계 소개
AWS 서밋 서울 2026에서 ‘생성형AI의 신뢰성 확보 전략 : 매경AX의 환각 통제 사례’ 주제로 발표 중인 스마일샤크 최병주 솔루션즈 아키텍트. 사진제공=스마일샤크
광고 로드중
스마일샤크(대표 장진환)는 AI가 생성한 결과물을 또 다른 AI 모델이 평가하고 검수하는 ‘LLM-as-a-Judge’ 방식을 매일경제신문사 산하 디지털 조직 매경AX의 AI 팟캐스트에 적용한 결과, 월 평균 15~20건 수준으로 발생하던 사실 오류를 월 1건 이하로 줄였으며, 검수 과정에 투입되는 인력 시간도 90% 이상 단축했다고 밝혔다.
최병주 스마일샤크 솔루션즈 아키텍트는 이같은 내용을 지난 20일 ‘AWS 서밋 서울 2026’ 인더스트리데이 세션에서 ‘매경AX의 환각 통제 사례’를 주제로 발표했다.
이 프로젝트는 생성형 AI 도입 시 가장 큰 걸림돌인 환각 현상(사실과 다른 정보를 생성하는 문제)을 해결하기 위해, AI 모델이 결과물을 내놓으면 별도의 평가 AI가 원문 대조 및 평가 기준에 따라 결과물의 신뢰도를 검증하는 방식으로 진행됐다.
광고 로드중
AWS 서밋 서울 2026 스마일샤크 부스를 찾은 참관객들. 사진제공=스마일샤크
한편, 올해로 12회를 맞은 ‘AWS 서밋 서울’은 AWS가 주최하는 국내 대표 AI·클라우드 행사로, 올해는 생성형 AI 기술과 산업 현장 적용 사례를 중심으로 다양한 세션이 진행됐다. 스마일샤크는 이 행사에 플래티넘 스폰서로 참가해 AI 상용화 전략과 운영 경험을 소개했다.
또한 현장 부스에서는 야구단 포지션 테스트 기반 클라우드 서비스 추천 콘텐츠와 맞춤형 굿즈 프로그램 등이 운영됐다. 스마일샤크는 행사 기간 동안 스타트업과 중소기업 관계자를 대상으로 AI 도입 상담도 병행했다.
최용석 기자 duck8@donga.com