스마일샤크, 생성형 AI ‘환각통제 사례’ 발표…“팩트 오류 큰폭 감소, 검수 시간 90% 절감”

입력 | 2026-05-22 09:59:59

AWS 서밋 2026 서 ‘LLM-as-a-Judge’ 기반 검증 체계 소개

AWS 서밋 서울 2026에서 ‘생성형AI의 신뢰성 확보 전략 : 매경AX의 환각 통제 사례’ 주제로 발표 중인 스마일샤크 최병주 솔루션즈 아키텍트. 사진제공=스마일샤크

광고 로드중

스마일샤크(대표 장진환)는 AI가 생성한 결과물을 또 다른 AI 모델이 평가하고 검수하는 ‘LLM-as-a-Judge’ 방식을 매일경제신문사 산하 디지털 조직 매경AX의 AI 팟캐스트에 적용한 결과, 월 평균 15~20건 수준으로 발생하던 사실 오류를 월 1건 이하로 줄였으며, 검수 과정에 투입되는 인력 시간도 90% 이상 단축했다고 밝혔다.

최병주 스마일샤크 솔루션즈 아키텍트는 이같은 내용을 지난 20일 ‘AWS 서밋 서울 2026’ 인더스트리데이 세션에서 ‘매경AX의 환각 통제 사례’를 주제로 발표했다.

이 프로젝트는 생성형 AI 도입 시 가장 큰 걸림돌인 환각 현상(사실과 다른 정보를 생성하는 문제)을 해결하기 위해, AI 모델이 결과물을 내놓으면 별도의 평가 AI가 원문 대조 및 평가 기준에 따라 결과물의 신뢰도를 검증하는 방식으로 진행됐다.

광고 로드중

최병주 아키텍트는 “생성형 AI 서비스는 운영 단계에서 품질 평가 체계가 반드시 필요하다”며 “모델 자체 성능뿐 아니라 오류 검증과 실패 사례 관리가 함께 이뤄져야 안정적인 서비스 운영이 가능하다”고 말했다.

AWS 서밋 서울 2026 스마일샤크 부스를 찾은 참관객들. 사진제공=스마일샤크

클라우드 업계 역시 생성형 AI 확산과 함께 AI 결과물의 신뢰성과 운영 안정성을 검증하는 기술 수요 역시 빠르게 증가할 것으로 보고 있다. 장진환 대표는 “AI를 실제 업무 환경에 적용하려는 기업 문의가 지속적으로 증가하고 있다”며 “운영 경험 기반의 사례와 노하우 공유를 확대할 계획”이라고 밝혔다.

한편, 올해로 12회를 맞은 ‘AWS 서밋 서울’은 AWS가 주최하는 국내 대표 AI·클라우드 행사로, 올해는 생성형 AI 기술과 산업 현장 적용 사례를 중심으로 다양한 세션이 진행됐다. 스마일샤크는 이 행사에 플래티넘 스폰서로 참가해 AI 상용화 전략과 운영 경험을 소개했다.

또한 현장 부스에서는 야구단 포지션 테스트 기반 클라우드 서비스 추천 콘텐츠와 맞춤형 굿즈 프로그램 등이 운영됐다. 스마일샤크는 행사 기간 동안 스타트업과 중소기업 관계자를 대상으로 AI 도입 상담도 병행했다.

최용석 기자 duck8@donga.com

스마일샤크, 생성형 AI ‘환각통제 사례’ 발표…“팩트 오류 큰폭 감소, 검수 시간 90% 절감”

AWS 서밋 2026 서 ‘LLM-as-a-Judge’ 기반 검증 체계 소개

트랜드뉴스

“합의안 반대” DX조합원 1만명 늘자… 초기업노조 “투표 제외”

머스크, 173조원 반도체 공장 짓는다…韓·美·中·日 ‘칩 패권’ 경쟁

후식인 줄 알았던 과일의 반란… 뷔페 ‘메인 주인공’이 됐다

이스라엘에 공중급유기 50대 넘게 집결…美 공습 재개 임박했나

“아버지 이미 사망했는데”…손주에게 이어진 조부모 빚 [상속리포트]

‘스벅 불매’ 공직사회로 번져…“배달 않겠다” 라이더도 등돌렸다

이스라엘서 풀려난 활동가 “정부가 막아도 다시 가겠다”

신동욱 “하정우 화이팅”…논란 일자 “우정식당 화이팅 외친것”

정청래 “스벅 불매운동 불길처럼 번지기 전에, 정용진 석고대죄하라”

“합의안 반대” DX조합원 1만명 늘자… 초기업노조 “투표 제외”

지금 뜨는 뉴스

이스라엘 공항에 공중급유기 최소 50대…“군사력 증강 계속”

살 뺐다 다시 찌면 몸에 더 해롭다?…결론은 ‘반전’ [바디플랜]

머스크 하고 싶은 거 다 해! 세계 시총 6위, 스페이스X가 온다 [딥다이브]