K-언어모델 비교 실험 ‘WBA(와바)’, 대중의 평가로 결정되는 AI 순위 비전문가도 직접 질문하고 답변 비교… 공정, 신뢰, 재미 모두 잡아
WBA 서비스 메인 화면. 이미지=프렌들리AI 제공
광고 로드중
AI 기술 전문 기업 프렌들리AI(대표 전병곤)가AI 비전문가도 참여할 수 있는 K-언어모델 비교 실험 플랫폼, ‘WBA(World Best AI, 와바)’를 6일 공식 출시했다.
WBA는 블라인드 테스트 방식으로 사용자가 AI언어모델을 평가할 수 있는 서비스다. 평가 순위표 (리더보드, Leaderboard)도 공개된다. 쉬운 사용법과 공정성, 재미 요소를 모두 갖춘 것이 특징이다.
최근 LG AI연구원, 업스테이지, SKT, 네이버 등 국내 AI 기업들은 다양한 언어모델을 오픈소스로 공개했다. 하지만 개발사가 공개한 일부 벤치마크 점수만으로는 실사용 환경에서 어떤 모델이 더 뛰어난 성능을 지녔는지 비교하기 어렵다.
광고 로드중
WBA 모델 평가 인터페이스 예시. 이미지=프렌들리AI 제공
정부가 지난 4일 선정한 국가대표 AI 정예팀(독자 AI 파운데이션 모델 사업)의 주관사들 (LG AI연구원, 업스테이지, SKT, 네이버 등)도 만나볼 수 있다. 또한 OpenAI, Anthropic, Google 등 글로벌 빅테크의 대표 모델과 DeepSeek, Qwen 같은 해외 유명 오픈소스 모델도 함께 등록되어 있어, 정예팀의 K-언어모델과 해외 언어모델 간의 직접적인 비교 평가도 가능하다.
전병곤 프렌들리AI 대표는 “한국에서 AI 언어모델 개발 경쟁이 본격화된 지금, 실제로 대중이 선택하는 진짜 고성능 AI가 무엇인지 확인해볼 기회”라며 “WBA는 누구나 참여해 재미와 보람을 얻어갈 수 있다. 주저하지 말고 이번 K-언어모델 비교 실험에 참여해보라”고 전했다.
최용석 기자 duck8@donga.com