허깅페이스에 개발 과정과 성능 비교 자료 업로드 수학·코딩 테스트에서 딥시크-V3.1보다 각각 102·110% 우위 연내 멀티모달 기능 도입과 조 규모 확장 검토 4개월 개발·1천 GPU로 519B 모델 완성
SK텔레콤 CI
광고 로드중
SK텔레콤 정예팀은 7일 5190억 매개변수 규모의 대형 AI 모델 A.X K1(에이닷엑스 케이원)에 대한 기술 보고서를 허깅페이스에 올렸다고 발표했다.
정예팀은 4개월 동안 1000개 GPU를 동원해 약 10조 토큰 데이터를 처리했다고 한다. 스케일링 이론(투입 자원에 따라 성능이 비례한다는 원리)을 적용해 모델 크기를 설계하고, 웹·코드·이공계(STEM: 과학·기술·공학·수학) 자료를 활용했다. 정부 지원 없이 자체 자원으로 목표를 이뤘다.
수학 벤치마크 AIME25(미국 고교생 수학 올림피아드 문제 세트)에서 89.8점을 기록하며 딥시크-V3.1(88.4점)보다 102% 높은 점수를 냈다. 코딩 테스트 LiveCodeBench(실시간 신규 문제 풀이 평가)에서는 영어 75.8점·한국어 73.1점으로, 상대 모델(영어 69.5점·한국어 66.2점) 대비 109·110% 성능을 보였다. 비교 대상은 딥시크-V3.1(685B)과 GLM-4.6(357B) 오픈소스 모델이다.
광고 로드중
SK텔레콤은 추가 연구로 컴퓨팅과 데이터를 늘려 성능을 끌어올릴 방침이다. 올해 말 멀티모달(텍스트·이미지 등 다중 입력 처리) 기능을 넣고 조(1조) 단위 매개변수로 키울 계획이다.
김상준 기자 ksj@donga.com