SK텔레콤, 초대형 AI모델 ‘A.X K1’ 기술공개… 中 딥시크 능가

입력 | 2026-01-07 14:59:53

허깅페이스에 개발 과정과 성능 비교 자료 업로드
수학·코딩 테스트에서 딥시크-V3.1보다 각각 102·110% 우위
연내 멀티모달 기능 도입과 조 규모 확장 검토
4개월 개발·1천 GPU로 519B 모델 완성

SK텔레콤 CI

광고 로드중

SK텔레콤 정예팀은 7일 5190억 매개변수 규모의 대형 AI 모델 A.X K1(에이닷엑스 케이원)에 대한 기술 보고서를 허깅페이스에 올렸다고 발표했다.

정예팀은 4개월 동안 1000개 GPU를 동원해 약 10조 토큰 데이터를 처리했다고 한다. 스케일링 이론(투입 자원에 따라 성능이 비례한다는 원리)을 적용해 모델 크기를 설계하고, 웹·코드·이공계(STEM: 과학·기술·공학·수학) 자료를 활용했다. 정부 지원 없이 자체 자원으로 목표를 이뤘다.

수학 벤치마크 AIME25(미국 고교생 수학 올림피아드 문제 세트)에서 89.8점을 기록하며 딥시크-V3.1(88.4점)보다 102% 높은 점수를 냈다. 코딩 테스트 LiveCodeBench(실시간 신규 문제 풀이 평가)에서는 영어 75.8점·한국어 73.1점으로, 상대 모델(영어 69.5점·한국어 66.2점) 대비 109·110% 성능을 보였다. 비교 대상은 딥시크-V3.1(685B)과 GLM-4.6(357B) 오픈소스 모델이다.

광고 로드중

모델은 519B 중 33B만 선택 활성화하는 전문가 혼합(MoE: 여러 전문 모듈이 입력에 맞춰 동작하는 구조) 방식을 썼다. 이를 통해 훈련 과정의 안정성과 효율을 높였다. 128K 토큰(한국어 약 10만 단어) 문맥 처리도 가능해 긴 보고서나 책 한 권을 한 번에 분석할 수 있다.

SK텔레콤은 추가 연구로 컴퓨팅과 데이터를 늘려 성능을 끌어올릴 방침이다. 올해 말 멀티모달(텍스트·이미지 등 다중 입력 처리) 기능을 넣고 조(1조) 단위 매개변수로 키울 계획이다.

김상준 기자 ksj@donga.com

SK텔레콤, 초대형 AI모델 ‘A.X K1’ 기술공개… 中 딥시크 능가

허깅페이스에 개발 과정과 성능 비교 자료 업로드
수학·코딩 테스트에서 딥시크-V3.1보다 각각 102·110% 우위
연내 멀티모달 기능 도입과 조 규모 확장 검토
4개월 개발·1천 GPU로 519B 모델 완성

트랜드뉴스

권은빈, 26세에 연예계 떠난다…“껍데기 인간관계, 공허-불안 시달려”

B-52 폭격기, 美기지서 이륙 직후 추락…탑승자 전원 사망

CLC 권은빈, 연예계 은퇴 “공허함·불안함 시달렸다”

장동혁 “전국 재선거가 목표”…오세훈 “자리보전용 구호 멈춰라”

‘0’ 하나 잘못 붙여…18억 아파트 172억에 낙찰

오세훈 “장동혁 재선거 주장 소모적…자리보전용 구호 멈춰라”

사퇴론 몰린 장동혁 “전국 재선거 소청”… 당내 “무책임한 행동”

장동혁 “전국 재선거가 목표”…오세훈 “자리보전용 구호 멈춰라”

시위자 1명이 문앞 저지…체육단체, 野중재에도 진입 못했다

한병도 “국힘이 맡았던 경제관련 상임위원장 회수 검토”

지금 뜨는 뉴스

정청래 “역사는 1인1표제 얻기 위해 피 흘려”

이준석 “탈모가 생존?…건보는 정치인 하사품 아냐”

삼성 준감위 “반도체 지방투자, 정치권 논리에 좌우되지 않아야”

SK텔레콤, 초대형 AI모델 ‘A.X K1’ 기술공개… 中 딥시크 능가

허깅페이스에 개발 과정과 성능 비교 자료 업로드 수학·코딩 테스트에서 딥시크-V3.1보다 각각 102·110% 우위 연내 멀티모달 기능 도입과 조 규모 확장 검토 4개월 개발·1천 GPU로 519B 모델 완성

권은빈, 26세에 연예계 떠난다…“껍데기 인간관계, 공허-불안 시달려”

B-52 폭격기, 美기지서 이륙 직후 추락…탑승자 전원 사망

CLC 권은빈, 연예계 은퇴 “공허함·불안함 시달렸다”

장동혁 “전국 재선거가 목표”…오세훈 “자리보전용 구호 멈춰라”

‘0’ 하나 잘못 붙여…18억 아파트 172억에 낙찰

오세훈 “장동혁 재선거 주장 소모적…자리보전용 구호 멈춰라”

사퇴론 몰린 장동혁 “전국 재선거 소청”… 당내 “무책임한 행동”

장동혁 “전국 재선거가 목표”…오세훈 “자리보전용 구호 멈춰라”

시위자 1명이 문앞 저지…체육단체, 野중재에도 진입 못했다

한병도 “국힘이 맡았던 경제관련 상임위원장 회수 검토”

정청래 “역사는 1인1표제 얻기 위해 피 흘려”

이준석 “탈모가 생존?…건보는 정치인 하사품 아냐”

삼성 준감위 “반도체 지방투자, 정치권 논리에 좌우되지 않아야”

허깅페이스에 개발 과정과 성능 비교 자료 업로드
수학·코딩 테스트에서 딥시크-V3.1보다 각각 102·110% 우위
연내 멀티모달 기능 도입과 조 규모 확장 검토
4개월 개발·1천 GPU로 519B 모델 완성