[Tech&]압도적 스케일의 인공지능 모델로 '모두의 AI' 꿈 이룬다… SKT, 5000억 매개변수 초대형 모델 연말 공개

  • 동아일보

SK텔레콤 컨소시엄, 산학전문가 연합으로 최고 수준 독자 AI 모델 개발
엔비디아 B200 기반 국내 최대 규모 단일 클러스터로 GPUaaS 제공도
“세계 최고 수준 AI 모델 달성은 기술 자립을 위해 필수… 지체할 시간 없어”

11월 28일 서울 성동구 성수동에 마련된 SKT 정예팀 전용 공간 ‘워룸’에서 과학기술정보통신부 ‘독자 AI 파운데이션 모델’ 프로젝트에 참여 중인 SK텔레콤 정예팀과 대학생, AI 연구자들이 함께한 ‘2025 파운데이션 모델 테크 워크숍’이 열렸다. 사진은 김태윤 SK텔레콤 파운데이션 모델 담당이 개발 중인 AI 모델을 주제로 발표하는 모습.
SK텔레콤이 연내에 매개변수 5000억 개 이상의 초거대 인공지능(AI) 모델 A.X K1(에이닷엑스 케이원)을 선보인다. 그동안 수십억∼수백억 개 수준의 모델에 머물렀던 대한민국의 AI 모델들을 아득히 넘어서는 수준의 도전적인 프로젝트를 선택해 그 첫 성과물의 공개를 앞두고 있다.

SK텔레콤 컨소시엄은 글로벌 초거대 AI 경쟁이 미국과 중국을 중심으로 치열하게 전개되는 가운데, 대한민국이 자국의 AI 주권을 지키고 미래 산업의 경쟁력을 확보하기 위해 본격적으로 나서는 역사적인 계기를 마련하겠다는 각오로 프로젝트를 추진 중이다.

컨소시엄에는 SK텔레콤을 중심으로 크래프톤, 포티투닷, 리벨리온, 셀렉트스타, 라이너 등 각 산업 분야에서 강점을 가진 컨소시엄 참여사들이 함께 협력하고 있으며, 서울대·KAIST 등 국내 최고 학계 연구진이 참여했다. 게임, 자동차, 반도체, 데이터, 검색, 멀티모달 AI 등 각자의 전문성을 한데 모아, 초거대 AI의 난제를 함께 풀어가고 있다.

SK텔레콤 컨소시엄의 프로젝트 핵심 목표는 한국어 처리 능력에서 세계 최고 수준을 달성하면서도, 다국어 지원과 멀티모달 기능을 갖춘 차세대 AI 모델 개발이다. 특히 대한민국의 문화적 맥락과 정서를 깊이 이해할 수 있는 AI 기술 구현을 통해 국내뿐만 아니라 글로벌 AI 시장에서도 차별화된 경쟁력을 확보한다는 전략이다.

2027년까지 계속되는 프로젝트 기간에 맞춰 기술적으로도 도전적 목표를 세웠다. 수조 개 이상의 토큰을 학습하는 수천억∼수조 파라미터 규모의 초거대 모델을 구축하고, 최신 구조인 MoE(Mixture of Experts) 방식을 도입해 학습 효율성을 극대화한다.

기존에 보유한 A.X 시리즈 모델을 넘어, 완전히 프롬 스크래치(From Scratch·모델의 맨 첫 단계부터 모두 직접 구축)로 새롭게 설계·학습하여 글로벌 프런티어 모델의 95% 이상 성능을 달성하고, 최종적으로는 독자적인 포스트 트랜스포머 모델을 만들어 성능과 효율성 모두 세계 최고들과 경쟁할 만한 수준을 달성하는 것이 목표다.

또한 2019년부터 한국형 AI 모델을 자체 개발한 경험과 1000만 고객이 활용하는 AI 에이전트 에이닷(A.)을 상용화하며 수렴한 고객의 목소리를 바탕으로 사용자 편의성과 사용성이 뛰어난 모델을 만든다는 각오다.

워크숍에 참석한 SK텔레콤 정예팀 관계자들.
SKT 정예팀은 ‘모두의 AI’라는 국가적 목표가 의미하듯 실사용자 관점의 체감 성능이 중요하다는 점에 집중했다. AI의 사회·경제적 파급 효과, 접근성 향상, 실질적 활용성이 주요해질 것으로 보고 입체적으로 준비해 나갈 예정이다.

SKT 컨소시엄은 리벨리온이 보유한 국산 NPU(Neural Processing Unit) 활용 기술 최적화를 통해 고성능·고효율 AI 서비스를 구현할 계획이다. 리벨리온이 최근 출시한 AI 전용 NPU ‘아톰맥스(ATOM-Max)’는 자연어 처리, 컴퓨터 비전, 추천 시스템 등 대규모 고성능 AI 추론에 최적화되어 성능 및 에너지 효율이 뛰어나다.

컨소시엄은 모든 국민이 손쉽고 편리하게 활용할 수 있는 AI 에이전트를 개발하고, 국내 산업 영역의 중요도가 높은 사무·제조·자동차·게임·로봇 분야의 AI 혁신과 대전환을 선도할 계획이다.

독자 파운데이션 모델의 완성은 단순한 기술 성과에 그치지 않고, 대한민국 산업 전반에 큰 파급 효과를 미치게 될 예정이다. 먼저 SK 그룹사와 컨소시엄 참여사를 중심으로 모델을 적용·확산시킬 계획이다. 이미 SK하이닉스, SK이노베이션, SK AX, SK브로드밴드 등 주요 관계사, 최종현학술원, 한국고등교육재단을 포함하여 20여 기관이 참여 의향서를 제출하여, 실제 현장에서의 활용과 검증을 함께하기로 했다. 제조, 자동차, 게임, 로봇, 금융 등 우리 생활과 산업 전반을 아우르는 분야에서 AI 전환(AX)을 선도적으로 추진할 수 있는 기반이 마련됐다.

국내 최초로 거대 언어모델을 개발하고 공개해 온 경험, 국내 5위 규모의 슈퍼컴퓨터 TITAN을 직접 운영해 온 경험, 자체 GPU 클러스터와 MLOps 기술, 국내 최대 규모로 새롭게 건설될 울산 AI DC, 그리고 하루 수천만 건의 통화 요약과 고객 상담 요약에 자체 모델을 적용한 상용화 경험은 모두 이번 프로젝트의 든든한 토대가 되고 있다.

특히 SK텔레콤은 가산 AI 데이터센터에 엔비디아 블랙웰 B200 GPU를 기반으로 구성한 클러스터 ‘해인’을 활용한 GPU 임차 사업자로서도 이번 독자 AI 파운데이션 모델 프로젝트에 기여하고 있다. GPU 임차 지원 사업은 국내 AI 산업의 글로벌 경쟁력 확보와 국가 AI 생태계의 고도화를 위해 마련됐다.

가산 AI 데이터센터에 구축된 엔비디아 블랙웰 B200 기반 클러스터 ‘해인’의 모습. 1000장이 넘는 엔비디아의 최신 AI 칩인 블랙웰 B200을 단일 클러스터로 구성하여 제공하는 국내 최대 규모이자 최고 성능의 GPUaaS다.
클러스터명 ‘해인(海印, Haein)’은 팔만대장경이 보관된 ‘해인사’에서 모티브를 가져왔으며, 이번 SKT B200 클러스터가 디지털 팔만대장경을 품은 K-소버린 AI 인프라가 되겠다는 의미를 담고 있다.

SK텔레콤은 독자 모델의 직접 개발, GPUaaS(대규모 모델 학습 및 추론을 위해 설계된 GPU 클라우드 인프라를 제공하는 서비스) 사업자로서 정부 프로젝트 참여 등 다방면에서 대한민국이 글로벌 경쟁력을 갖춘 국가 AI 파운데이션 모델을 개발하는 데 기여해 나갈 예정이다.

SK텔레콤 AI 모델 개발 히스토리

국산 생성형 언어 모델의 출발점, 한국어 AI 기술의 초석 다져

SK텔레콤은 생성형 AI 기술이 전 세계적으로 주목받기 시작한 2018년부터 한국어 중심의 AI 기술 연구를 지속해 자연어 이해 및 생성 기술의 기반을 마련하는 한편, 주요 모델을 오픈소스로 공개해 국내 생태계와의 상생에도 기여해 왔다.
또한 감성 대화, 통화 요약, 지식 기반 응답 등 다양한 분야에서 생성형 AI 기술을 고도화하며, 이를 실제 고객 접점에 지속적으로 적용 중이다.

SK텔레콤은 2019년 국내 최초의 한국어 딥러닝 언어 모델인 ‘KoBERT’를 자체 개발해 공개하고, 이를 고객센터 챗봇 등에 적용한 바 있다. KoBERT는 기존 해외 모델과 달리 한국어의 조사, 어순, 띄어쓰기 등 언어 구조를 반영해 문맥 이해와 의미 분석에서 높은 정확도를 보였다.

이후 2020년 4월에는 국내 최초로 GPT-2를 한국어로 구현한 ‘KoGPT2’를 공개했으며, 같은 해 10월에는 뉴스 및 문서 요약에 특화된 ‘KoBART’를 출시하는 등 지속적인 기술 개발로 자연어 처리 역량을 향상시켰다.

이러한 과정은 한국어 기반 생성형 언어 모델의 초석을 다졌다는 점에서 큰 의미를 지닌다. SKT는 KoBERT, KoGPT2, KoBART 등 주요 모델을 오픈소스로 공개하며 기술 경쟁력을 확보하고 국내 AI 생태계 발전에도 기여해 왔다. 이후에도 한국어 고유의 언어 구조와 표현 방식을 정밀하게 분석해 국내 언어 환경에 최적화된 AI 역량을 꾸준히 강화하고 있다.

일상 속의 AI, 고객과 함께 발전한 A.X 시리즈

SKT는 개발한 기술을 상용 환경에 적용하기 위한 고도화도 병행했다. 2022년에는 자체 개발한 GPT-3 기반 한국어 특화 버전을 에이닷(A.) 서비스에 적용해 사용자 요청에 따라 일상 대화와 다양한 작업 수행이 가능하도록 구현했다. 이어서 감성 대화에 특화된 ‘A.X 1’ 모델을 추가 적용하며 정서적 교감 기능을 강화하기도 했다.

2023년에는 복잡한 문맥 이해와 지식 기반 응답이 가능한 ‘A.X 2’를 선보였다. 표준형과 경량형으로 구성된 이 모델은 대화 흐름을 보다 깊이 있게 파악하고 정보 제공 능력을 고도화해 이용자들로부터 호평을 받았다.

이어 2024년에는 새로운 아키텍처를 기반으로 추론 속도와 전반적인 성능을 향상시킨 ‘A.X 3.0’을 선보였다. A.X 3.0은 340억(34B) 파라미터의 표준형과 70억(7B) 파라미터의 경량형으로 구성되었으며, 같은 해 4월 에이닷 전화의 통화 요약 기능에 적용된 데 이어 8월에는 AI 에이전트 기능에도 적용되며 상용 서비스에 활용됐다.

A.X 1부터 3.0까지의 모든 모델은 구조 설계부터 데이터 수집, 학습까지 모든 과정을 SKT가 직접 수행한 ‘프롬 스크래치(From Scratch)’ 방식으로 개발되었다. 대규모 한국어 데이터를 기반으로 단순한 질의응답을 넘어 사용자 의도와 맥락을 파악해 보다 논리적이고 유용한 대화가 가능하다.

성능과 효율 중심으로 진화하는 한국어 특화 LLM 지향

2025년 7월 공개한 ‘A.X 4.0’은 외부 지식 기반 추론 기능이 대폭 강화되었으며, 대규모 학습(CPT) 방식으로 학습되어 데이터 보안, 로컬 운영 가능성, 한국어 처리 효율성 측면에서 강점을 갖추고 있다. A.X 4.0은 현재 에이닷의 통화 요약 등 실제 서비스에 적용되어 정확성과 응답 신뢰도를 한층 높이고 있다.

또한 SKT는 비슷한 시기에 70억(7B) 및 340억(34B) 파라미터 규모의 두 가지 ‘A.X 3.1’ 모델을 프롬 스크래치 방식으로 개발해 공개했다. 두 모델 모두 추론 모델로의 확장 가능성을 고려해 코드와 수학 성능을 대폭 향상시킨 것이 특징이다.

이처럼 SKT는 독자 기술을 기반으로 한 A.X 3 계열의 프롬 스크래치 모델과 CPT 방식의 외부 지식 학습을 적용한 A.X 4 계열의 대규모 모델을 병행 개발하는 ‘투 트랙 전략’을 추진해 왔다. 이를 통해 다양한 서비스 환경과 용도에 최적화된 AI 모델 포트폴리오를 지속적으로 확장해 나가고 있다.

SKT는 한국어에 최적화된 LLM 기술을 고도화해 나가며, 초거대 AI의 산업화와 일상화를 선도하고, 국내 AI 생태계 활성화를 위한 기술 공유와 협력을 확대해 나갈 계획이다.
#SK텔레콤#A.X K1#초거대 AI#AI 기술#프롬 스크래치#해인#SKT B200 클러스터
