그록 4.1은 즉각적인 응답을 제공하는 ‘그록 4.1’(코드명:tensor)과 심층적 사고를 지원하는 ‘그록 4.1 씽킹’(quasarflux)으로 구성됐다. 두 모델은 여러 벤치마크에서 오픈AI·앤트로픽·구글 등 경쟁 모델들을 제치고 잠시 동안 1~2위권에 올랐다.
그록 4.1 출시 직후 이번엔 구글이 차세대 AI 모델 ‘제미나이3’(Gemini3)를 출시하며 세계 최고 수준 성능의 모델이라고 강조했다. 제미나이3는 제미나이2.5 공개 이후 약 8개월 만에 선보인 최신 버전이다.
제미나이3는 인간 최후의 시험(Humanity‘s Last Exam·HLE) 벤치마크에서 37.4점을 기록했다. 이는 GPT-5.1과 클로드 소넷 4.5를 앞서는 수치다.
구글은 연구용 확장 버전 ’제미나이3 딥싱크‘(DeepSync)’도 조만간 공개할 예정이다.
미국 현지에선 제미나이3 출시에 그록 4.1은 출시하자마자 관심에서 멀어지는 상황에 놓였다는 평가가 나오고 있다.
한편 미·중 AI 모델 성능 격차는 실제로 빠르게 좁혀지고 있다. 스탠퍼드대 인간중심AI연구소(HAI) 보고서에 따르면 2024년 1월 중국과 미국 최상위 모델 간 성능 격차는 103점이었지만 올해 2월엔 23점으로 축소됐다. MMLU 벤치마크에서는 2023년 20%포인트 차이가 2024년 말 0.3%포인트로 급감했다.
딥시크는 18일(현지시간) 학술전문지 네이처에 동료심사를 거친 논문을 통해 R1의 훈련 비용이 29만4000달러(약 4억 원)라고 처음 밝혔다. 오픈AI가 2023년 “1억 달러 이상”이라고 밝힌 기초 모델 훈련 비용과 비교하면 약 0.3%(300분의 1 수준)이다.
댓글 0