“대한민국은 AMD의 AI 여정에 있어서 굉장히 중요하고 전략적인 파트너다. 한국에 있는 엔지니어링 팀의 규모도 점점 커지고 있다. 개발자부터 언론인까지 개방적 생태계에 함께하는 모든 이들에게 감사하며, 앞으로도 꾸준히 지원하겠다”
지난 12월 12일, 아누쉬 엘랑고반(Anush Elangovan) AMD AI 소프트웨어 부문 총괄 부사장이 지난 9월 출시된 ROCm 7과 관련해 국내 취재진과의 그룹 인터뷰에서 남긴 소회다. 오늘날 AI 가속기의 중심에는 엔비디아가 있고, 그 중심에 엔비디아 GPU를 위한 병렬 컴퓨팅 플랫폼 겸 프로그래밍 모델 ‘CUDA’가 있다. 쿠다는 엔비디아 GPU로 AI 모델을 구축하고 운용하는데 필요한 데이터를 처리하는 기본 소프트웨어로, AI 데이터를 다루기 위한 핵심 기반이다.
아누쉬 엘랑고반(Anush Elangovan) AMD AI 소프트웨어 부문 총괄 부사장 / 출처=AMD
경쟁사인 AMD 역시 2016년부터 AMD GPU로 AI 데이터를 처리할 수 있도록 하는 ROCm 소프트웨어를 제공 중이며, 지난 2025년 9월에 ROCm 7을 출시해 AMD 기반 AI 생태계 구축에 박차를 가하고 있다. ROCm 7은 올해 6월 출시된 AMD 인스팅트 MI350 플랫폼을 공식 지원하며, 효율적인 GPU 자원 활용을 위한 분산 추론 및 엔터프라이즈 AI 구동을 위한 기능 등을 담고 있다. 또한 vLLM, 파이토치 등 오픈소스 프레임워크와도 통합 중이며, 성능과 양적 지원을 확보하기 위해 파트너십을 늘리는 상황이다.
광고 로드중
ROCm은 AMD AI 생태계의 근간, 혁신을 위한 모든 것 지원
AMD ROCm 7은 드라이버, 개발 도구, APU를 포함한 오픈 소프트웨어 스택이다. 쉽게 말해 AMD 그래픽 카드로 AI 모델을 개발하고 활용할 때 필요한 도구모음이다 / 출처=AMD
Q : ROCm의 주요 변경점, 초기 릴리즈부터 지금까지 핵심 업데이트에 대해 말해달라.
A : ROCm은 AMD 기반 AI 생태계의 기본적인 근간이다. 이에 따라 꾸준히 혁신하도록 지원 중이며, 알고리즘이나 오퍼레이터, 표준 제정 등과 관련해 지원 중이다. ROCm 7은 전 세대와 비교해도 성능이 3배 향상됐으며, LLM용 어텐션 알고리즘 최적화 등등 새로운 시도를 적용 중이다. 또 AMD 인스팅트 MI350 같은 새로운 하드웨어를 지원하고, 분산 추론 기능을 지원해 엔터프라이즈 급 AI와 클러스터 AI를 관리할 수 있는 역량을 갖췄다.
Q : 윈도우 환경에서 호환성을 강화하기 위해 노력중인 사안과 향후에 어떤 도전과제가 있는지?
A : 최근 캐노니컬과의 직접적인 파트너십을 통해 우분투 리눅스를 지원하게 됐고, 리눅스 기반 노트북과 데스크톱에서도 ROCm 7 라이브러리를 직접 활용할 수 있다. 이제 윈도우 PC와 리눅스 PC 모두 AMD ROCm 7을 지원한다.
광고 로드중
AMD ROCm 7.0.0 소프트웨어 스택, 하드웨어 및 기본 환경과 런타임, 컴파일러, 개발 및 관리 도구, 지원 라이브러리 등이 기재되어있다 / 출처=AMD
Q : 노드.ai(2023년 10월 AMD에 인수)의 샤크(노드.ai의 소프트웨어 스택)나 사일로 AI(2024년 7월 AMD에 인수)의 기술들이 ROCm에 부분적으로 통합된 상황인데, 공식적으로 완전히 통합되는 시점은 언제인지. 또 통합과 관련해 계속 진행중인 사안 등이 있으면 소개해달라.
A : 노드.ai팀은 IREE 컴파일러(MLIR이라는 통일된 컴퓨터 언어를 활용해 다양한 기계학습(ML) 모델을 어떤 하드웨어든 효율적으로 실행되도록 돕는 변환기) 기반을 바탕으로 LLVM 머신러닝 컴파일러 프레임워크(재사용 가능한 컴파일러 및 툴체인 기술 모음을 뜻하는 오픈소스 프로젝트)와 트라이튼(Tritan) 프로그래밍 언어를 지원하는 핵심 머신러닝 컴파일러 개선 작업을 진행 중이다. 사일로 AI팀은 엔터프라이즈 AI와의 통합 작업을 진행 중이며, 최근 추가된 엔터프라이즈 AI 기능도 사일로 팀 인수를 통해 직접 확보한 것이다.
업데이트 주기는 이제 6주, 핵심 AI는 사전 협력으로 당일 지원 나서
Q : ROCm 소프트웨어의 마이너 업데이트와 메이저 업데이트의 주기를 각각 알려달라.
A : 앞서 버전까지는 6개월 주기로 업데이트했지만 이제는 6주 단위로 업데이트를 출시 중이다. 앞으로는 서비스 개선을 위해 6주 단위로 서비스를 출시하고, 큰 단위의 업데이트는 6개월마다 할 예정이다.
광고 로드중
A : 데이제로 실현을 위해 먼저 선진 연구기관들과 협력 중이다. 오픈AI나 메타 같은 기업들이 모델을 구축하는 단계부터 협력하며, 덕분에 출시 시점에 AMD 플랫폼에서 이 모델들이 실행된다. 두 번째는 모델에 맞춰 지원을 출시하고 최상의 성능을 낼 수 있도록 최적화한다. 세 번째는 향후 업데이트가 있을 때마다 최종 소비자와 사용자들에게 도구를 제공해 문제점을 파악하고 미세조정하고 있다.
ROCm 7.0.0 이상 버전의 권장 그래픽 카드 목록 / 출처=AMD
Q : 지난 12월 2일에 한 개발자가 ROCm 7.1.1 버전에서 RDNA 2(AMD 라데온 RX 6000 시리즈)를 지원하는 버전을 깃허브에 공개했다. 공식적으로 ROCm 7에서 RNDA 2 등 구형 GPU를 지원할 예정이 있는지?
A : ROCm은 오픈소스 플랫폼이며 우리는 개발자 커뮤니티를 지원하고 있다. 개발자라면 누구나 자신의 필요에 따라 기능 등을 수정할 수 있고, 개발자들 사이에서 수요만 있다면 우리 역시 이를 공식 버전에 추가할 의향은 있다. 다만 방금 전달받은 내용에 대해서는 세부적인 내용을 파악할 필요가 있고, 사용자들 사이에서 수요가 있다고 하면 그때는 출시 프로세스에 포함하는 것을 검토해 보겠다.
이달 초, 파이토치 공식 블로그에 AMD 인스팅트 MI325 GPU 1024장을 활용해 MoE 사전 훈련을 진행한 내용에 대한 문서가 게재됐다 / 출처=파이토치
Q : 이달 초 파이토치(오픈소스 머신러닝 라이브러리, 딥러닝 프레임워크) 공식 블로그에 AMD GPU 1024개로 사전 학습을 진행한 내용이 게재됐다. 내용 중 파이프라인 진화나 커널 지원 범위 확장, AMD 인스팅트 MI450 등 차세대 하드웨어를 지원하겠다는 내용은 있으나 총 소유비용이나 와트당 성능에 따른 이점 등은 언급되지 않는다. 이에 대한 설명을 부탁한다.
A : AMD 소프트웨어 전략에 있어서 와트당 성능, 전력 대비 성능은 매우 중요하다. 해당 내용과 관련해서는 와트당 성능 부분을 제외하고도 이전 세대보다 약 1.2배 정도 성능 향상된 점이 확인됐다. 또 총소유비용이나 전력 면에서는 AMD가 추론, 학습 부분에서 꾸준히 좋은 성과를 보여주고 있다.
아울러 AMD는 책임감 있는 AI를 강조하며 개방형 소프트웨어 전략과 에너지의 지속가능성에 대해서도 혁신하기 위해 노력 중이다. 전력 소모와 관련해서는 누구나 오픈소스 측면에서 접근해 전력 효율을 개선할 수 있고, GPU가 활용되는 여러 분야에서 개선을 반영할 수 있다.
AMD, ROCm 생태계 확대 위한 지원 아끼지 않을 것
망고부스트는 AMD 인스팅트 MI300 및 350 시리즈에 대한 MLPerf 추론 테스트를 제출한 이력이 있다 / 출처=망고부스트
Q : 결국 AMD 기반 GPU 생태계가 확장되려면 ROCm 기반 전문가, 개발자가 늘어나야 한다. AMD가 소프트웨어 생태계 구축을 위해 어떻게 개발자 생태계를 지원하고 있나?
A : ROCm 개발자를 늘리기 위해 교육 프로그램, 접근성 강화 프로그램 등을 운영 중이다. 또 개발자 클라우드에 대해서는 개발자가 AMD 인스팅트를 직접 활용하도록 자원을 지원하고 있다. 대학교 등에서도 ROCm과 관련된 교육을 제공하기 위해 협력 중이며, 여러 개발 행사도 꾸준히 지원해 개발자들이 AMD를 직접 경험하고 정착할 수 있도록 지원 중이다.
한국에서도 모레(Moreh), 클레비(Clevi), 망고부스트(Mangoboost)같은 기업들과 협업 중이다. 이들은 AI 개발 환경에서 매우 중요한 파트너고, 기계학습 라이브러리나 ROCm 소프트웨어와 관련해 긴밀하게 협력 중이다. 망고부스트는 AMD 하드웨어를 기반으로 학습 트레이닝이나 추론 부분 확장에 많은 기여를 하고 있고, 올해 MI300X를 기반으로 MLPerf를 제출하기도 했다.
Q : AMD가 일반 개발자 생태계와 어떻게 상호작용하고또 어떤 역할을 하고 있는지도 소개해달라.
A : 깃허브 계정만 있다면 누구나 AMD 디벨로퍼 클라우드를 통해 AMD 하드웨어를 활용할 수 있고, 많은 개발자들이 참여하고 있다. 우리는 디벨로퍼 클라우드의 역량을 확대하기 위해 투자와 노력을 아끼지 않고 있으며, 해커톤 등도 주최하고 있다.
지난 12월 10일 개최된 ‘AMD AI 개발자 밋업 코리아 위드 Moreh’ / 출처=모레
Q : 마지막으로 국내에서 여전히 AMD ROCm 개발자 생태계가 크지 않다. 그럼에도 불구하고 적잖은 개발자들이 이 생태계에 기여하고 있고 실제 업무 환경과 산업에 반영하기 위해 노력 중이다. AMD에서 AI를 총괄하는 입장에서 AMD 개발자 생태계에 참여하고 있는 한국의 개발자들에게 남기고 싶은 메시지가 있다면?
A : ROCm은 소프트웨어 그 이상이며, 하나의 철학이다. 개방성과 포용성, 협력, 그리고 공동개발의 정신을 담고 있다. 우리가 모든 설루션을 갖추고 있다고 말씀드리기는 어렵다. 하지만 개발자들과 함께하는 AI의 미래는 같이 만들어나갈 수 있다. 그 미래는 개방적이며 또 협력을 가능하게 하는 시대다.
또한 한국은 AMD의 AI 여정에 있어서 굉장히 중요하고 전략적인 파트너다. 한국에 있는 엔지니어링 팀의 규모도 점점 커지고 있다. 개발자부터 언론인까지 개방적 생태계와 함께할 수 있는 모든 이들에게 감사하며, 앞으로도 꾸준히 지원하겠다
IT동아 남시현 기자 (sh@itdonga.com)