Arm, 3세대 AI 엣지 NPU·플랫폼으로 'AI 시장 가속'에 발맞춘다

  • 동아닷컴
  • 입력 2024년 4월 9일 15시 51분


코멘트
영국의 반도체 설계자산 기업 Arm이 엣지 AI 환경을 위한 Arm 에소스(Ethos)-U85 NPU(신경망 처리장치)와 IoT(사물인터넷) 반도체를 위한 기반 플랫폼 Arm 코스톤(Corstone)-320을 공개했다.

Arm이 차세대 엣지 AI 환경을 위한 NPU, 에소스-U85를 정식 공개했다 / 출처=Arm

황선욱 Arm 코리아 사장은 “에소스-U85는 Arm의 3세대 NPU로, 이전 세대 U65 대비 최대 4배의 성능 향상을 보여주며, 최신 AI 프레임워크를 지원한다. 코스톤-320은 U85를 포함한 Arm 임베디드 AI가 사전 포함된 새로운 사물인터넷 레퍼런스 플랫폼으로, 파트너사들이 고성능 엣지 AI 장치를 개발하는 것을 가속화한다”라고 말했다.

엣지 환경에서도 AI 추론 돕는 Arm 에소스-U85 NPU


발표에 앞서 황선욱 사장은 엣지 AI 하드웨어의 등장 배경에 대해 먼저 설명했다. 황 사장은 “엣지 컴퓨팅은 데이터가 발생하는 현장에 컴퓨팅 능력을 구축하는 기술로, 클라우드 연결 부하를 줄이고, 대규모 데이터 유입으로 인한 병목 등을 방지한다”라면서, “네트워크와 데이터가 진화하면서 엄청난 양의 데이터가 발생하고 있고, 데이터에서 의미 있는 결과를 도출하기 위해 엣지 컴퓨팅에 AI를 접목한 엣지 AI가 활용되고 있다”라고 설명했다.

정리하자면 엣지 컴퓨팅은 시스템의 말단에서 센서를 통해 데이터를 수집하고, 이를 관리하는 작은 컴퓨터다. 과거에는 데이터 수집이나 현장 데이터 처리 정도로 충분했지만, 기계학습 기술이 발전하면서 현장의 분산된 엣지 컴퓨터로도 AI를 처리하려는 움직임이 이어지고 있다. 이번에 공개된 에소스-U85가 이런 조건을 위해 최적화된 엣지 AI 반도체다.

에소스-U85는 1Ghz에서 4TOPS의 성능을 내며, 전 세대 대비 최대 4배로 처리량이 빨라졌다 / 출처=Arm

Arm 에소스-U85는 128에서 2048 MACs(곱셉-누산 연산)을 처리해 이전 세대 U65 대비 최대 4배 빠른 처리량을 갖추며, 전력 효율은 약 20% 더 높아졌다. NPU 처리 성능은 1GHz에서 4TOPS(초당 1조 번 연산 처리)로, 1초에 약 4조 번의 정수 연산을 처리한다. 에소스-U85는 스마트홈, 유통, 공장 자동화 및 상업용 등 상당 수준의 AI 연산이 필요한 조건에 적합하며, 기존 개발자도 원활하게 개발할 수 있도록 텐서플로우 라이트 및 파이토치 등의 AI 프레임워크를 지원한다.

Arm 에소스-U55 및 U65, U85 스펙 시트 / 출처=Arm

또한 전 세대인 U55 및 U65가 지원한 CNN(합성곱 신경망)과 RNN(순환신경망)을 포함해
트랜스포머 네트워크를 새롭게 지원한다. CNN은 물체인식, 분할 등 공간적 이해가 필요한 작업에 적합한 처리 방식이고, RNN은 자연어 처리나 기계번역 등 순차적인 데이터를 처리하는 데 적합하다. 여기에 데이터의 순차적인 학습 능력을 향상시키는 트랜스포머 네트워크를 조합해 이미지 분석이나 데이터 처리, 생성형 AI 활용 등에서 더 나은 성능을 갖춘다.

Arm, 코스톤-320 플랫폼으로 NPU 결합 돕는다


Arm 에소스-U85가 엣지AI 환경을 위한 칩이라면, 함께 공개된 코스톤-320은 이를 활용하기 위한 기반 플랫폼이다. 기본 구성으로 Arm 코텍스(Cortex)-M85 CPU와 Arm DMA-350(직접 메모리 접근), Arm 말리(Mali)-C55 이미지 처리 프로세서가 있고, Arm 에소스-U85 NPU가 함께 구성된다. 개발 기업은 사전 검증된 자산으로 하드웨어를 구축하고, Arm의 반도체 생태계 및 구성 요소를 적용할 수 있다. 구성된 자산은 Arm 버추얼 하드웨어, FVP(고정 버추얼 플랫폼), FPGA(프로그래밍이 가능한 반도체)를 통해 사전 시험할 수 있다.

Arm은 코스톤-320 플랫폼을 통해 업계의 엣지 AI 도입 가속화를 돕는다 / 출처=Arm


Arm 코스톤은 지난해 공개된 Arm 네오버스 컴퓨팅 서브 시스템(CCS)과는 조금 다르다. CSS는 사전에 확정된 디자인과 통합된 체계를 통해 검증까지 마친 구성인 반면, 코스톤은 사용자에게 수정 권한이 부여되고 조정할 수 있다. 이는 사물인터넷 애플리케이션의 활용 범주가 워낙 넓어서 직접 활용 환경에 맞춰 조절해야 할 필요가 있어서다.

Arm은 코스톤 플랫폼을 늦어도 내년 초에는 암 플렉시블 액세스에 포함시킬 계획이다. 암 플렉시블 액세스는 신규 및 기존 파트너가 라이선스를 구매하지 않아도 Arm의 IP 포트폴리오 및 지원, 도구, 트레이닝 자원의 일부를 활용할 수 있는 협력 프로그램이다.

동아닷컴 IT전문 남시현 기자 (sh@itdonga.com)
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

오늘의 추천영상

지금 뜨는 뉴스