인공지능 서버에서 오토모티브, 스마트 센서까지… AI 반도체 4개 제품군 ‘딥엑스 시리즈’ 동시에 선보여

  • 동아일보
  • 입력 2022년 5월 30일 03시 00분


코멘트

㈜딥엑스

㈜딥엑스 시리즈 4개 제품군의 성능과 출시일.
㈜딥엑스 시리즈 4개 제품군의 성능과 출시일.
빠르게 성장 중인 인공지능(AI) 반도체 시장에서 한 국내 스타트업이 2019년에 독자 인공신경망처리장치(NPU)를 개발해 업계를 놀라게 했다. 이 회사는 세계 최고 수준의 성능을 가진 AI 프로세서를 위한 원천기술을 지속적으로 신규 개발하고 고도화를 진행해왔다. 시제품 출시를 앞두고 많은 기대를 받고 있는 국내 AI 반도체 기업 ㈜딥엑스의 이야기다.

딥엑스가 개발하는 엣지 AI 반도체에 대한 전망은 밝다. 지난해 전세계 온라인 디지털 양은 44ZB였는데, 이는 2025년까지 180ZB로 늘어날 것으로 전망된다. 또한 앞으로 엣지 디바이스에서 발생하는 데이터 40%가 실시간 처리를 요구하고 데이터의 보안 이슈 등으로 인해 데이터가 생성된 엣지 디바이스에서 곧바로 AI로 연산 처리하는 온디바이스 AI 솔루션의 필요성이 높아지고 있다. 이에 딥엑스는 앞으로 서버 안에만 갇혀 있던 AI 연산 처리를 웨어러블, 집 안, 자동차 안, 엣지 서버 등의 일상생활 반경으로 끌어와 ‘도처에 존재하는 AI(Pervasive AI 또는 Ubiquitous AI)’를 실현하는데 기여할 것이다.
미래시장 선점 위해 원천기술 개발
글로벌 시장 조사기관에 따르면, 미래 AI 반도체 시장은 향후 3년 이내 엣지 디바이스용 NPU가 73%나 점유할 것으로 전망된다. 엣지 디바이스의 인공지능 서비스를 지원하기 위한 추론형 AI 서버 프로세서도 21%를 차지해 이들을 합치면 전체 AI 반도체 시장에서 94%나 차지하게 된다는 전망이 나온다. 딥엑스는 창업 초기부터 바로 이 94%의 시장을 공략하기 위한 원천기술 개발을 진행해 왔다.

이 회사는 창업 이전부터 지금까지 전세계 700개 글로벌 고객사와 소통해오고 있다. 이중 100개 기업은 딥엑스의 사업군과 직접적으로 연결되는 분야의 기업들로 일부는 딥엑스 기술의 가치를 이해하고 응용 제품의 상용화를 진행하는 수준에 이르렀다.

딥엑스의 김녹원 대표는 “시장의 정답은 현장의 고객이 알고 있다”는 생각으로 수많은 비즈니스 미팅을 통해 얻게 된 고객사들의 요구사항에 대한 면밀한 분석을 진행했다. 김 대표는 “전세계 고객사들은 더 가볍고 더 스마트하게 진화된 최신 딥러닝 모델을 실장하기를 원한다”며 “배터리로 동작하는 엣지 응용 시스템에서 서버 프로세서를 방불케 하는 연산 성능을 요구하면서도, GPU 수준에서 타협하지 않는 인공지능 정확도를 원하고 있다”고 설명했다.

이 회사의 주요 제품인 ‘딥엑스 시리즈’는 독자 개발한 NPU 기반 시스템온칩 형태의 제품이다. AI 소프트웨어과 하드웨어의 핵심기술을 상호 동시 최적화해 세계 최고 수준의 전성비를 유지하면서 최신 AI 알고리즘을 GPU 수준의 정확도로 유지하는 점이 특징이다. 낮은 전력 소모를 가지고 높은 AI 연산 처리 성능을 제공하는 인공지능 응용을 위한 시스템 반도체다.

한편, 이 시리즈는 딥러닝 기반 객체 인식, 얼굴 인식, 음성 인식, 이미지 분류, 화질 개선 등 보편적인 인공지능 알고리즘들의 연산 처리를 지원한다. 초소형 센서 기기를 위한 0.1 TOPS(초당 조 단위 AI 산술 연산 처리)에서 인공지능 서버를 위한 30 POPS(초당 3경회의 AI 산술 연산 처리)까지 범위를 확장할 수 있게끔 만들어졌다.

올해 하반기부터 선보이는 딥엑스 시리즈는 응용 분야가 요구하는 AI 연산 성능의 수준과 기능에 따라서 제품군을 DX-L1, DX-L2, DX-M1, DX-H1 총 4가지 솔루션으로 구성됐다. 삼성 파운드리의 5nm, 14nm, 28nm 공정을 사용해 제작된다. 딥엑스는 데이터 처리량이 적은 초소형 센서 디바이스부터 최고성능의 AI 알고리즘 연산을 요구하는 자율주행차, 인공지능 서버까지 진화하는 AI 생태계에 맞춰 체급별 AI 연산 성능과 다양한 기능 조합을 선보일 방침이다.

현재 스마트 센서, AMR, ICT 인프라, 자동차 부품, 센서 모듈, 공장자동화, 완성차 분야, AI 서버 등 20여 개의 글로벌 기업들에 뜨거운 관심을 받으며 PoC(검증 단계)를 진행 중이다. 딥엑스의 김녹원 대표는 “딥엑스와 고객사들은 보다 정확한 실증을 위해 딥엑스 시리즈가 출시되는 올해 말을 기다리고 있다”고 밝혔다.
“세계 최고 수준의 고효율, 고성능, 고품질의 AI 프로세서 기술 확보”
김녹원 대표는 “프로세서에서 연산 성능을 끌어올리려면 전성비 기술이 핵심이다. 전성비 기술이 없는 상태에서 성능을 끌어 올리면 과도한 전력소모와 이로 인한 안정성에 문제를 야기하는 과열을 피할 수 없기 때문이다. 모바일뿐만 아니라 서버에서도 이런 전성비 기술이 필수가 되고 있다. 전성비를 핵심 목표로 기술 개발을 하는 회사는 현재 전세계적으로 애플 실리콘과 딥엑스 뿐”이라며 “진보적인 전성비 기술을 획득한 회사들이 미래 실리콘 비지니스를 주도할 것”이라고 예상했다.

딥엑스의 NPU 기술이 추구한 첫 번째 목표는 연산 처리 전성비, 1와트 전력 소모당 AI 산술연산 횟수를 의미하는 ‘TOPS/W’를 높이는 것이다. 현재 글로벌 리더의 기술들이 정성적으로 NPU 기준 최대 8 TOPS/W 이상의 전성비를 형성하고 있다. 딥엑스는 현재 이 전성비를 상회하는 것에 도전하고 있고 삼성 파운드리의 선단 공정인 5nm 제조 공정을 통해 제작한 자사 NPU 시스템온칩을 통해 이에 대한 결과를 입증할 계획이다.

딥엑스가 연산 처리 전성비만큼 중요하게 생각하는 지표는 실효 연산 성능 효율이다. 즉 IPS/TOPS(초당 1조회 AI 산술 연산 처리 성능을 사용하면 최대 몇 회의 인공지능 추론 연산을 처리하는가)이다. 대다수의 글로벌 AI 반도체 개발 기업들이 Resnet-50이라는 DNN 모델을 기반으로 측정한 수치를 공통적으로 공개하고 있는데, 이와 비교 분석했을 때 가장 최상단에 딥엑스 NPU 기술이 위치한다고 평가한다. 딥엑스는 TOPS/W 기준과 IPS/TOPS 기준을 동시에 최상위로 맞추는 게 진정한 세계 최고 전성비의 조건이라고 강조한다.

한편, 이 회사가 추구하는 또 다른 핵심 지표는 NPU에 구현된 인공지능의 정확도이다. 딥엑스와 같은 대다수의 글로벌 NPU 기술들은 GPU 보다 연산 성능과 전성비를 좋게 하기 위해 GPU가 사용하는 부동소수점 32비트 대신에 정수형 8비트 이하로 인공지능 데이터를 표현한다. 부동소수점 32비트 연산을 하면 데이터 좌표를 정확하게 반영하기 때문에 매우 정확한 결과값을 계산해 낼 수 있지만 데이터량이 방대해 데이터 저장과 이동 그리고 연산 처리에서 많은 하드웨어 리소스, 긴 연산 처리 지연시간, 그리고 과도한 전력 소모를 야기한다. 이런 이유로 대다수 NPU 기술들은 연산 결과의 양자화에 따른 오류 값이 커서 좋은 인공지능 정확도를 얻기 어려운데도 정수형 8비트 이하를 주로 쓰고 있다.

예를 들어 최신 DNN 알고리즘을 포팅할 수 있다고 알려진 한 글로벌 기업의 NPU 조차 최신 객체 인식 DNN 알고리즘의 경우 공개된 인공지능 정확도 지표에서 4~5%(mAP 기준)의 인식률 저하를 보이고 있다. 딥엑스 NPU에 포팅된 최신 인공지능 알고리즘들은 최대 0.4% 정도만 저하되거나 오히려 0.2% 향상된 결과를 입증했다. 또한 작년 7월에 Archive에 공개된 YoloX 알고리즘을 구동시킬 수 있는 NPU는 아직까지 알려지지 않았지만, 딥엑스는 최초로 지난해말 포팅하여 실시간 데모를 했고, AI 정확도가 GPU보다 0.1% 상승하는 결과를 증명했다. 최근 복수의 고객사가 자신들이 개발한 상용 인공지능 알고리즘을 딥엑스 NPU에 포팅한 결과, 인공지능 정확도가 GPU에서 개발된 알고리즘 원본보다 향상된 것을 직접 확인했다고 밝히기도 했다.

또한 딥엑스는 고객사의 최신 AI 응용 알고리즘을 자사 NPU에서 바로 구동할 수 있도록 소프트웨어와 하드웨어의 연동을 자동화시켰다. Tensorflow, Pytorch, Caffe와 같은 AI SW 플랫폼에서 개발된 여러 응용 딥러닝 알고리즘을 딥엑스의 컴파일러(DX-COM)에서 최적화 변화한 후 런타임 소프트웨어(DX-RT) 통해 딥엑스 NPU 시스템온칩에서 연산처리 되도록 지원하는 자동화된 SW 프레임워크(DXNN) 체계를 개발한 것이다. 딥엑스는 이 기술을 다음 달 고객사를 대상으로 베타 릴리즈를 시작한다. 딥엑스 김녹원 대표는 앞서 언급한 하드웨어 기술의 우수성보다 이 부분에서 혁신과 품질이 더 중요하다고 강조했다.

딥엑스 NPU가 우수성을 갖게 된 바탕에는 AI 반도체 관련 20~30가지의 혁신적인 원천기술을 개발하여 접목시킨 노력이 있었고, 이에 대한 100건 이상의 원천 특허를 획득하였다. 내년 안에 ARM보다 더 많은 특허를 확보하여 NPU 분야 특허 보유량에서도 세계 최고 수준에 도전하고자 한다.
세계 최고 수준 AI 프로세서 솔루션 4종으로 구성된 제품군 동시 출시
딥엑스의 김녹원 대표는 “2010년에는 지구상에 50억 개의 전자기기가 있었다. 2020년에 500억개를 돌파했다. 인간 개체수의 10배에 해당하는 전자기기에 인간 수준의 인지능력을 가진 개체들이 자지도 쉬지도 않고 공존하는 초지능 사회가 올 것이다. 그때까지 되면 4차 산업혁명 정도가 아니라 인류 문명이 다음 단계로 진화하는 계기를 맞게 될 것이다. 여기에 근본적인 기여를 하는 것이 딥엑스 설립의 이유”라고 밝혔다.

김 대표는 현재 딥엑스의 기술이 있기까지의 핵심 동력으로 딥엑스 구성원들의 실행 능력을 꼽았다. 다재다능하고 유능한 대다수 구성원들이 의기투합해 같은 비전을 향해 내달리며 스타트업에 꼭 필요한 요소인 높은 효율의 협업을 성공적으로 해냈다는 것이다.

딥엑스 구성원 중 석박사 출신이 올해 기준 85%에 달한다, AI 반도체 분야에서 평균적으로 약 13년의 경력을 갖춘 전문가들이 대거 포진해 있다. 그는 “현재 대다수 구성원들의 업무에 대한 열정과 밀도, 협업 수준은 애플에도 뒤처지지 않는다”고 말했다.

김 대표는 “스타트업들은 대개 단기간에 가시적인 성과를 달성한 것처럼 보이기 위해 성과를 부풀리는 유혹에 빠지지만 딥엑스는 세계 최고 수준의 가치를 이루기 전까지 세상에 내놓지 않겠다는 초지를 지켜왔다”고 말했다. 그는 “이것이 가능했던 이유는 정부와 민간 투자자들의 전폭적인 지지와 후원이 있었기 때문”이라며 “열악한 국내 스타트업 환경에서 이와 같은 너그러운 지원을 받은 것에 매우 감사한 마음을 가지고 있다”고 덧붙였다.

딥엑스는 이제 NPU 기술을 매개체로 벌어지는 최첨단 세계 기술 대전 초입에서 AI 반도체 개발 기업 중 세계 최초로 첫 제품을 4개의 솔루션으로 동시에 출시하며 본격적인 진출을 위한 출사표를 낸다.

김 대표는 마지막으로 “이전의 클라우드 컴퓨팅의 중심은 데이터센터의 서버였다. 폭발적으로 증가하는 데이터를 처리해야 하는 AI 시대부터 컴퓨팅의 중심은 데이터가 생성되는 클라우드 컴퓨팅의 단말인 엣지 디바이스로 이동하게 될 것이다. 서버 프로세서도 단순히 엣지 데이터를 전송받아 인공지능 연산 처리를 대신하는 서비스뿐만 아니라 연합 추론과 같이 대단위 엣지 기기와 연동하는 응용 체계를 위한 인공지능 데이터 처리를 지원하는 서버 AI 프로세서로 재발명되어야 한다고 생각한다. 엣지 NPU와 서버 NPU 간의 상호 연동의 효율을 극대화하는 기술의 가치가 높을 것으로 예상하며 각종 온디바이스 NPU 뿐만 아니라 서버 NPU까지 기술 개발을 지속하겠다”라고 포부를 밝혔다.

태현지 기자 nadi11@donga.com
#중소벤처기업#기업#딥엑스
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스