고성능・저비용 AI 추론으로 에이젠틱 AI 상용화 가속
프렌들리AI와 엔비디아 협업. 이미지 제공=프렌들리AI
광고 로드중
AI 추론 플랫폼 기업 프렌들리 AI(FriendliAI)는 엔비디아(NVIDIA)의 공식 런칭 파트너로 참여해, 엔비디아의 신규 오픈 AI 모델 ‘Nemotron 3’ 를 자사 플랫폼을 통해 제공한다고 밝혔다.
이번 협력을 통해 기업과 개발자는 별도의 복잡한 인프라 구축 없이 프렌들리 AI 의 플랫폼에서 Nemotron 3 Nano 모델을 손쉽게 배포하고 운영할 수 있다. 프렌들리 AI 는 빠른 응답 속도와 비용 효율성을 강점으로 내세우며, 실제 서비스 환경에 적합한 AI 운영 환경을 제공한다. 프렌들리 AI 의 고성능 추론 환경에서 Nemotron 3 모델을 사용해 AI 에이전트를 안정적으로 운영할 수 있다.
전병곤 프렌들리 AI 대표는 “Nemotron 3와 FriendliAI 플랫폼의 결합은 AI가 스스로 판단하고 작업을 수행하는 ‘에이전틱 AI’를 보다 현실적인 비용과 성능으로 구현할 수 있게 하는 중요한 계기”라며 “기업들이 대규모 AI 서비스를 운영하는 데 필요한 성능과 효율성을 동시에 제공하는 것이 목표”라고 말했다.
광고 로드중
프렌들리 AI 플랫폼에서 Nemotron 3 Nano 모델을 실행할 경우, 최적화된 GPU 활용과 MoE 서빙 최적화 기술, 자동 확장 기능(Autoscaling)을 통해 안정적인 성능을 제공한다. 전용 환경(Dedicated Endpoints)을 사용할 경우 기존 방식 대비 GPU 비용을 50% 이상 절감할 수 있다. 또한 OpenAI와 호환되는 API를 지원해 기존 AI 서비스와의 연동도 용이하다.
전 대표는 “AI 도입을 검토하는 기업들에게 가장 큰 고민은 비용과 운영 복잡성”이라며, “프렌들리 AI 는 고성능 AI를 보다 쉽고 합리적으로 활용할 수 있는 인프라를 지속적으로 제공할 것”이라고 밝혔다.
한편 프렌들리 AI 는 전용 AI 추론, 서버리스 API, 컨테이너 기반 솔루션을 통해 48만 개 이상의 AI 모델을 지원하고 있으며, 스타트업부터 대기업까지 다양한 고객의 프로덕션 환경에서 AI 추론 서비스 운영을 지원하고 있다.
최용석 기자 duck8@donga.com