올해 가장 주목받은 인공지능(이하 AI) 스타트업을 꼽으라면 ‘업스테이지’도 순위권에 들 것이다. 업스테이지는 AI 자연어 처리 분야에서 최고 수준의 기술력을 갖고 있으며, 기업용 AI 구축 통합 솔루션인 AI PACK, 챗GPT와 광학문자인식(OCR)을 결합한 아숙업(Askup) 등의 제품을 보유하고 있다. 업스테이지는 심화학습(딥러닝) 및 기계학습(머신러닝), 대형언어모델(LLM) 구동 등과 관련해 AWS와 긴밀한 관계를 맺고 있다. 최신 AI 및 클라우드 기술 동향을 확인하고자 AWS 리인벤트를 방문한 이활석 업스테이지 최고기술책임자(CTO)를 직접 만났다
이활석 CTO “한국어 기반 sLLM 새롭게 공개”
업스테이지가 LLM 시장에 뛰어든 것은 지난 6월부터며, 지난 7월에 메타의 라마 2(Llama 2)를 심화 조정(파인 튜닝)한 모델을 활용해 허깅페이스 오픈LLM 리더보드에서 1위를 차지하기도 했다. LLM의 발전 속도를 생각하면 비교적 늦게 시작한 셈이지만, 실력 면에서는 세계 최고 수준을 인정받은 것이다.
이활석 업스테이지 CTO는 “지난 7월에 진행한 모델을 계속 파인 튜닝 하는 과정에서 우리의 역량으로 어디까지 할 수 있겠다는 기술적인 판단이 생겼다. 그래서 기업향 LLM 특화 모델을 만드는 것에 사업 방향을 결정하기로 했다”라며 설명을 시작했다.
이어서 “기존 (외국계) LLM보다 효율적이라면 충분히 사업 가능성이 될 것이라고 봤고, 가장 효율적인 작업을 위해 한글이 잘 되는 LLM이 필요하다는 결론이 이르렀다”라고 말했다. 특히 지난 9월 출시한 ‘솔라’와 다르게 현재 개발하고 있는 LLM은 AWS의 세이지메이커 점프스타트를 활용해 사전학습시킨 독자적으로 개발한 모델이라는 점을 강조했다.
성능 및 구성에 대해서는 “연말 내로 7B(70억 개), 10.7B(1070억 개)를 출시하고, 내년 1분기 중에 30B(300억 개) 매개변수로 구성된 모델을 출시할 예정이다. 성능은 리더보드 등에서 확인할 수 있고, 한글뿐만 아니라 영어 성능도 꽤 잘 나올 것으로 본다”라고 정리했다. 또한 아숙업(Askup) 등을 통해 멀티턴 대화(상호 대화) 역량을 충분히 확보했다고도 말했다.
업스테이지가 내놓는 소형 LLM의 경우 매개변수가 적은 만큼 용량도 적다. 그래서 기업 등에서 특화된 영역에 한정하여 실행하거나, 독립적으로 구동해야 하는 조건 등에 적합하고, 또 구동 비용이 저렴한 데다가 업데이트를 자주 하더라도 부담이 적다. 이활석 CTO는 “작은 모델을 지향한다. 하지만 지출 대비 성능이나 유지 비용 등을 고려했을 때 완성도가 높아야 시장의 선택을 받을 것”이라고 말했다.
OCR과 LLM 개발로 역량 강화 나선다
LLM 사업에 집중하기 위해 검색, 추천, 상품개발은 중단하고, 반면 OCR 기술은 계속 개발하는 등 조직 개편도 나선다. 이활석 CTO는 “OCR 기술은 LLM 학습에 필요한 데이터를 확보하는 과정에서 활용할 수 있다. 시너지를 내기 위해 OCR 개발은 계속 이어나갈 예정”이라고 말했다. 업스테이지가 LLM에 집중하는 것이 스타트업의 사업 방향성을 선회하는 피벗(Pivot)인가 묻는 질문에 대해서는 “사실상 피벗이 맞다”고 말했다.
업스테이지는 현재 개발하고 있는 LLM 모델을 일본 시장을 비롯한 해외 시장에 주력하고, 국내 시장은 사내 구축형 사업 위주로 전개한다. 일본 시장부터 공략하는 이유는 이활석 CTO를 비롯한 임원진들이 일본 시장에 대한 경험이 있고, 또 일본 시장의 규모도 크기 때문이다. 외국 시장 진출은 AWS 세이지메이커 점프스타트, 마켓플레이스를 통해 진행하고, 의료 전용 LLM이나 전자상거래 전용 LLM을 올해 안에 내놓을 예정이다.
마지막으로 이활석 CTO는 “올해가 챗GPT의 해였다면, 내년에는 다른 많은 솔루션들이 떠오르는 한 해가 될 것이다. 업스테이지는 단 한 곳의 고객이라도 만족스럽게 쓰는 사례를 만드는 것에 집중할 것이다. 소수 고객에 집중할 예정이어서 수를 늘리기가 쉽진 않겠지만, 그만큼 좋은 결과를 낼 수 있도록 노력할 것”이라고 말했다.
댓글 0