“2+7은 8? 맞아요” 맥락 아는 AI, 돈 벌기 시작하다[딥다이브]

  • 동아일보
  • 입력 2023년 2월 1일 08시 00분


코멘트
구글이 ‘코드 레드(code red)’를 발령케 하고, ‘숙제의 종말’을 불러오고, 미국 의사∙변호사 면허 시험을 통과하고….

오픈AI(OpenAI)가 지난해 11월 30일 공개한 대화형 AI서비스 ‘챗(Chat)GPT’ 관련 기사가 두달 지난 지금까지 끊임없이 쏟아져 나옵니다. 그만큼 관심이 정말 뜨겁단 얘기죠. 하루 사용자 수가 1500만명에 달한다고 합니다(ARK인베스트 추정). 1월 23일엔 마이크로소프트(MS)가 오픈AI에 100억 달러를 추가로 투자한다는 뉴스도 나왔는데요.

챗GPT을 가지고 얘기할 주제는 너무나 많지만 상상과 두려움이 뒤섞여 있거나(인공지능이 사무직을 대체할까?)이나 윤리와 관련한 이슈(저작권 침해는 어쩌지?)들은 일단 넘어가겠습니다(어차피 얘기해봤자 끝도 없고 결론이 안 난다는). 대신 오늘은 ‘앞으로 1~2년 안에 챗GPT가 가져올 기업과 기술, 생활의 변화’에 초점을 맞춰 봤습니다. 글로벌 소프트웨어 담당인 김수진 미래에셋증권 선임연구위원을 인터뷰했습니다.
사람의 지시 없이도 스스로 대용량 데이터를 학습하는 엄청 똑똑한 AI의 등장. 게티이미지
사람의 지시 없이도 스스로 대용량 데이터를 학습하는 엄청 똑똑한 AI의 등장. 게티이미지
*이 기사는 1월 31일 발행한 딥다이브 뉴스레터의 온라인 기사 버전입니다. ‘읽다 보면 빠져드는 경제뉴스’ 딥다이브를 뉴스레터로 받아보세요.
https://www.donga.com/news/Newsletter
챗GPT가 특별한 이유
-챗GPT가 일반에 공개된 지 두달이 됐는데요. 이 정도까지 사람들이 활발하게 참여할 줄은 사실 몰랐어요.

“새로운 기술에 대해 사람들이 ‘스파크’가 튀는 포인트가 있는데요. 챗GPT가 바로 그걸 건드렸습니다. 과거 ‘알파고’는 바둑밖에 못했지만, 챗GPT는 우리가 사용하면 실무에서 쓸 수 있다는 피드백이 바로 오니까 환호할 수밖에 없는 상황이죠.”

-챗GPT를 특별하게 만든 건 뭔가요.

“AI는 나온 지 오래됐지만 우리가 일상생활에서 AI가 쓰인다고 느낀 적은 거의 없었죠. ‘상품성’이 있다고 와닿는 제품으로서 반응이 처음 온 게 바로 챗GPT이고요. 그게 바로 생성형(Generative)AI라는 특징 때문입니다.”

-‘생성(Generative)’이란 용어가 언어학에 나오는 개념이더라고요. 몇가지 원리만 알면 무수히 많은 문장을 만들어낼 수 있다는 건데요.

“맞아요. ‘자가학습이 된 인공지능’이라고 합니다. 최근 증권가 텔레그램에서 화제가 된 챗GPT 답이 있는데요. ‘2 더하기 7이 뭐라고 생각해’라고 물었더니 ‘9입니다’라고 하길래 ‘아니야, 우리 와이프가 8이래’라고 하니까 챗GPT가 ‘그럼 8이 맞죠’라고 한 거예요. 맥락을 이해한 거죠. 사람의 지시 없이 스스로 학습해서 답을 내놨습니다.

이게 가능해진 게 두가지 기술 때문인데요. 트랜스포머와 퓨샷러닝(Few-Shot Learning)입니다. 트랜스포머는 2017년 구글이 만든 알고리즘입니다. AI가 단어를 학습 할 때 앞, 뒤에 있는 단어 2개와의 관계만 학습하는 게 아니라 문단 전체에 있는 단어와의 관계성을 정의할 수 있게 했죠. 덕분에 문맥을 이해하는 능력이 생겼습니다.

또 데이터 학습을 시키려면 원래는 사람이 일일이 라벨링한 데이터를 줘야 했는데요. 라벨링이 없어나 최소한만 있어도 학습하는 ‘퓨샷러닝’으로 자가학습을 하게 됐습니다. 트랜스포머와 퓨샷러닝 기술 덕분에 2020년 오픈AI의 GPT-3(언어모델)가 탄생했고요. GPT-3 등장을 보고 다른 기업들도 ‘저렇게 하면 엄청 뛰어난 AI가 되는구나’라며 우후죽순으로 초거대AI를 만들게 됐습니다.”
김수진 미래에셋증권 선임연구위원은 요즘 투자자나 기업 관계자를 만나면 많이 하는 질문이 “챗GPT가 왜 이렇게 화제인가요?”라고 했다. 안철민 기자
김수진 미래에셋증권 선임연구위원은 요즘 투자자나 기업 관계자를 만나면 많이 하는 질문이 “챗GPT가 왜 이렇게 화제인가요?”라고 했다. 안철민 기자
-빅테크는 물론 한국 기업들까지 초거대AI 개발에 뛰어든 것도 GPT-3가 먼저 나왔기 때문이었군요.

“기점이었죠. 1750억개라는 어마어마한 파라미터(매개변수)를 가지고 등장한 게 GPT-3가 처음이었고요. 다른 기업들이 ‘저 방법으로 하면 되는구나’라고 따라하기 시작하면서 초거대AI 시대가 온 겁니다. 그래서 GPT-3가 의미 있고요. 그 GPT-3로 가장 먼저 우리가 일상에서 상용화하는 제품을 만든 게 챗GPT라 할 수 있죠.”

-GPT-3의 놀라운 학습능력이 기반이 됐고, 그걸 바탕으로 상품성 있는 제품이 등장했다는 게 챗GPT의 특별한 점인 거군요.

“가장 핵심은 ‘상품성 있는 제품을 만드는 것’입니다. 소프트웨어 산업에서 사실 기술력은 거기서 거기란 말이죠. 우리가 오피스 워드가 특별해서 쓰나요? 다른 것도 있는데, 남들이 다 쓰니까 쓰잖아요. 쓰게 하려면 사용자가 편리하고 다른 사람들과 공유하기도 쉬워야 하는데요. 이런 부분이 소프트웨어 영역에선 매우 중요해요. AI도 마찬가지죠. 사람들이 쓰고 싶게끔 하는 서비스를 출시하는 게 핵심입니다.

2020년 GPT-3가 처음 공개됐을 때부터 IT업계는 이걸로 뭘 하느냐가 고민이었어요. (알파고처럼 인공지능이) 맨날 바둑만 둘 건 아니잖아요. 그런 일회성 이벤트가 아니라 정말 본격적으로 돈을 벌 비즈니스 모델을 어떻게 만들 것이냐가 가장 어려운 문제였죠. 지금은 챗GPT라는 텍스트 기반 AI가 나왔지만, 앞으론 이미지∙영상∙음성 같은 데이터로도 나올 텐데요. 그걸 어떻게 비즈니스 모델화해서 수익을 뽑아낼 것인가가 중요합니다.”
2015년 설립된 오픈AI는 세계 최대 AI 연구소이다. 사진은 오픈AI의 AI 개발 모습. 오픈AI 홈페이지
2015년 설립된 오픈AI는 세계 최대 AI 연구소이다. 사진은 오픈AI의 AI 개발 모습. 오픈AI 홈페이지
오픈AI와 손잡은 MS의 큰 그림
-오픈AI가 올해 매출 2억 달러, 내년 10억 달러를 올릴 거라고 밝혔는데요. 궁금한 게 오픈AI는 어떻게 돈을 버나요? 챗GPT를 유료화한다고는 하지만, 그게 다는 아닐 거고. B2B 비즈니스를 하나요?

“말씀드렸듯이 오픈AI가 GPT-3를 만들었는데요. 카카오브레인이 개발한 코지피티(KoGPT, 한국어에 특화된 AI 언어모델)나 SK텔레콤의 에이닷(A.) 같은 게 GPT-3 기반이에요. 따라서 사용료를 내죠. ‘토큰(단어) 당 얼마’라고 비용이 책정돼 있어요.”

-만약 카카오 코지피티를 사람들이 많이 쓰면 오픈AI가 가져가는 수수료도 늘어나는 구조이군요. 사업 모델로서 매우 좋네요.

“여기서 마이크로소프트(MS)가 중요한데요. 사실 GPT-3를 구동하는 데 핵심 중 하나가 인프라거든요. GPU(그래픽처리장치)로 구동시켜야 하는데, 그 GPU 시스템을 제공하는 게 MS입니다. GPT-3를 사람들이 많이 쓰면 MS도 돈을 버는 구조이죠.

MS처럼 클라우드 컴퓨팅 인프라가 없으면 아무리 초거대AI를 만들어도 이를 다른 기업에 판매하는 서비스로 연결되기가 어렵습니다. 인프라까지 다 갖춰져 있어야 하는데 그 비용이 어마어마하고, 결국 자금력 있는 회사만 할 수 있죠.”

-오픈AI도 클라우드 컴퓨팅 기업과 손을 잡아야 했고, 마침 MS도 오픈AI 기술에 사업 기회가 있다고 본 거군요.

“구글은 자기네 AI를 개발 중이고, 심지어 TPU라는 자체 프로세서도 만들고 있어요. 오픈AI과는 경쟁사니까 오픈AI가 구글로 갈 리는 없고 MS가 최적의 선택이었죠.”
출처를 알 수 없는 AI 챗봇의 답변, 우리의 검색 습관을 바꾸게 될까. 게티이미지
출처를 알 수 없는 AI 챗봇의 답변, 우리의 검색 습관을 바꾸게 될까. 게티이미지
-MS도 새로운 돌파구가 필요했겠죠? 사티아 나델라 CEO가 “AI를 새로운 플랫폼으로 만들겠다”고 얘기했는데요. MS는 윈도우에서 클라우드 컴퓨팅으로 사업을 성공적으로 전환했지만 다시 한단계 더 도약을 해야 할 테니까요.

“(클라우드) 성장률이 둔화되기 시작했으니까요. 2014년부터 MS가 ‘클라우드 퍼스트’라고 주장했는데요. 이제 클라우드 시장이 성숙단계에 접어들면서 지난해부터 성장 동력이 부재하기 시작했어요. 주가를 끌어올리려면 2%로 떨어진 성장률(매출)을 다시 끌어올려야 하는데, 그 모멘텀을 AI로 본 거죠. AI를 하면 일단 제품 가격을 올릴 수 있거든요. 예를 들어 엑셀, 워드에도 챗GPT를 넣는다고 하는데 그러면 가격을 인상할 수 있죠.

검색엔진의 경우 구글의 시장 점유율이 91%이고 MS 빙(bing)이 3-4%대이거든요. 빙에 AI를 탑재해서 구글보다 더 사람들이 쓰고 싶게끔 만든다면 구글의 광고수익을 뺏어올 수도 있겠죠.”

-챗GPT가 처음 공개됐을 때부터 다들 ‘구글 검색에 위협이 될 거다’라고 봤죠. 그런데 저는 유닷컴(You.com ; 챗봇 적용 검색엔진)도 들어가봤는데 아직은 그 정보를 그닥 신뢰하진 못하겠더라고요.

“맞아요. 지적받는 부분 중 하나가 정보 출처를 모르니까 정확한지 아닌지 모른다는 건데요. 그런데 선택할 수 있는 문제인 것 같아요.

예를 들어 금요일 저녁 7시에 광화문에서 친구를 만날 때, 구글에서 ‘광화문 맛집’으로 검색해서 하나하나 살펴볼 수도 있지만 챗GPT한테 ‘친구랑 3명이서 캐주얼한 분위기로 갈만한 맛집 추천해줘’라고 할 수도 있는 거죠. 내가 일일이 뒤지는 게 좋을 수도 있고, 추천 받는 게 더 편할 수도 있고요.

만약 MS 빙이 그 선택지를 줄 수 있으면, 그것 때문에 예전보다 사람들이 모일 수 있을 거고요. 역시 ‘정말 사람들이 쓰고 싶게 만들 수 있느냐’가 핵심입니다.”

-MS가 오픈AI에 추가 투자를 하면서, 다른 곳보다는 AI 상품화에서 확실히 앞서갈 수 있겠네요.

“예전부터 AI 챗봇은 있었는데, 문제점이 비적합한 데이터가 나올 때가 있다는 거였어요. 인종 차별적이거나 성적인 발언처럼요. 웹에는 정제되지 않은 데이터가 다 있으니까요. 그래서 그 문제를 해결하는 게 굉장히 중요했어요.

상품화한다는 건 바로 그런 걸 뜻하거든요. 그런 오류를 교정해야 상품화할 수 있죠. 지금 챗GPT는 ‘GPT-3.5’ 버전으로 서비스하는데요. 편향된 문장을 완화하기 위해 GPT3를 2년 동안 업그레이드한 겁니다.

인종차별 같은 편향된 문장은 사실 디테일의 차이입니다. 많은 기업들이 초거대AI 만들었죠. 그런데 이걸 상품화할 때는 이런 디테일을 어떻게 정교하게 잡느냐가 중요하고요. 그 작업을 해서 출시한 게 챗GPT입니다. 그런 디테일이 경쟁력을 좌지우지하는 부분입니다.”
기술은 1위인데…초조한 구글?
AI 기술이 뛰어나면 AI 서비스도 잘 만들까? 글쎄. 게티이미지
AI 기술이 뛰어나면 AI 서비스도 잘 만들까? 글쎄. 게티이미지
-챗GPT 공개 이후 구글이 ‘코드 레드’를 발령했다고 하죠. 구글 역시 뛰어난 기술이 있으니까 당연히 구글이 챗GPT를 따라잡으려고 나설 거라고 다들 보고 있는데요. 어떻게 보세요?

“AI 기술 자체는 구글이 더 앞섭니다. 파라미터 수도 훨씬 많고요. 그런데 방금 말씀드린 그 부분, 상업화하고 제품화하는 데 있어서 디테일을 못 잡는 게 구글의 단점입니다.”

-구글이 원래 그랬나요?

“클라우드 컴퓨팅 산업도 기술은 구글이 가장 앞서요. 그런데 1등은 아마존이잖아요. 사실 ‘커머스 회사가 웬 클라우드 컴퓨팅?’이라고 할 수 있는데 클라우드, 즉 소프트웨어는 서비스이기 때문에 CS(고객만족)가 엄청 중요해요. 고객이 오류가 났다고 하면 바로 해결해줘야 하죠.

구글은 그런 게 약해요. 기업 고객 입장에선 아마존이 더 편하죠. 사실 기업 고객 중에서 기술적으로 전문가가 얼마나 되겠어요. 쓰기에 더 편리하고, 뭔가 요구하면 빨리 처리해주는 게 중요하죠. 아마존은 고객서비스가 원래 하던 메인 비즈니스니까 그걸 잘했는데 구글은 기술은 1등이지만 서비스는 ‘그걸 왜 해줘야 해?’라는 느낌인 거죠. 그래서 클라우드 시장에서 완전히 뒤쳐졌는데요.

이게 바로 상품화가 안 되는 거예요. AI도 구글이 분명히 기술력이 가장 앞서고, 트랜스포머 알고리즘도 구글이 만들었잖아요. 그런데 그 구글 기술을 기반으로 해서 오픈AI는 챗GPT를 만들었는데, 정작 구글은 검색엔진에 AI를 적용하는 것 말고는 뚜렷한 상품이 없어요. 그러니까 어떻게 상품화해야 하는지에 대한 개념은 떨어지는 거죠.”

-구글은 기술 개발이 문제가 아니라, 갖고 있는 기술을 어떻게 돈 버는데 쓸지를 고민해야 겠네요.

“구글이 뭔가를 할 거라는 기사는 계속 나오는데요. 새로운 서비스를 내놨는데 별로이면 그건 구글 입장에서 치욕스러울 수 있거든요. 그래서 구글이 힘든 상황입니다. 기술 개발은 자기네가 먼저 했지만, 기술만 있다고 해서 되는 건 아닌 거죠.”
한국 기업도 가자, 초거대 AI로?
-다시 오픈AI 얘기로 돌아가면. GPT-4가 올해 안에 나온다고 하죠. 100조 파라미터를 학습하고, 멀티모달(텍스트만이 아닌 이미지∙영상∙음성 등으로 대화)일 거라는 식의 추측이 많았는데요. 실제론 그렇게 가진 않을 것 같다고요?

“샘 알트만 오픈AI CEO가 인터뷰에서 멀티모달은 일단 아니라고 했고요. 또 ‘파라미터 자체가 더 많아지는 건 의미 없다’고 했어요. 파라미터는 단어와 단어 사이의 함수인데 이건 이미 충분하고, 더 중요한 건 양질의 데이터를 제공하는 거죠.

지금 챗GPT는 웹상에 있는 데이터를 학습했는데요. 과연 어떤 데이터를 학습시켜야 괜찮은 AI가 나올지가 진짜 고민인 겁니다. 예를 들면 의료 데이터가 있겠죠. 그런데 접근이 쉽지 않잖아요. 또 금융권 고객 데이터도 있는데요. 개인정보인데 이걸 어떻게 학습시킬지가 문제입니다.

만약 데이터 자체가 있다 해도 이곳저곳 뿌려져 있는 데이터를 어떻게 다 모아서 전처리 작업을 해서 학습시킬 것인가. 이런 문제가 더 핵심이에요. 더 정교한 AI를 만들기 위해서는 이제 단순히 파라미터수가 아니라 데이터를 정제하는 게 더 의미가 있는 겁니다.”

-AI를 더 똑똑하게 만드는 게 의미있는 게 아니라, 입력하는 정보 자체의 질을 높여야 하는 군요. 그게 어려운 거죠.

“PC 바탕화면도 원래 정리를 안 한 사람은 한번씩 정리할 때 되게 머리 아프잖아요. 비슷합니다. 깔끔하게 데이터를 만들어서 AI한테 떠먹여줘야 하는데, 그 작업이 기업 입장에선 어렵죠.”

-그런 것 때문에 우리가 상상하듯이 변호사나 의사를 AI가 대체하게 되려면 시간이 오래 걸릴 수 있을까요?

“변호사를 대체하려면 사건 케이스 자료를 전부 학습해야 할 텐데요. 그걸 로펌마다 따로 갖고 있으면 어떻게 모으겠어요. 사건 케이스를 모으는 DB가 있어서 모든 변호사가 사건 하나 끝날 때마다 했던 업무를 다 적어넣게 하지 않는 이상 말이죠. 그런 게 사실 훨씬 중요합니다.”

-지금 단계에서는 챗GPT가 유료화된다 해도 예를 들어 애널리스트가 그걸 업무에 상당 부분 활용하게 되진 않으려나요?

“흠. 모르겠어요. 저희가 보고서 쓸 때 앞에 요약을 하는데요. 챗GPT가 전체 글을 주고 요약하라고 하면 진짜 잘해요. 예를 들어 100장짜리 책을 요약하라고 하면 챗GPT가 인간보다 잘할 수밖에 없죠. 아마 나중엔 주가 맞추는 것까지도 더 잘하게 될 수 있을지 몰라요.”

-최근 만난 기업 관계자가 ‘그동안 자체 챗봇 개발한다고 돈과 시간을 들였는데 괜히 고생했다. 그냥 챗GPT 쓰면 되는데’라고 말하더라고요. 여전히 한국 기업들이 초거대AI 개발에 많은 투자를 하고 있지만, 동시에 많은 기업들은 개발 의지가 꺾일 수도 있겠습니다.

“기술로는 우리가 어떻게 구글을 이기겠어요. AI 자체를 만드는 건 한계가 있으니 그냥 모델은 가져와서 쓰고, 더 나은 부가가치를 창출할 수 있는 서비스를 어떻게 만들까를 고민하는 게 사실은 더 실용적이죠. 그 서비스라는 게 챗봇처럼 직접적인 서비스가 될 수도 있고, 간접적으로 광고수익을 내는 서비스가 될 수도 있겠고요.

정교한 서비스 만들기가 진짜 어려운 문제죠. 지금 산업계는 뒤쳐질까봐 난리입니다. 대기업 전략팀은 머리 아프게 고민하고 있죠.” By. 딥다이브

챗GPT가 처음 등장했을 때부터 계속 고민했습니다. 어떻게 해야 챗GPT를 둘러싼 수많은 이슈 중 꼭 필요한 내용만 정확하게 전할 수 있을까. 그러다가 김수진 미래에셋증권 선임연구위원이 쓴 보고서를 보고 ‘이거다!’ 싶어서 한 인터뷰였는데요. 어떠신가요. 좀 정리가 잘 되셨나요? 개인적으로는 구글 이야기가 특히 재미있었는데요. 인터뷰의 주요 내용을 요약해드리자면

  • 챗GPT는 사람들이 쓰고 싶게 하는 ‘상품성’ 있는 인공지능 서비스라는 점에서 특별합니다.
  • 마이크로소프트는 검색엔진 빙과 엑셀, 워드에도 챗GPT를 결합할 겁니다. AI를 새로운 성장동력으로 삼아 돈을 벌 겁니다.
  • AI 기술로는 세계 최고인 구글은 초조할 겁니다. 기술을 먼저 개발하고도 상품화엔 뒤쳐졌으니까요. 구글의 약점이기도 합니다.
  • 한국 기업도 모두 초거대AI 개발 경쟁에 뛰어들어야 한다고요? 글쎄요. 오히려 AI 모델은 그냥 다른 데 걸 가져와서 쓰고, 더 나은 부가가치를 창출할 서비스를 만드는 게 좀더 실용적일 수도.

*이 기사는 1월 31일 발행한 딥다이브 뉴스레터의 온라인 기사 버전입니다. ‘읽다 보면 빠져드는 경제뉴스’ 딥다이브를 뉴스레터로 구독하세요.
https://www.donga.com/news/Newsletter

한애란 기자 haru@donga.com
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스