“시각 의존 AI는 가라”… 새해 글로벌 빅테크 격전지는 ‘음성AI’

  • 동아일보

음성AI 탑재한 안경시장 열리자… ‘핸즈프리’ AI 비서 관심 늘어나
오픈AI, 음성모델 개선팀 꾸리고… 시장 선점한 메타는 기업 인수 활발
“실시간 번역 등 음성AI 큰 역할”

메타가 지난해 9월 공개한 스마트 안경 ‘메타 레이밴 디스플레이’. 메타 제공
메타가 지난해 9월 공개한 스마트 안경 ‘메타 레이밴 디스플레이’. 메타 제공
새해 글로벌 빅테크들의 인공지능(AI) 경쟁이 이미지를 넘어 음성으로 확대되고 있다. 음성 AI를 탑재한 스마트 안경 시장이 열리며, 손이 자유로운 ‘핸즈프리’ AI 비서에 대한 관심이 늘어난 데 따른 것이다. 업계에서는 음성 AI가 스마트폰에 의존하는 기존 라이프스타일에 변화를 가져올 것이라는 관측이 나온다.

4일 정보기술(IT) 업계에 따르면 메타, 구글, 오픈AI 등 주요 글로벌 빅테크들이 최근 음성 AI 개발을 가속화하고 있다. 미국의 IT 전문 매체 디인포메이션에 따르면 오픈AI는 최근 두 달 동안 여러 엔지니어링, 제품, 연구 팀을 통합해 음성모델 개선 팀을 새롭게 꾸렸다. 이 팀은 지난해 오픈AI가 캐릭터AI에서 영입한 음성 AI 전문가인 쿤단 쿠마르가 이끌 예정이다.

오픈AI가 음성 AI 개발에 나선 것은 지난해부터 추진 중인 새로운 기기 개발과 연관이 있는 것으로 추정된다. 이 회사는 지난해 5월 애플에서 아이폰, 아이패드, 애플워치 등 주요 제품의 디자인 개발을 이끌었던 조니 아이브가 설립한 AI 기기 스타트업 io를 65억 달러(약 9조3990억 원)에 인수했다. 올해 첫 합작 AI 기기를 선보일 예정이지만 정확히 어떤 형태의 기기를 개발할지는 밝히지 않았다. 업계에서는 당시 샘 올트먼 오픈AI 최고경영자(CEO)가 노트북이나 스마트폰이 아닌 일생생활에 더 쉽게 통합될 수 있는 기기를 선호한다고 밝힌 것을 고려했을 때 스마트 안경과 같이 음성 AI를 활용하는 기기가 될 가능성이 높다는 관측이 나온다.

현재 스마트 안경 시장을 선점하고 있는 메타도 음성 AI 기능을 강화하고 있다. 메타는 지난해 9월 첫 AI 스마트 안경인 ‘메타 레이밴 디스플레이’를 공개한 바 있다. 회사는 앞서 같은 해 7월 사람의 목소리를 생성해내는 AI를 개발하는 스타트업 플레이AI를 인수하고, 한 달 뒤 또 다른 음성 AI 기업 웨이브폼스를 인수했다. 고도화된 음성 AI는 향후 메타가 개발할 새로운 스마트 안경에 적용될 것으로 전망된다.

지난해 AI 서비스 ‘제미나이’의 성능을 대폭 향상한 구글은 삼성전자, 젠틀몬스터와 협력해 올해 제미나이를 탑재한 AI 스마트 안경을 출시할 계획이다. 앞서 구글은 지난해 6월 음성 AI 성능 고도화를 위해 검색 결과를 대화형 음성 요약으로 변환하는 ‘오디오 개요’ 기능을 출시하기도 했다. 여러 가지 문서나 자료를 입력하면 오디오 개요 기능을 통해 팟캐스트 형식으로 변환되거나 요약 내용을 음성으로 들을 수 있다.

업계에서는 빅테크들의 음성 AI 개발이 단기적으로는 스마트 안경과 같은 새로운 폼팩터(모바일 기기의 형태) 경쟁으로 이어질 것이란 전망이 나온다. 시각에 의존하는 소비자의 AI 소비 형태가 청각 위주로 바뀔 것이란 분석도 적지 않다. 국내 AI 업계 관계자는 “사람이 정보를 인식하는 주된 방식이 시각과 청각이기 때문에 AI 개발에서 음성 AI는 중요한 의미를 지닌다”며 “실시간 번역 등 스마트 안경의 핵심 기능을 구현하는 데도 음성 AI의 정확도가 큰 역할을 할 것”이라고 말했다.

#인공지능#음성 AI#스마트 안경#핸즈프리#오픈AI#메타#구글#음성 인식
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스