전체메뉴
‘음성인식과학자’ 구글 마이클 코언 박사 화상 인터뷰
더보기

‘음성인식과학자’ 구글 마이클 코언 박사 화상 인터뷰

동아일보입력 2011-06-16 03:00수정 2011-06-16 03:00
뉴스듣기프린트
트랜드뉴스 보기
“물음표까지 표현하는 음성인식 개발중”
구글이 14일(현지 시간) 미국 샌프란시스코에서 새 음성인식 기술 등을 소개하는 ‘구글 인사이드 서치’ 행사를 열었다. 행사 직후 이 회사의 음성인식 기술을 이끌어 온 마이클 코언 박사를 화상으로 인터뷰했다. 그는 구글과 함께 세계 음성인식 기술 시장을 양분하는 뉘앙스 커뮤니케이션스의 공동창업자로 2004년 구글로 이직했다. 구글코리아 제공
스마트폰에 사용돼 화제를 모았던 음성인식 기술이 이제 PC에서도 쓰인다. 구글은 14일(현지 시간) 미국 샌프란시스코에서 ‘인사이드 서치’라는 행사를 통해 PC를 이용한 음성인식 기능을 발표했다. 그동안 PC에서의 음성인식은 휴대전화보다 성능이 떨어지는 마이크와 PC 내부의 기계 소음 때문에 정확도가 떨어져 거의 사용되지 않았다.

이날 행사 후 구글의 음성인식팀을 이끌어 온 마이클 코언 박사를 화상으로 인터뷰했다. 코언 박사는 “구글 데이터센터로 하루 동안 입력되는 음성은 사람이 2년 동안 쉬지 않고 얘기하는 양”이라며 “이런 방대한 통계를 바탕으로 음성인식 정확도를 획기적으로 높여 PC에서의 음성 검색도 가능해졌다”고 말했다.

○ 작곡가에서 음성인식 과학자로

오늘날 구글의 음성인식 기술은 세계 27개국에 제공된다. 이는 50억 명 이상이 사용하는 언어다. 이 뒤에 코언 박사가 있다. 현재 세계에서 가장 많이 쓰이는 음성인식 기술은 뉘앙스 커뮤니케이션스와 구글 두 회사가 갖고 있다. 스마트폰 음성인식과 관련해 뉘앙스의 기술은 애플의 아이폰에서 주로 쓰이고, 구글의 기술은 구글이 만든 안드로이드폰에서 주로 사용된다. 코언 박사는 이 뉘앙스의 공동 창업자였지만 2004년 구글로 옮겼다. 그 덕분에 구글은 후발 주자임에도 불구하고 빠르게 뉘앙스를 따라잡을 수 있었다.

코언 박사는 “당시 스마트폰을 통한 음성인식이 미래의 화두라고 생각했고 그러자면 세계 최고 수준의 컴퓨터가 필요했다”며 “엄청난 서버 컴퓨터를 가진 구글이 내 꿈을 실현시킬 직장이라고 봤다”고 말했다. 구글은 당시부터 오늘날까지 단일 기업으로 세계에서 가장 많은 서버를 운영하는 회사다.

주요기사

코언 박사가 구글의 컴퓨터를 원했던 것은 그가 만든 음성인식 기술이 다른 업체의 음성인식 기술과 달랐기 때문이다. 구글의 음성인식 기술은 단기간에 27개국에 각각의 언어를 지원하고 있는데 이렇게 많은 언어를 지원하는 음성인식 기술은 현재 구글 외에는 없다. 이에 대해 코언 박사는 “음성인식 기술을 통계적인 방법으로 풀어 나갔기 때문”이라고 설명했다. 기계한테 사람의 말을 이해하도록 가르치는 게 기존 방식이었다면 코언 박사는 ‘기계가 말을 이해하지 않고도 비슷한 파형의 통계를 모아 확률적으로 가능성이 높은 문장을 제시하도록’ 했기 때문이다.

이는 언어학에서 출발해 음성인식을 연구하는 다른 학자들과 달리 코언 박사가 작곡가 출신이기 때문에 가능했다. 그는 1984년 스탠퍼드대연구소(SRI)에서 음성인식 연구를 시작하기 전 7년 동안 작곡가로 일했다. 그는 “도대체 사람들이 어떤 소리를 음악으로 받아들이고 어떤 소리를 소음으로 받아들이는지 궁금했다”며 “음악과 소음의 차이를 과학적으로 분석해 보려다 자연스레 음성인식 기술을 공부하게 된 것”이라고 설명했다.

○ 음성인식의 미래

코언 박사는 음성인식 기술의 미래는 ‘상호작용’이라고 했다. “앞으로 사람의 어조와 억양을 파악해 물음표나 느낌표까지 표현하는 음성인식 기능이 가능해지고 음악과 함께 나오는 영화 속 대사도 우리가 알아듣는 것처럼 컴퓨터가 알아듣게 된다”는 것이다. 그는 특히 “스마트폰과 PC 등 기기의 장벽을 넘어선 음성인식이 가능해졌는데, 이는 곧 ‘사람들이 돌아다니는 곳 어디서든 기계가 사람의 음성에 반응해 움직이는 시대’의 시작을 의미하는 것”이라고 강조했다.

한편 구글은 이날 음성인식 기술처럼 스마트폰에서만 가능했던 ‘구글 고글’이라는 사진만으로 사진 속 대상을 찾아주는 기술도 PC에서 쓸 수 있게 했다. 또 검색 결과 맨 위에 나오는 웹페이지를 검색어 입력과 동시에 읽어 들이기 시작해 검색 후 첫 검색 결과를 클릭하면 기다리는 시간 없이 바로 해당 페이지로 이동하는 ‘순간 페이지’ 기능도 소개했다. 순간 페이지 기능을 사용하면 웹페이지를 읽는 데 걸리는 3∼5초의 시간까지도 줄일 수 있다.

김상훈 기자 sanhkim@donga.com

당신이 좋아할 만한 콘텐츠


기사 의견

   

주요뉴스

1/3이전다음