웹의 미래를 재정의하다… AI 에이전트로 마음의 여유 실현하는 ‘유토리’[최중혁의 월가를 흔드는 기업들-창업가편]

  • 동아일보
  • 입력 2026년 1월 29일 17시 41분


웹 에이전트 AI 스타트업 ‘유토리(Yutori)’ 공동창업자 데비 파리크 인터뷰


인공지능(AI)이 ‘일을 대신하는 기술’로 진화하고 있다. 이 변화의 중심에 ‘에이전트(Agent)’가 있다. 에이전트는 사용자의 목표를 이해하고, 필요한 도구를 호출하거나 웹을 직접 탐색해 업무를 수행하는 AI다. 오픈AI가 ‘오퍼레이터(Operator)’를, 앤트로픽이 ‘컴퓨터 유즈(Computer Use)’를 선보이며 빅테크들이 앞다퉈 뛰어드는 이 시장에서 유독 주목받는 실리콘밸리 스타트업이 있다. 바로 메타 AI 연구소 출신 3인이 설립한 웹 에이전트 스타트업 ‘유토리(Yutori)’다.

역설적으로 기술이 발전할수록 현대인은 더 바빠지고 있다. 상품 가격을 비교하고, 티켓 예매 사이트를 새로고침하며 뉴스와 정보를 찾아 수십 개의 탭을 오간다. 끊임없는 맥락 전환과 반복적인 클릭 속에서 시간은 흩어진다. 유토리는 이 문제를 정면으로 겨냥한다. “우리는 웹과 이런 방식으로 상호작용해서는 안 된다”는 문제의식이 이들의 출발점이다.

미국 샌프란시스코에 위치한 유토리 본사에서 인터뷰 중인유토리 공동창업자 데비 파리크. 최중혁 팔로알토캐피탈 대표 제공
미국 샌프란시스코에 위치한 유토리 본사에서 인터뷰 중인유토리 공동창업자 데비 파리크. 최중혁 팔로알토캐피탈 대표 제공

유토리 공동창업자 겸 공동 최고경영자(CEO)인 데비 파리크는 메타의 대규모언어모델(LLM) ‘라마(LLaMA)’ 개발을 이끈 생성형 AI 조직의 시니어 디렉터를 지낸 AI 분야 리더다. 조지아공대 교수로도 활동했다. 파리크의 남편이자 공동창업자인 드루브 바트라는 메타의 핵심 연구조직인 FAIR(Fundamental AI Research)에서 엠바디드 AI(Embodied AI·로봇 등 물리적 세계와 상호작용하는 AI) 연구를 총괄했다. 또 다른 공동창업자 아비셱 다스는 바트라의 박사과정 제자로, 10년간 함께 연구해온 사이다. 역시 메타 FAIR에서 리서치 사이언티스트로 일했다. 이들은 ‘언젠가 함께 창업하자’는 약속을 품고 각자의 커리어를 쌓다가 때가 무르익자 안정적인 자리를 뒤로하고 한 팀으로 뛰어들었다.

유토리의 비전은 분명하다. 사람들이 웹과 상호작용하는 방식 자체를 바꾸는 것이다. 사용자가 직접 클릭하고 탐색하는 대신, AI 에이전트가 백그라운드에서 24시간 웹을 모니터링하며 필요한 정보를 가져온다. 첫 제품인 ‘스카우트(Scouts)’는 2024년 12월 정식 출시됐다. 제품 가격 변동, 이벤트 티켓 오픈, 스타트업 투자 유치 발표 등 사용자가 관심 있는 웹 정보를 실시간으로 추적해 알려준다.

기술적으로도 주목할 만하다. 유토리가 자체 개발한 브라우저 활용 모델 ‘네비게이터(Navigator)’는 웹사이트 스크린샷만을 보고도 어떤 행동을 취할지 판단한다. 오픈AI, 구글, 앤트로픽의 컴퓨터 사용 모델과의 벤치마크에서 최고 수준의 성능을 기록했다. 범용 LLM에 의존하지 않고 브라우저 조작에 특화된 모델을 직접 훈련해 비용을 수개월 만에 10분의 1로 낮추는 데 성공했다.

실리콘밸리의 반응도 뜨겁다. 펠리시스와 레디컬벤처스를 비롯해 ‘딥러닝의 대모’로 불리는 페이페이 리 스탠퍼드대 교수, 구글 AI를 이끌어온 제프 딘 수석과학자, 글로벌 오픈소스 플랫폼 허깅페이스 최고기술책임자(CTO), AI 스타트업 유닷컴(you.com) CTO, 엘라드 길 등 실리콘밸리 최정상급 인사들이 어드바이저이자 초기 투자자로 합류했다. 아직 시드 단계인 스타트업이 이 정도 라인업을 갖춘 것은 이례적이다.

최중혁 팔로알토캐피탈 대표(왼쪽)와 유토리 공동창업자 데비 파리크. 최중혁 대표 제공
최중혁 팔로알토캐피탈 대표(왼쪽)와 유토리 공동창업자 데비 파리크. 최중혁 대표 제공

필자는 지난해 12월 샌프란시스코 유토리 본사에서 파리크 공동 CEO를 만났다. 메타에서 수백 명의 팀을 이끌던 AI 리더가 왜 다시 ‘제로’에서 시작하기로 했는지, 그리고 이들이 그리는 ‘웹의 미래’는 어떤 모습인지 직접 들어봤다.

학계에서 창업으로, 그리고 ‘유토리’의 탄생

유토리 공동창업자의 모습. 좌측부터 아비셱 다스, 데비 파리크, 드루브 바트라. 유토리 제공
유토리 공동창업자의 모습. 좌측부터 아비셱 다스, 데비 파리크, 드루브 바트라. 유토리 제공

― 유토리의 공동창업자들은 메타 GenAI와 FAIR, 조지아공대 등 AI 분야에서 최고의 커리어를 쌓고 있었다. 데이터브릭스 공동창업자인 이온 스토이카 교수는 필자와의 인터뷰에서 “연구가 실제 세상에 영향을 미치길 원해서” 창업했다고 말한 바 있다. 학문적·직업적 성공에도 불구하고 유토리를 창업하게 된 구체적인 ‘트리거’는 무엇이었나.

“몇 가지 요인이 복합적으로 작용했습니다. 세 명의 공동창업자 모두 비슷한 상황에 놓여 있었죠. 드루브와 저는 조지아공과대 교수였고, 세 사람 모두 메타에서 일하다가 함께 떠나게 됐습니다. 드루브는 메타에서 엠바디드 AI 연구를 이끌고 있었습니다.

첫째는 메타에서의 역할이 커지면서 점점 실무에서 멀어졌다는 점입니다. 당시 저는 GenAI 조직의 시니어 디렉터로 여러 팀을 이끌고 있었죠. 분야 자체도 회사에서 가장 높은 우선순위를 받는 흥미로운 영역이었습니다. 하지만 점점 직접 일을 주도하는 감각이 그리워졌습니다. 단순히 사람들을 연결하고 관리하는 역할을 넘어, 다시 현장에서 디테일을 챙기고 싶었습니다.

둘째는 공동창업자들과의 오랜 인연입니다. 드루브와는 20년 가까이 함께 연구하며 조지아공대에서 연구소를 운영했고, 다스는 드루브의 박사 제자로 10년 가까이 협업해왔습니다. 우리는 오래전부터 언젠가 함께 회사를 차리자는 이야기를 해왔죠.

셋째는 아비셱 다스의 결심이었습니다. 그는 메타에서의 역할이 ‘포화(saturated)’ 상태에 이르렀다고 느끼고 있었고, 자신의 회사를 시작할 계획을 세우고 있었습니다. 그가 ‘함께 하자’고 제안했고, 여러 조건이 맞물리면서 결정을 내리게 됐습니다.

저는 새로운 경험에 흥분하는 편입니다. 해보지 않은 일, 처음 도전하는 것에는 기본적인 설렘이 있죠. 제로에서 시작해 제품을 만들고, 시장에 내고, 사용자가 가치를 느끼고, 반복(iteration)하며 성장시키는 과정 자체가 흥미진진합니다. 어느 한 가지 때문이 아니라, 이 모든 요소가 교차한 순간이 바로 창업을 결심한 트리거였습니다.”

― ‘유토리(ゆとり)일본어로 ‘마음의 여유’를 뜻한다. 초효율을 중시하는 실리콘밸리 문화와는 대비되는 인상이다. 기술이 발전할수록 사람들은 역설적으로 더 바빠지고 있다. 유토리가 말하 ‘진정한 유토리’란 무엇이며, 이 철학은 제품과 조직 문화에 어떻게 반영돼 있나.

“유토리는 일본어로 정신적 여유, 즉 ‘mental spaciousness’를 뜻합니다. 저는 이것이 효율성과 대립한다고 보지 않습니다. 오히려 중요한 일에 집중할 수 있는 상태이며, 핵심은 맥락 전환이 줄어들고 산만함과 정신적 분주함이 사라지는 데 있습니다. 끊임없는 문맥 전환(context switching)과 정신없는 상태가 유토리의 반대라고 할 수 있죠. 유토리는 의미 있는 일에 시간과 에너지를 온전히 투입하게 해주고, 결과적으로 ‘정말 중요한 것에 대한 효율’을 높입니다.

이 철학은 제품 기능에 가장 직접적으로 반영됩니다. ‘스카우트(Scouts)’는 우리가 내놓은 첫 제품으로, 인터뷰 전날(2025년 12월 10일) 정식 출시됐습니다. 사용자가 설정해 둔 관심사(상품 가격 변동, 재입고, 이벤트 티켓 판매, 스타트업 투자 유치 발표 등)를 백그라운드에서 24시간 추적하다가 변화가 생기면 알려줍니다. 웹사이트를 새로고침하고 탭을 전환하며 소셜미디어를 수시로 확인할 필요가 없습니다. 인터넷을 ‘능동적으로’ 사용자에게 가져다주는 방식입니다. 제품은 컨텍스트 전환을 최소화하도록 설계됐고, 에이전트가 사용자를 대신해 그 역할을 합니다.

제품 디자인(UI)에도 이런 철학이 담겨 있습니다. 불필요하게 주의를 빼앗지 않도록 깔끔하게 만들었습니다. ‘무엇을 하는가’와 ‘어떻게 만들어졌는가’ 모두에서 유토리가 드러납니다.
조직 문화에서는 보다 간접적으로 작용합니다. 회사 이름 자체가 공동창업자들이 ‘중요한 일에 집중할 수 있는 상태’를 가치로 둔다는 뜻이기 때문입니다. 디테일에 대한 집착, 빈말을 하지 않는 태도, 약속을 지키는 문화가 결국 제품 품질로 이어진다고 보고 있습니다.”

― 유토리의 어드바이저와 초기 투자자 라인업이 눈길을 끈다. 페이페이 리, 제프 딘 등 실리콘밸리의 주류 인사들이 포함돼 있다. 초기 스타트업임에도 이런 인물들을 어떻게 영입할 수 있었나.

“솔직히 말하면 운도 있었습니다(웃음). 페이페이 리나 제프 딘 같은 분들은 연구 커뮤니티에서 알게 됐습니다. 학회에서 만나거나 다른 맥락에서 교류해왔죠. 그래서 창업할 때 연락을 드렸더니 기꺼이 지원해주셨습니다. 모두 친절하고 관대한 분들입니다.

직접 알지 못했던 분들도 있었지만, 디자인 감각이나 그분들이 세운 회사들을 오래전부터 존경해왔습니다. 언젠가 그 수준에 도달하고 싶은 목표가 되는 분들이죠. 지지자가 하나둘 생기면서, 그분들을 통해 또 다른 분들을 소개받았고 네트워크가 점점 커졌습니다.

엘라드 길과 사라 구오는 ‘노 프라이어스(No Priors)’ 팟캐스트를 진행하는데, 몇 년 전 그 방송에 출연하면서 인연이 닿았습니다. 여러 경로에서 퍼즐 조각이 맞춰진 셈입니다. 이런 분들이 우리를 지지해주고 있다는 점이 무엇보다 감사할 따름입니다.”

에이전트 ‘스카우트’의 다양한 활용 사례

― 스카우트는 테니스장 예약 같은 개인적 용도부터 비즈니스 활용까지 폭넓은 사용 사례가 있는 듯하다.

“맞습니다. 사람들이 정말 다양한 방식으로 사용하고 있습니다. 개인적으로는 상품 가격이나 할인 코드 추적, 테니스장 예약, 레스토랑 예약, 티켓 구매 등에 쓰고 있습니다. 업무 맥락에서도 활용도가 큽니다.

중요한 점은 스카우트가 ‘예약을 대신해준다’거나 ‘무조건 구매해준다’처럼 과도한 약속을 하지 않는다는 것입니다. 제품 기능은 의도적으로 좁게 정의돼 있습니다. 정보를 모니터링하다가, 미래에 어떤 변화가 생기면 알려주는 것, 그게 전부입니다. 대신 모니터링 대상 도메인은 매우 범용적입니다. 웹의 거의 모든 영역을 추적할 수 있죠.

이 조합이 효과적이었다고 봅니다. 기능을 좁힘으로써 신뢰성 있게 제공할 수 있고, 사람들이 일상적으로 활용할 수 있습니다. 동시에 도메인이 넓기 때문에 어떤 대상이 가장 많이 쓰이는지, 어디서 깊은 사용이 일어나는지에 대한 중요한 신호를 얻을 수 있습니다. 우리는 이 데이터를 바탕으로 다음 확장 방향을 설계하고 있습니다. 이런 ‘좁은 기능, 넓은 도메인’의 조합이 지금으로서는 좋은 출발점이라고 생각합니다.”

기술 심층 분석, 지연 시간과 비전 모델

― 웹 에이전트는 시각 데이터의 연속 스트림을 해석해 행동을 결정해야 하는 ‘비디오-투-액션(video-to-action)’ 문제에 가깝다. 이 구조에서는 모델 복잡성과 지연 시간(레이턴시) 사이의 트레이드오프가 불가피한데, 유토리의 네비게이터(Navigator)는 이 레이턴시 문제를 기술적으로 어떻게 해결하고 있나.

“우리는 비디오가 아니라 정적 스크린샷(static screenshots)을 사용합니다. 에이전트는 웹사이트 화면을 캡처한 뒤 행동을 결정하고, 다시 스크린샷을 찍는 방식을 반복합니다. 즉, 실제 영상을 연속적으로 처리하는 대신 ‘화면을 보고 → 행동 → 다시 캡처’하는 구조입니다. 모든 과거 프레임을 처리할 필요 없이 가장 최근 화면을 중심으로 다음 행동을 결정할 수 있어 지연시간을 줄이는 데 도움이 됩니다.

또 하나는 범용 LLM이 아니라 브라우저 사용에 특화된 자체 모델을 훈련했다는 점입니다. 코딩이나 수학, 일반 지식까지 두루 잘하는 모델이 아니라 웹 내비게이션에만 집중하도록 설계했기 때문에 예측 속도가 빠르고 레이턴시 측면에서도 유리합니다.

마지막으로 우리는 HTML(DOM) 코드가 아니라 렌더링된 시각정보만 활용합니다. 초기에는 기계가 굳이 사람이 보는 화면을 볼 필요 없이 코드를 직접 읽으면 된다고 생각했지만, 실제로는 웹사이트마다 구조가 제각각이고 예외가 많아 사이트별로 대응해야 했습니다. 반면 렌더링된 화면은 이미 사람을 기준으로 최적화된 정보이기 때문에 훨씬 일반적이고 안정적인 입력 방식이라고 판단했습니다.”

불량 봇과 위임형 에이전트의 분기점

― 웹 에이전트의 근본적 제약 가운데 하나는 CAPTCHA 같은 보안 장치와의 ‘창과 방패’ 싸움이다. 웹사이트는 봇을 차단하려 하고, 에이전트는 이를 탐색하려 한다. 유토리는 이런 적대적 역학 관계를 어떻게 지속 가능하게 다루려 하나. 에이전트가 해야 할 일과 하지 말아야 할 일의 경계는 어떻게 정의하고 있나.

“장기적으로는 생태계 자체가 바뀔 것이라고 봅니다. 과거의 봇이 웹에서 무단으로 데이터를 긁어가는 악성 존재였다면, 지금의 에이전트는 사용자를 대신해 행동하는 ‘대리인(proxy)’입니다. 사용자가 웹사이트에서 하고 싶은 일을 대신 수행하는 것이죠. 따라서 ‘모든 봇은 악’이라는 전제는 시간이 지나면서 달라질 가능성이 큽니다.

앞으로는 무단 스크래핑을 하는 ‘불량(rogue) 봇’과, 사용자를 대표해 움직이는 ‘위임형 에이전트’를 구분하는 방향으로 진화할 것입니다. 실제로 에이전트가 누구를 대표하는지, 어떤 웹사이트로 보내지는지를 식별하는 프로토콜—예컨대 헤더 기반 식별—을 마련하려는 움직임도 나타나고 있습니다.

조금 거리를 두고 보면 우리가 계속 브라우저를 열어 버튼을 누르고 폼을 채우는 일을 해야 할 이유는 없습니다. 이런 작업은 자동화되고 에이전트가 대신 수행하게 될 것입니다. 어떤 웹사이트는 이런 변화를 일찍 받아들일 것이고, 다른 곳은 생태계가 성숙하는 과정을 지켜본 뒤 합류할 것입니다. 항상 고양이와 쥐 게임처럼 끝없는 추격전이 이어질 것이라고 보지는 않습니다.

또 웹이 점점 에이전트 친화적으로 바뀌면서 모델 콘텍스트 프로토콜(MCP) 서버 같은 요소들도 늘어날 것입니다. 기술적으로 유토리의 스택은 유연합니다. 웹사이트가 API(응용 프로그램 인터페이스)나 MCP를 제공하면 이를 우선 활용하고, 테니스장 예약 사이트처럼 그런 수단이 없는 경우에만 원격 브라우저를 띄워 시각 기반 모델로 클릭하며 정보를 수집합니다. 생태계가 에이전트 친화적으로 진화할수록 우리는 그 흐름을 활용할 수 있는 위치에 있을 것입니다.”

로그인하지 않는 에이전트, ‘신뢰의 계단’

― 많은 사용자가 여전히 AI 에이전트에 로그인 자격 증명(credentials)을 맡기는 데 불안을 느낀다. 이른바 ‘신뢰의 격차’를 해소하고 보안을 보장하기 위해 어떤 기술적·제품적 장치를 마련했나.

“현재 스카우트는 공개 정보만 모니터링합니다. 사용자 대신 로그인하지도 않습니다.
우리는 ‘신뢰의 계단(staircase)’ 전략을 택했습니다. 시간을 두고 단계적으로 신뢰를 쌓는 방식입니다. 먼저 위험이 낮은 영역에서 유용성과 신뢰성을 입증한 뒤, 점진적으로 더 많은 권한과 문맥을 위임받아 더 큰 가치를 제공하는 선순환 구조를 만들고자 합니다.

업무의 위험도 역시 각기 다릅니다. 항공권 구매처럼 고위험 작업은 바로 결제하지 않고, 항공편을 찾아 링크를 보내 ‘이걸 찾았는데 구매해도 될지’ 사용자 승인을 받는 절차가 바람직합니다. 반면 피자 주문 같은 저위험 업무는 더 많은 자동화를 허용할 수 있겠죠. 태스크 유형에도 단계가 있고, 위험 허용 범위는 시간이 지나며 넓어질 수 있습니다.

스카우트는 ‘읽기 전용(read-only)’ 서비스로, 세상을 바꾸는 행동을 하지 않기 때문에 신뢰 형성의 첫 단계로 적합하다고 봅니다. 정보를 안정적으로 제공하면 사용자의 신뢰도 커지고, 시간이 지나면서 더 많은 일을 맡길 수 있게 될 것입니다.”

Online-Mind2Web 벤치마크 결과  유토리의 네비게이터는 정확도 78.7%를 기록해 구글 제미나이 2.5(69.0%), 오픈AI 오퍼레이터(61.3%), 앤트로픽 클로드 4.0(61.0%)을 크게 앞섰다. 스텝당 레이턴시(지연시간) 역시 가장 낮아 정확도와 속도 모두에서 ‘파레토 프론티어(Pareto frontier)’를 형성했다. 출처 유토리 블로그
Online-Mind2Web 벤치마크 결과 유토리의 네비게이터는 정확도 78.7%를 기록해 구글 제미나이 2.5(69.0%), 오픈AI 오퍼레이터(61.3%), 앤트로픽 클로드 4.0(61.0%)을 크게 앞섰다. 스텝당 레이턴시(지연시간) 역시 가장 낮아 정확도와 속도 모두에서 ‘파레토 프론티어(Pareto frontier)’를 형성했다. 출처 유토리 블로그

― 오픈AI, 제미나이 같은 범용 LLM과의 벤치마크 결과를 공개했다. 에이전트 전용 도구나 다른 자율 프레임워크와도 비교했나. 그렇다면 어떤 유형의 태스크에서 유토리가 가장 뚜렷한 성능 우위를 보이는가.

“우리가 블로그에서 공개한 비교 대상은 범용 LLM이 아니라 오픈AI의 ‘오퍼레이터(Operator)’, 클로드의 ‘컴퓨터 유즈(Computer Use)’, 구글의 ‘제미나이 2.5’ 같은 ‘컴퓨터 조작 모델’들이었습니다.

대부분의 에이전트 툴이나 프레임워크는 기존 모델 위에 오케스트레이션 층을 얹은 일종의 래퍼(wrapper)에 가깝습니다. 반면 우리는 자체 코어 에이전트 모델을 직접 훈련했기 때문에, 빅테크 모델들과 ‘애플 대 애플(apples to apples)’ 방식으로 비교할 수 있습니다. 핵심은 오케스트레이션이 아니라 브라우저 사용 능력 자체입니다.

오케스트레이션 계층은 필요하다면 어떤 모델 위에도 얹을 수 있고, 반대로 유토리 모델 위에 다른 팀들이 자신들의 레이어를 구축할 수도 있습니다. 그래서 우리는 핵심 컴퓨터 유즈·브라우저 유즈 역량을 기준으로 비교하는 것이 적절하다고 보고 있습니다.”

24시간 에이전트의 운영 전략

― 유토리 서비스를 처음 접했을 때, 사용자가 늘어나면 인프라 부담이 커질 수 있겠다는 생각이 들었다. 실시간 에이전트를 운영하려면 상당한 컴퓨팅 자원이 필요할 텐데, GPU 인프라 전략은 무엇이며 스케일링 과정에서 예상되는 병목은 무엇인가.

“우리는 자체 GPU 인프라를 보유하고 있지 않습니다. 투게더(Together)나 베이스텐(Base10) 같은 파트너들과 협력해 모델을 호스팅하고 제품을 서비스합니다. 스케일링은 결국 이들과의 계약 규모를 키우는 방식이 될 것이며, 구조적으로 결정적인 병목이 있다고 보지는 않습니다.

다만 중요한 점은 에이전트가 24시간 가동되는 구조 자체가 본질적으로 비용이 크다는 것입니다. LLM이 토큰 생성을 반복하는 ‘for 루프’(컴퓨터 프로그래밍에서 for 루프는 반복문의 일종으로, 특정한 부분의 코드가 반복적으로 수행될 수 있도록 함)에 가깝다면, 에이전트는 모델을 중심으로 행동과 관찰이 반복되는 또 하나의 루프라고 할 수 있습니다. 스카우트는 여기에 더해 ‘크론 잡(Cron job·백업, 리포트 생성 등의 정기적 작업을 지정된 시간에 주기적으로 실행하도록 스케줄링하는 하는 것으로 각 작업은 무기한 반복되도록 구성)’처럼 주기적으로 실행되는 구조까지 얹혀 있어, 에이전트 위에 또 다른 반복 구조가 올라간 셈입니다.

이 비용을 감당할 수 있는 이유는 브라우저 사용을 외부 API(오픈AI, 앤트로픽, 제미나이 등)에 계속 맡기는 대신, 자체적으로 훈련한 브라우저 유즈 모델을 직접 호스팅하기 때문입니다. 브라우저 조작에 필요한 모든 토큰을 GPT-4 같은 초대형 모델로 처리한다면 비용이 감당하기 어려울 것입니다.

또한 우리는 메타와 구글에서 파운데이션 모델을 훈련하고 제품에 적용한 경험을 가진 팀입니다. 이런 전문성을 바탕으로 브라우저 사용에 특화된 자체 모델을 개발해 비용을 획기적으로 낮췄습니다. 현재 비용은 몇 달 전과 비교해 10분의 1 수준으로 줄었고, 이것이 정식 출시(GA)로 이어질 수 있었던 배경입니다.”

― 기업 고객을 위해 특정 데이터나 도메인에 맞춘 사전 훈련(pre-training)이나 커스터마이징이 필요한가. 온보딩은 어떻게 진행하고 있나.

“아직 B2B는 초기 단계입니다. 우리는 모델을 새로 사전학습하는 방식은 취하지 않고, 오픈소스 모델을 바탕으로 사후 훈련(post-training)만 진행하고 있습니다.

우리 모델은 시각 정보를 기반으로 하기 때문에 특정 웹사이트나 도메인에 크게 의존하지 않고 범용적으로 작동합니다. 기업의 요구가 매우 구체하고 규모가 크다면 맞춤형 대응도 검토하겠지만, 아직 그런 사례는 없습니다. 현재로서는 기본 모델만으로도 다양한 웹사이트를 충분히 커버하고 있습니다.”

시장 포지셔닝과 경쟁 환경

― ‘웹 에이전트’ 시장은 아직 형성 단계다. 카테고리 관점에서 유토리는 에이전트 인프라·플랫폼(B2B), 버티컬 SaaS(특정 산업·태스크), 컨슈머 도구(브라우저 확장, OS 레벨 어시스턴트) 가운데 어디에 가장 잘 맞는가?

“인프라와 컨슈머 도구, 두 영역 모두에 해당한다고 생각합니다. 첫 제품인 스카우트는 컨슈머·프로슈머 성격이 강하지만, 이 성과를 바탕으로 기업들의 문의와 API 사용 요청도 늘어나고 있습니다. 내부에는 웹 에이전틱 기술에서 최상위 수준(state of the art)의 역량을 갖춘 인재들이 포진해 있습니다. 아직 초기 단계이지만 API를 공개했고, 일부 엔터프라이즈 고객과도 논의를 시작했습니다.

우리는 스스로를 ‘웹 에이전트 기술을 우선 구축하고, 이를 여러 표면으로 제공하는 회사’로 정의합니다. 궁극적으로는 사람들이 지금처럼 브라우저에서 클릭하고 폼을 채우며 웹을 쓰지 않게 될 것입니다. 유토리는 그 전환을 가능하게 하는 기반 기술을 제공하는 것이 목표입니다.”

― 코멧(Comet), 아크(Arc)처럼 에이전트 기능을 직접 통합한 AI 네이티브 브라우저가 부상하고 있다. 유토리의 차별점은 무엇이며, 다양한 브라우저 환경 차이는 어떻게 다루고 있나.

“AI 브라우저들을 보며 우리는 흔히 말하는 ‘더 빠른 말(faster horses)’의 비유를 떠올립니다. 기존의 웹 사용 방식(브라우저를 열고 사이트에 들어가 클릭하는 방식)에 AI 기능을 덧붙이는 접근이라는 뜻입니다. 반면 유토리는 ‘자동차’를 만들고자 합니다. 브라우저를 열고 클릭하는 행위 자체를 없애는 것이 목표입니다.

우리는 처음부터 사용자가 웹과 직접 상호작용하는 방식이 아니라, 목표를 말하면 에이전트가 백그라운드에서 모든 워크플로를 실행하고 결과를 가져오는 구조가 되어야 한다고 봅니다. 철학적으로 다른 접근입니다.

또 하나의 큰 차별점은 클라우드에서 24시간 작동한다는 점입니다. ‘디바이스 안에서 돌아가는 에이전트’와 ‘백그라운드에서 상시 작동하는 에이전트’의 경험은 전혀 다릅니다. 노트북을 닫으면 로컬 에이전트는 멈추지만, 백그라운드 에이전트는 계속 일을 합니다. 브라우저 안에서 에이전트를 돌리면 사용자 기기의 자원을 소모하게 되지만, 우리는 클라우드에서 수십 개의 에이전트를 동시에 띄워 병렬로 작업을 처리합니다. 이런 구조는 로컬 브라우저 환경에서는 현실적으로 구현하기 어렵습니다. 사용자 경험의 차원이 다르다고 생각합니다.”

― MCP(Model Context Protocol) 같은 프레임워크 등장으로 오픈소스 에이전트 생태계가 빠르게 확장되고 있다. 유토리는 이를 어떻게 바라보고 있으며, 어떤 방식으로 경쟁하거나 차별화하려 하나.

“우리는 MCP를 경쟁 상대로 보기보다 호환 관계로 보고 있습니다. 우리가 구축한 스택에는 다양한 API와 MCP 서버에 접근할 수 있는 도구들이 포함돼 있습니다. 그런 수단이 충분하지 않을 때—예컨대 지역 테니스장 예약 사이트처럼 API나 MCP 서버가 없는 경우—원격 브라우저를 띄워 브라우저 사용 모델로 필요한 정보를 얻습니다.

우리는 MCP와 완전히 호환됩니다. 더 많은 MCP 서버와 도구가 등장할수록, 우리 에이전트가 활용할 수 있는 도구 역시 늘어나는 셈입니다. 우리는 이런 요소들을 통합해 더 강력한 서비스를 제공할 수 있습니다.”

― 시간과 자본이 충분하더라도 경쟁자들이 가장 따라 하기 어렵다고 보는 유토리만의 ‘해자(moat)’는 무엇인가.

“우리가 구축한 웹 에이전틱 아키텍처와 기술 스택 전체라고 생각합니다. 앞서 언급한 최첨단(state of the art) 브라우저 사용 모델은 물론, API와 MCP 서버 전반을 아우르는 오케스트레이션 체계까지 포함됩니다.

모델 하나를 만드는 것만으로는 충분하지 않습니다. 이를 제품에 적용해 반복 구조 속에 넣으면 곧바로 신뢰성과 비용 문제가 드러납니다. 인프라 운영, 일정 수준의 영속성(persistence), 컨텍스트 관리 같은 제품화 단계의 엔지니어링이 매우 큽니다.

우리는 200개가 넘는 도구와 API, MCP 서버를 다루며 이를 수행하는 서브 에이전트들을 효율적으로 조율합니다. 단순히 기존 LLM을 가져와 수백 개 도구에 연결하면 곧바로 한계에 부딪힙니다. 처리해야 할 문맥이 지나치게 많아지기 때문입니다. 이 과정에서 발생하는 인프라 문제와 컨텍스트 관리, 비용 최적화는 하루아침에 해결할 수 있는 일이 아닙니다.

그래서 우리는 작업을 하위 에이전트로 분해하고, 불필요한 토큰 왕복을 줄이며, 안정성과 비용을 동시에 만족시키도록 스택을 정교하게 설계해왔습니다. 이런 시스템을 실제 서비스 수준으로 운영 가능하게 만드는 데 거의 1년에 가까운 시간을 투입했습니다. 유토리는 우리가 아는 한 최신 기술 수준에 와 있으며, 이 전체 역량이 단기간에 복제되기는 어렵다고 봅니다.”

유토리가 생각하는 ‘엔드게임’

미국 샌프란시스코에 위치한 유토리 본사에서 인터뷰 중인유토리 공동창업자 데비 파리크. 최중혁 팔로알토캐피탈 대표 제공
미국 샌프란시스코에 위치한 유토리 본사에서 인터뷰 중인유토리 공동창업자 데비 파리크. 최중혁 팔로알토캐피탈 대표 제공

― 현재 베타 테스트와 초기 사용 단계에서 가장 강한 트랙션과 리텐션을 보이는 활용 사례나 고객 세그먼트는 무엇인가.

“대표적으로 제품 재고 확인과 구매 가능 여부, 할인·가격 하락 추적, 아파트 매물 검색, 최신 테크·리서치 뉴스 모니터링, 비즈니스·경쟁 정보 수집 같은 용도가 많습니다.

예컨대 미터(Meter)라는 회사의 CEO는 ‘샌프란시스코에서 새로운 오피스 임대 계약이 체결될 때마다 알림’을 받도록 설정해두고 있습니다. 이 회사는 오피스 인터넷 회선을 판매하는 업체여서 신규 임대 계약 소식이 곧 영업 리드로 이어지기 때문입니다.

이 밖에도 세일즈와 리크루팅 분야에서 다양한 활용 사례가 나타나고 있습니다. 개인 생활과 업무 양쪽에서 폭넓게 쓰인다는 점이 특징입니다.”

― 향후 6∼12개월 동안 유토리가 직면할 가장 큰 리스크나 도전은 무엇이라고 보나.

“AI 업계에서 1년은 너무 긴 시간입니다(웃음). 변화 속도가 워낙 빠르기 때문에 당장은 3개월 단위로 집중하고 있습니다. 다행히 첫 제품인 스카우트는 사용자들의 공감을 얻고 있습니다. 무엇을 하는 제품인지, 개인에게 어떤 가치를 주는지가 분명해졌고 리텐션도 강합니다. 가격 정책을 도입한 뒤 유료 전환율도 꽤 높게 나오고 있어 정식 공개(GA)를 결정했습니다. 다음 단계의 핵심은 더 많은 사용자를 확보하는 일입니다.

동시에 스카우트는 끝이 아니라 시작입니다. 앞으로 더 많은 도구를 연결하고, 사용자의 더 많은 맥락을 안전하게 통합해 더 큰 가치를 제공하며 ‘웹과 상호작용하는 방식 자체를 바꾸겠다’는 비전에 가까워지려 합니다. 단순 모니터링을 넘어 보다 복잡한 작업까지 수행할 수 있도록 도구와 문맥 접근성을 확장하는 것이 현재 우리의 최우선 과제입니다.”

― 에이전트가 인터넷 사용의 주체가 되면 광고·트래픽 중심의 기존 웹 생태계가 근본적으로 흔들릴 수 있다. 5년 뒤 웹은 어떻게 달라질까. 에이전트와 콘텐츠 퍼블리셔의 관계는 어떻게 재편될 것으로 보나.

“정답은 없고, 모두가 함께 답을 찾아가야 할 문제라고 생각합니다. 지금의 웹 생태계는 인간의 시선을 겨냥한 이른바 ‘어텐션 경제(attention economy)’를 중심으로 구축돼 있습니다. 시간이 흐르며 인간이 직접 웹에서 행동하는 주체가 아니라 에이전트가 점점 더 많은 일을 대신하게 된다면, 이 구조는 근본부터 다시 검토해야 할 것입니다.

여기서 여러 흥미로운 변화가 파생될 수 있습니다. 첫째는 ‘구매자 에이전트(buyer’s agent)’의 부상입니다. 지금까지의 웹은 무엇을 보여줄지를 정하는 ‘판매자 에이전트(seller’s agent)’ 중심이었지만, 이제는 사용자를 대신하는 에이전트가 등장하면서 힘의 균형이 달라질 수 있습니다. 이런 흐름은 이미 시작됐다고 봅니다.

둘째는 정보 접근 방식이 새로운 거래 구조를 만들어낼 수 있다는 점입니다. 웹사이트 접근에 비용을 지불하는 모델이 등장하거나, 에이전트와 웹사이트 사이의 ‘핸드셰이크’를 중개하는 제3자가 수익을 얻는 구조가 생길 수도 있습니다.

마지막으로 웹은 개별 사이트 중심이 아니라 ‘사용자가 수행하려는 과업(task)’을 축으로 재편될 가능성이 큽니다. 지금은 같은 사이트에 들어가면 모두 비슷한 화면을 보지만, 에이전트 시대에는 목적에 따라 전혀 다른 경험이 제공될 것입니다. 이런 변화는 광고와 유통, 콘텐츠, 수익 배분 등 웹의 여러 방정식을 흔들 수 있습니다.”

― 유토리가 비전대로 성장한다면 세상은 어떻게 달라질까. 유토리가 말하는 ‘엔드게임(endgame)’은 무엇인가.

“궁극적으로는 우리가 웹과 상호작용하는 방식이 완전히 달라지는 세상입니다. 한 단계 더 높은 추상화 수준에서 소통하게 될 것입니다. ‘이걸 해줘’라고 말하면, 혹은 말하지 않아도 에이전트가 백그라운드에서 알아서 필요한 일을 처리하는 환경이죠. 유토리는 이 전환을 앞당기는 기술을 만들고 싶습니다.

사용자들이 자질구레한 웹 서핑에서 벗어나 맥락 전환이 줄고, 덜 산만해지며, 덜 ‘정신적으로 분주한’ 상태가 돼 삶에서 더 중요한 일에 집중할 수 있도록 하는 것—그것이 우리가 말하는 진정한 ‘유토리(여유)’입니다. 아직은 매우 초기 단계지만, 그 방향으로 가고 있습니다.”

최중혁 팔로알토캐피탈 대표

필자(최중혁)는 미국 미시간대 경영학석사(MBA) 학위를 받은 뒤 삼성SDI America, SK Global Development Advisors 등을 거쳐 미 실리콘밸리 소재의 사모펀드 팔로알토캐피탈(Palo Alto Capital)을 설립해 운용하고 있다. ‘AI 로봇 반도체 BIG 3 투자 트렌드’ ‘2025-2027 앞으로 3년 미국 주식 트렌드’ 등의 저자다.


#인공지능#에이전트#유토리#웹 에이전트#생성형 AI#네비게이터

트렌드뉴스

트렌드뉴스

  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스