※ 서울과학기술대학교는 초기창업패키지 딥테크(AI·빅데이터) 분야 창업 기업을 지원합니다. IT동아는 서울과학기술대학교의 맞춤형 성장 지원 프로그램을 토대로 시장에서 뚜렷한 성과를 내는 유망 딥테크 스타트업의 면면을 살펴봅니다.
“청각 인텔리전스의 표준을 정의하고 싶습니다.”
돌봄과 안전에 대한 사회적 우려가 점차 커지고 있다. 혼자 사는 노인이 쓰러졌을 때나 아이가 울고 있을 때, 그리고 누군가 골목길에서 도움을 요청하는 순간 등을 감지할 수 있는 기술의 필요성이 높아지는 시점이다. 특히 비대면 진료와 원격 돌봄 서비스가 확산되는 가운데 사람이 직접 보거나 듣지 못하는 상황을 기술로 보완하려는 시도가 다양한 분야에서 이뤄지고 있다.
광고 로드중
김성은 메디센싱 대표 / 출처=IT동아
스타트업 메디센싱(Medisensing)은 이러한 사회적 요구에 응답한다. 특히 소리를 듣고 그 의미와 상황을 해석하는 인공지능(AI) 기술로 의료부터 일상 생활의 안전·돌봄 영역까지 도전하고 있다. 단순한 음성 인식을 넘어 비명, 울음, 도움 요청 등 비언어적 소리를 이해하고 상황을 판단하는 고도화된 AI 기술도 개발 중이다. 김성은 메디센싱 대표를 만나 사업 동기와 전략, 그리고 비전을 들어봤다.
AI 분야 연구하며 창업 결심
2024년 설립된 메디센싱은 ‘의료(Medical)’와 ‘감지(Sensing)’를 결합한 것. 김성은 대표는 “사람의 몸과 일상에서 발생하는 신호를 감지하고 그 의미를 이해함으로써 사회에 실질적으로 기여할 수 있는 기술을 만들기 위해 메디센싱을 설립했다”고 설명했다.
김성은 대표는 서울과학기술대학교 인공지능학과 교수로 생체신호, 뇌파, 소리 신호를 이해하는 AI 분야에서 최근 5년간 상위 10% 이내 최상위 국제 학술지에 12편 이상의 논문을 발표한 연구자이기도 하다. AI 분야 연구를 진행하면서 기술이 단순히 논문 수준에 머무르지 않고 사회에 기여할 수 있도록 하기 위해 창업을 결심했다.
김성은 대표는 서울과학기술대학교 인공지능학과 교수로 AI 분야를 연구하며 창업을 결심했다 / 출처=IT동아
김성은 대표는 “병원과의 공동연구를 통해 AI 기술을 적용해 봤는데 예상보다 높은 정확도로 이상 호흡음을 판별할 수 있었다. 당시 기술적 성취를 넘어 ‘이 기술이 실제로 누군가에게 도움이 될 수 있겠다’는 가능성이 분명하게 보였다. 특히 스마트폰 마이크만으로도 이 기술의 구현이 가능하다면 의료 접근성이 낮은 환경에서도 기본적인 청진 보조 기능을 제공할 수 있을 것이라고 생각했다”고 회상했다. 이어 “이러한 경험을 통해 연구 성과를 논문에 머무르게 하지 않고 실질적인 가치로 구현하는 것이 중요하다고 생각했다. 그 결단이 창업으로 이어졌다”면서 “학생들에게도 연구실을 넘어 기술이 실제 제품과 서비스로 구체화되는 전 과정을 직접 경험하게 하고 싶었다”고 덧붙였다.
광고 로드중
메디센싱의 핵심 기술은 현실의 복잡한 소음 환경 속에서도 의미 있는 개별 소리를 정확히 인식하고, 상황까지 이해하는 AI다. 소리 데이터를 분석해 상태를 파악하고 행동을 유도하는 SSI(Sound State Intelligence) 기술을 개발하고 있다. 일반적인 범용 모델은 학습된 기준에 따라 ‘이건 울음이다’라는 라벨을 붙이는 분류에 강점이 있으나 오류가 많을 수밖에 없다. SSI의 경우 각 가정의 평상시 소리 환경을 레퍼런스로 삼아 ‘이 소리가 평소와 비교해 얼마나 의미 있는 변화인지’를 함께 판단한다. 시계열 패턴과 LLM 기반 맥락 추론을 결합해 소리의 ‘왜’와 ‘무엇’에 답하는 셈이다. 예를 들어 아이의 지속적인 고음 울음을 단순 울음이 아닌 통증 혹은 이상 징후 위험으로 해석하는 식이다.
김성은 대표는 “아이 울음소리를 들었을 때 범용 모델은 보통 ‘baby cry 0.72’처럼 확률을 출력한다. 이때 사용자 입장에서 보면 ‘그래서 지금 내가 뭘 해야 하는지’까지 연결되기 어렵다. SSI는 울음소리가 언제 시작했고, 얼마나 지속됐는지, 강도는 어떤지, 최근 10분 내 재발 여부 등 사용자가 바로 판단할 수 있는 형태로 정리해준다”며 “같은 아이 울음소리라도 집집마다 TV 소리 크기가 다르고, 아이마다 평소 우는 패턴도 차이가 있다. SSI는 그 집과 아이의 평상시 소리 및 패턴을 먼저 학습하고, 그 기준에서 벗어나는 변화가 감지될 때 이벤트로 정리한다”고 밝혔다.
이를 바탕으로 메디센싱은 AI 기반 소아 호흡기 평가를 위한 자가 청진 도구 앱 ‘아이메딕(iMedic)’ 베타 버전을 개발해 2025년 선보였다. 아이메딕은 스마트폰 마이크로 아이의 호흡음을 측정하면 이상 여부를 판별하고 기록 및 관리하는 것이 핵심. 가정에서도 누구나 손쉽게 작동할 수 있고, 필요 시 해당 음을 의료진에게 전달할 수 있도록 하는 데 초점을 맞췄다. 다만 아이메딕의 정식 출시를 위해서는 의료기기 인증 등 추가 절차가 필요하다는 점을 확인했다. 이에 베타 서비스를 종료했다. 김성은 대표는 “아이메딕의 핵심 기술은 이미 학술 논문으로 발표된 연구 성과를 바탕으로 한 것”이라면서 “비록 상용화로 이어지지는 않았지만, 논문에 머물렀던 기술을 실제 MVP 형태로 구현하고 현장에서 검증해본 경험은 큰 의미가 있었다고”고 말했다.
메디센싱이 개발한 아이메딕의 베타 버전 / 출처=IT동아
메디센싱은 아이 울음소리나 비명 등 5~6개의 핵심 개별 소리를 인식하는 기술 개발에도 집중하고 있다. 김성은 대표는 “TV 소리, 생활 소음, 주변 대화가 섞인 환경에서도 아이 울음소리를 안정적으로 인식할 수 있는 모델을 개발했다”면서 “이러한 기술을 특정 소리에 국한하지 않고 여러 핵심 소리들을 통합한 소리 센싱 AI 플랫폼으로 확장하고 있다”고 설명했다.
광고 로드중
이에 따라 기술 활용 시나리오도 다양하다. 골목길이나 공공 공간에 설치해 밤 시간대 비명이나 도움 요청 소리를 감지하는 안전 시스템뿐만 아니라 가정에서는 아이의 울음부터 칭얼대는 소리까지 인식하는 돌봄 보조 기술 등이 대표적이다.
김성은 대표는 “메디센싱이 만들고자 하는 것은 단순한 소리 인식 기능이 아니다. 사람이 직접 듣고 판단해야 했던 순간들을 기술로 보조하는 청각 인텔리전스다. 의료에서 출발했지만, 일상과 사회 전반에서 사람의 안전과 돌봄을 돕는 방향으로 기술을 확장해 나가고 있다”고 말했다.
데이터 확보·실제 소음 환경에 어려움, 접근 방식 바꿔 해결
메디센싱이 기술을 개발하기까지 쉬운 여정은 아니었다. 가장 큰 어려움은 단연 데이터 확보였다. 김성은 대표는 “소리는 이미지나 텍스트와 달리 공개된 데이터가 매우 제한적이다. 특히 실제 상황 맥락이 포함된 소리 데이터는 거의 존재하지 않는다. 의료 소리의 경우에는 여기에 더해 임상 검증과 윤리적 고려가 필수적이기 때문에 개발 속도에도 현실적인 제약이 있었다”고 털어놨다.
또 다른 문제는 소리 인식 기술이 실제 사용 환경에서는 거의 항상 ‘소음 속’에서 동작해야 한다는 것. 김성은 대표는 “연구실 환경에서는 잘 동작하는 모델도 TV 소리와 대화 소리 등 생활 소음이 섞인 실제 환경에서는 성능이 급격히 떨어지는 경우가 많았다. 하지만 이런 현실적인 환경 소음을 충분히 확보하고 재현하는 것 자체가 쉽지 않았다”고 말했다.
여기서 끝이 아니었다. 연구와 사업의 간극도 컸다. 김성은 대표는 “연구는 충분한 검증과 반복을 요구하는 반면, 사업은 빠른 실행과 방향 전환을 요구한다. 이 2가지 요구를 동시에 만족시키는 것이 기술 개발 과정에서 지속적인 고민이었다”고 밝혔다.
메디센싱은 일련의 문제를 해결하기 위해 접근 방식을 바꿨다 / 출처=IT동아
그럼에도 포기하지 않았다. 문제를 해결하기 위해 접근 방식부터 바꿨다. 처음부터 모든 소리를 포괄적으로 이해하는 것보다 의미가 분명하고 사회적으로 활용 가치가 높은 소리부터 하나씩 정의하고 인식하는 방향으로 전략을 세웠다. 그 결과 현재 아이 울음소리, 비명, 도움 요청 소리 등 5~6개의 핵심 개별 소리를 선정해 각각을 독립적인 의미 단위로 정의하고 인식하는 기술 개발에 집중하고 있다.
김성은 대표는 “전략을 변경한 후 문제의 범위를 명확히 제한하고, 기술 완성도를 빠르게 높일 수 있었다. 또 실제 환경과 유사한 조건을 만들기 위해 환경 소음을 다양한 시나리오로 설계하고 이를 생성형 AI와 결합해 재현하는 방식을 도입했다. 예를 들어 가정, 골목길, 실내 공공 공간 등 실제 사용 환경을 가정한 소음 조건을 인위적으로 생성하고 이를 학습과 검증에 활용함으로써 소음 환경에 강한 모델을 개발할 수 있었다. 실제 환경에서도 제대로 작동하도록 모델을 경량화하고, 아주 적은 연산 자원으로도 안정적으로 동작할 수 있도록 설계했다”고 설명했다.
결과적으로 메디센싱은 일련의 전략을 통해 현실적인 소음 환경에서도 의미 있는 소리를 놓치지 않는 경량 소리 인식 AI 모듈을 확보할 수 있었다. 이는 현재 메디센싱이 개발 중인 소리 센싱 인공지능 플랫폼의 핵심 기반이 됐다.
현재 메디센싱의 가장 큰 도전과제는 시장이 지금 당장 필요로 하는 ‘소리 기반 기술’이 무엇인지 정확히 파악하는 것이다. 김성은 대표는 “기술적으로는 개별 소리를 인식하고 소음 환경에서도 안정적으로 동작하는 AI 기술을 상당 부분 확보했지만, 이 기술이 어떤 문제를 해결할 때 ‘반드시 필요한 기술’이 되는지를 명확히 정의하는 단계에 와 있다”고 말했다.
메디센싱은 기술 개발과 병행해 다양한 산업 관계자들과의 인터뷰와 PoC(개념검증)를 통해 실제 니즈를 검증하는 데 노력을 기울이고 있다. 어떤 소리 인식 기능이 현장에서 가장 절실한지, 어떤 형태로 제공돼야 서비스로서 가치가 있는지, 그리고 이를 기반으로 어떤 비즈니스 모델을 만들어야 하는지를 하나씩 확인해 가고 있다.
기술·시장 검증 병행하며 단계적 성장 목표
메디센싱의 강점은 단기간에 만들어진 아이디어가 아니라, 오랜 기간 연구실에서 축적한 연구 역량과 성과를 기반으로 한다는 것이다. 최상위 국제 학술지 논문과 특허 포트폴리오는 초기 스타트업 단계에서 쉽게 갖추기 어려운 중요한 자산이기도 하다. 여기에 클라우드 API와 엣지 SDK를 동시에 개발 및 배포할 수 있는 기술 역량은 다양한 산업 파트너와의 협업 가능성을 높여주는 요소로 꼽힌다.
메디센싱은 ‘2025년 초기창업패키지 딥테크 분야 글로벌오픈이노베이션(글로벌 IR 데모데이)-넥스트 스테이지: 글로벌 IR 포 그로우 스테이지 스타트업(Next Stage: Global IR for Growth-Stage Startups)에 참여했다 / 출처=IT동아
이러한 사업성을 바탕으로 메디센싱은 2025년 서울과학기술대학교 창업지원단의 딥테크 분야 초기창업패키지 사업에 선정됐다. 김성은 대표는 “이번 사업을 통해 초기 자금을 지원받아 약 5개월간 인건비를 안정적으로 확보했고, 기술 개발에 집중할 수 있는 환경도 마련할 수 있었다”면서 “자금 지원뿐만 아니라 VC 밋업, IR 자료 작성 및 발표 기회, 네트워킹 프로그램이 실질적으로 큰 도움이 됐다. 이러한 과정들은 단순한 지원을 넘어 메디센싱이 다음 단계로 나아가기 위한 준비를 체계적으로 할 수 있도록 도와줬다”고 만족감을 드러냈다.
또 메디센싱은 현재 서울과학기술대학교 기술지주로부터 초기 소규모 투자 계약을 완료했다. 2026년 상반기에는 TIPS 연계를 목표로 한 씨드 투자 유치도 준비하고 있다. 김성은 대표는 “투자를 통해 안정적인 자금이 확보되면 소리 인식 및 상황 이해 기술을 고도화할 수 있는 핵심 기술 인력과 상품 기획 인력을 확충하고, 실제 시장에 적용 가능한 제품과 서비스의 완성도를 높여 나갈 계획”이라면서 “단기적인 확장보다는 기술과 시장 검증을 병행하며 단계적으로 성장하는 것이 메디센싱의 목표”라고 강조했다.
메디센싱에 따르면 중장기적으로는 다양한 소리 데이터베이스를 구축하고, 여러 소리를 동시에 이해하며 상황까지 인지할 수 있는 청각 인텔리전스 기술을 확보하는 것이 목표다. 의료는 중요한 출발점이었고, 앞으로는 일상과 산업 전반으로 확장 가능한 핵심 기술로 성장시킨다는 전략이다.
메디센싱의 비전은 ‘청각 인텔리전스의 표준을 정의하는 것(Defining the Standard for Hearing Intelligence)’이다. 김성은 대표는 “사람은 소리만 듣고도 대략적인 상황을 인지할 수 있지만, 현재 AI 기술은 음성 인식에는 뛰어나도 비언어적 소리들이 담고 있는 상황적 의미를 이해하는 데 아직 한계가 있다”며 “어떤 소리를, 어떤 맥락에서, 어떤 의미로 해석해야 하는지에 대한 공통된 기준과 구조를 만드는 것이 목표”라고 밝혔다. 이어 “이 기준이 정립되면 로봇, 스마트홈, 자율주행, 돌봄 서비스 등 다양한 산업에서 소리를 이해하는 AI의 기본 인프라로 활용될 수 있을 것”이라고 전망했다.
오랜 연구 성과를 사회적 가치로 연결하려는 김성은 대표의 도전이 시장에서 어떤 성과로 이어질지 주목된다.
IT동아 박귀임 기자(luckyim@itdonga.com)