“지식주권과 소버린 AI 전략을 논하다” 지식(데이터) 주권을 위한 오픈소스 활성화 전략 세미나
동아닷컴
공유하기
글자크기 설정
한국AI서비스학회 지식주권AI서비스 분과는 지식(데이터) 주권을 위한 오픈소스 활성화 전략 세미나를 개최했다 / 출처=IT동아
AI는 한 나라의 지적·물적 자산이 집약되는 산업이다. 핵심은 데이터다. 데이터를 누가 소유하고, 학습에 활용하며, 결과물이 어떻게 귀속되느냐가 곧 경쟁력의 차이를 결정한다. 해외 선진국들은 AI 데이터 보호와 확보를 위해 일찌감치 국가 안보 차원에서 지식주권 방어선을 구축했다. 대한민국 정부와 산업계 역시 공공 클라우드 보안인증(CSAP) 제도를 전면에 내세워 국산 클라우드 산업을 보호하고, 산업 특화 인공지능 모델을 발굴하는 소버린(Sovereign) AI 전략으로 대응에 나섰다.
양질의 AI 데이터를 만들기 위한 노력도 활발하다. 오픈소스(개방형) 생태계를 활용한 기술 개발이 대표적이다. 퍼포스 오픈로직(Perforce Openlogic)이 2025년 발간한 오픈소스 현황 보고서에 따르면 전 세계 기업의 96%가 오픈소스 사용량을 늘리거나 유지하는 것으로 조사됐다. 그중 26%는 지난 1년간 사용량이 크게 증가한 것으로 나타났다. 오픈소스가 기술 혁신의 핵심 인프라로 자리잡았음을 보여주는 수치다.
반면, 일부 거대 자본이 오픈소스 생태계의 성과를 무단으로 활용해 이익을 낸다는 비판도 제기된다. 생태계 기여 동기를 저하시킬 수 있다는 우려에서다. 그런 맥락에서 오픈소스 생태계의 주도권 확보가 시급하다는 주장이 힘을 얻는다. 그렇다면 대한민국이 지식주권 경쟁에서 뒤처지지 않기 위해 어떤 방안을 마련해야 할까? 이 물음에 답하기 위해 민관 전문가들이 한자리에 모였다.
2026년 5월 22일, 한국AI서비스학회 지식주권AI서비스 분과는 더존을지타워(서울 중구 소재)에서 ‘지식(데이터) 주권을 위한 오픈소스 활성화 전략’ 세미나를 열었다. AI 데이터 주권, 클라우드·AI 인프라, 오픈소스 생태계 구축, 온톨로지 기반 지식 체계화 등을 두루 다뤘다.
양질의 데이터 확보하려면 투명한 체계 갖춰야
연단에 오른 이제응 한국AI서비스학회 지식주권AI서비스 분과장은 지식주권이란 무엇이며, AI 시대에 인간의 지적 기여를 어떻게 보호하고 보상할 수 있을지 설명했다. 지식주권 생태계를 구축하려면 정당한 보상이 전제돼야 한다는 점도 강조했다.
이제응 분과장은 지식주권과 저작권에는 분명한 차이가 존재한다고 짚었다. 저작권은 창작물에 대한 법적 보호를 다루지만, 지식주권은 더 포괄적인 개념이다. 개인이 자신의 경험, 통찰, 맥락 등을 공유했을 때 그 데이터가 어디에 활용되는지, 그에 대한 대가와 통제권을 스스로 쥘 수 있는지에 초점을 둔다.
이제응 한국AI서비스학회 지식주권AI서비스 분과장 / 출처=IT동아
이제응 분과장은 지식주권을 생성권·활용 결정권·보상권 등 세 가지로 분류했다. 생성권은 어떤 맥락과 의도로 정보를 생성했는지 스스로 설명할 권리다. 활용 결정권은 내 지식이 어디에 어떻게 쓰일지를 통제할 권리를 뜻한다. 보상권은 AI가 내 지식을 학습에 활용했을 때 경제적 혹은 사회적 방식으로 보상받을 권리다.
지식주권이 보장되지 않으면 사람들은 자신의 아이디어와 경험을 공개하지 않을 것이라는 게 이제응 분과장의 설명이다. AI에 무언가를 입력하면 그 아이디어가 학습 재료로 쓰인다는 사실을 알기에 전문가들은 이미 고급 정보를 의도적으로 AI 도구에 입력하지 않는다. 기여 동기가 떨어진 셈이다. 고품질 데이터 공급 위축으로 이어지고, 결국 AI 학습 품질이 떨어지면서 신뢰도와 정확성이 낮아지는 구조적 손실이 발생한다.
이제응 분과장은 AI 데이터 기여에 대한 평가와 보상이 필요하다고 주장했다 / 출처=IT동아
오픈소스 생태계가 위기라는 점도 지적됐다. 과거 개발자가 오픈소스 플랫폼에 코드를 공개하면 커뮤니티에서 인정받아 스카우트 제안을 받거나 커리어로 이어지는 선순환 구조가 뚜렷했지만, 지금은 다르다. 누군가 코드 한 줄을 공개하면 AI가 즉시 그것을 학습하고 응용해 누구나 쉽게 구현할 수 있도록 만들기 때문이다. 기여의 희소성이 사라지면 어느 누구도 선뜻 자신의 아이디어를 공유하지 않는다.
이제응 분과장은 집단 지성으로 문제 극복이 가능하다고 봤다. 인간의 지성은 사회적 경험, 관계의 맥락, 직관과 통찰에 기반한다. 수많은 사람의 생각이 모이고 상호작용하면서 발생하는 집단 지성은 비선형적인 가치를 만들어내며, 이것이 AI 학습의 원천이다. 지식주권 보장이 개인의 권리 문제를 넘어 집단 지성의 생태계를 지키는 일이자, AI의 지속적인 품질 향상을 위한 구조적 전제라는 점을 이제응 분과장은 거듭 강조했다.
데이터 주권, 결국 ‘소버린 AI’
양재수 한국데이터산업진흥원 원장은 AI 시대 데이터 인프라의 현황과 전략 과제를 광범위하게 조망했다. AI가 모든 물리적 세계와 결합하는 피지컬 AI 시대로 전환됐다는 점을 짚으면서, 제조·물류·국방 등 경제를 지탱하는 산업 분야의 정보들이 완전히 새로운 성장 동력으로 작용해 기존 판도를 뒤흔들 게임 체인저가 될 것이라고 내다봤다.
관건은 역시 데이터다. 데이터가 어떤 지역 서버에 저장되고, 어떤 국가의 법률 관할 아래 놓이느냐가 중요하다는 것이다. 국가주권 AI, 이른바 소버린 AI(Sovereign AI)의 중요성을 거론한 셈이다.
양재수 한국데이터산업진흥원 원장 / 출처=IT동아
피지컬 인공지능이 복잡한 산업 현장에서 오차 없이 작동하려면 카메라, 라이다 등 각종 정밀 센서를 통한 정확한 인지 과정을 거쳐야 한다. 현장 상황을 파악하고, 자율적인 물리적 행동과 정교한 피드백을 무한히 반복하는 고도화된 정보 순환 체계도 필요하다. 그런데 이런 데이터들이 국내에 없다면, 아무리 한국 기업의 것이라 해도 데이터 주권은 유명무실해질 가능성이 크다.
양재수 원장은 민감한 정보 교류 과정에서 생성되는 방대한 국내 현장 정보를 아무런 여과 장치 없이 글로벌 기업의 언어모델에 무방비로 넘겨주는 작금의 상황을 경계했다. 국가 고유의 핵심 주권 정보를 지켜내려면, 전용 서버를 국내에 두고 독자 알고리즘으로 구동되는 한국형 소버린 AI 확보가 시급하다는 점을 강조했다.
한국형 소버린 AI에 대해 설명 중인 양재수 원장 / 출처=IT동아
이어 한국데이터산업진흥원의 정책이 소개됐다. 정보의 악의적인 위변조나 딥페이크 범죄 악용을 원천 봉쇄하기 위해 데이터 신뢰팀을 조직 내에 신설한다. 데이터 위·변조가 증가하면서 신뢰성이 무너지는 문제를 품질·보안 차원에서 체계적으로 다루겠다는 구상이다. 딥페이크 예방 교육 시스템도 2027년도 사업으로 추진할 방침이다. 생산자부터 소비자까지 전 단계에서 딥페이크를 방지하는 구조 설계에 역량을 집중할 예정이다.
개인정보나 의료 정보처럼 외부 반출이 불가능한 민감 데이터를 다루는 데이터 안심구역도 언급됐다. 데이터 안심구역에서는 각 부처·공공기관의 민감 데이터를 물리적으로 격리된 공간 내에서만 분석하도록 허용한다. 개인 식별 정보는 보호하면서도 통계적 분석은 가능하게 하는 구조다. 데이터 안심구역에는 이미 여러 공공기관이 입주해 운영 중이라는 게 양재수 원장의 설명이다.
데이터 유통 활성화를 위한 한국 데이터거래소(K-DEX, Korea Data Exchange) 운영도 추진한다. 참여자들의 데이터 소유권을 유지한 채 안전하게 연계·교환하는 유럽의 가이아-X(GAIA-X), 일본 데이터거래소 등과 유사한 구조다. 데이터 관련 분쟁이 증가하는 현실을 반영해, 중소기업을 위한 데이터 소송 지원 예산도 2027년도 예산에 편성됐다고 양재수 원장은 전했다. AI 제대로 뿌리내리려면 ‘온톨로지’ 구축 중요해
마지막으로 연단에 오른 신동호 토지 대표는 오픈소스 기반 온톨로지(Ontology) 솔루션, 고피디아(Gopedia)를 시연했다. 고피디아는 마크다운(텍스트 기반 문서 서식 언어), PDF, 코드 파일, 슬랙 메시지, 티켓 시스템 등 기업 내 흩어진 모든 데이터 소스를 단일 지식 저장소로 통합하는 게 목표다.
신동호 대표는 인공지능 모델이 태생적으로 인간이 구사하는 복잡한 언어와 추상적 개념을 완벽히 이해하지 못하기에, 그 언어·개념 체계를 정교하게 분류한 온톨로지 설계가 필요하다고 강조했다.
그는 자신이 키우는 강아지를 예로 들어 온톨로지를 설명했다. AI는 뚝이라는 단어만으로 이 존재를 이해하지 못한다. AI가 뚝이를 이해하려면 먼저 강아지라는 정보를 제공해야 한다. 이어 강아지는 포유류이며, 뚝이는 낮잠을 좋아하고 치킨을 즐긴다는 사실들을 연결해줘야 비로소 “뚝이는 운동 없이 고칼로리 음식을 먹으니 체중이 늘 것”이라는 추론이 가능해진다. 온톨로지는 지식의 출처를 추적한다. 어떤 정보가 언제, 누구에 의해 생성됐고, 어디에 활용됐으며 얼마나 신뢰받는지를 메타데이터 수준에서 관리한다.
신동호 토지 대표 / 출처=IT동아
이어 고피디아 솔루션을 활용한 장애 복구 과정이 시연됐다. 내부망과 외부망 연결이 완전히 끊어지는 심각한 네트워크 장애가 갑작스럽게 발생했지만, 고피디아는 내부 데이터를 분석해 원인과 해결책을 담은 보고서를 자동 생성했다. 민감한 정보는 내부에서 관리하고, AI는 허용된 범위의 데이터에만 접근하도록 설계된 덕분이다.
신동호 대표는 데이터가 시스템에 처음 입력되는 단계에서 출처와 기여도를 기록하는 블록체인 기반 구조를 확립해야만 기업과 개인 창작자가 지식주권을 온전히 행사할 수 있다고 강조했다.
댓글 0