“영리적으로 (AI를 개발)하려는 민간회사 입장에선 (공정이용이 인정)되는 게 거의 없지 않느냐…. 제대로 본 겁니다.”
4일 문화체육관광부와 한국저작권위원회는 ‘생성형 인공지능(AI)의 저작물 학습에 대한 저작권법상 공정이용 안내서’(안내서) 설명회를 열었다. 안내서 초안의 검토에 참여한 최진원 대구대 법학부 교수는 설명회 막바지 현장에서 나온 질문에 이렇게 답했다. 공정이용은 특정한 경우 저작권자의 허락 없이도 저작물을 이용할 수 있도록 허용하는 저작권법 조항이다.
이 안내서는 AI 개발 시 저작물 학습이 공정이용으로 인정될 수 있는 예시로 ‘공공데이터 기반 비영리 AI’ ‘오픈액세스 논문으로 과학기술 요약 AI’ ‘이공계 논문의 데이터분석 AI’ 등을 제시했다. 전부는 아니지만 대체로 비영리 목적이다. 이에 ‘공정이용으로 인정받기가 어렵다고 느껴진다’는 질문이 나오자 내놓은 답이었다.
최 교수의 답변 논지를 따라가 보자. 저작권은 잉여 이익이 발생했을 때 어떻게 분배할 것인지를 다룬다. AI 개발도 마찬가지다. AI가 사회적 이익을 창출하면 그를 어떻게 나눌 것인가도 논의해야 하는 게 당연하다. 한데 저작권법상 공정이용은 분배 비율이 ‘100 대 0’이다. 공정이용으로 인정되기만 하면 AI 개발의 원자재를 공급한 창작자들에겐 돌아가는 몫이 전혀 없다는 뜻이다. 공정이용이 폭넓게 인정되기 어려운 이유다.
물론 창작자의 권리라는 가치만큼이나 AI 산업의 성장 기회도 놓쳐서는 안 될 것이다. 이번 안내서는 ‘거래 활성화’와 ‘저작권 권리정보 제공, 유통 플랫폼 구축’ 등을 대안으로 제시했다. AI의 학습 데이터가 되는 저작물을 합리적으로 거래하는 시장이 형성돼야 한다는 뜻이다. AI에 앞서 빅데이터가 ‘산업의 쌀’로 주목받을 당시 관련 산업의 도약을 위해선 데이터 거래소가 필요하다는 의견이 나왔던 것과 결이 같다.
하지만 실정은 어떠한가. 당장 포털 네이버에 최근 주요 이슈를 검색하면 언론 보도에 앞서 ‘AI 브리핑’의 내용 요약이 맨 위에 나오는 경우가 많다. 대강만 살펴봐도 개방된 공공데이터만을 학습해 내놓은 답변으로 보이진 않는다. 한국신문협회는 네이버가 뉴스 기사의 주요 내용을 무단 복제·요약·재구성했다고 보고 있다. 이런 서비스는 AI가 원저작권자의 시장을 침해한다는 측면 등에서 이번 안내서가 제시한 ‘공정이용이 인정되기 어려운 경우’ 1번 예시와 별로 다름이 없다.
네이버는 자체 생성형 AI 모델을 개발하는 과정에서 뉴스 데이터를 사용했다는 것도, “뉴스가 AI 학습과 개발에 필요한 가장 고품질 데이터”라는 것도 인정했지만 정작 뉴스 데이터를 얼마나 어떻게 활용했는지는 꽁꽁 숨기고 있다. 국내 손꼽히는 빅테크 기업의 태도가 이런 식이니, AI 학습 데이터 거래 시장의 활성화란 요원할 수밖에 없다.
밥을 지어 팔려면 쌀값은 치르는 게 상식이다. 학습 데이터 거래 시장이 활성화돼야, 스타트업이 AI를 개발하는 단계에선 데이터에 대해 대가를 적게 치르더라도 나중에 AI 모델이 상용화되면 제대로 보상하는 식의 거래도 가능해진다. 무턱대고 ‘공짜로 쓰겠다’는 건 창작자와 저작권자의 반발을 불러올 뿐이다. 개발사들도, 그렇게 개발된 AI도 언제 터질지 모르는 폭탄을 안는 것이나 다름없다.
댓글 0