뉴스 트렌드 생활정보 International edition 매체

비플라이소프트, ‘문서요약 텍스트 AI 데이터 프로젝트’ 참여자 모집

입력 | 2020-08-27 11:15:00


 테스트웍스의 크라우드 소싱 플랫폼 ‘에이아이웍스’ 통해 진행
 한국정보화진흥원(NIA)이 진행하는 인공지능 학습용 데이터 구축사업을 수행하고 있는 비플라이소프트 (대표 임경환)는 사회적 가치를 추구하는 인공지능 데이터 수집-가공 및 소프트웨어 테스트 전문기업인 테스트웍스 (대표 윤석원)와 함께 ‘문서요약 텍스트 AI 데이터 프로젝트’의 참여자를 공개 모집한다고 밝혔다.

 한국정보화진흥원은 중소-벤처, 스타트업 등 민간의 인공지능기술 연구개발 촉진 및 인공지능산업 육성을 위한 데이터 구축 및 확보를 위해 다양한 분야에서 공모를 진행해 왔다. 국내 중소-벤처기업들은 인공지능 학습용 데이터를 자체 구축하기에 많은 시간과 비용이 소요되고 원천 데이터 확보의 어려움이 있다. 이에 한국정보화진흥원은 인공지능 개발에 필수적인 양질의 인공지능 데이터를 대규모로 구축하고 민간이 참여하는 선순환 생태계 조성을 확대하기 위해 이번 사업을 추진한다.

 비플라이소프트는 한국정보화진흥원의 지정공모 과제 중 하나인 ‘문서요약 텍스트 AI 데이터 구축’ 과제의 주관기관으로 테스트웍스, WIGO, 에이아이닷엠, 그리고 고려대학교 산학협력단 등 참여기관들과 함께 해당 과제를 수행해 오고 있으며, 이번 프로젝트에 참여할 언어에 관심이 있는 주부, 대학생, 일반인을 공개 모집한다. 이 프로젝트에는 다양한 한국어 원문 데이터의 텍스트 요약 가공에 관심이 있는 사람이라면 누구나 참여가 가능하다.

 한국정보화진흥원의 인공지능 학습용 데이터 구축 사업 중 하나인 ‘문서요약 텍스트 AI 데이터 프로젝트’는 검증된 한국어 텍스트 요약 데이터를 통한 AI 요약 기술 경쟁력을 확보하고, 한국어 요약 데이터 및 모델을 통해 다양한 신사업을 개발하기 위한 것이다. 다양한 한국어 원문 데이터로부터 정제된 추출 및 생성 요약문을 도출하여 검증된 한국어 문서 요약 AI 데이터셋을 구축, 배포하고자 한다. 이렇게 구축된 한국어 문서 요약 AI 데이터셋을 기반으로 추출·생성 요약 AI 알고리즘을 개발하여 배포하고, 추출·생성 요약 AI 알고리즘을 이용해 문서 요약 관련 서비스 구현 및 API 배포까지 확장시키는 것이 목표다.

 ‘문서요약 텍스트 AI 데이터’ 프로젝트는 테스트웍스의 크라우드 소싱 플랫폼 ‘에이아이웍스(aiworks)’를 통해 진행되며, 회원가입 후에 누구나 참여할 수 있다. 참여자는 신문 기사를 읽고, 핵심 문장 3개를 표시한 후, 한 문장으로 요약하면 되며, 건당 500원의 현금 포인트를 획득해 최대 200만원까지 획득할 수 있다.

 테스트웍스가 이번 프로젝트에 활용하는 제품은 자사의 ‘에이아이웍스’이다. 에이아이웍스는  크라우드 소싱 방식의 인공지능을 위한 학습 데이터 수집 및 가공 전문 플랫폼으로서, 일반인도 공공 과제의 원본 데이터 수집 자원봉사자로 참여하면 봉사활동을 인정해 주는 국내 유일의 크라우드 소싱 임팩트 플랫폼이다. 이 플랫폼은 데이터 수집에서부터 자동화 가공, 정밀한 수동 가공, 검수에 이르는 전체 단계를 단 기간에 진행하고 고품질의 데이터셋을 구축할 수 있도록 지원한다.

 테스트웍스 윤석원 대표는 “한국정보화진흥원의 ‘문서요약 텍스트 AI 데이터 프로젝트’는 문서 요약 AI 모델을 활용하여 제품 리뷰 요약, 양산형 기사 품질 측정, 가짜 블로그 포스트 필터링, 커뮤니티 포스트 요약 등 다양한 서비스로 확장할 수 있는 AI 데이터 구축 사업이다”라고 말하며, “이번 프로젝트는 언어에 관심이 있는 사람이라면 누구나 참여가 가능하며, 우리나라 AI 요약 기술 경쟁력 강화에 힘을 보탤 수 있는 의미 있는 사업인 만큼 문서요약에 관심이 많은 이들의 참여를 기대한다”고 말했다.

 동아닷컴 최용석 기자 duck8@donga.com