3초면 야구기사 뚝딱… ‘케이봇’기자 아시나요

  • 동아일보
  • 입력 2018년 7월 24일 03시 00분


코멘트

KBO 퓨처스 소식 전하는 로봇기자
경기 기록지 데이터만 입력하면 축적된 DB 바탕 대량 작성 가능
사회인 경기 6만 건 제공하기도


17일부터 프로야구 퓨처스리그 매 경기는 ‘로봇 기사’로 소식을 접할 수 있다. 기사에는 단순 스코어뿐 아니라 ‘노력은 물거품이 됐다’ ‘다소 아쉬운 플레이를 보여줬다’는 인간적인(?) 표현도 있다.

이 로봇 기사를 작성하는 ‘케이봇’을 개발한 랩투아이는 OB 베어스 어린이 회원이었던 ‘골수 두산 팬’ 대표이사와 본인은 LG 팬임을 부정하지만 여전히 스코어는 LG부터 보게 된다는 ‘해탈한 LG 팬’ 기술이사의 만남에서 시작됐다. 학부 때 전산을 전공한 김동환 랩투아이 대표이사는 서울대 언론정보학과에서 박사과정을 수료했는데 그때 연구실 후배로 만난 이가 오종환 기술이사다. 오 기술이사는 학부 때 전기공학을 전공했다. 야구에 대한 관심이 합쳐져 둘은 뉴스 알고리즘 개발을 함께하게 됐다.

케이봇은 1차적으로 기자들이 실제 쓴 기사를 수집해 ‘데이터’와 ‘표현’을 구별하는 기계학습을 거쳤다. 점수 차가 몇 점 이상 났을 때 ‘대파’라는 표현을 허락하는지 등 데이터 설정 범주에 따라 기사 표현이 달라진다. 경기 성남시 랩투아이 사무실에서 만난 오 기술이사는 “지금 퓨처스용 알고리즘은 (범주를) 엄청 조여 놓은 상태라 무리한 표현은 절대 못 한다”라며 웃었다.

기록지의 데이터만 입력하면 케이봇은 축적된 야구 기록 데이터를 바탕으로 강조해야 할 부분을 판단해 3초 안에 기사를 쓴다. 단, 데이터가 없으면 기사도 없다. 심판이 삼진 포즈를 취했다가 급히 볼을 인정한 뒤 풀카운트에서 볼넷이 됐다거나 주자가 홈 플레이트를 밟지 않고 지났다가 뒤늦게 터치하는 등 최근 화제가 된 장면의 과정들은 기록지에 남지 않으니 기사로 쓸 방법이 없다. 김 대표이사가 “로봇기사의 한계는 곧 데이터의 한계”라고 말하는 이유다.

“유려한 글 역시 여전히 인간의 몫”이라는 김 대표이사는 로봇 기사의 가치를 이렇게 평가했다.

“물론 사람의 글이 더 풍부한 표현이 가능하다. 기계로는 인터뷰도 불가능하다. 다만 로봇 기사의 가치는 빠르게, 대량으로 만들 수 있다는 점에 있다. 예전에 로봇 기사로 사회인 야구 경기를 서비스했는데 쓴 기사가 6만 건이 넘었다. 이렇게 기자가 모두 투입될 수는 없지만 기사 수요는 있는 분야에서 로봇 기사가 가치를 가질 수 있다고 본다.”

성남=임보미 기자 bom@donga.com
#야구기사#케이봇
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스