전체메뉴
텍스트는 죽지 않는다[DBR]
더보기

텍스트는 죽지 않는다[DBR]

유재연 서울대 융합과학기술대학원 연구원입력 2019-10-21 03:00수정 2019-10-21 03:00
뉴스듣기프린트
트랜드뉴스 보기

글은 계속 생성된다. 창작의 욕구와 함께 나타나기도 하고, 배설의 욕구와 함께 드러나기도 한다. 사람들은 레스토랑을 예약할 때 소셜미디어에 올라온 음식 사진을 보고 난 뒤에도 굳이 문자로 된 후기까지 찾아서 읽는다. 이미지와 동영상이 대세인 시대라고는 하지만 사람들은 여전히 문자를 놓지 않는다. 마케팅 연구자들 역시 마찬가지다.

마케팅에 널리 쓰이는 ‘워드클라우드(word cloud)’라는 분석 기법이 있다. 워드클라우드란 소셜미디어나 뉴스 속 문장들을 수십만 건 모아다가 그중 어떤 단어가 화제의 중심인지를 찾아 보여주거나, 특정한 이슈에 대해 어떤 단어가 가장 많이 연관돼 등장하는지를 구름 모양으로 그려서 보여주는 기법이다.

롯데제과는 2018년 여름 과자 고깔콘의 ‘버팔로윙’맛 신제품을 출시했다. 두 달 만에 100만 봉지가 팔렸다고 한다. 필자 또한 너무나 자연스럽게 이 과자를 맥주 안주로 집어든 경험이 있다. 왜 잘 팔렸을까? 당시 ‘혼술족’(집이나 가게에서 혼자 술 마시는 사람들)이 늘어남에 따라 IBM의 데이터분석팀과 롯데제과가 혼술족에 대한 워드클라우드 분석을 했다고 한다. 그때 찾은 연관 키워드가 ‘버팔로윙’이었다. 롯데제과는 과자 포장지에도 이런 분석 결과를 적어놓았다.


텍스트 분석에는 어려움도 있다. 워드클라우드 같은 분석 기법은 단어의 출현 빈도를 중심으로 조사하기 때문에, 출현 빈도는 낮지만 소소하게 중요한 키워드들을 놓칠 수 있다. 또 큰 의미 없는 단어(각종 조사와 주어, ‘ㅋㅋ’ 등)를 처리하느라 분석자들이 시간을 보내는 일도 많다.

주요기사

한국 시장에서 특히 주의해야 할 점도 있다. 유쾌하고 해학 넘치는 민족성을 잊지 말아야 한다. 소비자가 올리는 온라인 후기가 꼭 진실이 아닌 경우도 많다. 예를 들어 평가가 좋지 않을 법한 영화에 ‘꼭 봐야 할 영화’란 식으로 반어적인 후기를 올리는 식이다.

숙박 중개 사이트인 에어비앤비에서도 재미있는 일들이 벌어진다. 외국에서 에어비앤비 숙박을 한 사람이 한국어로 후기를 올리면 자동으로 번역돼 외국인 집주인이 읽을 수 있다. 그래서 한국인 숙박객들은 종종 의도적인 오타를 낸다. 좋은 말은 정확하게 쓰지만 불만사항은 엉터리로 적는 것이다. 자동번역기가 놓친 오타에는 한국인들만이 알아볼 수 있는 치명적인 메시지들이 숨어 있다. “쥐가 나와서 잠을 제대로 잘 수 없었다”는 말을 일부러 “쭈 l 가 나와서 자미를 재데로 자르수 옵솟다”로 적는 식이다.

문자 데이터를 분석할 때는 수만 가지 종류의 텍스트 가운데 어떤 것을 재료로 선택하는지도 아주 중요하다. 일례로, 국내 한 금융업체가 주식시장의 우량주를 골라내는 데 언론사 뉴스 기사를 활용해 봤다. 하지만 주식시장에 올라있는 수많은 종목 중 언론매체가 다루는 기업의 범위는 매우 제한적이라 이 목적으로 사용하기엔 그리 적합하지 않았다고 한다.

하지만 틀이 명확한, 공식적인 텍스트로 옮겨 오면 이야기가 달라진다. 올해 8월 한국에서 인공지능과 인간 변호사 간에 벌어진 법률 대결이 좋은 예다. 샘플로 주어진 근로계약서를 분석하고 누락된 조항이나 보완사항을 쓰고 종합적인 의견을 제시하는 평가였다. 여기서 1∼3등을 모두 AI가 차지했다. 법전과 같이 형식이 뚜렷하고 조항 간 연계가 명백하게 드러나는 경우 데이터 분석으로 알맞은 결과물을 내기에 좋다.

비슷한 경우로 미국 매사추세츠공대(MIT)에서는 셰익스피어의 작품을 분석해 복수와 오해, 운명 등을 변수로 하는 등장인물 간 연계 구조를 그려냈다. 이렇게 원인과 결과가 명시적으로 드러나면 키워드 간 관계를 데이터로 설명하기에 적합해진다.

인류는 지속적으로 문자 데이터를 생성할 것이다. 기업은 이를 그냥 흘려보내서는 안 된다. 수집해서 마음껏 써먹어야 한다. 최근 기술의 발전 정도를 보면 기계와 인간이 대화할 수 있는 수준으로 나아가고 있다. 문장과 맥락, 글의 연속성을 이해하는 것과 별개로 문장을 새롭게 만들어내는 기술도 나날이 진보하고 있다.

텍스트는 죽지 않는다. 멈춰 있지도 않다. 생동하는 텍스트를 우리는 계속 쫓아가야 한다. 그래야 그것을 쓰는 사람들, 소비자와 대중을 알 수 있다.

이 원고는 DBR(동아비즈니스리뷰) 282호에 실린 글 ‘동영상이 대세? 텍스트는 죽지 않는다’의 내용을 요약한 것입니다.

유재연 서울대 융합과학기술대학원 연구원 you.jae@snu.ac.kr
#글#워드클라우드#문장

당신이 좋아할 만한 콘텐츠


기사 의견

   

주요뉴스

1/3이전다음