LG, 이미지 이해하고 설명하는 AI 키운다

  • 동아일보
  • 입력 2023년 2월 1일 03시 00분


코멘트

‘제로샷 이미지 캡셔닝’ 주제로
4월까지 글로벌 챌린지 개최

“토끼도 털은 있지만 고양이와는 다르게 귀가 길고 뒷다리가 발달했네요.”

토끼를 한 번도 본 적이 없는 인공지능(AI)이 토끼 여러 마리와 고양이 한 마리가 함께 있는 모습을 보고 사람처럼 묘사할 수 있다면 어떨까.

LG AI연구원은 전 세계 AI 연구자를 대상으로 ‘제로샷 이미지 캡셔닝’을 주제로 한 ‘LG 글로벌 AI 챌린지’를 2월부터 4월까지 개최한다고 31일 밝혔다. AI가 처음 본 이미지를 얼마나 정확하게 이해하고 설명하는지 평가하는 대회다.

제로샷 이미지 캡셔닝은 AI가 사물, 동물, 풍경 등이 포함된 이미지를 보고 어떤 내용을 담고 있는지 스스로 유추한 결과를 글로 풀어내는 기술이다. 서로 다른 물체나 배경을 구별해 어떤 점이 같고 다른지 파악할 수 있다.

LG AI연구원은 서울대 AI 대학원 및 이미지 플랫폼 기업 셔터스톡과 함께 경진 대회를 공동 진행한다. 셔터스톡은 AI 편향성과 선정성 등에 대한 윤리 검증을 마친 이미지-텍스트 데이터 묶음 2만6000개를 제공한다. 6월에는 컴퓨터 비전 분야 글로벌 최고 권위 학회인 ‘CVPR 2023’에서 관련 워크숍을 진행한다. 챌린지 최종 수상 팀이 워크숍에서 성과를 발표할 예정이다.

제로샷 이미지 캡셔닝 기술이 고도화되면 실생활에도 직접 도움이 될 것으로 기대된다. 예를 들어 매일 온라인에 오르내리는 방대한 분량의 이미지 데이터를 분석해 검색 편의성과 정확도를 높일 수 있다. 시각장애인들을 위한 접근성 솔루션 개발에도 기여할 것으로 전망된다.

LG 관계자는 “특히 최근 챗GPT(chat GPT)가 자연어 검색 분야에서 주목받듯 이미지 캡셔닝 기술은 이미지 검색 분야에서 혁신을 가져올 것”이라고 했다.

박현익 기자 beepark@donga.com
#lg#ai#제로샷 이미지 캡셔닝#lg 글로벌 ai 챌린지
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스