챗GPT 이미지 1.5로 생성한 이미지. 오픈AI 제공
광고 로드중
올해 초 지브리풍 이미지 열풍을 일으켰던 오픈AI가 더 발전된 이미지 생성 도구 ‘GPT 이미지 1.5’를 내놨다. 구글 ‘제미나이3’가 오픈AI의 챗GPT보다 우수하다는 평가를 받은 데 이어 이미지 생성 도구 ‘나노바나나 프로’도 호평 속 돌풍을 일으키자 서둘러 새 모델을 내놓으며 주도권 탈환에 나선 모습이다.
16일(현지시간) 오픈AI는 GPT 이미지 1.5를 출시한다고 밝혔다. 오픈AI는 “이미지의 디테일은 그대로 유지하면서 정밀한 편집을 할 수 있게 됐고 이미지 생성 속도는 최대 4배 더 빨라졌다”며 GPT 이미지 1.5를 소개했다.
특히 단순한 이미지 생성 모델을 넘어 ‘이미지 편집·제작도구’로 업그레이드됐다고 강조했다. 실제로 오픈AI에 따르면 GPT 이미지 1.5는 명령어를 이용해 이미지의 특정 부분만 정밀하게 편집할 수 있다. 예를 들어 여러 명의 인물이 등장하는 이미지를 제시하고 “맨 왼쪽 남성만 애니메이션 스타일로 바꾸고 나머지 인물과 배경은 그대로 유지해 줘”라고 명령하면 맨 왼쪽 남성의 모습만 새로 생성해 낸다. “사진 속 스케이트 보드를 탄 남성의 티셔츠 색깔을 빨간색으로, 모자는 노란색으로 바꿔줘”라고 명령하면 나머지 요소를 그대로 두고 모자와 옷 색깔만 바꾸는 것도 가능하다.
광고 로드중
챗GPT 이미지 1.5로 생성한 이미지. 오픈AI 제공
경쟁 상대 나노바나나 프로의 강점으로 꼽히는 문자 표현 기능도 강화됐다. 이로 인해 단순 이미지를 넘어 인포그래픽 등 정보를 담은 이미지를 생성하는 데 적합하다는 게 오픈AI의 설명이다. 또한 기존 이미지에 필름 카메라로 찍은 듯한 효과를 추가하거나, 빛 반사와 같이 인공지능(AI)가 이해하고 표현하기 어려운 효과도 문제없이 표현할 수 있다.
챗GPT 이미지 1.5로 생성한 이미지. 오픈AI 제공
일단 GPT 이미지 1.5는 출시 당일 수많은 이용자가 블라인드 테스트를 통해 선호 모델을 선택하는 ‘LM아레나 리더보드’ 평가에서 기존 1위였던 구글의 나노바나나 프로를 밀어내고 1위에 올랐다. AI 이미지 도구 경쟁이 치열해지는 가운데 오픈AI는 “(GPT 이미지 1.5가)이전 버전보다 개선됐지만 여전히 결과가 완벽하다고 보긴 어렵다”며 “향후 개선을 통한 발전의 여지가 크다”고 밝혔다.
박종민 기자 blick@donga.com