구글 ‘나노바나나’ 돌풍에 대응 나서
이미지 특정 부분만 정밀편집 가능
인포그래픽 등 문자표현 기능 강화
출시 첫날 블라인드 평가 1위 올라
하얀 티셔츠가 빨간색으로… 오픈AI의 ‘GPT 이미지 1.5’를 활용하면 왼쪽 사진을 오른쪽 사진과 같이 정밀하게 편집하는 것이 가능하다. 스케이트보드를 탄 남성의 티셔츠는 빨간색으로, 모자는 노란색으로 바꾸고 배경에 있는 표지판의 제한속도 표시는 15로, 트럭을 소방차로 변경했다. 오픈AI 제공
올해 초 지브리풍 이미지 열풍을 일으켰던 오픈AI가 더 발전된 이미지 생성 도구 ‘GPT 이미지 1.5’를 내놨다. 구글 ‘제미나이3’가 오픈AI의 챗GPT보다 우수하다는 평가를 받은 데 이어 이미지 생성 도구 ‘나노바나나 프로’도 호평 속 돌풍을 일으키자 서둘러 새 모델을 내놓으며 주도권 탈환에 나선 모습이다.
16일(현지 시간) 오픈AI는 GPT 이미지 1.5를 출시한다고 밝혔다. 오픈AI는 “이미지의 디테일은 그대로 유지하면서 정밀한 편집을 할 수 있게 됐고 이미지 생성 속도는 최대 4배 더 빨라졌다”며 GPT 이미지 1.5를 소개했다.
특히 단순한 이미지 생성 모델을 넘어 ‘이미지 편집·제작도구’로 업그레이드됐다고 강조했다. 실제로 오픈AI에 따르면 GPT 이미지 1.5는 명령어를 이용해 이미지의 특정 부분만 정밀하게 편집할 수 있다. 예를 들어 여러 명의 인물이 등장하는 이미지를 제시하고 “맨 왼쪽 남성만 애니메이션 스타일로 바꾸고 나머지 인물과 배경은 그대로 유지해 줘”라고 명령하면 맨 왼쪽 남성의 모습만 새로 생성해 낸다. “사진 속 스케이트보드를 탄 남성의 티셔츠 색깔을 빨간색으로, 모자는 노란색으로 바꿔 줘”라고 명령하면 나머지 요소를 그대로 두고 모자와 옷 색깔만 바꾸는 것도 가능하다.
사진 속 인물의 모습을 예술 작품과 합성하는 등 창의성이 필요한 이미지 생성 능력도 강화됐다. 오픈AI는 예시로 네덜란드 화가 요하네스 페르메이르의 작품 ‘진주 귀걸이를 한 소녀’에 샘 올트먼 오픈AI 최고경영자(CEO)의 모습을 합성한 이미지, 올트먼 CEO의 사진으로 만든 음료 포스터 등을 제시했다.
경쟁 상대 나노바나나 프로의 강점으로 꼽히는 문자 표현 기능도 강화됐다. 이로 인해 단순 이미지를 넘어 인포그래픽 등 정보를 담은 이미지를 생성하는 데 적합하다는 게 오픈AI의 설명이다. 또한 기존 이미지에 필름 카메라로 찍은 듯한 효과를 추가하거나, 빛 반사와 같이 인공지능(AI)이 이해하고 표현하기 어려운 효과도 문제없이 표현할 수 있다.
올트먼 CEO는 11월 경쟁사 구글이 제미나이3 프로와 나노바나나 프로를 잇따라 내놓자 사내에 ‘코드 레드(중대 경보)’를 발령하고 새 AI 모델과 이미지 생성 도구 개선에 집중하라고 직원들에게 주문한 바 있다. 미국 정보기술(IT) 전문 매체 테크크런치는 “오픈AI가 이미지 1.5를 1월 초에 공개할 계획이었으나 일정을 앞당겼다”고 전했다.
일단 GPT 이미지 1.5는 출시 당일 수많은 이용자가 블라인드 테스트를 통해 선호 모델을 선택하는 ‘LM아레나 리더보드’ 평가에서 기존 1위였던 구글의 나노바나나 프로를 밀어내고 1위에 올랐다. AI 이미지 도구 경쟁이 치열해지는 가운데 오픈AI는 “(GPT 이미지 1.5가) 이전 버전보다 개선됐지만 여전히 결과가 완벽하다고 보긴 어렵다”며 “향후 개선을 통한 발전의 여지가 크다”고 밝혔다.
댓글 0