오픈AI, 텍스트·이미지 통합한 새 AI 이미지 생성 모델 공개 > IT/과학기사 | it/science

본문 바로가기
사이트 내 전체검색

IT/과학기사 | it/science

오픈AI, 텍스트·이미지 통합한 새 AI 이미지 생성 모델 공개

페이지 정보

profile_image
작성자 수집기
댓글 0건 조회 24회 작성일 25-03-26 08:02

본문

오픈AI 새 이미지 모델이 생성한 뉴턴의 프리즘 실험/오픈AI 제공

오픈AI 새 이미지 모델이 생성한 뉴턴의 프리즘 실험/오픈AI 제공

챗GPT 개발사 오픈AI가 기존 이미지 생성 AI보다 더 정교하고 직관적인 새로운 이미지 생성 모델을 25일현지시각 공개했다. 이 모델은 텍스트와 이미지를 통합한 첫 번째 모델로, 복잡한 요청도 이해하고 이용자의 의도를 반영해 이미지를 생성하는 것이 특징이다.

오픈AI는 이번에 출시한 ‘챗GPT-4o 이미지 생성’ChatGPT-4o Image Generation 모델이 텍스트 기반 언어 지능을 가진 GPT-4와 이미지 생성 기능을 결합한 모델이라고 밝혔다. 오픈AI는 이를 통해 텍스트의 의미를 깊이 이해하면서도 시각적으로 정교한 이미지를 만들어내는 AI를 구현했다고 설명했다.

기존 ‘달리’DALL-E 모델은 사용자가 원하는 이미지를 만들기 위해 프롬프트를 세밀하게 입력해야 했지만, 이번 모델은 간단한 지시만으로도 이용자의 의도를 파악해 복잡한 이미지도 쉽게 생성할 수 있다. 삼각형 바퀴를 가진 자전거처럼 기존 AI가 처리하기 어려웠던 이미지도 무리 없이 만들어낸다.


특히 텍스트 삽입 기능이 크게 개선돼, 다양한 고래의 종류를 포함한 포스터나 대사가 포함된 카툰 등도 정확히 표현할 수 있다. 기존 모델은 글씨가 깨지거나 객체와 텍스트 간의 관계를 제대로 이해하지 못하는 경우가 많았지만, 새 모델은 이 같은 한계를 극복했다는 평가다.

자연법칙을 설명하는 이미지나 수학 공식, 메뉴판, 비즈니스 로고 등도 요청만으로 쉽게 생성할 수 있으며, 투명 배경도 지원해 스티커 제작 등 실용적인 활용도 가능하다.

오픈AI는 이 모델이 기존 ‘달리’의 단순한 업그레이드가 아니라, 전혀 다른 기술 기반에서 개발된 만큼 기능과 성능 모두 대폭 개선됐다고 강조했다. 새 모델은 한국어를 포함한 다양한 언어를 지원하며, 챗GPT 프로 유료 이용자는 물론 무료 이용자도 사용할 수 있다.

[ 조선비즈 바로가기]

- Copyrights ⓒ 조선비즈 amp; ChosunBiz.com, 무단 전재 및 재배포 금지 -
이경탁 기자 kt87@chosunbiz.com

댓글목록

등록된 댓글이 없습니다.

회원로그인

회원가입

사이트 정보

회사명 : 원미디어 / 대표 : 대표자명
주소 : OO도 OO시 OO구 OO동 123-45
사업자 등록번호 : 123-45-67890
전화 : 02-123-4567 팩스 : 02-123-4568
통신판매업신고번호 : 제 OO구 - 123호
개인정보관리책임자 : 정보책임자명

접속자집계

오늘
503
어제
1,460
최대
3,806
전체
943,897
Copyright © 소유하신 도메인. All rights reserved.