2023년 10월 Chat GPT에 DALL-E 3가 적용되었습니다. 프롬프트 작성을 통한 이미지 생성과 기존의 이미지를 업로드하는 두 가지 방식으로 이미지를 생성할 수 있습니다. 지금부터 Chat GPT 유료 버전에서 활용할 수 있는 DALL-E 3의 이미지 생성 방법에 관해 알아보겠습니다.
DALL-E 3의 사용 방법
앞서 설명한 것처럼 기존의 Text-2-Image 서비스와 유사하게 프롬프트를 직접 작성하여 이미지를 생성할 수 있습니다. 또한 적절한 프롬프트가 떠오르지 않는다면, 이미지를 업로드하여 이를 참조하여 이미지를 생성할 수도 있습니다.
여기서 다른 이미지 생성 서비스와 다른 DALL-E 3만의 강점이 있습니다. 바로 Chat GPT에게 프롬프트 작성을 요청할 수 있다는 점입니다. 또한 Chat GPT에 업로드한 이미지에서 프롬프트를 추출할 수도 있습니다. Chat GPT만이 가진 기능들을 활용하면, 다른 이미지 생성 서비스보다 더 쉽게 원하는 그림을 그릴 수 있습니다.
이미지 생성
현재 Chat GPT-4의 모든 기능은 통합되어 있습니다. 이제 모드를 선택할 필요 없이 하나의 프롬프트 창에서 모든 명령이 가능합니다. 우선 생성할 수 있는 이미지의 사이즈를 질문했습니다. 다음과 같이 총 3가지 사이즈를 생성합니다.
- 정사각형(Square): 1,024 x 1,024
- 와이드(Wide): 1,792 x 1,024
- 전신 초상화(Full Body Portrait): 1,024 x 1,792
그냥 단순하게 생각나는 이미지를 생성해 보겠습니다. 골든 리트리버가 등장하는 실사 풍의 와이드 이미지의 제작을 부탁했습니다. 일단 별도의 프롬프트 작성 규칙 없이 자연어로 이미지를 생성할 수 있다는 점이 꽤 마음에 들었습니다. 다만 좀 더 세밀한 작업은 영어로 지시하는 게 더 나은 것 같습니다.
![골든 리트리버 이미지](https://i0.wp.com/zephyrsong.net/wp-content/uploads/2023/11/이미지0.webp?resize=800%2C457&ssl=1)
다음으로 현재 작성하고 있는 포스팅의 주제를 담은 이미지를 생성해 달라고 요청했습니다. 다만 아직 한글 텍스트를 포함한 이미지는 제대로 생성하지 못합니다. ‘How to use Dall-E 3 in Chat GPT’라는 텍스트를 넣어 이미지 생성을 요청하였고, 다음과 같은 결과를 얻었습니다.
![포스팅의 주제를 담은 이미지](https://i0.wp.com/zephyrsong.net/wp-content/uploads/2023/11/이미지1-3.webp?resize=800%2C457&ssl=1)
이미지 업로드
이제 위에서 제작한 이미지를 업로드하여 프롬프트를 추출하겠습니다. 다음과 같은 프롬프트를 작성해 주었습니다. 물론 한글 프롬프트 추출도 가능하지만, 텍스트가 포함된 이미지는 현재 한글로 생성하기 어렵습니다.
“A wide-format tech-themed banner featuring the phrase ‘How to use DALL·E 3 in Chat GPT’ prominently displayed in the center. The design should be futuristic with a deep blue background that symbolizes advanced technology and innovation (후략).
프롬프트 작성
이제 추출한 프롬프트를 입력하여 다시 이미지를 생성해 보겠습니다. 다음과 같은 이미지가 생성되었지만, 텍스트가 정확하지 않습니다.
![추출한 프롬프트로 이미지 생성](https://i0.wp.com/zephyrsong.net/wp-content/uploads/2023/11/이미지2-2.webp?resize=800%2C457&ssl=1)
이미지 편집 및 수정
제작된 이미지의 텍스트와 색상을 수정하겠습니다. Correct the text to ‘How to use DALL-E 3 in Chat GPT’ and change the color to green. 다음과 같이 지시하였고 결과를 얻었습니다. 아직 틀린 철자가 있지만 색상 부분은 올바르게 수정해 주었습니다.
![이미지의 텍스트와 색상 수정](https://i0.wp.com/zephyrsong.net/wp-content/uploads/2023/11/이미지3-1.webp?resize=800%2C457&ssl=1)
정리
DALL-E 3는 전문적으로 AI 이미지를 생성하는 스테이블 디퓨전이나 미드저니에는 품질면에서 미치지 못한다고 생각됩니다. 다만 자연어를 이용하여 가볍게 이미지를 생성하는 용도로는 Chat GPT의 DALL-E 3는 매우 만족스럽습니다.