2023년 10월 Chat GPT에 DALL-E 3가 적용되었습니다. 프롬프트 작성을 통한 이미지 생성과 기존의 이미지를 업로드하는 두 가지 방식으로 이미지를 생성할 수 있습니다. 지금부터 Chat GPT 유료 버전에서 활용할 수 있는 DALL-E 3의 이미지 생성 방법에 관해 알아보겠습니다.
DALL-E 3의 사용 방법
앞서 설명한 것처럼 기존의 Text-2-Image 서비스와 유사하게 프롬프트를 직접 작성하여 이미지를 생성할 수 있습니다. 또한 적절한 프롬프트가 떠오르지 않는다면, 이미지를 업로드하여 이를 참조하여 이미지를 생성할 수도 있습니다.
여기서 다른 이미지 생성 서비스와 다른 DALL-E 3만의 강점이 있습니다. 바로 Chat GPT에게 프롬프트 작성을 요청할 수 있다는 점입니다. 또한 Chat GPT에 업로드한 이미지에서 프롬프트를 추출할 수도 있습니다. Chat GPT만이 가진 기능들을 활용하면, 다른 이미지 생성 서비스보다 더 쉽게 원하는 그림을 그릴 수 있습니다.
이미지 생성
현재 Chat GPT-4의 모든 기능은 통합되어 있습니다. 이제 모드를 선택할 필요 없이 하나의 프롬프트 창에서 모든 명령이 가능합니다. 우선 생성할 수 있는 이미지의 사이즈를 질문했습니다. 다음과 같이 총 3가지 사이즈를 생성합니다.
- 정사각형(Square): 1,024 x 1,024
- 와이드(Wide): 1,792 x 1,024
- 전신 초상화(Full Body Portrait): 1,024 x 1,792
그냥 단순하게 생각나는 이미지를 생성해 보겠습니다. 골든 리트리버가 등장하는 실사 풍의 와이드 이미지의 제작을 부탁했습니다. 일단 별도의 프롬프트 작성 규칙 없이 자연어로 이미지를 생성할 수 있다는 점이 꽤 마음에 들었습니다. 다만 좀 더 세밀한 작업은 영어로 지시하는 게 더 나은 것 같습니다.
다음으로 현재 작성하고 있는 포스팅의 주제를 담은 이미지를 생성해 달라고 요청했습니다. 다만 아직 한글 텍스트를 포함한 이미지는 제대로 생성하지 못합니다. ‘How to use Dall-E 3 in Chat GPT’라는 텍스트를 넣어 이미지 생성을 요청하였고, 다음과 같은 결과를 얻었습니다.
이미지 업로드
이제 위에서 제작한 이미지를 업로드하여 프롬프트를 추출하겠습니다. 다음과 같은 프롬프트를 작성해 주었습니다. 물론 한글 프롬프트 추출도 가능하지만, 텍스트가 포함된 이미지는 현재 한글로 생성하기 어렵습니다.
“A wide-format tech-themed banner featuring the phrase ‘How to use DALL·E 3 in Chat GPT’ prominently displayed in the center. The design should be futuristic with a deep blue background that symbolizes advanced technology and innovation (후략).
프롬프트 작성
이제 추출한 프롬프트를 입력하여 다시 이미지를 생성해 보겠습니다. 다음과 같은 이미지가 생성되었지만, 텍스트가 정확하지 않습니다.
이미지 편집 및 수정
제작된 이미지의 텍스트와 색상을 수정하겠습니다. Correct the text to ‘How to use DALL-E 3 in Chat GPT’ and change the color to green. 다음과 같이 지시하였고 결과를 얻었습니다. 아직 틀린 철자가 있지만 색상 부분은 올바르게 수정해 주었습니다.
정리
DALL-E 3는 전문적으로 AI 이미지를 생성하는 스테이블 디퓨전이나 미드저니에는 품질면에서 미치지 못한다고 생각됩니다. 다만 자연어를 이용하여 가볍게 이미지를 생성하는 용도로는 Chat GPT의 DALL-E 3는 매우 만족스럽습니다.