미드저니의 V6 알파 버전이 출시되었습니다. 정식 버전이 아니기 때문에 이후에도 기능 추가, 업데이트, 변경이 있을 수 있습니다. 이번 포스팅에서는 미드저니 V6가 기존 버전인 V5.2와 어떤 차이점이 있고 개선점이 있는지 살펴보겠습니다.
V6 업데이트의 주요 내용
V6 업데이트의 주요 내용은 디스코드의 미드저니 방을 선택하고 Announcements를 클릭하면 확인할 수 있습니다. 12. 21일 올라온 업데이트의 주요 내용을 요약하겠습니다.
- 더 정확한 프롬프트 반영 능력 (더 긴 프롬프트도 정확하게 이미지 생성에 반영)
- 이미지 생성의 일관성 향상, 이미지 생성 모델의 지식 향상
- 텍스트 생성 능력의 개선: 기존 버전에서는 이미지에 텍스트를 반영하는 능력이 좋지 않았음
- 업스케일러 개선
- 프롬프트 작성 방식이 기존과 크게 달라집니다. award winning, photorealistic, 4k, 8k 같은 표현은 피하세요
- 금지되는 이미지에 관한 규제는 기존보다 더 엄격해질 수 있습니다. 이미지 생성에 조심하세요.
요약하자면, 단어 나열 방식은 피하고 가능한 완전한 문장으로 프롬프트를 작성합니다. 업스케일링 기능이 개선되었습니다. 마지막으로 텍스트 생성 능력이 개선되었습니다.
이미지 생성 및 비교(V6 vs. V5.2)
이미지 비교(1)
사실적인 이미지의 비교를 위해 사진 이미지를 생성해 보겠습니다. 프롬프트는 다음과 같습니다.
realistic photo of a beautiful woman, close-up shot ‐‐ar 2:3
이제 모델을 V6로 변경하여 이미지를 생성하겠습니다. 프롬프트 창에 /settings를 누르고 모델을 V6로 변경합니다. 사실적인 이미지의 비교를 위해, 미학적인 표현을 더하는 Style은 Raw mode로 변경하겠습니다. stylize 값도 낮추는 것을 추천합니다. (디폴트 값 100, 범위 0~1,000)
생성한 이미지는 다음과 같습니다. 피부 주름, 음영, 주근깨, 체모 표현 등, 모든 면에서 더 섬세하고 세밀한 이미지가 생성됩니다. 반면 V5.2에서 생성한 이미지는 후보정이 많이 들어간 느낌입니다.
이미지 비교(2)
이미지를 한 번 더 생성하겠습니다. 프롬프트는 다음과 같습니다.
vintage oil painting, realistic image of a beautiful woman ‐‐ar 2:3
동일한 프롬프트로 V6에서 이미지를 생성하겠습니다. 이전 모델보다 이미지 생성에 더 긴 시간이 걸리는 것 같습니다. 구체적인 비교는 힘들지만 Oil painting(유화)이라는 프롬프트에 훨씬 더 잘 부합되는 이미지가 생성되었습니다. 붓터치 및 캔버스 질감도 V6 버전 이미지가 더 유화에 가깝게 묘사된 것 같습니다.
이미지의 업스케일링
최초에 생성된 4장의 이미지 중에서 마음에 드는 이미지를 업스케일링 후에, 추가 업스케일링 옵션이 생겼습니다. Upscale(Subtle)과 Upscale(Creative), 이렇게 2가지 항목이 있습니다.
각각의 항목을 클릭하여 이미지를 생성해 보겠습니다. 꽤 시간이 오래 소요됩니다. Subtle 옵션은 원본과 큰 차이가 없는 이미지가 생성되었으며, Creative 옵션은 그림의 음영, 캔버스 질감, 붓 터치, 등장하는 모델이 여러모로 변경되었습니다.
이미지에 텍스트 삽입
V6의 텍스트 생성 능력을 한번 확인해 보겠습니다. V5.2의 텍스트 생성 능력은 좋지 않기 때문에 따로 확인하지 않겠습니다. 프롬프트는 다음과 같습니다.
A superhero standing in a city center, wearing a red and black uniform and a top with the logo “Punch man” on it, front view
후기
다른 부분은 상관이 없으나, 전반적으로 이미지 생성 시간이 너무 오래 걸리는 것 같습니다. 이미지 생성 시간을 기준으로 미드저니의 요금이 책정되고 있습니다. 저렴한 요금제 기준으로는 V6 모델을 사용하기에는 조금 부담이 될 것 같습니다. 정식 버전에서는 이 부분이 개선되길 바랍니다.
텍스트 삽입의 경우 심볼이 되는 알파벳 1~2글자 정도는 쉽게 구현이 되지만, 단어를 생성하려면 시행착오가 필요합니다. 그렇지만 그럭저럭 텍스트 구현은 잘 되는 것 같습니다. 큰따옴표로 텍스트를 묶어서 사용합니다. (예. “Punch Man”)