이전 포스팅에 이어 구글 제미나이와 관련하여 발표한 내용의 나머지 부분을 정리하겠습니다. 멀티 모달, 코딩, 수학 및 물리학 문제 풀이, 추론 능력 등을 담고 있습니다. 기타 크게 중요하지 않은 기능 소개는 생략하였습니다.
제미나이(Gemini)
오디오
대부분의 AI 모델은 오디오를 텍스트로 처리하고, 다시 오디오로 변환하는 과정을 거칩니다. 반면 제미나이는 원본 오디오를 그대로 인식하고 반응하기 때문에 뉘앙스가 손실되지 않습니다. 다음과 같이 오디오로 이미지에 관하여 질문할 수 있습니다. 다음 재료로 만들 수 있는 요리를 추천해 달라고 요청합니다.
코딩 능력
Python, C++, Java, GO와 같은 대부분의 프로그래밍 언어에서 정확하게 코드를 이해하고 생성할 수 있습니다. 빠르게 웹 & 앱의 프로토타입을 만들어 낼 수 있습니다. 제미나이의 코딩 능력은 많은 부분을 Alphacode 2의 뛰어난 능력에 의존하고 있습니다. 테스트 과정에서 85% 이상의 참가자들보다 훌륭한 코딩 능력을 선보였습니다.
수학과 물리학
복잡한 수학과 물리학 문제를 해결할 수 있습니다. 손으로 쓰인 내용도 확인합니다. 시험지를 촬영해서 업로드합니다. 답안지에 쓰인 풀이 과정의 옳고 그름을 판별합니다. 제미나이는 적용한 공식이 올바른지, 계산 과정이 적절한지 판단합니다. 사용자가 원한다면 유사한 맞춤형 문제를 새로 출제합니다. 사용자는 반복 학습을 통해 해당 주제에 숙달할 수 있습니다.
추론 능력
이미지를 보여주고 제미나이에게 추론하게 합니다. 주제는 영화입니다. 정답은 따로 넣지 않겠습니다.
이모지 키친
이모지 키친은 2개의 이모지를 조합하여 새로운 이모지를 생성하는 도구입니다. 이렇게 합성된 이미지를 토대로 제미나이에게 원본 이모지가 무엇인지 질문합니다. 그리고 합성된 이미지의 작명을 요청합니다. 어떻게 원본 이미지를 추론했는지, 어떻게 합성된 이미지의 이름을 생성했는지 구체적인 설명을 들을 수 있습니다.
주변 환경에 대한 이해
시연 영상에서 창문이 있는 방의 이미지가 등장합니다. 창문이 동서남북 어느 방향에 있는지, 사용자가 질문합니다. 집 안에 있는 식물의 이미지를 업로드하고 질문합니다. 식물을 어디에 배치해야 할까요? 제미나이는 해당 식물은 햇빛이 거의 필요 없다고 답변합니다. 창문이 없는 거실의 이미지를 첨부하고 식물을 놓을 최적의 위치를 다시 질문합니다. 빛이 거의 들지 않는 거실에 놓을 것을 제미나이가 추천합니다. 모든 대화는 중국어로 이루어집니다.
정리
지금까지 구글 제미나이의 유튜브 영상과 홈페이지 정보를 토대로 주요 내용을 정리하였습니다. GPT-4 대비 우월한 성능과 기능을 소개하고 있으며, 내년 1월 출시를 예상합니다. 현재까지 출시된 다른 AI 모델 대비 우월한지는 그때 가서 판단해도 늦지 않을 것 같습니다. 제미나이 관련 소식이 있으면 다른 포스팅으로 전달하겠습니다. 제미나이의 추론 능력을 판단하는 두 가지 문제의 정답은 문라이즈 킹덤과 포레스트 검프입니다.