스토리
내일은쌤 스토리는 쌤들이 직접 올려주시는 컨텐츠로 만들어지는 공간입니다.
글쓰기내일은쌤 스토리는 쌤들이 직접 올려주시는 컨텐츠로 만들어지는 공간입니다.
글쓰기에디터
2023년 12월 21일
창의 STEM
기타
기타
연말에 새로운 인공지능이 발표되는 것이 연례 행사로 굳어지려는 걸까요?
작년 이맘때 OpenAI의 ChatGPT 가 발표되면서 인공지능 분야에 지각변동을 일으켰었는데요, 올해는 구글이 Gemini(제미나이)를 발표했습니다.
구글은 올해 3월 바드(Bard)라는 AI 모델을 발표했지만, 이미 ChatGPT를 경험한 이들에게 그다지 큰 인상을 남기지는 못했습니다. 그런 구글로서는 이번 제미나이 발표에 더욱 심혈을 기울였을텐데요.
제미나이의 주요 기능
제미나이는 대규모 언어 모델(LMM)로서, 텍스트 뿐만 아니라 이미지를 포함한 다양한 형태의 정보를 인지하고 추론할 수 있습니다. ChatGPT가 텍스트에 기반한 서비스를 보여주고 있는 것에 비해 멀티모달(Multimodality) 기능으로 우위를 점하려고 하는 것 같습니다.
제미나이의 주요 기능은 다음과 같습니다.
- 텍스트와 이미지를 이해하고 추론
- 텍스트와 이미지를 유기적으로 연결
- 다양한 언어 번역
- 창의적인 콘텐츠 생성
제미나이 시연 영상
제미나이의 주요 기능을 어떻게 활용할 수 있는지 구글이 시연 영상을 함께 발표했는데요,
이 영상이 상당히 화제입니다.
몇 몇 눈에 띄는 장면을 소개해드릴게요.
영상을 보면 제미나이가 멀티모달답에 사람과 직접 음성으로 소통을 하고 있습니다.
사람이 그린 그림을 보면서 그림(이미지)에 대해 추론하는 능력을 보여줍니다.
- 물속에서 헤엄치고 있는 새
- 긴 목과 긴 부리
→ 오리입니다.
물 속에서 헤엄치고 있는 긴 목과 부리를 가진 새로부터 해당 그림이 오리일 것이라고 추론해냈습니다.
이번에는 이미지를 해석하고 논리적 추론 결과까지 제시하는 능력을 보여줍니다.
- 오리가 왼쪽으로 가면 친구인 오리를 만난다.
- 오른쪽으로 가면 천적인 곰을 만난다.
→ 천적보다는 친구를 만나는게 좋으니 오리는 왼쪽으로 가야한다.
오, 꽤나 논리적인 인공지능입니다.
시연 영상이 발표된 후 제미나이의 성능에 대해 환호하는 목소리가 컸는데요, 이 영상이 화제가 된 데에는 다른 이유도 있습니다. 바로 영상이 조작되었다는 주장이 제기된 것인데요. 구글에서도 결국 영상이 실시간 반응이 아니며, 원활한 진행을 위한 편집이 있었음을 인정했습니다. 음성 역시 이후에 녹음된 것이라고 하니 어쩐지 배신감이 느껴지기도 하네요. 😅
인공지능 개발 경쟁에 대한 압박이 컸던 것인지 구글이 이런 행보를 보인 것에 대해 아쉽다는 반응이 많습니다. 하지만 멀티모달로 발전하고 있는 인공지능에 대한 앞으로의 기대를 심어주기에는 부족하지 않아 보입니다.
제미나이 활용하기
제미나이는 울트라, 프로, 나노의 세가지 버전으로 개발되어 각각의 용도에 따라 적용될 예정인데요,
현재는 구글 바드에 제미나이 프로가 통합되어 사용해 볼 수 있습니다.
아래 페이지에서 구글 인공지능이 어디까지 발전했는지 직접 경험해보세요!
구글 '바드' 바로가기 : https://bard.google.com/chat