[생성형 AI(Generative AI), 인간의 창작 영역을 넘본다! (56)] 구글이 선언한 새로운 AI 시대, ‘제미나이 시대(Gemini era)’ 열리나? (下)
최봉 산업경제 전문기자 입력 : 2024.06.04 00:30 ㅣ 수정 : 2024.06.04 00:30
[기사요약] AI 비디오 생성기 ‘Veo’, 크리에이터에게 OpenAI의 Sora 스타일 비디오 생성 제공 제미나이에 맞춤형 챗봇 생성 기능 제공하는 ‘Gems’라는 크리에이터 출시 ‘제미나이 시대’의 본격 개막.. 자신감은 “구글의 방대한 소비자 분포”와 구글 제품 통해 유입되는 데이터 하지만 전문가도 헷갈리는 라인업, 그리고 ‘AI Overviews’는 설익은 검색 결과 내놓아.. 검색 엔진의 절대 강자 구글, 검색 오류 반복되면 시장에서의 신뢰와 명성에 치명적 위험
사람들은 시, 소설, 보고서 등 글쓰기, 그림 그리기, 알고리즘 코딩 등 창작의 세계가 그동안 인간에게만 허락된 별도의 영역이라 알고 있었다. 그런데 AI(인공지능)의 발전과 함께 이제는 진화한 AI가 스스로 창작의 영역을 넘보는 시대가 되었다. 생성형 AI(Generative AI)의 등장은 인간에게 어떤 의미가 있으며 우리의 미래에 어떤 영향을 미칠지 가늠하기 쉽지 않지만, 생성형 AI는 이미 여러 분야에서 현실로 나타나 적용되고 있다. 우리에게 성큼 다가온 생성형 AI의 시장현황, 다양한 이슈와 관심 사항 등을 살펴보기로 하자. <편집자 주>
[뉴스투데이=최봉 산업경제 전문기자] 지난 편에서 ‘제미나이 시대(Gemini era)’의 본격 개막을 알린 다양한 라인업 중 ‘제미나이 라이브(Gemini Live)’, ‘프로젝트 아스트라(Project Astra)’, ‘Ask Photos’, ‘AI Overviews’ 등을 소개했다.
몇 가지 ‘선수들’을 좀더 살펴보자.
• AI 비디오 생성기 ‘Veo’, 맞춤형 크리에이터 ‘Gems’ 등도 선보여..
구글은 이번 ‘개발자 컨퍼런스 2024(Google I/O 2024)’ 행사에서 ‘가장 유능한’ AI 비디오 생성기라고 부르는 ‘Veo’ 프로그램을 발표했다. Veo는 크리에이터에게 OpenAI의 Sora 스타일의 비디오 생성을 제공한다.
이 ‘선수’는 텍스트, 이미지 및 비디오 기반 프롬프트를 활용해서 1080p 동영상을 출력할 수 있는 새로운 생성형 AI 모델이다. (※1080p는 1920×1080픽셀의 해상도, 순차주사(progressive scan) 방식)
동영상은 항공 촬영이나 타임랩스(Time Lapse) 등 다양한 스타일로 제작할 수 있으며 더 많은 프롬프트를 통해 조정할 수 있다.
이미 일부 크리에이터에게 유튜브 동영상에 사용할 수 있도록 Veo를 제공하고 있으며, 할리우드에도 영화에 사용할 수 있도록 제안했다고 한다.
구글은 제미나이(Gemini)에 맞춤형 챗봇 생성 기능을 제공하는 ‘Gems’라는 크리에이터를 출시한다.
OpenAI의 GPT와 마찬가지로 Gems를 사용하면 사용자는 제미나이에게 응답 방식과 전문 분야를 ‘사용자 지정(customize)’ 하도록 지시를 내릴 수 있다.
새로운 제미나이 모바일 앱은 카메라를 사용하여 제미나이 라이브(AI와의 음성 대화)를 제공하고, 사용자가 만든 지침 집합인 Gems 기능을 통해 구글 드라이브에 액세스하여 자주 하는 복잡한 작업을 수행한다.
이외에도 이날 행사에서는 ‘Imagen’, ‘Lyria’, ‘Music AI Sandbox’, ‘Google Workspace’ 등 “현란한 라인업 소개”가 있었다.
• 구글의 자신감, ‘방대한’ 소비자 분포와 데이터 확보
구글은 검색 엔진에 Generative AI ‘제미나이(Gemini)’를 전방위적으로 탑재하면서 ‘제미나이 시대(Gemini era)’의 본격 개막을 알렸다. 그렇다면 구글의 자신감은 어디서 온 것이며 노림수는 무엇일까?
구글은 제미나이 모델이 최상위권에 속할 정도로 ‘경쟁자’를 따라잡았을 뿐만 아니라 OpenAI가 쉽게 넘을 수 없는 ‘해자(垓字)’의 강도에 대한 자신감을 다시 한번 확인했다고 여긴다.
바로 수십억 명의 사용자를 확보하고 있는 깊고 광범위한 제품군에 걸친 “구글의 방대한 소비자 분포”다.
엔비디아의 한 AI 책임자는 “구글의 가장 강력한 해자는 분포다. 제미나이가 세계에서 가장 많이 사용되는 모델이 되기 위해 최고의 모델일 필요는 없다.”라고 X 포스팅한 바 있다(yahoo finance, 2024.5.16.).
또한, 웹 검색, 유튜브 동영상, 구글 맵 요청, 고객 리뷰 등 매일 구글 제품을 통해 유입되는 페타바이트 규모의 방대한 데이터는 구글 자신감의 비결이라고 할 수 있다.
사용자는 모델을 학습시키는 것 외에도 구글의 AI 기능에 구글 앱에 저장된 데이터를 검색하도록 요청하여 점점 더 다양해지는 개인화된 작업을 수행할 수 있으며, 기본적으로 구글을 사용하여 “나만의 구글”을 만들 수 있다.
• 과유불급(過猶不及), 그리고 검색 오류 반복
하지만 이번 행사 이후 구글에 대해 긍정적인 얘기만 나오고 있는 것은 아니다. 이 시리즈를 지켜본 독자분들도 느꼈을 것이다.
‘과유불급(過猶不及)’이라 했던가. “뭐가 이리도 많고 복잡하지? 헷갈리네.”
13년 동안 활동한 기술 저널리스트가 CNET에 기고한 글(CNET, 2024.5.15)에 따르면, “이번 구글의 2024 I/O 행사를 마친 후처럼 정보에 압도당했다는 느낌을 받은 적이 없다. Gemini, Gemma, Gem, Veo, Astra 및 Learn LM에 이르기까지 구글은 수많은 제품을 내놓았는데, 머리가 어지러워지는 사람은 나뿐만이 아닐 것이다.”
그리고 검색 엔진의 절대 강자 구글은 이번에도 또 설익은 검색 결과를 내놓는 실수를 범했다.
구글은 행사에서 소개했던 새로운 검색 플랫폼 ‘AI Overviews’의 기능으로 인해 발생한 여러 해프닝의 여파를 막기 위해 분주한 시간을 보내야 했다.
지난 편에서 소개했듯이 AI Overviews는 검색어에 대한 생성형 AI 기반 응답을 제공하도록 되어 있다.
그런데 이 ‘선수’가 사용자들에게 피자에서 치즈가 미끄러지는 것을 방지하기 위해 무독성 접착제를 사용할 수 있다고 했고, 버락 오바마가 최초의 무슬림 대통령이라고 주장하기도 했다.
• 절대 강자 구글의 검색 오류 반복, 자사 생성형 AI의 신뢰 하락 경계해야..
2023년 2월에 Bing 검색 엔진과 챗봇의 Generative AI 버전을 출시하기 위해 마이크로소프트와 OpenAI가 협력한 이후, 구글은 뒤처진 것처럼 보이는 ‘자신의 모습’을 극복하기 위해 경쟁해 왔다.
하지만 경쟁에서 이긴다는 것이 오류나 유해한 정보를 생성하는 제품을 출시하는 것을 의미하지는 않는다.
오류가 반복된다면, 구글은 사용자에게 자사의 AI를 신뢰할 수 없고 궁극적으로 사용할 가치가 없다는 인상을 줄 위험이 있음을 경계해야 한다.