[생성형 AI(Generative AI), 인간의 창작 영역을 넘본다! (55)] 구글이 선언한 새로운 AI 시대, ‘제미나이 시대(Gemini era)’ 열리나? (中)
최봉 산업경제 전문기자 입력 : 2024.05.28 00:30 ㅣ 수정 : 2024.05.28 00:30
[기사요약] 검색 엔진에 ‘제미나이’ 본격 탑재, 제미나이 사용해 전체 구글 검색 결과 페이지 구성할 계획 ‘제미나이 라이브(Gemini Live)’, 스마트폰에서 제미나이와 심층적인 음성 채팅 가능 ‘프로젝트 아스트라(Project Astra)’, 멀티모달 기능으로 모든 것 할 수 있는 가상 비서 ‘Ask Photos’, 자연어 쿼리 사용해 ‘구글 포토’ 컬렉션 전체 검색 가능 ‘AI Overviews’, 더 넓은 범위의 웹사이트 탐색해서 모든 정보 빠르게 직접 정리
사람들은 시, 소설, 보고서 등 글쓰기, 그림 그리기, 알고리즘 코딩 등 창작의 세계가 그동안 인간에게만 허락된 별도의 영역이라 알고 있었다. 그런데 AI(인공지능)의 발전과 함께 이제는 진화한 AI가 스스로 창작의 영역을 넘보는 시대가 되었다. 생성형 AI(Generative AI)의 등장은 인간에게 어떤 의미가 있으며 우리의 미래에 어떤 영향을 미칠지 가늠하기 쉽지 않지만, 생성형 AI는 이미 여러 분야에서 현실로 나타나 적용되고 있다. 우리에게 성큼 다가온 생성형 AI의 시장현황, 다양한 이슈와 관심 사항 등을 살펴보기로 하자. <편집자 주>
[뉴스투데이=최봉 산업경제 전문기자] 구글의 이번 ‘개발자 컨퍼런스 2024(Google I/O 2024)’ 행사는 지난 편에서 언급했듯이 ‘AI의 향연’이었다. 특히 ‘검색’에 있어서 생성형 AI(Generative AI)의 적극 활용이다.
구글은 검색 엔진에 Generative AI ‘제미나이(Gemini)’를 본격적으로 탑재한다. 이에 따라 제미나이를 사용하여 전체 구글 검색 결과 페이지를 구성할 계획이다.
구성된 페이지는 검색어에 따라 달라지겠지만, AI가 생성한 리뷰 요약, 레딧(Reddit)과 같은 소셜 미디어 사이트의 토론, AI가 생성한 추천 목록 등이 표시될 수 있다고 구글은 밝혔다.
‘제미나이 시대(Gemini era)’의 본격 개막을 알린 다양한 라인업 중 몇가지를 살펴보자.
• ‘제미나이 라이브’ 혁신, 멀티모달 AI 비서 ‘프로젝트 아스트라’에서 비롯
구글은 사용자가 스마트폰에서 제미나이와 ‘심층적인’ 음성 채팅을 할 수 있는 ‘제미나이 라이브(Gemini Live)’라는 새로운 경험을 선보였다.
사용자는 챗봇이 말하는 동안 제미나이를 중단하고 명확한 질문을 할 수 있으며, 제미나이는 사용자의 음성 패턴에 실시간으로 적응한다.
또한, 제미나이는 스마트폰 카메라로 촬영한 사진이나 동영상을 통해 사용자의 주변 환경을 보고 이에 반응할 수 있다.
그리고 멀티모달 기능을 사용해 Google Calendar 등에서 정보를 업데이트하거나 가져올 수 있는 새로운 통합 기능을 제공한다.
‘프로젝트 아스트라(Project Astra)’는 멀티모달 AI 비서로, 기기의 카메라를 통해 보이는 것을 이해하고, 사용자의 물건이 어디에 있는지 기억하고, 사용자를 대신해 일을 처리하는 모든 것을 할 수 있는 가상 비서가 되기를 희망한다.
이번 I/O 2024 행사에서 가장 인상적인 데모를 선보였던 이 비서의 목표는 단순히 대화만 하는 것이 아니라 실제로 사용자를 대신해 일을 처리하는 정직한 AI 에이전트가 되는 것이다(The Verge, 2024.5.15.).
올해 말에 출시될 예정인 Gemini Live는 사용자가 어느 동네에 있는지, 고장 난 자전거의 부품 이름이 무엇인지 등 스마트폰 카메라의 시야에 들어오는(또는 최근에 들어온) 사물에 대한 질문에 답할 수 있다.
Gemini Live를 이끄는 기술 혁신은 부분적으로는 실시간 멀티모달 이해를 위한 AI 기반 앱과 프로젝트 아스트라에서 비롯된다(TechCrunch, 2024.5.15.).
• ‘Ask Photos’, 구글 포토 라이브러리 샅샅이 뒤져 복잡한 검색 수행
구글은 이번 여름에 수년간(심지어 10년 이상) 사진을 보관하고 있는 모든 사람에게 유용한 ‘Ask Photos’라는 새로운 기능을 출시할 예정이다.
‘Ask Photos’는 사용자의 질문에 대한 답변으로 제미나이가 ‘구글 포토(Google Photos)’ 라이브러리를 샅샅이 훑어보는 기능으로, 단순히 개와 고양이 사진을 불러오는 것 이상의 기능을 제공한다(The Verge, 2024.5.15.).
Ask Photos를 통해 사용자는 사진 콘텐츠 및 기타 메타데이터에 대한 제미나이의 이해를 활용하는 자연어 쿼리를 사용해 Google Photos 컬렉션 전체를 검색할 수 있다.
예를 들어, 사용자는 사진에서 특정 대상을 검색하는 대신 “내가 방문한 각 국립공원에서 가장 좋은 사진”을 찾는 것과 같이 훨씬 더 광범위하고 복잡한 검색을 수행할 수 있게 된다.
이 예에서 제미나이는 조명, 흐릿함 등과 같은 신호를 사용해 주어진 세트에서 무엇이 사진을 ‘최고’로 만드는지 판단하고 이를 지리적 위치 정보 및 날짜에 대한 이해와 결합하여 관련 이미지를 보여준다.
• ‘AI Overviews’, 넓은 범위의 웹사이트 탐색해서 빠른 답변 제공
‘AI Overviews’도 눈여겨볼만한 아이템이다. 검색과 관련해서 때로는 빠른 답변을 원하지만 모든 정보를 직접 정리할 시간이 없다. 검색의 ‘AI Overviews’가 이 작업을 수행한다.
많은 테스트를 거친 후 구글은 AI Overviews를 통해 사람들이 검색을 더 많이 사용하고 결과에 더 만족한다는 것을 확인했다. AI Overviews는 미국의 모든 사용자에게 배포되기 시작했으며 곧 더 많은 국가에서 출시될 예정이다.
AI Overviews를 통해 사용자는 더 복잡하고 난해한 질문을 해결하기 위해 더 넓은 범위의 웹사이트를 탐색한다.
구글은 사용자가 어떤 질문을 할 수 있는지 설명하기 위해 다음과 같은 예를 제시했다.
새로운 요가 또는 필라테스 스튜디오를 찾고 있는데 지역 주민들에게 인기가 있고 출퇴근하기에 편리한 위치에 있으며 신규 회원에게 할인 혜택을 제공하는 스튜디오를 원한다. 이제 검색 한 번으로 다음과 같이 질문할 수 있다.
“보스턴 비컨힐(Beacon Hill)에서 가장 좋은 요가 또는 필라테스 스튜디오를 찾아서 소개 혜택과 도보 소요 시간을 자세히 알려줘.”