네이버, GPT-3 능가하는 초대규모 AI ‘하이퍼클로바' 공개
[뉴스투데이=양대규 기자] 국내에서 GPT-3를 능가하는 초대규모 인공지능(AI)이 공개됐다.
네이버가 25일 공개한 ‘하이퍼클로바(HyperCLOVA)’가 그 주인공. 하이퍼클로바는 GPT-3보다 6500배 많은 한국어 데이터를 학습했으며, 204B 규모로 세계 최대 한국어 언어 모델이다.
이날 네이버는 국내 기업 최초의 ‘초대규모 AI’인 ‘하이퍼클로바’를 공개하고, 국내 AI 퍼스트무버를 넘어 글로벌 AI 기술 리더로 발돋움하겠다는 계획을 밝혔다.
기존 한국어 AI의 패러다임을 바꾸는 하이퍼클로바를 통해 새롭고 차별화된 경험을 선보이며, ‘모두를 위한 AI’ 시대를 이끌어가겠다는 목표다.
이날 네이버는 온라인으로 열린 ‘NAVER AI NOW’ 컨퍼런스에서 작년 10월 슈퍼컴퓨터 도입 이후 네이버 AI 기술의 성과와 앞으로의 방향성을 공개했다.
정석근 네이버 CLOVA CIC(Company-In-Company) 대표는 키노트에서 “글로벌 기술 대기업들은 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있다”며 “한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다”고 하이퍼클로바 개발 배경을 설명했다.
하이퍼클로바는 세계에서 제일 유명한 초대규모 AI 모델인 OpenAI의 GPT-3(175B)를 뛰어넘는 204B(2040억 개) 파라미터(parameter, 매개변수) 규모로 개발했다.
AI 모델의 크기를 나타내는 파라미터의 수가 높아질수록, AI는 더욱 많은 문제를 해결할 수 있게 된다.
또 하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한, 현재 전세계에서 가장 큰 한국어 초거대 언어모델이다.
영어가 학습 데이터의 대부분을 차지하는 GPT-3와 달리, 하이퍼클로바 학습 데이터는 한국어 비중이 97%다.
업계는 기존의 영어 중심 외국 AI모델이 아닌 한국어 중심 AI모델로 한국 사용자들에게 더 나은 AI 경험을 제공해 줄 것으로 기대한다.
네이버는 하이퍼클로바 개발을 위해 지난 10월 국내 기업 최초로 700 페타플롭스(PF, 1PF=1초당 1000조 회 연산) 성능의 슈퍼컴퓨터를 도입했다.
국내 최대 인터넷 플랫폼을 운영하며 쌓아온 대규모 데이터 처리 능력도 하이퍼클로바만의 중요한 경쟁력이다. 네이버는 하이퍼클로바 개발을 위해 5600억개 토큰(token)의 한국어 대용량 데이터를 구축했다.
또한 네이버는 작년 한해 동안 글로벌 Top AI 컨퍼런스에서 국내 기업 중 가장 많은 43개의 정규 논문을 발표하며 기술력을 인정받았다. 서울대와 ‘서울대-네이버 초대규모(Hyperscale) AI 연구센터’를 설립하고, 카이스트 AI 대학원과는 ‘카이스트-네이버 초창의적(Hypercreative) AI 연구센터’를 설립하는 등 산학협력으로 AI 공동 연구에 더욱 박차를 가하고 있다.
정석근 네이버 CLOVA CIC 대표는 “더 짧은 시간과 더 적은 리소스를 사용해서 이전에 우리가 상상만 헀던, 또는 우리가 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다”고 말했다.