[뉴스투데이=임종우 기자] 두나무 머신러닝팀이 연구 및 개발한 텍스트-SQL 변환 모델이 글로벌 인공지능(AI) 모델 평가 지표인 'BIRD-SQL'에서 글로벌 리더보드 선두를 달성했다.
25일 두나무에 따르면 텍스트-SQL 변환 모델은 사람의 언어를 데이터 관리 프로그래밍 언어인 'SQL'로 변환하는 AI 모델로, 생성형 AI의 등장 이후 큰 관심을 받고 있는 연구 분야다.
두나무 머신러닝팀이 이번에 개발한 텍스트-SQL 모델은 사용자가 자연어로 질문을 입력하면 SQL 변환이 필요한 데이터를 빠르고 정확하게 추출해 챗GPT의 성능을 한층 강화시키는 것이 특징이다.
해당 모델은 성능 측정 벤치마크인 BIRD-SQL의 글로벌 리더보드에서 정확도 점수와 효율성 점수 각각 65.4%와 71.3%을 받아 모두 1위에 올랐다. 이는 GPT-4의 정확도(54.8%)와 정확성(60.7%)을 각 10%포인트 이상 웃도는 수준이다.
2위 모델과의 격차도 정확도와 효율성에서 각 3%포인트 넘게 났으며, 처음 1위에 오른 지난 14일 이후 현재까지 계속 선두를 유지하고 있다.
두나무는 이번 연구로 증권플러스에서 제공하는 AI 대화형 서비스 '우디'의 자연어를 통한 종목 선별 기능을 크게 향상시킬 것으로 기대하고 있다.
이동준 두나무 머신러닝팀장은 “챗GPT로 촉발된 생성형 AI 기술 개발이 활발해지면서 더 정교하게 자연어를 이해하고 누구나 쉽게 기술을 활용할 수 있도록 연구하고 있다”며 “명령어에 따라 성능이 크게 달라지는 거대언어모델(LLM)의 한계점을 개선하는데 초점을 두고 두나무의 다양한 서비스 향상에 기여하도록 노력하겠다”고 말했다.