생성형 AI가 신약을 본격 개발하는 시대 도래하다! ③ - 제약회사들이 '알파폴드(AlphaFold)'에 주목하는 이유는? (i)
사람들은 시, 소설, 보고서 등 글쓰기, 그림 그리기, 알고리즘 코딩 등 창작의 세계가 그동안 인간에게만 허락된 별도의 영역이라 알고 있었다. 그런데 AI(인공지능)의 발전과 함께 이제는 진화한 AI가 스스로 창작의 영역을 넘보는 시대가 되었다. 생성형 AI(Generative AI)의 등장은 인간에게 어떤 의미가 있으며 우리의 미래에 어떤 영향을 미칠지 가늠하기 쉽지 않지만, 생성형 AI는 이미 여러 분야에서 현실로 나타나 적용되고 있다. 우리에게 성큼 다가온 생성형 AI의 시장현황, 다양한 이슈와 관심 사항 등을 살펴보기로 하자. <편집자 주>
[뉴스투데이=최봉 산업경제 전문기자] 4년전 이미 단백질에 대한 과학자들의 이해를 돕는데 대변혁을 일으켰던 구글 딥마인드(DeepMind)의 ‘알파폴드(AlphaFold)’ AI 모델이 지난 5월초에 출시된 새로운 버전에서 그 성능을 확장했다.
업그레이드 버전인 ‘알파폴드 3’는 생명의 기초를 형성하는 거의 모든 분자 사이의 상호 작용이 어떤 모습인지 예측할 수 있으며, 이를 통해 신약이나 보다 탄력적인 결과물로 가는 길을 열 수 있다(Axios, 2024.5.9.).
알파폴드 얘기를 하려면 생물학, 생명과학의 조금더 근본적인 내용을 다룰 필요가 있다.
• ‘단백질 접힘 문제’, 지난 50년 동안 생물학에서 큰 도전 과제
단백질(protein)은 다양한 기관, 효소, 호르몬 등 신체를 이루는 주성분으로, 몸에서 물 다음으로 많은 양을 차지한다. 단백질의 구성단위 물질은 아미노산이며, 주로 인체 구성에 사용되고 에너지원으로도 드물게 사용된다(네이버 지식백과).
단백질은 20개의 서로 다른 아미노산 수백개가 서로 이어져서 만들어진 긴 사슬과 같다. 이 아미노산 사슬은 특별한 방식으로 접히게 되어 복잡한 3차원(3D) 모양의 구조를 만드는데, 이것을 ‘단백질 접힘(protein folding)’이라고 한다.
단백질 접힘이 왜 중요할까?
이 3차원 모양이 단백질이 어떤 일을 하는지를 결정하기 때문이다. 따라서 단백질의 구조를 알아내면, 그 단백질이 어떻게 작동하는지, 어떤 약이 어떻게 작용하는지 등을 이해할 수 있게 된다.
단백질이 어떤 모양으로 접히는지 알아내는 것은 ‘단백질 접힘 문제(protein folding problem)’로 알려져 있으며, 지난 50년 동안 생물학, 생명과학에서 큰 도전 과제로 알려져 왔다.
단백질 구조는 X-선 결정학(X-ray crystallography), 극저온 전자 현미경, 핵자기공명 등의 기술을 통해 실험적으로 결정할 수 있지만, 모두 엄청난 비용과 시간이 소요된다. 이러한 실험적 방법을 통해 지난 60년 동안 약 17만개의 단백질 구조를 밝혀냈으며, 모든 생명체에는 2억개 이상의 단백질이 존재한다고 알려져 있다(wikipedia).
• 딥마인드의 ‘알파폴드’, 불과 며칠 만에 단백질 접힘 구조 예측할 수 있어..
그런데 2020년 말 딥마인드(DeepMind)는 단백질 접힘 구조를 불과 며칠 만에 정확하게 예측할 수 있는 ‘알파폴드(AlphaFold)’라는 AI 소프트웨어를 개발했다(엄밀히 얘기하면 두 번째 버전인 ‘알파폴드 2’).
앞서 언급했듯이 모든 살아있는 세포 안에는 수천 가지의 다양한 단백질이 존재하며, 이 단백질은 세포의 생명과 건강을 유지한다.
단백질이 접히는 모양을 예측하는 것은 단백질의 기능을 결정하고 암과 치매를 비롯한 거의 모든 질병이 단백질의 기능과 관련되어 있기 때문에 중요하다.
딥마인드의 알파폴드는 2020년 11월 ‘CASP(Critical Assessment for Structure Prediction)’라는 그룹에서 주최한 대회(CASP14, 단백질구조 예측대회로 2020년이 14회)에 참가했다.
이 단체는 단백질 분자의 3D 구조를 계산하는 방법이라는 한 가지 문제의 해결책을 증진하는 것을 사명으로 하는 과학자 커뮤니티 실험 조직이다.
이 대회는 구조가 알려지지 않은 단백질의 아미노산 사슬만을 토대로 단백질의 3차원 구조를 계산해 예측하는 방식으로 진행된다.
당시 25년 동안 이 분야의 진행 상황을 모니터링해 온 CASP는 딥마인드의 알파폴드 시스템이 단백질 구조 예측에서 타의 추종을 불허하는 수준의 정확도를 달성했다고 발표했다.
CASP는 실제 단백질과 예측한 단백질 모델 간 차이를 나타내는 GDT(global distance test) 점수로 소프트웨어를 평가하는데, 알파폴드는 평균(중앙값, 100점 만점) 92.4GDT의 놀랄만한 성능을 보였다. 이는 예측의 절반 이상이 원자가 어느 정도 올바른 위치에 있다는 것을 의미하며 92.4% 이상의 점수를 받았다는 것이다.
약 1천명의 직원을 보유하고 있으며 거의 수익이 없는 딥마인드는 알파벳(구글의 모회사)이 지원하기에는 비용이 많이 드는 회사였다. 하지만 알파폴드의 성공에 힘입어 딥마인드는 마이크로소프트, OpenAI 등과 함께 글로벌 AI 경쟁의 선두주자로 떠올랐다(CNBC, 2020.11.30.).
구글의 CEO인 순다르 피차이(Sundar Pichai)는 X(옛 트위터)를 통해 이 획기적인 발전을 환영했다.