GTC | 유전체 분석 가속, 엔비디아 바이오네모 기반 혁신 데이터셋 공개
엔비디아(www.nvidia.co.kr)가 미국 새너제이에서 열린 세계 최대 AI·가속 컴퓨팅 콘퍼런스인 ‘엔비디아(NVIDIA) GTC 2026’에서 엔비디아 바이오네모(BioNeMo)를 활용해 데이터를 처리하고 모델을 개발하며 치료 혁신을 가속하고 있는 의료·생명과학 기업들의 최신 사례를 소개했다.
혁신적인 치료법인 유전자 편집, 면역치료, RNA 의약품은 빠르고 대규모의 유전체 분석을 필요로 한다. 방대한 유전체 데이터와 단일세포 데이터 통합은 치료 표적을 발굴하고 더 안전한 치료법을 설계하는 데 필수적이다. 그러나 기존 파이프라인은 연구 기간을 수개월에서 수년까지 지연시킬 수 있다.
엔비디아 바이오네모 플랫폼은 엔비디아 파라브릭스(Parabricks)와 엔비디아 쿠다-X 데이터 사이언스(CUDA-X Data Science (DS)) 라이브러리를 포함한 GPU 가속 도구, 프레임워크, AI 모델로 구성된 통합 플랫폼으로, 유전체 워크플로우를 획기적으로 가속한다.
베이스캠프 리서치 ‘트릴리언 진 아틀라스’
베이스캠프 리서치(Basecamp Research)의 트릴리언 진 아틀라스(Trillion Gene Atlas, TGA)는 앤트로픽(Anthropic), 얼티마 지노믹스(Ultima Genomics), 팩바이오(PacBio)와 협력하고 엔비디아 AI 인프라를 기반으로 구축됐다. 이 생물학 데이터 수집 프로젝트는 유전적 다양성에 대한 이해를 100배 확장하는 것을 목표로 한다.
전 세계 수천 개 지역에서 수백만 종의 신규 유전체 데이터를 수집하는 베이스캠프 리서치는 GTC에서 기존 공개 데이터베이스 전체를 합친 것보다 10배 큰 데이터셋인 베이스데이터(BaseData)를 100배 확장했다고 발표했다. 이를 통해 연구자들은 차세대 생물학 파운데이션 모델을 활용해 새로운 치료법을 설계하고 개발할 수 있다.
베이스캠프 리서치는 TGA를 활용해 엔비디아 파라브릭스로 수천조 개의 DNA 염기쌍을 처리할 계획이다. 엔비디아 파라브릭스는 데이터 처리 속도를 10배 향상시키며, 기존에는 20년 이상 걸리던 분석을 2년 미만으로 단축할 수 있다.
타호 테라퓨틱스, 가상 세포 모델 위한 10억 세포 규모로 확장
타호 테라퓨틱스(Tahoe Therapeutics)는 세계 최대 개별 단일세포 데이터셋인 타호-100M(Tahoe-100M)을 구축해 새로운 가상 세포 모델 아키텍처를 개발했다. 이 모델은 실제 생물학적 세포의 복잡하고 동적인 움직임을 모방하는 AI 기반 시뮬레이션으로, 비용이 많이 드는 대규모 현장 실험 없이도 치료 연구를 가능하게 한다.
타호-100M은 370개 이상의 화합물과 50개 세포주에 걸친 1억 개 세포 데이터를 포함하고 있다. 이 데이터셋은 GPU 가속을 통해서만 가능한 규모로 단일세포 분석을 확장한다.
타호-100M 훈련 파이프라인은 엔비디아 H200 GPU에서 엔드투엔드로 실행되며 엔비디아 cuVS 라이브러리를 활용한다. 타호 테라퓨틱스는 scverse가 개발한 래피즈 싱글셀(RAPIDS-singlecell) 프레임워크와 엔비디아 DGX B200 시스템을 활용해 10억 개 세포 규모로 확장할 계획이다.
퍼터브AI, 생체 내 뇌 유전자 교란 데이터셋 공개
퍼터브AI(PerturbAI)는 엔비디아 생물학 파운데이션 모델 리서치(Biology Foundation Model Research) 팀과 협력해 생체 내(in vivo) CRISPR 기능 유전체 아틀라스를 공개했다. 이 데이터셋은 약 800만 개의 뇌 전체 세포 데이터를 포함하며, 생체 조직에서 유전자 기능을 규명하는 가장 큰 규모의 인과 지도 중 하나를 구축한다.
퍼터브AI는 엔비디아 쿠다-X DS를 활용해 신경퇴행성 질환, 정신 질환, 대사 질환의 근본적인 생물학적 메커니즘을 규명하고 있다. 또한 엔비디아 RTX PRO 6000 GPU 가속 워크플로우와 래피즈 싱글셀의 새로운 교란 분석 기능을 통해 분석 시간을 기존 며칠에서 거의 실시간 수준으로 단축했다.
여기에서 “인실리코 생명과학·신약 개발 가속화(Accelerate the Path to In-Silico Life Sciences and Drug Discovery)” GTC 세션을 시청하고 단알세포 분석과 유전체 연구를 위한 엔비디아 블루프린트(Blueprints)에 대해 자세히 알아볼 수 있다.

엔비디아, NVIDIA, GTC, GTC 2026, 유전체 분석, 가속, 엔비디아 바이오네모, BioNeMo, 기반, 혁신, 데이터셋, 공개







