차세대 산업 혁명 청사진 수립, 엔비디아 파트너사와 미국 AI 인프라 구축

홈 > 최신뉴스 > 주요뉴스
주요뉴스

PC | 차세대 산업 혁명 청사진 수립, 엔비디아 파트너사와 미국 AI 인프라 구축

권경욱 기자 0   0

엔비디아(www.nvidia.co.kr, CEO 젠슨 황)가 오늘 미국 에너지부(Department of Energy, DOE) 산하 국립연구소, 주요 기업들과 협력해 미국의 AI 인프라를 구축한다고 발표했다. 이를 통해 과학적 발견과 경제 성장을 지원하고 차세대 산업 혁명을 주도할 예정이다. 


엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 "우리는 모든 산업과 국가의 미래를 정의할 AI 산업 혁명을 맞이했다. 미국은 미래 경쟁을 주도해야 하며, 지금이야말로 아폴로 프로젝트처럼 우리 세대가 기술 혁신으로 인류의 미래를 바꿀 결정적인 순간이다. 발명, 발견, 진보의 다음 단계는 국가의 AI 인프라 확장 능력에 따라 결정될 것이다. 엔비디아는 파트너들과 함께 역대 최고의 AI 인프라를 구축 중이다. 이를 통해 미국이 번영하는 미래의 기반을 확보하고, 전 세계 AI가 미국의 혁신, 개방성, 협력을 바탕으로 운영돼 모두에게 이익이 되도록 할 것"이라고 말했다. 


엔비디아 AI, 국립 연구소의 과학적 발견을 앞당기다


엔비디아는 미국 에너지부 산하 연구기관 아르곤 국립연구소(Argonne National Laboratory)와 로스앨러모스 국립연구소(Los Alamos National Laboratory, LANL)에 AI 인프라를 제공해 7개의 신규 시스템을 가속화하고, 과학 연구와 혁신을 추진한다. 


엔비디아는 오라클(Oracle), DOE와 협력해 과학적 발견을 위한 미국 에너지부 최대 규모의 AI 슈퍼컴퓨터를 구축 중이다. 10만 개의 엔비디아 블랙웰(Blackwell) GPU를 탑재한 솔스티스(Solstice) 시스템은 사상 최대 규모를 자랑하며, 미국의 보안, 과학, 에너지 분야에서 기술 리더십을 강화하려는 DOE의 AI 역량 개발 사명을 지원할 예정이다. 


또 다른 시스템인 이퀴녹스(Equinox)는 1만 개의 엔비디아 블랙웰 GPU를 탑재해 2026년에 출시될 예정이다. 두 시스템 모두 아르곤 국립연구소에 설치되며, 엔비디아 네트워킹으로 상호 연결돼 총 2,200 엑사플롭(exaflops)의 AI 성능을 제공한다. 


또한, 아르곤 국립연구소는 타라(Tara), 미네르바(Minerva), 야누스(Janus) 등 세 가지 강력한 엔비디아 기반 시스템을 공개했다. 이 시스템들은 미국 전역의 연구자들에게 AI 기반 컴퓨팅 접근성을 확대할 예정이다. 이를 통해 과학자와 엔지니어들이 과학적 발견 방식 혁신과 생산성 향상에 기여한다. 


아르곤 국립연구소 소장인 폴 컨스(Paul Kearns)는 “아르곤과 엔비디아, 오라클의 협력은 미국의 AI와 컴퓨팅 인프라를 발전시키는 중대한 발걸음이다. 이번 파트너십을 통해 우리는 성능, 확장성, 과학적 잠재력을 새롭게 정의하는 플랫폼을 구축 중이다. 우리는 함께 향후 수십 년간 과학적 발견을 이끌 차세대 컴퓨팅의 기반을 만들어가고 있다.”고 말했다. 


뉴멕시코 주에 위치한 LANL은 차세대 미션(Mission)과 비전(Vision) 시스템 구축을 위해 엔비디아 베라 루빈(Vera Rubin) 플랫폼과 엔비디아 퀀텀 X800 인피니밴드(Quantum X800 InfiniBand) 네트워킹 패브릭 도입을 발표했다. 해당 시스템은 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE)가 구축과 공급을 담당한다. 비전 시스템은 비기밀 연구용으로 개발된 베나도(Venado) 슈퍼컴퓨터의 성과를 기반으로 한다. 미션은 LANL이 지원하는 미국 국가행안보청(National Nuclear Security Administration, NNSA)의 어드밴스드 시뮬레이션과 컴퓨팅(Advanced Simulation and Computing) 프로그램의 다섯 번째 첨단 기술 시스템(Advanced Technology System, ATS5)으로, 2027년 말 가동될 예정이며, 기밀 연구용 애플리케이션을 실행하도록 설계됐다. 


베라 루빈 플랫폼은 이러한 시스템에 첨단 가속 컴퓨팅 기능을 제공해 연구자들이 전에 없던 속도와 규모로 방대한 데이터를 처리하고 분석할 수 있게 해준다. 플랫폼은 저지연, 초고속 네트워크 대역폭을 제공하는 퀀텀-X800 인피니밴드 패브릭과 결합될 수 있다. 과학자들은 이를 통해 복잡한 시뮬레이션을 실행해 재료 과학, 기후 모델링, 양자 컴퓨팅 연구 등 다양한 분야를 발전시킬 수 있다. 


LANL의 톰 메이슨(Thom Mason) 소장은 "엔비디아 베라 루빈 플랫폼과 퀀텀 X800 인피니밴드 패브릭의 통합은 우리 연구소의 혁신적인 발전을 의미한다. 이러한 수준의 컴퓨팅 성능을 활용하는 것은 과학과 국가 안보에서 가장 복잡한 문제를 해결하는 데 필수적이다. 엔비디아와의 협력으로 우리는 혁신의 최전선에 머물면서 중요한 기반 시설들의 복원력을 강화할 해결책들을 빠르게 찾아가고 있다"고 전했다. 


엔비디아 AI 팩토리 리서치 센터와 기가와트 규모의 AI 팩토리 청사진


또한 엔비디아는 버지니아주 디지털 리얼티(Digital Realty)에 AI 팩토리 리서치 센터(AI Factory Research Center)를 구축한다고 발표했다. 이 시설은 엔비디아 베라 루빈 플랫폼으로 구동되며, 생성형 AI, 과학 컴퓨팅와 첨단 제조 분야에서 획기적인 발전을 가속화하고, 디지털 트윈과 대규모 시뮬레이션 분야에서의 선구적인 연구를 위한 토대가 될 것이다. 


AI 팩토리 리서치 센터는 엔비디아 옴니버스 DSX(Omniverse DSX)의 토대가 될 예정이다. 엔비디아 옴니버스 DSX는 엔비디아 옴니버스™(Omniverse™) 디지털 트윈을 활용해 여러 세대에 걸쳐 기가와트급 초대형 AI 인프라를 구축할 수 있는 일종의 청사진으로, AI 인프라의 새로운 우수성 기준을 마련하게 된다. 엔비디아는 가상 시스템과 물리적 시스템을 통합해 성능은 물론 에너지 효율성, 지속 가능성을 계속적으로 최적화하는 지능형 시설 구축을 위한 확장 가능한 모델을 만들고 있다. 


이 새로운 센터를 통해 엔비디아와 파트너사들은 자율 제어 시스템과 모듈식 인프라를 통합함으로써 차세대 AI 팩토리를 가동시킬 옴니버스 DSX를 개발하기 위해 협력 중이다. 초대형급 AI 인프라 대규모 구축을 위해 엔비디아가 협력하는 기업들은 다음과 같다. 


엔지니어링 및 건설 파트너사인 벡텔(Bechtel)과 제이콥스(Jacobs)는 엔비디아와 협력해 복잡한 건축, 전력, 기계, 전기 시스템 전반에 걸쳐 검증된 설계에 첨단 디지털 트윈 기술을 통합하고 있다.


전력, 냉각, 에너지 장비 파트너사인 이튼(Eaton), GE 버노바(GE Vernova),  히타치(Hitachi), 미쓰비시 전기(Mitsubishi Electric), 슈나이더 일렉트릭(Schneider Electric), 지멘스(Siemens), 지멘스 에너지(Siemens Energy), 테슬라(Tesla), 트레인 테크놀로지(Trane Technologies), 버티브(Vertiv) 등이 리서치 센터와 협력 중이다. 


전력과 시스템 모델링 작업을 통해 설계되는 AI 팩토리들은 기가와트급 규모로 전력망과 효율적으로 소통할 수 있는 기능을 갖추게 될 것이다. 또한 엔비디아 그레이스 블랙웰(Grace Blackwell)과 베라 루빈 플랫폼에 맞춰 최적화된 액체 냉각, 정류와 전력 변환 시스템들도 이미 AI 팩토리 디지털 트윈을 위한 엔비디아 옴니버스 블루프린트(Omniverse Blueprint)에서 가상으로 모델링 작업까지 마쳤다.


소프트웨어 및 에이전트 AI 솔루션 제공업체인 케이던스(Cadence), 에메랄드 AI(Emerald AI), 파이드라(Phaidra), PTC, 슈나이더 일렉트릭 ETAP(Schneider Electric ETAP), 지멘스, 스위치(Switch) 등은 AI 팩토리의 설계에서부터 운영까지 전체 수명 주기를 모델링하고 최적화하기 위한 디지털 트윈 솔루션을 구축했다. AI 에이전트들은 전력, 냉각, 작업량을 지속적으로 최적화함으로써 AI 팩토리 디지털 트윈을 위한 엔비디아 옴니버스 DSX 청사진을 스스로 학습하는 시스템으로 전환한다. 이로써 전력망의 유연성, 복원성, 에너지 효율성을 크게 향상시키고 있다. 


차세대 미국 인프라 구축


서버 제조업체, 클라우드 서비스 제공업체, 모델 개발업체, 기술 공급업체, 엔터프라이즈 등 미국의 선도 기업들은 AI 팩토리 구축과 미국의 AI 개발을 가속화하기 위해 첨단 AI 인프라에 투자하고 있다. 


시스템 제조업체인시스코(Cisco), 델 테크놀로지스(Dell Technologies), HPE, 슈퍼마이크로(Supermicro)는 엔비디아와 협력해 엔비디아 GPU와 AI 소프트웨어를 풀 스택 시스템에 통합함으로써 안전하고 확장 가능한 AI 인프라를 구축하고 있다. 풀 스택 시스템에는 새로 발표된 정부용 엔비디아 AI 팩토리(AI Factory for Government) 참조 설계가 포함되며, 이는 공공 부문과 엄격한 규제를 받는 산업들을 위한 AI 배포를 가속화할 예정이다. 


또한 시스코(Cisco)는 엔비디아 스펙트럼-X(Spectrum-X™) 이더넷(Ethernet) 스위치 실리콘으로 구동되는 신규 넥서스 N9100(Nexus N9100) 스위치 시리즈를 출시한다. 신규 스위치가 시스코의 기존 넥서스 관리 시스템에 통합되면 고객들은 이미 믿고 사용하던 도구와 운영 방식을 그대로 활용해 새로운 고속 엔비디아 기반 패브릭을 원활하게 배포, 관리할 수 있다. 


시스코는 이제 엔비디아 클라우드 파트너(Cloud Partner) 표준을 따르는 AI 팩토리를 제공할 예정이다. 여기에는 신규 넥서스 스위치를 기반으로 한 시스코 클라우드 참조 아키텍처도 포함된다. N9100 시리즈 스위치는 2025년 말에 주문 가능할 예정이다. 


AI 가속화하는 선도 클라우드 제공업체와 모델 구축업체


클라우드 제공업체와 모델 개발업체는 AI 발전으로 나아가는 다양한 생태계 구축을 위해 AI 인프라에 지속적으로 투자하고 있다. 이를 통해 미국은 AI 기술 발전과 전세계 산업에 걸친 실제 응용분야에서 계속해서 선두의 자리를 공고히 하고 있다. 


미국 내 AI 혁신을 더욱 강화하기 위해 투자를 확대하는 기업은 다음과 같다. 


아카마이(Akamai)는 핵심 데이터 센터에서 엣지로 AI 추론을 확장하는 분산 플랫폼인 아카마이 인퍼런스 클라우드(Akamai Inference Cloud)를 출시한다. 이 플랫폼은 미국 5개 주를 비롯해 전 세계 20개 지역을 시작으로 서비스를 제공하며, 엔비디아 RTX 프로 서버(RTX PRO™ Servers)를 통해 더욱 확장할 계획이다.


코어위브(CoreWeave)는 엔비디아 GPU와 검증된 설계를 기반으로, 미국 정부를 대상으로 한 보안성, 규정 준수, 고성능 AI 클라우드 인프라와 서비스를 제공하는 데 중점을 둔 새로운 사업인 코어위브 페더럴(CoreWeave Federal)을 준비 중이다. 이 이니셔티브는 코어위브 플랫폼의 페드램프(FedRAMP)와 관련 정부기관의 인증 획득 계획이 포함된다.


신규 엔비디아 클라우드 파트너사인 글로벌 AI(Global AI)는 뉴욕에서 가장 큰 규모의 엔비디아 GB300 NVL72 서버 랙 배치를 위해 128대의 엔비디아 GB300 NVL72 랙(9,000개 이상 GPU 탑재)을 처음으로 대량 구매했다.


구글 클라우드(Google Cloud)는 엔비디아 GB300 NVL72가 탑재된 신규 A4X 맥스 VM(A4X Max VM)과 엔비디아 RTX 프로 6000 블랙웰(RTX PRO 6000 Blackwell) GPU가 탑재된 G4 VM을 제공한다. 또한 온프레미스나 에어갭(air-gapped) 환경에서도 엔비디아 블랙웰 플랫폼을 구글 분산 클라우드(Google Distributed Cloud)를 통해 사용할 수 있도록 한다.


람다(Lambda)는 미주리주 캔자스시티에 100메가와트 이상의 전력규모를 가진 신규 AI 팩토리를 건설 중이다. 이 슈퍼컴퓨터 센터는 10,000개 이상의 엔비디아 GB300 NVL72 GPU를 갖춰 미국에 소재한 연구자, 기업, 개발자들의 AI 혁신을 가속화할 예정이다.


마이크로소프트(Microsoft)는 마이크로소프트 애저(Microsoft Azure)에서 엔비디아 RTX 프로 6000 블랙웰 GPU를 사용하고 있으며, 최근 오픈AI(OpenAI)를 위해 엔비디아 GB300 NVL72를 사용하는 대규모 애저 클러스터를 배포한다고 발표했다. 또한, 몇 달 내에 애저 로컬(Azure Local)에서도 엔비디아 RTX™ GPU를 지원할 예정이다.


오라클(Oracle)은 최근 엔비디아 AI 인프라를 기반으로 한 업계 최대 규모의 클라우드 AI 슈퍼컴퓨터인 오라클 클라우드 인프라스트럭처 제타스케일10(Oracle Cloud Infrastructure Zettascale10)을 출시했다.


투게더 AI(Together AI)는 5C와 협력해 메릴랜드에서 이미 엔비디아 B200 GPU를 탑재한 AI 팩토리를 운영하고 있으며, 테네시주 멤피스에서 엔비디아 GB200와 GB300 시스템을 탑재한 새로운 팩토리를 곧 가동할 예정이다. 두 팩토리 모두 가까운 시일 내 확장을 앞두고 있으며, 2026년에는 AI 기술을 활용한 앱 개발과 확장을 가속화하기 위해 새로운 팩토리들이 만들어질 계획이다.


엑스AI(xAI)는 테네시주 멤피스에 위치한 대규모 콜로서스 2(Colossus 2) 데이터 센터를 개발 중이다. 이 센터에 탑재될 50만 개 이상의 엔비디아 GPU는 차세대 AI 모델을 최첨단 수준으로 훈련, 추론시킨다. 


미국 엔터프라이즈, 산업용 AI 인프라 구축


클라우드 서비스 제공업체와 AI 모델 개발업체뿐만 아니라, 미국의 여러 기관들도 자사용 AI 인프라를 구축하거나 타기관에 제공하기 위해 노력하고 있다. 이때 AI 인프라는 제약과 헬스케어 같은 다양한 산업 분야에서 AI 작업을 가속화한다. 


릴리(Lilly)는 엔비디아 DGX™ B300 시스템이 탑재된 엔비디아 DGX SuperPOD™을 통해 제약 업계에서 가장 강력한 AI 팩토리를 건설하고 있다. DGX SuperPOD에는 엔비디아 스펙트럼-X 이더넷(Spectrum-X Ethernet)과 엔비디아 미션 컨트롤(Mission Control™) 소프트웨어가 탑재됐다. 이를 통해 신약 개발과 설계를 가속화하는 대규모 생의학 기반 모델을 개발하고 훈련할 수 있도록 돕는다. 이러한 행보는 릴리가 그동안 엔비디아 RTX 프로(RTX PRO) 서버를 통해 엔터프라이즈 AI 작업을 가속화함으로써 신약 개발과 연구를 진행해 온 노력을 한층 강화한 것이다. 


세계 최대의 환자 데이터베이스를 갖춘 메이요 클리닉(Mayo Clinic)은 2천만 개의 환자 질병 디지털 슬라이드를 보유하고 있다. 이들은 DGX B200 시스템과 엔비디아 미션 컨트롤이 탑재된 DGX SuperPOD으로 구동되는 AI 팩토리를 설립했다. 이를 통해 의료 연구, 디지털 병리학, 개인 맞춤형 치료 등의 의료 애플리케이션을 발전시켜 환자의 건강상태를 개선하는 데 필요한 AI 연산기능을 제공한다. 


여기에서 젠슨 황 엔비디아 CEO가 진행하는 엔비디아 GTC 워싱턴 D.C. 기조연설을 시청하고 엔비디아와 파트너사들이 미국에서 AI 혁신을 발전시키는 방법을 자세히 확인할 수 있다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , , ,

0 Comments
맨위로↑