CES | 에이전틱 AI와 대규모 추론을 위한 AI 인프라의 새로운 청사진 제시, 엔비디아 루빈 플랫폼 기반 시스템 위한 DGX SuperPOD 공개
엔비디아(www.nvidia.co.kr)가 미국 라스베이거스에서 열린 세계 최대 IT·가전 전시회 CES 2026에서 차세대 AI 컴퓨팅 플랫폼 루빈(Rubin) 플랫폼 기반 시스템을 위한 DGX SuperPOD를 공개하며, 에이전틱 AI와 대규모 추론을 위한 AI 인프라의 새로운 청사진을 제시했다고 밝혔다.
엔비디아(NVIDIA) DGX SuperPOD는 엔비디아 루빈 플랫폼을 기반으로 대규모 시스템 구축의 길을 열며, 향후 AI 컴퓨팅의 도약을 가속한다.
![]()
엔비디아는 라스베이거스에서 열린 CES 2026에서 루빈 플랫폼을 공개했다. 이 플랫폼은 혁신적인 단일 AI 슈퍼컴퓨터 구현을 위한 6개의 신규 칩으로 구성되며, 에이전틱 AI, 전문가 혼합(mixture-of-experts, MoE) 모델, 긴 컨텍스트 추론 가속화에 중점을 두고 개발됐다.
루빈 플랫폼은 엔비디아 베라(Vera) CPU, 루빈 GPU, NV링크 6 스위치(NVLink 6 Switch), 커넥트X-9 슈퍼NIC(ConnectX-9 SuperNIC), 블루필드-4(BlueField-4) DPU, 스펙트럼-6 이더넷 스위치(Spectrum-6 Ethernet Switch)까지 총 6종의 칩을 통합했다. 이처럼 고도화된 공동 설계는 훈련 가속화와 추론 토큰 생성 비용을 절감시킨다.
DGX SuperPOD는 기업과 연구 환경 전반에 걸쳐 루빈 기반 시스템을 배포하는 핵심 설계로 자리매김하고 있다.
엔비디아 DGX 플랫폼은 엔비디아 컴퓨팅부터 네트워킹, 소프트웨어에 이르기까지 전체 기술 스택을 단일 통합 시스템으로 제공한다. 이를 통해 인프라 통합 부담을 해소하고, 기술팀이 AI 혁신과 비즈니스 성과에 집중할 수 있도록 돕는다.
엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “루빈 플랫폼은 훈련과 추론에 대한 AI 컴퓨팅 수요가 급증하는 시점에 정확히 적절한 시점에 공개됐다”고 말했다.
AI 산업 혁명을 위한 새로운 플랫폼
루빈 플랫폼은 새로운 DGX 시스템에 탑재되면서 AI 지능과 효율성을 비약적으로 향상시켰다. 핵심 기술은 다음과 같다.
l 6세대 엔비디아 NV링크: GPU당 3.6TB/s, 베라 루빈 NVL72 랙당 260TB/s로 대규모 MoE, 긴 컨텍스트 워크로드 지원
l 엔비디아 베라 CPU: 88개의 엔비디아 맞춤형 올림푸스(Olympus) 코어, 완전한 Armv0.2 호환성. 초고속 NV링크-C2C 연결성으로 업계 최고의 효율적인 AI 팩토리 컴퓨팅 제공
l 엔비디아 루빈 GPU: AI 추론을 위해 50페타플롭스의 NVFP4 컴퓨팅 성능을 제공하며, 하드웨어 가속 압축 기능을 갖춘 3세대 트랜스포머 엔진 탑재
l 3세대 엔비디아 컨피덴셜 컴퓨팅(Confidential Computing): 베라 루빈 NVL72는 최초의 랙 스케일 플랫폼으로 CPU, GPU, NV링크 도메인 전반에 걸쳐 데이터 보안을 유지하는 엔비디아 컨피덴셜 컴퓨팅 제공
l 2세대 RAS 엔진: GPU, CPU, NV링크를 아우르는 엔비디아 루빈 플랫폼은 실시간 상태 모니터링, 내결함성, 사전 예방 유지보수를 제공하며, 모듈식 케이블 프리 트레이로 서비스 속도 3배 향상
이러한 혁신 기술의 결합으로, 루빈 플랫폼은 이전 세대 대비 추론 토큰 비용을 최대 10배 절감시킨다. 이는 AI 모델의 규모, 컨텍스트, 추론 깊이가 확대된 측면에서 중요한 진전이다.
DGX SuperPOD, 루빈 플랫폼 기반 AI 확장의 청사진 제시
루빈 플랫폼 기반의 DGX SuperPOD 시스템에 통합되는 요소는 다음과 같다.
l 엔비디아 DGX 베라 루빈 NV72 또는 DGX 루빈 NVL8 시스템
l 안전한 소프트웨어 정의 인프라를 위한 엔비디아 블루필드-4 DPU
l 차세대 추론을 위한 엔비디아 추론 컨텍스트 메모리 스토리지 플랫폼(Inference Context Memory Storage Platform)
l 엔비디아 커넥트X-9 슈퍼NIC
l 엔비디아 퀀텀 X-800 인피니밴드(Quantum-X800 Infiniband), 엔비디아 스펙트럼-X 이더넷
l 자동화된 AI 인프라 오케스트레이션과 운영을 위한 엔비디아 미션 컨트롤(Mission Control)
엔비디아 DGX SuperPOD는 DGX 베라 루빈 NVL72를 기반으로 8개의 DGX 베라 루빈 NVL72 시스템을 통합하고, 576개의 루빈 GPU를 탑재해 28.8 엑사플롭의 FP4 성능과 600 테라바이트(TB)의 고속 메모리를 제공한다. 각 DGX 베라 루빈 NVL72 시스템은 36개의 베라 CPU, 72개의 루빈 GPU, 18개의 블루필드-4 DPU를 결합해 랙 전체에 걸쳐 통합된 메모리와 컴퓨팅 공간을 제공한다. 총 260 테라바이트(TB/s)에 달하는 NV링크 처리량을 통해 모델 분할의 필요성을 없애고, 랙 전체가 단일하고 일관된 AI 엔진처럼 작동하도록 설계됐다.
엔비디아 DGX SuperPOD는 DGX 루빈 NVL8 시스템을 기반으로, 512개의 루빈 GPU를 탑재했으며, 총 64개의 DGX 루빈 NVL8 시스템으로 구성된다. 엔비디아 DGX 루빈 NVL8 시스템은 x86 CPU와 액체 냉각식 폼팩터를 결합해, 개발부터 배포까지 모든 AI 프로젝트에서 루빈 아키텍처의 효율성을 제공한다. 8개의 엔비디아 루빈 GPU와 6세대 NV링크로 구동되는 각 DGX 루빈 NVL8은 엔비디아 블랙웰(Blackwell) 시스템 대비 5.5배의 NVFP4 플롭(FLOPS)을 제공한다.
![]()
AI 팩토리를 위한 차세대 네트워킹
루빈 플랫폼은 엔비디아 스펙트럼-6 이더넷 스위치, 엔비디아 퀀텀-X800 인피니밴드 스위치, 블루필드-4 DPU, 커넥트X-9 슈퍼NIC을 탑재한 혁신적인 네트워킹 기술로 데이터센터를 고성능 AI 공장으로 새롭게 정의한다. 이는 세계 최대 규모의 AI 워크로드를 지속적으로 처리하도록 설계됐다. 이러한 혁신 기술을 엔비디아 DGX SuperPOD에 통합함으로써, 루빈 플랫폼은 기존 시스템의 확장성, 혼잡도, 안정성 관련 병목 현상을 해소한다.
대규모 클러스터를 위한 최적화된 연결성
차세대 800Gb/s 엔드투엔드 네트워킹 제품군은 인피니밴드와 이더넷 환경 모두에서 AI 인프라의 최고 효율을 보장하는 두 가지 맞춤형 경로를 제공한다.
l 엔비디아 퀀텀-X800 인피니밴드: 전용 AI 클러스터를 위해 업계 최저 지연 시간과 최고 성능을 제공한다. 확장 가능한 SHARP(Scalable Hierarchical Aggregation and Reduction Protocol) v4와 적응형 라우팅 기술을 활용해 집합 연산을 네트워크로 오프로드한다.
l 엔비디아 스펙트럼-X 이더넷: 스펙트럼-6 이더넷 스위치와 커넥트X-9 슈퍼NIC을 기반으로 구축된 이 플랫폼은 표준 이더넷 프로토콜을 활용한다. 이를 통해 AI 팩토리에 예측 가능하고 고성능의 확장성과 분산 연결성을 구현하며, 특히 AI 워크로드의 ‘이스트-웨스트(east-west)’ 트래픽 패턴에 최적화된 것이 특징이다.
기가와트급 AI 팩토리 구축
이러한 신기술들은 루빈 플랫폼과의 고도화된 공동 설계를 통해 탄생했다. 엔비디아는 혼잡 제어와 성능 격리 기술을 완전하게 구현함으로써 차세대 기가와트급 AI 팩토리 시대를 열고 있다. 이러한 통합적 접근 방식은 AI 모델의 복잡성이 심화되더라도 AI 팩토리의 네트워킹 구조가 속도를 저해하는 요소가 아니라 오히려 가속하는 촉매제 역할을 수행하게 된다.
엔비디아 소프트웨어, AI 팩토리 운영과 배포 혁신
엔비디아 미션 컨트롤은 엔비디아 블랙웰 기반 DGX 시스템용으로 개발된 AI 데이터센터 운영과 오케스트레이션 소프트웨어다. 이는 루빈 기반 엔비디아 DGX 시스템을 통해 기업이 인프라 관리와 운영을 자동화할 수 있도록 지원한다.
엔비디아 미션 컨트롤은 배포 구성부터 시설 통합, 클러스터, 워크로드 관리에 이르기까지 인프라 운영의 모든 측면을 가속화한다.
지능형 통합 소프트웨어를 통해 기업은 엔비디아 루빈의 냉각과 전력에 대한 제어력을 향상시키고, 인프라 복원력을 확보할 수 있다. 엔비디아 미션 컨트롤은 신속한 누수 감지 기능으로 대응 속도를 높이고, 혁신적이고 효율적인 엔비디아의 최신 기술에 대한 활용범위를 확대하며, 자율 복구 기능을 통해 AI 팩토리 생산성을 극대화한다.
엔비디아 DGX 시스템은 엔비디아 네모트론(Nemotron)-3 오픈 모델, 데이터, 라이브러리 제품군과 같은 엔비디아 NIM 마이크로서비스를 포함한 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼도 지원한다.
DGX SuperPOD가 제시하는 산업용 AI의 미래
DGX SuperPOD는 오랫동안 대규모 AI 인프라의 청사진 역할을 해왔다. 루빈 플랫폼의 등장은 수천 단계에 걸쳐 추론하고 획기적으로 낮은 비용으로 지능을 제공하는 차세대 AI 팩토리 시스템의 발판이 될 전망이다. 이를 통해 기업들은 차세대 최첨단 모델, 멀티모달 시스템, 에이전틱 AI 애플리케이션 구축을 위한 강력한 동력을 얻게 될 것으로 예상된다.
DGX 베라 루빈 NVL72, DGX 루빈 NVL8 시스템을 탑재한 엔비디아 DGX SuperPOD는 올해 하반기에 출시될 예정이다.
여기에서 소프트웨어 제품 정보 관련 약관을 확인할 수 있다.
엔비디아, NVIDIA, 에이전틱 AI, 와, 대규모, 추론을, 위한, AI 인프라의, 새로운, 청사진, 제시, 루빈, 플랫폼, 기반, 시스템, DGX SuperPOD, 공개








