슈퍼마이크로 8개 엔비디아 HGX A100 GPU 지원 4U 서버 발표, 확장된 포트폴리오의 최고밀도 4U 서버

홈 > 최신뉴스 > 주요뉴스
주요뉴스

서버 | 슈퍼마이크로 8개 엔비디아 HGX A100 GPU 지원 4U 서버 발표, 확장된 포트폴리오의 최고밀도 4U 서버

권경욱 기자 0   0

엔터프라이즈 컴퓨팅, 스토리지, 네트워킹 솔루션, 그린 컴퓨팅 기술의 글로벌 리더인 슈퍼마이크로컴퓨터(Super Micro Computer, Inc.(SMCI))가 GPU 성능이 두 배로 확장된 8개 엔비디아(NVIDIA®) HGX A100 GPU 지원 4U 서버를 발표했다.  


슈퍼마이크로는 1U, 2U, 4U 및 10U GPU 서버와 슈퍼블레이드(SuperBlade) 서버를 아우르는 업계에서 가장 광범위한 GPU 시스템 포트폴리오를 사용자 정의 구성으로 폭넓게 제공한다. 


슈퍼마이크로는 새로운 엔비디아 HGX A100 8-GPU 서버와 함께 업계에서 가장 광범위하고 심층적인 GPU 시스템을 제공함으로써 엣지에서 클라우드까지 이르는 애플리케이션을 구동한다. 전체 포트폴리오는 1U, 2U, 4U 및 10U 랙마운트 GPU 시스템은 물론, 인텔 딥 러닝 부스트(Intel® Deep Learning Boost) 기술이 적용된 AMD EPYC 및 인텔 제온(Intel ® Xeon) 프로세서로 구동되는 울트라(Ultra), 빅트윈(BigTwin™)과 임베디드 솔루션을 포함한다. 


슈퍼마이크로의 CEO 겸 사장 찰스 리앙(Charles Liang)은 "슈퍼마이크로는 엔비디아 HGX A100 8-GPU 베이스보드(기존 코드명 ‘델타’)와 새로운 4U 시스템을 통해 기존 시스템에 비해 6배의 AI 학습 성능 및 7배의 추론 워크로드 용량을 제공한다”며, “최근에 발표한 엔비디아 HGX A100 4-GPU 보드(기존 코드명 ‘레드스톤’)가 시장에서 폭넓게 수용되고 있다. 슈퍼마이크로는 글로벌 고객 참여가 지속되어 기쁘게 생각한다. 이와 같은 슈퍼마이크로의 새로운 시스템은 HPC, 데이터 애널리틱스, 딥 러닝 학습 및 추론과 같이 급변하는 시장에서 필요로 하는 가속화된 워크로드를 위한 성능을 크게 향상시킨다" 라고 밝혔다.


맞춤형 히트싱크, 액체 냉각 옵션 등 슈퍼마이크로의 고급 열처리 설계를 통해 최신 고밀도 2U 및 4U 서버는 엔비디아 HGX A100 4-GPU 8-GPU 대시보드를 지원, 4U 서버는 총 8개의 엔비디아 A100 PCI-E GPU를 지원한다.


슈퍼마이크로의 고급 I/O 모듈(AIOM) 폼 팩터는 높은 유연성으로 네트워킹 통신을 더욱 향상시킨다. AIOM은 병목 현상 없이 연속적인 데이터 흐름이 가능한 확장형 멀티 GPU 시스템을 공급하는 엔비디아 멜라녹스 인피니밴드(Mellanox® InfiniBand)의 NVMe-oF (NVME over Fabrics)를 사용함으로써 NVIDIA GPUDirect® RDMA 및 GPUDirect 스토리지를 지원하는 최신 고속, 저지연 PCI-E 4.0 스토리지 및 네트워킹 장치와 결합할 수 있다. 또한 슈퍼마이크로의 티타늄 레벨 전원 공급 장치는 GPU에 대한 중복 지원을 허용하고 96%의 업계 최고 효율 등급으로 친환경 시스템을 유지함으로써 훨씬 더 큰 비용 절감을 실현한다. 


엔비디아 가속화 컴퓨팅 제품 마케팅 디렉터 파레쉬 카리아(Paresh Kharya)는 "엔비디아 A100 기반 슈퍼마이크로 시스템은 수천 개의 GPU로 빠르게 확장할 수 있고, 새로운 다중 인스턴스 GPU 기술(Multi-Instance GPU, MIG)을 이용해 7개의 개별 GPU 인스턴스로 분할하여 여러 작업을 수행할 수 있다."며, “텐서플로트-32(TensorFloat-32)가 탑재된 엔비디아 A100 텐서 코어 GPU는 코드 변경 없이 이전 세대에 비해 최대 20배 더 많은 컴퓨팅 용량을 제공한다" 라고 전했다.



슈퍼마이크로의 HGX A100 4-GPU용 고급 2U 설계


이 2U 시스템은 엔비디아 HGX A100 4-GPU 베이스보드에 슈퍼마이크로의 고급 열 히트싱크 설계를 적용해 전체 부하를 최적의 시스템 온도에서 소형 폼 팩터로 유지한다. 이 시스템은 엔비디아 NVLink®, 최대 8TB의 DDR4 3200Mhz 시스템 메모리, GPUDirect RDMA를 지원하는 5개의 PCI-E 4.0 I/O 슬롯 및 GPUDirect 스토리지 기능을 갖춘 4개의 핫 스왑 NVMe를 통해 높은 GPU 피어 투 피어(peer-to-peer) 통신을 가능하게 한다.



HGX A100 8-GPU를 사용한 고밀도, 다용도 4U 설계


새로운 4U GPU 시스템은 인피니밴드의 NVMe-oF, GPUDirect RDMA, GPUDirect와 같이 최신 기술 스택을 통해 시스템 간 8-GPU 통신과 데이터 흐름 활성화를 지원하는 슈퍼마이크로의 고유한 AIOM을 갖춘다. 엔비디아 HGX A100 8-GPU 베이스보드, 최대 6개의 NVMe U.2 및 2개의 NVMe M.2, 10개의 PCI-E 4.0 x16 슬롯까지도 지원한다. 이 시스템은 엔비디아 NVLink 및 NVSwitch 기술을 적용한다. 대규모 딥 러닝 학습, 연구 혹은 국가 연구소용 신경망 모델 애플리케이션, 슈퍼컴퓨팅 클러스터 및 HPC 클라우드 서비스에 적합하다.



20개의 A100 PCI-E GPU가 장착된 고밀도, 에너지 효율적인 8U 슈퍼블레이드


업계 최고 밀도의 GPU 블레이드 서버는 노드 당 2개의 싱글 슬롯(single-width) GPU로 최대 20개의 노드와 40개의 GPU를 지원하거나, 슈퍼마이크로 8U 슈퍼블레이드 인클로저에서 노드 당 하나의 엔비디아 텐서 코어(Tensor Core) A100 PCI-E GPU를 지원한다. 


8U내 20개의 엔비디아 A100 GPU는 더 작은 공간에서 컴퓨팅 성능의 밀도를 높이므로 고객은 총소유비용(Total Cost of Ownership, TCO)를 절감할 수 있다. GPU 최적화 구성을 지원하고 까다로운 AI 애플리케이션에 필요한 최고의 성능 및 처리량을 유지하고자 슈퍼블레이드는 100% 비차단 HDR 200Gb/s 인피니밴드 네트워킹 인프라를 제공해 딥 러닝을 가속화하고 실시간 분석 및 의사 결정을 제공한다. 고밀도, 안정성 및 업그레이드 용이성을 갖춘 슈퍼블레이드는 AI 기반 서비스를 제공하는 엔터프라이즈 애플리케이션을 위한 완벽한 빌딩 블록이다.



업계에서 가장 광범위한 GPU 가속 시스템 포트폴리오


슈퍼마이크로는 고객의 개별 사용 사례 시나리오 및 요구 사항에 최적화된 다양한 폼 팩터를 통해 엔비디아의 고급 GPU를 지속적으로 지원한다. 1U GPU 시스템은 NEBS Level 3 인증, 5G/ 엣지 지원 SYS-1029GQ를 비롯하여 NVLink를 갖춘 최대 4개의 NVIDIA GPU를 포함한다. SYS-2029GP-TR 등 슈퍼마이크로의 2U GPU 시스템은 하나의 시스템에서 듀얼 PCI-E 루트 복합 기능을 갖춘 엔비디아 V100 GPU를 최대 6개까지 지원한다. 마지막으로 SYS-9029GP-TNVRT와 같은 10U GPU 서버는 AI 가속 기능이 내장된 듀얼 인텔 제온 스케일러블 프로세서 (Dual Intel Xeon Scalable processor)를 통해 16개의 V100 SXM3 GPU 확장을 제공한다. 


엔비디아 NGC 에코 시스템의 엔비디아 GPU 및 GPU 소프트웨어로 구동되는 유연한 솔루션 범위는 개발된 모델에 대한 AI 추론에서 HPC, 고급 교육에 이르기까지 여러 업종의 다양한 작업에 적합한 구성 요소를 제공한다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , , , ,

0 Comments
많이 본 뉴스
인기기사