HPC 및 AI 워크로드에 엑사스케일급 성능, AMD CNDA2 기반 인스팅트 MI210 액셀러레이터와 ROCM 5 소프트웨어 발표

홈 > 기획·특집 > 테크닉
테크닉

서버 | HPC 및 AI 워크로드에 엑사스케일급 성능, AMD CNDA2 기반 인스팅트 MI210 액셀러레이터와 ROCM 5 소프트웨어 발표

권경욱 기자 0   0

AMD는 새로운 AMD 인스팅트 MI210(AMD Instinct™ MI210) 액셀러레이터와 ROCM 5 소프트웨어를 발표하며 AMD 인스팅트 생태계를 다시 한번 확장했다.  


에이수스(ASUS), 델(Dell), 기가바이트(Gigabyte), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise, 이하 HPE), 레노버(Lenovo) 및 슈퍼마이크로(Supermicro) 등 주요 파트너사의 시스템과 폭넓게 호환되는 AMD 인스팅트 MI210 액셀러레이터와 ROCM 5 소프트웨어는 고성능 컴퓨팅(High Performance Computing, 이하 HPC)과 인공지능(AI) 워크로드에서 고객에게 엑사스케일급 성능을 제공한다. 또, 날로 증가하는 가속 컴퓨팅 데이터 센터 워크로드 수요에 대응하고 연구자와 과학자, 엔지니어 등 전문가들이 다양한 연구 활동을 보다 빠르게 진행할 수 있도록 도울 예정이다.



thumb-3696014431_RyHOox5k_9b5094faf6acdbb5389825122b629e1dd5ae2275_600x338.jpg


AMD 데이터센터 GPU 및 가속 프로세싱 사업 부문 부사장 브래드 맥크레디(Brad McCredie)는 “이전 세대 액셀러레이터 대비 약 2배 확장된 시스템 호환성, HPC 및 AI 애플리케이션 고객 확대, 주요 워크로드에 대한 상용 독립 소프트웨어 업체(ISV) 지원을 통해 AMD 인스팅트 생태계를 지속적으로 확장하고 있다”며 “AMD는 기존 MI200 액셀러레이터 제품군에 MI210을 새롭게 추가하며 대규모 HPC 및 AI 워크로드를 위한 보다 빠른 처리 속도와 더욱 상용화된 방식의 엑사스케일급 기술을 제공하는 등 고객의 세부적인 니즈에 따라 최적화된 액셀러레이터를 마련할 수 있게 됐다”라고 전했다.



HPC 및 AI 영향력 확장


AMD 인스팅트 MI200 시리즈 액셀러레이터는 엑사스케일 시스템 기반의 연구를 가속화하기 위해 설계됐으며, 연구자와 과학자, 엔지니어 등 전문가들이 기후 변화 관련 연구 및 백신 개발까지 광범위한 분야에서 중요한 과제들을 해결할 수 있도록 지원한다.



thumb-3696014431_ZGzT2SJf_44d3c4af90db67de8b1f1259fc063e3ee31b2c36_600x317.jpg


AMD 인스팅트 MI210 액셀러레이터는 AMD CDNA 2 아키텍처를 기반으로 설계됐으며, 엑사스케일급 기술을 기반으로 고객에게 압도적인 HPC 및 AI 성능을 PCIe 형식으로 제공한다. 



thumb-3696014431_sb5361rU_f117647e059cc57538d0be6cde9b01a20e80a646_600x334.jpg


또한, PCIe 폼 팩터 카드에서 선도적인 배정밀도(FP64) 컴퓨팅 성능을 지원하며, AMD 매트릭스 코어 기술(Matrix Core Technology)을 기반으로 폭넓은 혼합 정밀도(mixed-precision) 성능을 지원하는 등 고속 딥 러닝 트레이닝 가속화에 최적화된 환경을 제공한다.



thumb-3696014431_bKQHxDAI_c61d639636935f5e3a9ee499cb7740c5bda0fdbd_600x302.jpg


AMD Instinct MI210은 CDNA 2 아키텍처를 기반으로 6656 스트림 프로세서(Stream Processors, SP)와 104 컴퓨트 유닛(Compute Units,CUs), 엔진 클럭 1700MHz, 181 TFLOPS(Peak Half Precision Performance, FP16), 22.6 TFLOPS(Peak Single Precision Performance, FP32), 22.6 TFLOPs(Peak Double Precision Perforamnce, FP64), 181 TOPs(Peak INT4 Performance), 181 TOPs(Peak INT8 Performance), HBM2e 64GB 메모리와 4069bit 메모리 인터페이스, 1.6GHz 메모리 클럭, 최대 1638.4GB/s 메모리 대역폭, ECC(Full-Chip) 지원, PCIe 4.0 x16, 인피니티 패브릭 링크 3개(Infinity Fabric Links), 인피니티 패브릭 링크 최대 100GB/s, 8핀 12V EPS 커넥터, TBP(Total Board Power) 300W(Peak)의 스펙을 제공한다.



ROCm 지원 확장


AMD ROCm 플랫폼은 오픈 소프트웨어 플랫폼으로 최상위 HPC 및 AI 애플리케이션을 지원하는 수많은 도구 및 라이브러리로 구성되어 있으며, 전문가들이 AMD 인스팅트 액셀러레이터의 성능을 활용해 유의미한 과학적 발전을 촉진하기 위해 구축됐다. 


AMD ROCm 5 소프트웨어는 AMD 인스팅트 MI200 시리즈 액셀러레이터 및 AMD 라데온 프로 W6800(AMD Radeon™ PRO W6800) 전문가용 그래픽 카드 등 새로운 하드웨어 제품과 호환된다. 


또한, 레드햇 엔터프라이즈 리눅스 8.5(Red Hat® Enterprise Linux® 8.5)를 지원하여 개발자들에게도 더 나은 접근성을 제공하고 독보적인 성능으로 워크로드 전반에 걸쳐 추진력을 강화한다. 


이와 더불어, 사용자는 AMD GPU 간 전송 및 성능 최적화를 위한 오픈 소스 애플리케이션을 제공하는 AMD 인피니티 허브(Infinity Hub)에서 컨테이너형 HPC 애플리케이션 및 ML 프레임워크를 쉽게 다운로드 및 설치할 수 있다. AMD 인피니티 허브 애플리케이션 컨테이너는 사용자가  보다 편리하게 소프트웨어를 찾아 설치하고, 다른 사용자들과 사용 경험을 공유하며 함께 문제 해결 방안을 모색할 수 있는 환경을 제공한다.



파트너 및 고객 생태계 확장


AMD는 ROCm 및 인스팅트 액셀러레이터를 지원하는 애플리케이션이 증가함에 따라 앤시스(Ansys®), 케스케이드 테크놀로지(Cascade Technologies), 템포퀘스트(TempoQuest)를 비롯한 상용 ISV를 추가 지원하며 소프트웨어 생태계를 지속적으로 성장시키고 있다. 


ROCm 및 인스팅트 액셀러레이터를 지원하는 ISV는 여러 애플리케이션에서 전산 유체 역학(Computational Fluid Dynamics, CFD), 기후, 컴퓨터 지원 엔지니어링(Computer Aided Engineering, CAE) 등 가속화된 워크로드를 지원한다. 


또한, 기존 ROCm 지원 애플리케이션과 함께 HPC, AI, 머신 러닝, 앰버(AMBER), 크로마(Chroma), CP2K, 그리드(GRID), 그로맥스(GROMACs), 램스(LAMMPS), MILC, 미니-HAAC(Mini-HAAC), NAMD, NAMD 3.0, ONNX-RT, 오픈MM(OpenMM), 파이토치(PyTorch), 릴리온(RELION), SPECFEM3D Cartesian, SPECFEM3D Globe, 및 텐서플로우(TensorFlow)를 추가 지원한다. 


AMD는 에이수스, 델, 기가바이트, HPE, 레노버, 슈퍼마이크로 등 주요 파트너사와 콜팩스(Colfax), 익잭트(Exxact), 코이 컴퓨터(KOI Computers), 노-텍(Nor-Tech), 팽귄(Penguin), 시메트릭(Symmetric) 등 SI 업체에게 차세대 컴퓨팅을 위한 차별화된 솔루션을 제공한다. 일부 파트너사는 오크리지 국립연구소(Oak Ridge National Laboratory), KTH/다르델(KTH/Dardel), CSC/ 루미(CSC/LUMI), 씨넥스/아다스트라(Cinex/Adastra) 등 새로운 고객을 확보하여 프론티어(Frontier) 슈퍼컴퓨터를 제공하고 있다.



고객 및 파트너 접근성 확장


AMD 액셀러레이터 클라우드(AMD Accelerator Cloud)는 사용자들이 원격으로 AMD 인스팅트 액셀러레이터와 AMD ROCm 소프트웨어에 접근할 수 있는 환경을 마련한다. AMD 액셀러레이터 클라우드는 레거시 코드(legacy code) 전송, 애플리케이션 벤치마킹, 멀티 GPU 테스트 및 멀티 노드 확장 작업에서 사용자가 최신 GPU 및 소프트웨어에 빠르고 쉽게 접근할 수 있도록 돕는다. 


또한, 모든 사용자에게 해커톤(hackathons) 및 ROCm 교육 세션 등을 제공하여 개발자가 기술을 배우고 AMD 인스팅트 액셀러레이터 활용도를 최대한으로 높일 수 있도록 지원한다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , ,

Facebook Twitter GooglePlus KakaoStory NaverBand Naver Tumblr Pinterest 신고
0 개의 댓글이 있습니다.
많이 본 뉴스
인기기사