대규모 AI 및 HPC 워크로드 대응, 엔비디아 Arm 기반 그레이스 CPU 발표

홈 > 기획·특집 > 취재
취재


GTC | 대규모 AI 및 HPC 워크로드 대응, 엔비디아 Arm 기반 그레이스 CPU 발표

권경욱 기자 0   0

엔비디아(www.nvidia.co.kr, CEO 젠슨 황)는 4월 12일부터 16일까지 온라인으로 진행되는 GTC 21에서 대규모 AI 및 고성능컴퓨팅(HPC) 워크로드를 위한 자사 최초의 데이터센터 CPU를 공개했다.



thumb-3696014431_cQMuFHrE_52bc418f18b8a10124cd7d9dbf71aa6cbe533517_600x375.jpg


그레이스(Grace)로 명명된 이 새로운 Arm 기반 CPU는 오늘날 가장 빠른 서버보다 10배 뛰어난 성능을 제공한다. 1만년 이상의 엔지니어링의 산물인 그레이스 CPU는 자연어 처리, 추천 시스템, AI 슈퍼컴퓨팅과 같이 초고속 컴퓨팅 성능과 대용량 메모리를 모두 필요로 하는 방대한 데이터세트를 분석하는 세계에서 가장 진보한 애플리케이션의 컴퓨팅 요구사항을 충족하도록 설계됐다. 에너지 효율적인 Arm CPU 코어와 혁신적인 저전력 메모리 서브시스템의 결합으로 뛰어난 효율성과 높은 성능을 제공한다.


젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 "최첨단 AI와 데이터 사이언스는 오늘날 컴퓨터 아키텍처의 한계를 뛰어넘어 상상 이상의 데이터를 처리하고 있다. 엔비디아는 Arm IP를 사용하여 대규모 AI와 HPC를 위한 CPU로 그레이스를 설계했다. GPU와 DPU가 결합된 그레이스 CPU를 통해 엔비디아는 컴퓨팅을 위한 세 번째 기반기술을 구축하고, AI의 진보를 위해 데이터센터를 재설계할 수 있는 능력을 갖추게 됐다. 엔비디아는 이제 세 종류의 칩을 가진 기업"이라고 설명했다.



thumb-3696014431_pRfSvib1_ba574fbcc48d6b09a0f8660f445cfbdd2c4c6d4a_600x326.jpg


그레이스는 파라미터가 1조 개가 넘는 차세대 NLP 모델 훈련과 같은 워크로드를 대상으로 하는 고도로 특화된 프로세서다. 그레이스 CPU 기반 시스템은 엔비디아 GPU와 긴밀하게 결합되었을 때 x86 CPU에서 실행되는 최첨단 엔비디아 DGX 기반 시스템보다 10배 더 빠른 성능을 제공한다.


그레이스에 도입된 4세대 NV링크(NVLink) 인터커넥트 기술은 그레이스와 엔비디아 GPU간에 기록적인 초당 900GB 연결을 제공하여 주요 서버 대비 30배 더 높은 총 대역폭을 지원한다. 



thumb-3696014431_2zeAu3bn_52bc418f18b8a10124cd7d9dbf71aa6cbe533517_600x337.jpg


또한 DDR4 메모리 대비 2배의 대역폭과 10배 더 나은 에너지 효율성을 제공하는 혁신적인 LPDDR5x 메모리 서브시스템을 활용할 예정이다. 새로운 아키텍처는 단일 메모리 주소 공간으로 통일된 캐시 일관성을 제공하며, 시스템과 HBM GPU 메모리를 결합하여 프로그래밍 기능을 단순화한다.


그레이스는 세계에서 가장 중요한 과제를 해결하는 과학자와 연구자들의 발명을 가속화할 수 있도록 엔비디아 HPC 소프트웨어 개발 키트와 2,000개 이상의 GPU 애플리케이션을 가속화하는 쿠다(CUDA) 및 쿠다-X 라이브러리 제품군의 지원을 받는다.



thumb-3696014431_gMXm3C09_52bc418f18b8a10124cd7d9dbf71aa6cbe533517_600x338.jpg


대부분의 데이터센터는 기존 CPU를 사용할 것으로 예상되지만, 미국의 컴퓨터 프로그래밍 선구자 그레이스 하퍼(Grace Hopper)의 이름을 딴 그레이스는 컴퓨팅의 틈새시장에서 서비스를 제공할 것으로 기대된다.


스위스 국립 슈퍼컴퓨팅센터(CSCS)와 미 에너지부 산하 로스앨러모스 국립연구소(Los Alamos National Laboratory)는 국가의 과학 연구 이니셔티브를 지원하기 위해 그레이스 기반의 슈퍼컴퓨터를 구축한다는 계획을 최초로 발표했다.


오늘날 가장 큰 AI 모델은 수십억 개의 파라미터를 포함하며 매 2개월 반마다 두 배씩 증가하고 있다. 이러한 모델을 훈련하려면 시스템 병목 현상을 제거하기 위해 GPU와 긴밀하게 결합할 수 있는 새로운 CPU가 필요하다.


엔비디아는 Arm의 데이터센터 아키텍처의 놀라운 유연성을 활용해 그레이스를 구축했다. 엔비디아는 새로운 서버급 CPU를 선보임으로써, 세계에서 가장 시급한 문제를 해결하는 데 필요한 혁신을 달성하기 위해서 선택이 핵심적 역할을 하는 AI와 HPC 커뮤니티의 기술 다양성 목표를 앞당기고 있다.


사이먼 시거스(Simon Segars) Arm CEO는 "세계에서 가장 많은 라이선스를 취득한 프로세서 아키텍처인 Arm은 매일 놀랍고 새로운 방식으로 혁신을 주도하고 있다. 엔비디아의 그레이스 데이터센터 CPU 출시는 Arm의 라이선스 모델이 어떻게 중요한 발명을 가능케 하는지, 즉 전 세계 AI 연구자와 과학자들의 놀라운 업적을 계속 뒷받침하고 있다는 것을 여실히 보여주는 예"라고 말했다.


CSCS와 로스앨러모스 국립연구소는 HPE(휴렛 팩커드 엔터프라이즈)가 구축하게 될 그레이스 기반 슈퍼컴퓨터를 2023년 공식 운영할 예정이다.


CSCS 디렉터 토마스 슐테스(Thomas Schulthess)는 "엔비디아의 새로운 그레이스 CPU는 계산과학에서 가장 어려운 문제를 해결하기 위해 AI 기술과 클래식 슈퍼컴퓨팅을 융합할 수 있게 해준다. 스위스와 전 세계 사용자들이 대규모의 복잡한 과학 데이터세트를 처리하고 분석하는 데 새로운 엔비디아 CPU를 사용할 수 있게 되어 기쁘다" 고 말했다.


톰 메이슨(Thom Mason) 로스앨러모스 국립연구소 디렉터는 "메모리 대역폭과 용량의 혁신적인 균형으로, 이 차세대 시스템은 우리 기관의 컴퓨팅 전략을 좌우할 것"이라며 "엔비디아의 새로운 그레이스 CPU 덕분에 이전보다 더 큰 데이터세트를 사용해 고성능 3D 시뮬레이션 및 분석을 활용하는 첨단 과학 연구를 수행할 수 있게 되었다"고 말했다.


한편 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 4월 13일 오전 10시(한국시간) 기조연설을 진행했다. 

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , , , , , , , , , , , , , ,

Facebook Twitter GooglePlus KakaoStory NaverBand Naver Tumblr Pinterest 신고
0 개의 댓글이 있습니다.
많이 본 뉴스
인기기사