엔비디아 그레이스 GPU, 데이터센터의 에너지 효율적 컴퓨팅 전환 가속화

홈 > 최신뉴스 > 주요뉴스
주요뉴스

GTC | 엔비디아 그레이스 GPU, 데이터센터의 에너지 효율적 컴퓨팅 전환 가속화

권경욱 기자 0   0

 엔비디아(www.nvidia.co.kr, CEO 젠슨 황)가 엔비디아 그레이스 CPU 슈퍼칩(NVIDIA Grace CPU Superchip)이 동일한 전력 엔벨롭(power envelope) 내 주요 CPU 애플리케이션 전반에서 x86 프로세서 대비 2배의 성능 향상을 제공한다는 워크로드 테스트 결과를 밝혔다.


그레이스 CPU 슈퍼칩을 사용하면 데이터센터는 2배 더 많은 피크 트래픽(peak traffic)을 처리하며, 전력 요금을 최대 절반까지 줄일 수 있다. 네트워크 엣지의 제한된 공간에 더 많은 성능을 제공할 수 있으며, 옵션들을 조합해 사용하는 것도 가능하다.

 

 

thumb-c57c266fa3e707e5d433ec2425add241_F0smtMqN_c7981922f62e6a41f1d88e55283c272db51e7313_600x318.jpg


이는 완전히 새로운 기회를 제시하며, 에너지 효율적인 컴퓨팅의 새 시대가 열렸다는 것을 의미한다.


데이터센터의 최우선 과제, 에너지 효율성


에너지 효율의 시대에서 데이터센터 관리업체에는 다음와 같은 옵션들이 필요하다.


무어의 법칙은 사실상 끝났다고 할 수 있다. 동일한 전력과 동일한 공간에 이 이상으로 많은 트랜지스터를 넣는 것은 이제 물리적으로 불가능하다.


따라서 새로운 x86 CPU의 성능 향상은 일반적으로 이전 세대 대비 30% 미만으로 한정된다. 이는 점점 더 많은 데이터센터가 전력 제한을 받는 이유이기도 하다.



지구 온난화의 위협이 가중되면서, 데이터센터는 전력을 확장할 수 있는 여유가 없음에도 여전히 증가하는 컴퓨팅 수요에 계속 대응해야 한다.



전력은 동일하게, 성능은 높게


맥킨지 연구(McKinsey study)에 따르면, 컴퓨팅 수요는 미국에서 매년 10%씩 늘어나고 있으며 2022년부터 2030년 사이 8년 안에 두 배로 증가할 것이다.



이에 대해 맥킨지 연구는 “데이터센터를 지속 가능하게 만들어야 한다는 압박이 높으며, 일부 규제당국과 정부는 새로 구축된 데이터센터에 지속 가능성 표준을 부과하고 있다"고 기술한다.



맥킨지가 인용한 설문조사에 따르면, 무어의 법칙이 끝남에 따라 데이터센터의 컴퓨팅 효율성 향상이 정체됐다(아래 차트 참조).

 

 

thumb-c57c266fa3e707e5d433ec2425add241_neXZuTAI_26eb69f2818ebab560c5ace42937da19f45bd4e4_600x363.jpg


오늘날의 환경에서 엔비디아 그레이스가 제공하는 2배의 성능 향상은 여러 세대를 뛰어넘는 놀라운 도약과 같으며, 데이터센터 관리업체들의 요구를 충족한다. 



240개 이상의 데이터센터를 관리하는 글로벌 서비스 제공업체인 에퀴닉스(Equinix)의 잭 스미스(Zac Smith) 엣지 인프라 총괄은 에너지 효율적인 컴퓨팅에 대한 기사에서 요구사항을 명확히 설명했다. 



그는 "탄소 배출량 대비 성능을 높여야 한다. 이러한 여정에서 10,000여개의 고객사가 에퀴닉스에 의존하고 있다. 고객들은 AI 등의 사용으로 더 많은 데이터와 인텔리전스를 요구하며, 이를 지속 가능한 방식으로 얻기를 바란다”고 말했다. 



세 가지 CPU 혁신


그레이스 CPU의 효율적인 성능 뒤에는 세 가지 혁신이 있다. 



먼저, 처리량의 표준 척도인 패브릭 바이섹션 대역폭에서 초당 3.2테라바이트를 자랑하는 단일 다이(die)에서 72개의 암 네오버스(Arm Neoverse) V2 코어를 연결하기 위해 초고속 패브릭을 연결한다. 그런 다음 슈퍼칩 패키지에 두 다이를 앤비디아 NV링크(NVLink)-C2C 인터커넥트와 연결하여 900GB/s의 대역폭을 제공한다. 



마지막으로, 그레이스는 서버급 LPDDR5X 메모리를 사용하는 최초의 데이터센터 CPU다. 그레이스 CPU는 같은 비용으로 최대 50% 더 많은 메모리 대역폭을 제공하지만 사용 전력은 일반적인 서버 메모리 사용 전력의 8분의 1에 불과하다. 또한 컴팩트한 크기로 일반적인 카드 기반 메모리 설계 밀도의 2배를 지원한다.

 

 

thumb-c57c266fa3e707e5d433ec2425add241_9rx32WCR_7f670f3d15d1f9368408698fc0be15aae8e5b890_600x314.jpg


현재의 x86 CPU에 비해, 엔비디아 그레이스는 더 단순한 설계로 더 많은 대역폭과 보다 적은 전력 사용량을 제공한다. 



첫 번째 테스트 결과


엔비디아 엔지니어는 현재 그레이스에서 실제 데이터센터 워크로드를 실행하고 있다. 



동일한 전력 공간을 사용하는 데이터센터의 주요 x86 CPU와 비교할 때 그레이스는 다음과 같은 결과를 보였다.


마이크로서비스의 경우 2.3배 더 빠른 속도

메모리 집약적 데이터 프로세싱에서 2배 더 빠른 속도

많은 기술 컴퓨팅 앱에서 사용되는 전산유체역학(CFD)에서 1.9배 더 빠른 속도 



데이터센터는 일반적으로 아래 차트에 요약된 이점들을 얻기 위해 두 개 이상의 CPU 세대를 기다려야 한다.

 

 

thumb-c57c266fa3e707e5d433ec2425add241_ldYxqt1B_0b385f0bb2af4de63bd1416ff7f3496b5f92ae6f_600x356.jpg


순이익(연한 녹색)은 서버 세대 간 발전(진한 녹색)과 그레이스의 에너지 효율성 덕분에 가능해진 동일한 x86 전력 엔벨롭(중간 막대)에 맞는 추가 그레이스 서버다. 



현재 구동 중인 CPU에서 이러한 결과를 얻기 이전에도 사용자는 그레이스의 혁신에 반응했다.


지난 5월, 로스 앨러모스 국립 연구소(Los Alamos National Laboratory)는 재료과학, 재생에너지 등 분야의 연구를 발전시킬 10 엑사플롭 AI 슈퍼컴퓨터인 베나도(Venado)에 그레이스를 사용할 것이라고 발표했다. 한편 유럽과 아시아의 데이터센터들은 워크로드에 대한 그레이스의 평가를 진행 중이다.


엔비디아 그레이스는 올해 하반기 생산을 위해 샘플링 중이다. 에이수스(ASUS), 아토스(Atos), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(HPE), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron), ZT 시스템즈(ZT Systems) 등이 그레이스를 사용하는 서버를 구축하고 있다. 


지속 가능한 컴퓨팅 자세히 알아보기


더 자세한 내용은 그레이스 아키텍처에 대한 백서에서 확인할 수 있다. 


엔비디아 GTC(3월 20~23일, 등록 시 무료)는 ‘엔드투엔드 AI 세상에서 조직의 지속 가능성과 성공을 극대화하기 위한 세 가지 전략(Three Strategies to Maximize Your Organization’s Sustainability and Success in an End-to-End AI World)’이라는 지속 가능한 컴퓨팅 관련 세션을 제공한다. 


엔비디아 블루필드(BlueField) DPU에 대한 백서에서는 에너지 효율적인 네트워크를 구축하는 방법을 확인할 수 있다. 


또한 엔비디아의 창립자 겸 CEO 젠슨 황(Jensen Huang)의 GTC 키노트에서 더 큰 그림을 확인할 수 있다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , , ,

0 Comments
많이 본 뉴스
인기기사