X86 프로세서 대비 1.8배 빠른 속도, 엔비디아 전 세계 AI 에이전트 구동 위한 ‘베라 CPU’ 출시

홈 > 최신뉴스 > 주요뉴스
주요뉴스

컴퓨텍스 | X86 프로세서 대비 1.8배 빠른 속도, 엔비디아 전 세계 AI 에이전트 구동 위한 ‘베라 CPU’ 출시

권경욱 기자 0   0

엔비디아(www.nvidia.co.kr)가 아시아 최대 ICT 전시회 컴퓨텍스(COMPUTEX) 2026을 맞이해 개최한 엔비디아 GTC 타이베이(NVIDIA GTC Taipei)에서 글로벌 기술 선도 기업들이 AI 에이전트를 위해 설계된 최초의 CPU인 엔비디아 베라(Vera)를 도입할 계획이라고 발표했다. 


엔비디아 베라는 현재 본격 양산 단계에 진입한 차세대 프로세서다. 이는 x86 CPU 대비 작업 완료 속도를 1.8배 향상시켜 에이전틱 AI, 강화학습, 데이터 처리 등 다양한 산업 분야의 워크로드를 지원해 데이터 센터의 토큰 수익을 증대시킨다. 


현재까지 약 250만 대가 출하된 엔비디아 그레이스TM(GraceTM) CPU의 성공을 기반으로, 베라는 에이전트가 단순한 질문 답변을 넘어 행동하고, 코드를 실행하며, 도구를 사용하고, 결과를 평가하는 등 최신 데이터센터의 가장 까다로운 AI 워크로드에서 CPU 성능과 에너지 효율성을 새로운 차원으로 끌어올린다. 


다양한 금융 업계 선도기업, 글로벌 AI 연구소, 하이퍼스케일러가 베라 CPU 도입을 검토하고 있으며, 여기에는 뉴욕증권거래소(NYSE), 앤트로픽(Anthropic), 오픈AI(OpenAI), 스페이스XAI(SpaceXAI), 바이트댄스(ByteDance), 코어위브(CoreWeave), 람다(Lambda), 네비우스(Nebius), 엔스케일(Nscale), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI) 등이 포함된다. 


엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “AI 에이전트가 컴퓨팅 자원의 최대 수요자가 될 것이다. 베라는 이를 위해 설계된 최초의 CPU로, 탁월한 성능, 효율성, 프로그래밍 유연성을 바탕으로 하이퍼스케일 환경에서 에이전틱 AI를 구동하도록 설계됐다”고 말했다. 


뉴욕증권거래소 그룹 사장 린 마틴(Lynn Martin)은 “뉴욕증권거래소는 독보적인 인프라의 기반이 되는 시스템의 지연 시간, 처리량, 신뢰성을 최적화하는 데 집중하고 있다. 뉴욕증권거래소는 하루에 1조 1천억 건 이상의 메시지를 처리한다. 레드판다(Redpanda)·HPE와 협력해 엔비디아 베라 CPU를 활용함으로써, 우리는 용량을 확장하는 동시에 지연 시간을 최적화하며, 고성능의 유연한 AI 기반 시장 인프라를 구축할 것”이라고 말했다. 


클로드(Claude)를 개발한 AI 혁신 기업 앤트로픽은 CPU 집중형 에이전틱 워크로드를 확장하기 위해 베라 도입을 검토 중이다. 


앤트로픽 컴퓨팅 부문 책임자 제임스 브래드버리(James Bradbury)는 “컴퓨팅 성능의 확장은 모델 성장에 있어 중요한 촉진제다. 에이전틱 워크로드를 해결하는 과정에서 베라가 생태계의 유망한 구성 요소로 부상하는 것을 지켜보게 돼 매우 기쁘다”고 말했다.


엔비디아 베라를 기반으로 한 OCI 슈퍼클러스터(Supercluster)는 하이퍼스케일 AI 슈퍼컴퓨팅의 새로운 시대를 열고 있다. 


OCI 수석 부사장 마헤시 티아가라잔(Mahesh Thiagarajan)은 “OCI는 훈련, 추론, 에이전틱 AI에 대한 급증하는 수요를 충족하기 위해 AI 인프라를 빠르게 확장하고 있다. 엔비디아 베라 CPU를 도입함으로써 OCI는 차세대 AI 환경 전반에서 높은 처리량의 추론과 데이터 처리 워크로드를 지원할 것”이라고 말했다. 


포로닉스(Phoronix)의 오픈소스 벤치마크 결과에 따르면, 엔비디아 베라는 코드 컴파일, 파이썬(Python), 자바(Java), 데이터베이스 처리를 포함한 에이전틱 워크로드 전반에서 가장 빠른 종합 성능을 보였다. 이러한 워크로드는 에이전트 도구 사용과 샌드박스 실행 등 최신 AI 인프라의 핵심 단계에 속하며, 더 빠른 CPU 성능은 더 높은 에이전트 처리량과 상호작용을 제공한다. 


에이전트 시대를 위한 맞춤형 CPU


AI 팩토리의 경제성은 코어(core) 중심에서 토큰(token)당 비용 중심으로 전환되고 있으며, 이에 따라 에이전트 작업, 데이터 처리, 오케스트레이션을 더 빠르고 효율적으로 수행할 수 있는 CPU가 필요하다. 


베라는 엔비디아의 맞춤형 CPU 코어인 올림푸스(Olympus)를 기반으로 설계돼, 파이썬 런타임, 샌드박스 코드 실행, 오케스트레이션 로직, 분석 파이프라인 등의 전환을 뒷받침하는 CPU 작업을 지원한다. 


베라는 더 많은 명령어를 처리하고, 애플리케이션 동작을 예측하며, 수많은 동시 실행 환경·쿼리·데이터 처리 작업 간에 데이터를 이동하도록 설계됐다. 베라는 88개의 올림푸스 코어, 공간적 멀티스레딩(Spatial Multithreading) 기술, 최대 1.2TB/s 대역폭의 LPDDR5X 메모리 서브시스템을 탑재했다. 이를 통해 에이전트는 CPU 병목 현상이 발생하는 단계에서 지연 시간을 줄일 수 있으며, AI 팩토리는 가속기를 지속적으로 가동할 수 있다. 


베라 CPU는 독립형 CPU 인프라부터 긴밀하게 결합된 가속 시스템까지 AI 팩토리 전반에 도입할 수 있다. 베라는 AI 팩토리가 더 높은 엔드투엔드 처리량과 더 빠른 솔루션을 제공하도록 지원하며, 훈련, 추론, 에이전트 실행 전반에 걸쳐 응답성과 효율성을 향상시킨다. 


베라는 2세대 엔비디아 NV링크TM-C2C 인터커넥트(NVLinkTM-C2C interconnect) 기술을 통해 엔비디아 베라 루빈 플랫폼의 호스트 CPU 역할을 수행한다. 이 기술은 CPU와 GPU 간 최대 1.8TB/s의 코히어런트 대역폭을 제공한다. 또한 랙 규모로 엔비디아 컨피덴셜 컴퓨팅(Confidential Computing)을 확장해 에이전틱 워크로드를 보호한다. 


엔비디아 베라 블루필드-4 STX(Vera BlueField-4 STX) 프로세서는 베라를 고성능 네트워킹, 스토리지 가속화, 온칩 보안 기능과 통합해 설계 단계부터 보안을 고려한 AI 네이티브 데이터 플랫폼을 구축한다. 


광범위한 생태계 지원


베라 CPU는 대규모 에이전틱 AI와 강화학습 환경을 위한 고밀도 수냉식 랙과 엔터프라이즈, 클라우드, 데이터 처리, AI 팩토리 구축을 위한 유연한 2소켓 공랭식 시스템으로 제공된다. 


베라 CPU 기반 시스템을 제공하는 주요 인프라 공급업체는 에이브레스(Aivres), 애즈락 랙(ASRock Rack), 에이수스(ASUS), 컴팔(Compal), 델(Dell), 폭스콘(Foxconn), 기가바이트(GIGABYTE), HPE, 하이브 솔루션스(Hyve Solutions), 인벤텍(Inventec), 레노버(Lenovo), 미텍 컴퓨팅(MiTAC Computing), MSI, 페가트론(Pegatron), 퀀타 클라우드 테크놀로지(Quanta Cloud Technology, QCT), 슈퍼마이크로(Supermicro), 위스트론(Wistron), 위윈(Wiwynn) 등이 있다. 주요 OEM 업체인 델, HPE, 레노버, 슈퍼마이크로는 x86을 넘어서는 최초의 표준 CPU인 베라를 독립형 CPU 서버 구성으로 제공할 예정이다. 


베라 CPU 도입 예정인 주요 클라우드 서비스 제공업체로는 아카마이(Akamai), 바이트댄스, 클라우드플레어(Cloudflare), 코어위브, 크루소(Crusoe), 람다, 네비우스, 엔스케일, OCI, 레드판다, 스타버스트(Starburst), 투게더 AI(Together AI), 벌처(Vultr) 등이 있다. 


출시 일정


베라 시스템은 올해 가을부터 시스템 제조사와 클라우드 파트너사를 통해 공급될 예정이다. 


엔비디아 GTC 타이베이(GTC Taipei)에서 젠슨 황 CEO의 기조연설을 시청하고 자세한 내용을 확인할 수 있다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , , , , , , , , , ,

0 Comments
맨위로↑