GPU 가속 솔루션 확대, 엔비디아 AWS와 협력

홈 > 최신뉴스 > 주요뉴스
주요뉴스

GTC | GPU 가속 솔루션 확대, 엔비디아 AWS와 협력

권경욱 기자 0   0

엔비디아(www.nvidia.co.kr)가 미국 새너제이에서 열린 세계 최대 AI·가속 컴퓨팅 콘퍼런스인 ‘엔비디아(NVIDIA) GTC 2026’에서 아마존웹서비스(Amazon Web Services, AWS)와 GPU 가속 솔루션 확대를 위해 협력한다고 밝혔다. 양사는 이번 협력을 통해 AWS 환경에서 엔비디아 기반 데이터 처리 기능을 확장하고, 엔비디아 네모트론(Nemotron) 오픈 모델 제품군에 대한 지원을 추가한다. 


2010년부터 엔비디아와 AWS는 인프라, 소프트웨어, 서비스를 아우르는 대규모의 비용 효율적이고 유연한 GPU 가속 솔루션을 제공하기 위해 협력해오고 있다. 이를 통해 양사는 실제 운영 환경에서 AI를 구축하고 배포할 때 솔루션 구현 시간을 단축하는 풀스택 제품군을 제공하고 있다. 


엔비디아 RTX PRO 4500으로 AWS에서 데이터 처리 가속화


새로운 엔비디아 RTX PRO 4500 블랙웰 서버 에디션(RTX PRO 4500 Blackwell Server Edition) GPU가 새로운 유형의 가속 컴퓨팅 아마존 EC2(Amazon EC2)를 통해 곧 AWS에 출시될 예정이다. 이를 통해 클라우드 환경에서도 엔비디아 블랙웰의 성능을 경험할 수 있게 된다. AWS는 엔비디아 RTX PRO 4500 지원을 발표한 최초의 클라우드 제공업체다. 이러한 아마존 EC2 인스턴스는 아마존 EMR과 함께 사용할 경우 데이터 처리 워크로드에 매우 적합하다. AWS 니트로 시스템(AWS Nitro System)을 기반으로 구축된 새로운 아마존 EC2 인스턴스는 데이터 처리 워크로드가 프로덕션 환경에서 필요로 하는 향상된 보안, 안정성, 리소스 효율성을 제공한다. 


엔비디아 네모트론, 세일즈포스 에이전트포스에 적용


엔비디아 네모트론 나노 3(Nemotron Nano 3) 모델이 세일즈포스(Salesforce) 에이전트포스(Agentforce)용 아마존 베드록(Amazon Bedrock) 모델로 제공된다. 이에 에이전트포스의 적용 범위가 배치 처리나 높은 동시 접속량을 요구하는 B2C 앱과 같은 새로운 고처리량 애플리케이션으로 확대됐다. 세일즈포스의 CRM용 에이전틱 벤치마크(Agentic Benchmark for CRM)에 따르면, 네모트론 3 나노는 요약과 생성 사용 사례에 있어 가장 비용 효율적인 모델이다. 


아마존 베드록에서 엔비디아 네모트론 모델용 강화 학습 파인튜닝 기능 출시 예정


개발자들은 곧 강화 학습 파인튜닝(reinforcement fine-tuning, RFT) 기능을 활용해 아마존 베드록에서 엔비디아 네모트론 모델을 직접 파인튜닝할 수 있게 된다. 이는 법률, 헬스케어, 금융 또는 기타 전문 분야 등 특정 영역에 맞춰 모델의 동작을 조정해야 하는 업무에 매우 중요한 기능이다. RFT를 통해 개발자는 모델이 단순히 무엇을 알고 있는지를 넘어, 어떻게 추론하고 반응하는지를 직접 설계할 수 있다. 네모트론 나노 3는 곧 RFT를 지원해 AWS 고객에게 해당 기능을 제공할 예정이다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , ,

0 Comments
많이 본 뉴스
인기기사