컴퓨텍스 | 엔비디아 RTX PC·DGX 스파크, 로컬 AI 에이전트 기능 강화
엔비디아(www.nvidia.co.kr)가 아시아 최대 ICT 전시회 컴퓨텍스(COMPUTEX) 2026을 맞이해 개최한 엔비디아 GTC 타이베이(NVIDIA GTC Taipei)에서 개인용 에이전트를 위한 새로운 등급의 윈도우(Windows) PC인 엔비디아 RTX 스파크(RTX Spark)를 공개했다. 동시에 엔비디아 RTX, DGX 생태계 전반에서 로컬 에이전트를 확장하는 다양한 업데이트를 함께 발표했다.
최근 개인용 에이전트는 빠르게 인기를 얻고 있으며, 오픈클로(OpenClaw), 헤르메스(Hermes)와 같은 오픈소스 프로젝트는 깃허브(GitHub) AI 개발자 커뮤니티에서 빠르게 확산되고 있다. 이러한 에이전트는 개인의 선호와 워크플로우에 맞게 적응하도록 설계됐으며, 애플리케이션과 상호작용하고 콘텐츠를 생성하며 반복 작업을 자동화할 수 있다. 또한 다단계 작업을 관리할 수 있으며, 이 모든 과정은 디바이스에서 로컬로 실행된다.
![]()
보안성과 프라이버시를 유지하면서 에이전트를 실행하려면 충분한 성능을 갖춘 하드웨어가 필요하다. RTX 스파크는 1페타플롭의 AI 컴퓨팅 성능과 128GB 통합 메모리를 통해 온디바이스 에이전트의 컴퓨팅 수요를 충족할 수 있다. 동시에 단순한 도구에서 동료로 진화하는 컴퓨터의 새로운 패러다임을 제시한다. AI, 창작, 게이밍을 위해 설계된 RTX 스파크는 엔비디아의 30년 기술 혁신을 윈도우 노트북과 종일 지속되는 배터리 수명, 그리고 고효율 데스크톱 PC에 접목한다.
엔비디아와 윈도우의 파트너십은 개인용에서 엔터프라이즈 솔루션까지 확장된다. 엔비디아는 GTC 타이베이에서 윈도우용 엔비디아 DGX 스테이션(DGX Station)을 공개했다. 이는 전문가를 위한 최상급 AI 데스크사이드 슈퍼컴퓨터로, 관리성, 보안성, 호환성을 갖춘 점이 특징이다. 또한 윈도우 데스크톱 시스템에서 데이터센터급 GPU와 CPU 기반 추론 성능을 제공한다.
추가 발표 내용은 다음과 같다.
엔비디아 오픈쉘(OpenShell) 런타임은 윈도우에 도입된다. 이는 마이크로소프트(Microsoft)의 새로운 에이전트 보안 프리미티브를 기반으로 구축돼 개발자들이 온디바이스 보안 에이전트를 손쉽게 배포할 수 있도록 지원한다. 헤르메스 에이전트와 오픈클로 역시 오픈쉘과 마이크로소프트 보안 프리미티브를 자사 윈도우 애플리케이션에 통합할 예정이다.
엔비디아 네모클로(NemoClaw) 블루프린트는 지포스(GeForce) RTX, RTX PRO, RTX, DGX 스파크(DGX Spark), DGX 스테이션 등 엔비디아 로컬 AI 전 제품군으로 확장되며, 신규 통합 설치 프로그램과 헤르메스 에이전트 지원을 제공한다.
라마.cpp(llama.cpp)와 vLLM에서는 멀티 토큰 예측 기반 추론을 통해 주요 에이전틱 모델에서 2배의 추론 성능 향상이 구현됐다. 라마.cpp와 컴피UI(ComfyUI) 전반에는 멀티 GPU 최적화가 추가됐다.
H 컴퍼니(H Company)는 RTX와 DGX PC에 최적화된 컴퓨터 사용 도구를 출시하며, 신규 모델과 데스크톱 에이전트 하네스를 포함한 솔루션을 선보인다.
어도비(Adobe)는 포토샵(Photoshop)과 프리미어(Premiere)를 전면 재구성하고 있으며, 블렌더(Blender)는 엔비디아 DLSS 4.5 레이 리컨스트럭션(Ray Reconstruction)을 추가 지원한다. 또한 엔비디아는 RTX 비디오 프레임 생성(RTX Video Frame Generation)을 공개했으며, 해당 기능은 컴피UI에 적용될 예정이다. 이 모든 업데이트는 RTX 스파크 출시와 함께 올가을 제공된다.
엔비디아 브로드캐스트(Broadcast) 2.2 업데이트는 스튜디오 보이스(Studio Voice) 기능 개선과 엘가토 스트림 덱(Elgato Stream Deck) 지원을 포함하며, 엔비디아 프로젝트 G-어시스트(Project G-Assist) 역시 스트림 덱 통합 기능을 추가한다.
로컬 에이전틱 AI, 윈도우 RTX PC에서 개인화·보안·고속 실행
광범위한 에이전트 도입은 개인용 PC에서 에이전트를 안전하고 프라이빗하게 실행할 수 있는 환경이 부족하다는 한계로 제한돼 왔다.
엔비디아와 마이크로소프트는 이러한 과제를 해결하고자, 온디바이스 에이전트를 위한 강력하고 보안성이 강화된 윈도우 플랫폼을 공동으로 구축하고 있다.
이번 협력은 새로운 윈도우 보안 프리미티브와 엔비디아 오픈쉘 런타임을 기반으로 시작되며, 에이전트가 안전하게 실행되고 사용자 통제 하에 운영될 수 있도록 설계됐다.
새로운 윈도우 프리미티브는 에이전트를 네이티브 환경에서 구축·실행할 수 있도록 사용자 인증, 격리, 정책, 엔드투엔드 보안 기능을 제공한다. 엔비디아 오픈쉘은 사용자가 에이전트의 수행 가능 범위와 제한 사항을 정의할 수 있도록 추가적인 정책 기능을 지원한다. 또한 사용자의 개인정보 정책에 따라 요청을 로컬 모델로 지능적으로 전달하며, 클라우드 모델로 전송되는 요청에서는 개인정보를 자동으로 보호한다.
이러한 강력한 보안, 프라이버시 기능은 헤르메스 에이전트와 오픈클로 등 주요 에이전트 개발자들에 의해 새로운 윈도우 애플리케이션에 도입되고 있다. 해당 앱들은 윈도우 애플리케이션 환경에서 온디바이스 에이전트에 쉽게 접근할 수 있도록 하며, 시맨틱(semantic) 로컬 파일 검색, 앱 간 워크플로우 추론, 이미지·비디오 생성, 플러그인·앱 코드 작성 등 다양한 작업을 수행할 수 있다.
로컬 디바이스에서 에이전트를 구동하기 위해서는 강력한 보안뿐 아니라 높은 성능의 하드웨어가 필요하다. RTX 스파크는 최대 1페타플롭의 AI 컴퓨팅 성능과 128GB 통합 메모리를 제공해 온디바이스 에이전트의 컴퓨팅 수요를 충족한다.
또한 엔비디아는 에이전트가 활용하는 로컬 오픈 모델 생태계를 가속하고 있다.
엔비디아는 라마.cpp 커뮤니티와 협력해 멀티 토큰 예측(multi-token prediction, MTP)과 같은 기능의 최적화를 구현했다. 이는 소형 드래프트 모델이 여러 토큰을 동시에 제안하고, 타깃 모델이 이를 한 번에 검증하는 추측 디코딩(speculative decoding) 기법이다. 해당 기술과 프로그램 기반 실행 최적화를 통해 큐원(Qwen) 3.6과 3.5 27B 모델에서는 최대 2배, 큐원 3.6과 3.5 35B 모델에서는 1.6배의 성능 향상이 구현됐다. 이러한 업데이트는 라마.cpp 웹UI(webUI)와 LM 스튜디오(LM Studio)를 통해 제공된다.
![]()
라마.cpp에서 최신 엔비디아 최적화를 통한 성능 향상이 확인됐다. 큐원 3.6-27B는 지포스 RTX 5090에서 최대 2배 처리량을 제공하며, 큐원 3.6-35B 모델은 최대 1.6배 향상을 달성했다. 이를 통해 오픈소스 커뮤니티 협업으로 로컬 에이전틱 AI 워크로드가 가속된다.
엔비디아는 멀티 GPU 환경을 보유한 AI 애호가를 위해, 오픈소스 커뮤니티와 협력해 두 가지 주요 로컬 AI 도구를 강화했다.
라마.cpp는 텐서 병렬 처리를 추가해 동일한 GPU 2개 구성에서 최대 2배의 메모리 확장과 1.8배의 컴퓨팅 성능 향상을 제공한다.
컴피UI는 신규 분류기 없는 가이던스(classifier-free guidance) 방식을 통해 동일한 GPU 2개 환경에서 최대 2배 성능 향상을 구현했다. 모델 체인을 여러 GPU로 분할해 결합된 메모리를 활용할 수 있는 기능도 지원한다.
![]()
라마.cpp의 텐서 병렬 멀티 GPU 기법은 파이프라인 병렬과 단일 GPU 추론 방식 대비 토큰 생성 성능 향상을 제공한다.
![]()
컴피UI에서 멀티 GPU 기법은 생성 시간 성능 향상을 제공한다.
한편 엔비디아는 H 컴퍼니와 협력해 에이전트 기능을 확장하고 있다. H 컴퍼니의 컴퓨터 사용(computer-use) 하네스는 에이전트가 화면을 인식하고 마우스와 키보드를 직접 조작해 사용자처럼 PC를 탐색할 수 있도록 지원하며, 애플리케이션 프로그래밍 인터페이스가 없는 앱에서도 작동한다. 해당 기능은 로컬 모델 지원과 함께 RTX, DGX PC에 곧 제공될 예정이다.
또한 엔비디아는 H 컴퍼니와 협력해 최신 홀로 컴퓨터 유즈(Holo Computer Use) 모델을 양자화하고 하네스를 가속했다. 이를 통해 엔비디아 GPU에서 2배의 속도 향상과 35%의 메모리 사용량 절감을 달성했다. 해당 모델은 현재 다운로드 가능하며, 홀로 데스크톱(Holo Desktop) 앱은 곧 출시될 예정이다.
리눅스 에이전트 최적화
엔비디아 DGX 스파크는 리눅스(Linux) 환경을 지원하는 가장 강력한 개인용 에이전트 AI 컴퓨터다. 항상 접근 가능한 로컬 에이전트를 필요로 하는 개발자를 겨냥하며, 대용량 메모리, 고속 컴퓨팅 성능, 엔비디아 쿠다(CUDA) 생태계와의 호환성을 통합한다.
이번 DGX 스파크 OS 발표는 더욱 간소화된 네모클로 설치 프로그램을 포함해 기본 사용 경험을 크게 개선했으며, 주요 에이전틱 모델 전반에서 빠른 추론 성능을 제공한다.
네모클로는 리눅스와 리눅스용 윈도우 하위 시스템(Windows Subsystem for Linux, WSL)을 포함한 모든 엔비디아 RTX, DGX PC에서 사용할 수 있다. 새롭게 간소화된 설치 프로그램을 통해 리눅스에서 로컬 에이전트를 안전하게 배포할 수 있으며, 자동 샌드박싱과 헤르메스 에이전트 추가 지원을 활용할 수 있다.
또한 엔비디아는 vLLM과 협력해 에이전트 추론을 최적화했으며, vLLM 개선 사항과 함께 큐원 3.6 35B용 최적화 NVFP4 체크포인트를 새롭게 제공했다. 해당 업데이트는 기존 언슬로스(Unsloth) NVFP4 대비 DGX 스파크에서 최대 2.6배 성능 향상을 제공하며, 커널 개선, 혼합 정밀도 지원, MTP를 위한 쿠다 그래프(Graph) 지원 등이 포함된다.
vLLM 블로그에서 DGX 스파크 기반 NVFP4 전문가 혼합(mixture-of-experts, MOE) 모델 서비스 방법을 확인할 수 있다. 해당 블로그에서는 통합 메모리 튜닝부터 엔비디아 네모트론 3 슈퍼(Nemotron 3 Super) 레퍼런스 구성까지 전 과정을 소개한다.
어도비와 협력해 창작 경험 강화
엔비디아는 어도비와 협력해 RTX 스파크에 최적화된 어도비 프리미어와 포토샵 아키텍처를 전면 재구성하고 있다. 포토샵 파이어플라이(Firefly) 기반 생성형 채우기(Generative Fill)와 프리미어 생성형 확장(Generative Extend) 등 수백 개의 가속화된 기능은 창작 역량, 정밀도, 제어력을 향상시키는 핵심 요소로 작동한다. RTX 스파크는 이러한 기능을 한 단계 확장해 크리에이티브 워크플로우 전반에서 AI, 편집, 색 보정, 효과 성능을 최대 2배까지 향상시킨다.
어도비 프리미어는 RTX 스파크의 통합 메모리, 블랙웰 GPU, 텐서RT(TensorRT) 소프트웨어를 활용하는 새로운 비디오 파이프라인을 도입한다. 이를 통해 실시간 편집과 색 보정 성능, GPU 가속 AI 처리, 복잡한 타임라인 렌더링 효율성을 제공한다. 또한 어도비 서브스턴스 3D 페인터(Substance 3D Painter)와 스테이저(Stager)는 RTX 스파크에서 네이티브로 실행돼 더욱 부드럽고 반응성이 높은 3D 텍스처와 장면 제작 워크플로우를 구현한다.
어도비의 차세대 포토샵 엔진은 GPU 가속 합성에 최적화된다. 이를 통해 라이브 필터, 하이 다이내믹 레인지(high dynamic range, HDR), 자연스러운 브러시 작업을 지원하며, AI 네이티브 파이프라인을 통해 텐서RT를 포함한 RTX 스파크의 전체 성능을 활용할 수 있다.
어도비는 프리미어와 포토샵을 윈도우 에이전트와 연동해 사용자가 창작, 편집, 디자인 작업을 에이전트와 협업 형태로 수행할 수 있도록 확장할 예정이다.
프리미어, 포토샵, 서브스턴스 등 주요 어도비 크리에이티브 앱 업데이트는 RTX 스파크 출시와 함께 순차적으로 제공될 예정이다.
크리에이터를 위한 신규 도구와 앱 업데이트
신규 엔비디아 플랫폼 업데이트와 파트너 앱 최적화는 RTX 생태계 전반에서 순차적으로 적용되고 있다. 일부는 현재 이용 가능하며, 일부는 올가을 RTX 스파크와 함께 출시될 예정이다.
엔비디아 브로드캐스트 2.2는 AI 기능인 스튜디오 보이스를 베타에서 정식 기능으로 전환했다. 해당 기능은 모든 마이크를 스튜디오 수준의 음질로 향상시키며, 현재 지포스 RTX 3060 이상 GPU에서 성능 개선을 가져온다. 또한 엘가토 스트림 덱 통합과 사용자 설정이 가능한 단축키 기능도 추가됐다.
프로젝트 G-어시스트는 엘가토 MCP 서버를 통해 스트림 덱 지원을 추가하며, 사용자가 스트리밍 환경에서 AI 어시스턴트 기능을 보다 쉽게 활용할 수 있도록 만든다.
블렌더 사이클(Cycles)은 DLSS 4.5 레이 리컨스트럭션을 신규 디노이저로 활용하고 있으며, 패스 트레이싱 뷰포트를 실시간 인터랙티브 환경으로 전환하고 있다. 이를 통해 3D 아티스트는 장면을 이동하면서 최종본에 가까운 렌더링 품질을 실시간으로 확인할 수 있고, 조명과 룩 개발 워크플로우가 크게 개선된다. 해당 업데이트는 블렌더 5.3과 함께 올가을 RTX 스파크 출시 일정에 맞춰 제공될 예정이다.
RTX 스파크와 함께 출시되는 RTX 비디오 프레임 생성은 실시간으로 비디오 프레임 속도를 2배 또는 4배까지 향상시키는 신규 AI 효과다. 통상적으로 AI 모델이 생성하는 15~20 FPS 수준의 출력 품질을 개선하는 데 적합하며, 파이썬(Python) 휠 형태와 컴피UI 노드로 제공된다. 이를 통해 AI 아티스트는 낮은 FPS로 생성된 비디오를 보다 부드러운 재생 속도로 빠르게 보간할 수 있다.
RTX AI 개러지 최신 업데이트 사항
슈퍼칩, 윈도우 에이전트 관련 엔비디아 소식, 파트너 노트북과 소형 데스크톱에 대한 자세한 내용은 RTX 스파크 전체 발표를 통해 확인할 수 있다.
에이수스 프로아트(ASUS ProArt) 크리에이터 노트북은 블랙 포레스트 랩스(Black Forest Labs)의 증류 이미지 모델인 플럭스.2 클라인 4B(FLUX.2 Klein 4B)를 탑재하며, 이는 뮤즈트리(MuseTree) 앱을 통해 사전 설치된다. 해당 모델은 NVFP4 포맷과 엔비디아 텐서RT 기반 RTX 소프트웨어 개발 키트에 최적화돼 있다. 이를 통해 크리에이터는 최대 2.5배의 성능 향상과 560%의 메모리 절감 효과를 누릴 수 있으며, 별도의 모델 다운로드나 컴피UI 설정 없이 로컬 이미지 생성이 가능하다.
엔비디아 미디어용 AI(AI for Media) 소프트웨어 개발 키트에 신규 업데이트가 적용되며, 프랑스어, 독일어, 스페인어에 최적화된 립싱크(LipSync) 엔비디아 NIM 마이크로서비스가 추가된다. 또한 액티브 스피커 디텍션(Active Speaker Detection) NIM 마이크로서비스는 멀티 카메라 지원과 비디오 간 화자 상관관계 분석을 제공한다.
최신 RTX AI 개러지(RTX AI Garage) 블로그에서는 헤르메스 에이전트와 RTX PC, DGX 스파크에서의 AI 업데이트를 확인할 수 있다.
페이스북(Facebook), 인스타그램(Instagram), 틱톡(TikTok), X에서 RTX 스파크에 연결하고 RTX 스파크 뉴스레터를 구독해 최신 소식을 받아볼 수 있다.
여기에서 소프트웨어 제품 정보 약관을 확인할 수 있다.
엔비디아, NVIDIA, 컴퓨텍스, COMPUTEX, 2026, RTX PC, DGX 스파크, RTX Spark, 로컬 AI, 에이전트, 기능, 강화








