AI 성능 대폭 강화, 엔비디아 마이크로소프트와 함께 RTX AI PC 생태계 확장

홈 > 최신뉴스 > 주요뉴스
주요뉴스

IT | AI 성능 대폭 강화, 엔비디아 마이크로소프트와 함께 RTX AI PC 생태계 확장

권경욱 기자 0   0

엔비디아(www.nvidia.co.kr)가 마이크로소프트(Microsoft)와 협력해 RTX AI PC를 위한 다양한 기능과 개발자 도구를 통해 AI 생태계 전반을 확장하고 있다고 밝혔다. 


RTX AI PC용으로 새롭게 설계된 엔비디아 텐서RT(NVIDIA TensorRT)는 윈도우 ML(Windows ML)을 통해 제공되며, 고성능 AI 실행 환경을 지원한다.



thumb-d300975fc34146b6debad75edcf19a56_4zKDG60n_45574cc7d69a166c5dcb409692005a61c4f7b2f8_600x315.jpg


생성형 AI는 디지털 휴먼부터 글쓰기 도우미, 지능형 에이전트, 크리에이티브 도구에 이르기까지 PC 소프트웨어를 획기적인 경험으로 변화시키고 있다. 


엔비디아 RTX AI PC는 생성형 AI 실험을 더 쉽게 시작하고, 윈도우 11에서 더 뛰어난 성능을 발휘할 수 있도록 지원하는 기술로 이러한 변화를 주도하고 있다. 


엔비디아 텐서RT가 RTX AI PC를 위해 새롭게 설계됐다. 업계 최고 수준의 텐서RT 성능과 함께 적시 온디바이스 엔진 구축과 기존 대비 8배 더 작은 패키지 크기를 통해 1억 대 이상의 RTX AI PC에 AI를 원활하게 배포할 수 있도록 돕는다. 


마이크로소프트 빌드(Microsoft Bulid)에서 발표된 RTX용 텐서RT는 앱 개발자에게 광범위한 하드웨어 호환성과 최첨단 성능을 모두 제공하는 새로운 추론 스택인 윈도우 ML에서 기본적으로 지원된다. 


엔비디아는 AI 기능을 통합하려는 개발자를 위해 엔비디아 DLSS부터 엔비디아 RTX 비디오(RTX Video)와 같은 멀티미디어 향상 기능까지 다양한 소프트웨어 개발 키트(software development kits, SDKs) 옵션을 제공한다. 이번 달에는 오토데스크(Autodesk), 빌리빌리(Bilibili), 카오스(Chaos), LM 스튜디오(LM Studio), 토파즈 랩스(Topaz Labs)의 인기 소프트웨어 애플리케이션에서 RTX AI 기능과 가속화를 위한 업데이트를 출시할 예정이다. 


AI 애호가와 개발자는 엔비디아 NIM을 사용해 AI를 쉽게 시작할 수 있다. 이는 애니띵LLM(AnythingLLM), 마이크로소프트 VS 코드(VS Code), 컴피UI(ComfyUI)와 같은 인기 앱에서 실행 가능한 사전 패키징, 최적화된 AI 모델이다. 이번 주에 출시되는 플럭스.1-쉬넬(FLUX.1-schnell) 이미지 생성 모델은 NIM 마이크로서비스로 제공되며, 인기 있는 플럭스.1-데브(dev) NIM 마이크로서비스는 더 많은 RTX GPU를 지원하도록 업데이트됐다. 


엔비디아 앱 내 RTX PC AI 어시스턴트인 프로젝트 G-어시스트(Project G-Assist)는 코딩 없이 간단한 AI 개발을 시작하고자 하는 사용자들을 지원한다. 이를 통해 자연어 기반 AI로 PC 앱과 주변기기를 제어하는 플러그인을 직접 구축할 수 있다. 아울러 구글 제미나이(Google Gemini) 웹 검색, 스포티파이(Spotify), 트위치(Twitch), IFTTT, 시그널RGB(SignalRGB)등 새로운 커뮤니티 플러그인도 현재 제공되고 있다. 


RTX용 텐서RT로 가속화된 AI 추론


오늘날의 AI PC 소프트웨어 스택을 사용하려면 성능을 타협하거나 특정 하드웨어에 대한 사용자 지정 최적화에 투자해야 한다. 


윈도우 ML은 이러한 문제를 해결하기 위해 개발됐다. 윈도우 ML은 ONNX 런타임(ONNX Runtime) 기반으로 구동되며, 각 하드웨어 제조업체에서 제공하고 유지 관리하는 최적화된 AI 실행 레이어에 원활하게 연결된다. 


지포스(GeForce) RTX GPU의 경우, 윈도우 ML은 높은 성능과 빠른 배포를 위해 RTX용 텐서RT 추론 라이브러리를 자동으로 사용한다. 다이렉트ML(DirectML)과 비교했을 때, 텐서RT는 PC에서 AI 워크로드를 처리하는 데 50% 이상 빠른 성능을 제공한다.



thumb-d300975fc34146b6debad75edcf19a56_SCs78jOW_e361a86bb7b2b6834231331fbe0ae50c472353ca_600x368.jpg

텐서RT는 PC에서 AI 워크로드에 다이렉트ML보다 50% 이상 빠른 성능을 제공한다. 성능은 지포스 RTX 5090에서 측정됐다. 


또한 윈도우 ML은 개발자의 QoL(Quality of Life) 측면에서도 다양한 이점을 제공한다. 각 AI 기능을 실행하는 데 가장 적합한 하드웨어(GPU, CPU, NPU)를 자동으로 선택하고, 해당 하드웨어에 맞는 실행 공급자를 다운로드해 해당 파일을 앱에서 패키징할 필요가 없게 한다. 이로써 최신 텐서RT 성능 최적화가 준비되는 즉시 사용자에게 제공될 수 있다.


 

thumb-d300975fc34146b6debad75edcf19a56_cIqfKp2R_41d086b15850068f7e2e8d46dde3ad3ed00a393d_600x457.jpg

텐서RT 성능 최적화는 준비되는 즉시 사용자에게 제공된다. 


텐서RT는 원래 데이터센터용으로 구축된 라이브러리였지만, RTX AI PC를 위해 새롭게 설계됐다. RTX용 텐서RT는 텐서RT 엔진을 사전 생성해 앱과 함께 패키징하는 대신, 적시에 온디바이스 엔진을 구축해 사용자의 특정 RTX GPU에 최적화된 AI 모델 실행을 수 초 내에 처리할 수 있다. 또한 라이브러리 패키징 방식이 간소화돼 파일 크기가 기존 대비 8배까지 크게 줄었다. 


RTX용 텐서RT는 현재 윈도우 ML 프리뷰를 통해 제공되고 있으며, 6월부터는 엔비디아 개발자(NVIDIA Developer) 포털에서 독립형 SDK로 제공될 예정이다. 


개발자는 RTX용 텐서RT 출시 블로그 또는 마이크로소프트의 윈도우 ML 블로그에서 자세한 내용을 확인할 수 있다. 


윈도우 11 PC에서 AI 생태계 확장


AI 기능을 추가하거나 앱 성능을 향상시키려는 개발자는 광범위한 엔비디아 SDK를 활용할 수 있다. 여기에는 GPU 가속화를 위한 엔비디아 쿠다(CUDA)와 텐서RT, 3D 그래픽을 위한 엔비디아 DLSS와 옵틱스(Optix), 멀티미디어를 위한 엔비디아 RTX 비디오와 맥신(Maxine), 생성형 AI를 위한 엔비디아 리바(Riva)와 ACE가 포함된다. 


이번 달에는 다음과 같은 인기 애플리케이션에서 엔비디아 SDK를 기반으로 한 기능 업데이트를 통해 차별화된 AI 기능을 선보인다. 


l  LM 스튜디오는 최신 쿠다 버전으로 앱을 업데이트해 성능을 30% 이상 향상시켰다.


l  토파즈 랩스는 쿠다로 가속된 생성형 AI 비디오 모델을 출시해 영상 품질을 향상시킬 예정이다.


l  카오스 엔스케이프(Enscape)와 오토데스크 VRED는 더 빠른 성능과 더 나은 이미지 품질을 위해 DLSS 4를 추가한다.


l  빌리빌리는 실시간 스트리밍의 품질을 향상시키기 위해 버추얼 백그라운드(Virtual Background)와 같은 엔비디아 브로드캐스트(Broadcast) 기능을 통합하고 있다. 


엔비디아는 윈도우 ML과 텐서RT 통합을 통해 마이크로소프트와 주요 AI 앱 개발자들과의 협력을 지속하며 RTX 기반 시스템에서 AI 기능을 가속화하도록 지원할 예정이다. 


NIM 마이크로서비스와 AI 블루프린트로 쉽게 만드는 로컬 AI


PC에서 AI 개발을 시작하는 일은 많은 진입 장벽이 존재한다. AI 개발자와 애호가들은 허깅페이스(Hugging Face)에서 120만 개가 넘는 AI 모델 중에서 적절한 모델을 선택하고, 이를 PC에서 잘 실행되는 방식으로 양자화해야 한다. 또한, 이를 실행하기 위한 모든 종속성을 찾아 설치하는 등의 작업을 수행해야 한다. 


엔비디아 NIM은 이러한 과정을 단순화한다. RTX GPU에서 최대 성능을 낼 수 있도록 최적화되고, 실행에 필요한 모든 파일이 포함된 AI 모델 리스트를 사전 패키징된 형태로 제공한다. 또한 컨테이너화돼 있으므로 동일한 NIM 마이크로서비스를 PC 또는 클라우드에서 원활하게 실행할 수 있다. 


엔비디아 NIM 마이크로서비스는 build.nvidia.com을 통해 다운로드하거나 애니띵LLM, 컴피UI, 비주얼 스튜디오 코드용 AI 툴킷(AI Toolkit for Visual Studio Code)과 같은 인기 AI 앱을 통해 다운로드 할 수 있다. 


컴퓨텍스(COMPUTEX) 기간 동안 엔비디아는 빠른 이미지 생성을 위한 블랙 포레스트 랩스(Black Forest Labs)의 이미지 생성 모델인 플럭스.1-쉬넬 NIM 마이크로서비스를 출시할 예정이다. 또한 광범위한 지포스 RTX 50과 40 시리즈 GPU에 대한 호환성을 추가하기 위해 플럭스.1-데브 NIM 마이크로서비스를 업데이트할 예정이다. 


이러한 NIM 마이크로서비스는 텐서RT와 양자화된 모델에서 더 빠른 성능을 지원한다. 특히, 엔비디아 블랙웰(Blackwell) GPU에서는 FP4와 RTX 최적화 덕분에 기본적으로 실행하는 것보다 두 배 이상 빠르게 작동한다.



thumb-d300975fc34146b6debad75edcf19a56_L3BioSET_f4c2dd9e6743d939f97d1ce1ae4773e824c8f15c_600x380.jpg

플럭스X.1-쉬넬(FLUX.1-schnell) NIM 마이크로서비스는 FP4와 RTX 최적화를 통해 엔비디아 블랙웰 GPU에서 두 배 이상 빠르게 실행된다. 


AI 개발자는 NIM 마이크로서비스를 사용하는 샘플 워크플로우와 프로젝트인 엔비디아 AI 블루프린트(AI Blueprint)로 작업을 바로 시작할 수도 있다. 


엔비디아는 지난달 3D 장면을 레퍼런스로 사용해 생성된 이미지의 구도와 카메라 각도를 제어하는 강력한 방법인 3D 가이드 생성형 AI를 위한 엔비디아 AI 블루프린트를 출시했다. 개발자는 필요에 따라 오픈소스 블루프린트를 수정하거나 추가 기능으로 확장할 수 있다. 


프로젝트 G-어시스트용 신규 플러그인과 샘플 프로젝트 공개


엔비디아는 최근 실험적인 AI 어시스턴트인 프로젝트 G-어시스트를 엔비디아 앱에 통합해 출시했다. G-어시스트를 통해 사용자는 간단한 음성과 텍스트 명령어로 지포스 RTX 시스템을 제어할 수 있으며, 다양한 기존 제어판에 분산됐던 수동 설정 방식보다 훨씬 편리한 인터페이스를 제공한다. 


또한 개발자는 프로젝트 G-어시스트를 사용해 플러그인을 쉽게 구축하고, 어시스트 사용 사례를 테스트한 후, 엔비디아 디스코드(Discord)와 깃허브(GitHub)를 통해 이를 게시할 수 있다. 


프로젝트 G-어시스트 플러그인 빌더(Plug-in Builder)는 자연어 명령으로 노코드 또는 로우코드 개발이 가능한 챗GPT(ChatGPT) 기반 앱으로, 플러그인 제작을 쉽게 시작할 수 있도록 지원한다. 커뮤니티가 주도하는 이 경량화된 플러그인은 간단한 JSON 정의와 파이썬(Python) 로직을 사용한다. 


새로운 오픈소스 플러그인 샘플은 현재 깃허브에서 사용할 수 있다. 이는 온디바이스 AI가 PC와 게임 워크플로우를 향상시킬 수 있는 다양한 방법을 보여준다. 대표적인 샘플은 다음과 같다. 


l  제미나이: 구글의 클라우드 기반 무료 거대 언어 모델(large language model, LLM)을 사용하는 기존 제미나이 플러그인이 실시간 웹 검색 기능을 포함하도록 업데이트됐다.


l  IFTTT: 사용자가 수백 개의 호환 가능한 엔드포인트에서 자동화를 생성해 실내 조명이나 스마트 그림자 조정, 또는 최신 게임 뉴스를 모바일 디바이스로 전송하는 등 IoT 루틴을 생성할 수 있는 플러그인이다.


l  디스코드: 게임 플레이를 방해하지 않고 게임 하이라이트나 메시지를 디스코드 서버에 직접 쉽게 공유할 수 있는 플러그인이다. 


이 외에도 깃허브 리포지토리에서 스포티파이를 통한 핸즈프리 음악 제어, 트위치를 통한 실시간 스트리밍 상태 확인 등 더 많은 예시를 확인할 수 있다. 


기업들은 새로운 PC 인터페이스로 AI를 채택하고 있다. 예를 들어 시그널RGB는 여러 제조업체의 조명을 통합 제어할 수 있는 G-어시스트 플러그인을 개발 중이다. 사용자는 곧 시그널RGB 앱에서 이 플러그인을 직접 설치할 수 있게 될 것이다.



thumb-d300975fc34146b6debad75edcf19a56_qynlVCfW_5deb66a64c557c92464a81f498d712531ddc2857_600x238.jpg

곧 시그널RGB의 G-어시스트 플러그인을 통해 여러 제조업체의 통합 조명 제어가 가능해질 예정이다. 


이번 주부터 AI 커뮤니티는 G-어시스트를 랭플로우(Langflow)의 사용자 지정 구성 요소로 사용할 수 있게 된다. 이를 통해 사용자가 로우코드 또는 노코드 워크플로우, AI 애플리케이션, 에이전틱 플로우에 함수 호출 기능을 통합할 수 있게 된다.


 

thumb-d300975fc34146b6debad75edcf19a56_E8UNwQkF_4e52b50f670031cd3a6a017e8796f32ce1d970c6_600x400.jpg

랭플로우의 G-어시스트 사용자 지정 컴포넌트는 곧 사용자가 함수 호출 기능을 통합할 수 있도록 지원할 예정이다. 


프로젝트 G-어시스트 플러그인 개발과 실험에 관심이 있는 이들은 엔비디아 개발자 디스코드 채널에 참여해 협업하고, 창작물을 공유하고, 지원을 받을 수 있다. 


매주 RTX AI 개러지(RTX AI Garage) 블로그 시리즈에서는 커뮤니티가 주도하는 AI 혁신과 콘텐츠를 통해, NIM 마이크로서비스와 AI 블루프린트에 대해 자세히 알아보고 있다. 또한, AI PC와 워크스테이션에서 AI 에이전트, 크리에이티브 워크플로우, 디지털 휴먼, 생산성 앱 등을 구축하려는 사람들을 위한 정보를 제공한다. 


RTX AI PC 뉴스레터를 구독하거나 페이스북(Facebook), 인스타그램(Instagram), 틱톡(TikTok), X 채널을 구독해 최신 소식을 받아볼 수 있다. 더불어 엔비디아 워크스테이션(Workstation)의 링크드인(LinkedIn), X 채널에서도 관련 소식을 확인할 수 있다.


여기에서 소프트웨어 제품 정보에 대한 안내를 확인할 수 있다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , ,

0 Comments
맨위로↑