SIGGRAPH | 생산성과 작업 환경 개선, 엔비디아 글로벌 파트너와 손잡고 피지컬 AI로 운영 효율·안전성 극대화
엔비디아(www.nvidia.co.kr)가 글로벌 최대 컴퓨터 그래픽 콘퍼런스인 시그라프(SIGGRAPH)에서 글로벌 기업들과 협력해 피지컬 AI 기반 인지, 추론 기술을 통해 전 세계적인 운영 효율성을 향상시키고 있다고 밝혔다.
엔비디아(NVIDIA)와 협력하고 있는 대표적인 기업들로는 액센츄어(Accenture), 아바톤(Avathon), 벨덴(Belden), 딥하우(DeepHow), 마일스톤 시스템즈(Milestone Systems), 텔릿 신테리온(Telit Cinterion) 등이 있다. 엔비디아는 이들과 함께 전 세계의 스마트 시티, 시설, 산업 공정의 기반이 되어가고 있는 피지컬 AI를 중심으로 운영 혁신을 이끌고 있다.
피지컬 AI를 시뮬레이션하고 훈련하며 배포하는 연속적인 루프는 정교한 산업 자동화 역량을 제공해 도시와 인프라를 더 안전하고, 스마트하며, 효율적으로 만든다.
예를 들어, 피지컬 AI 애플리케이션은 중장비 작업과 같이 작업자에게 잠재적으로 위험한 작업을 자동화할 수 있다. 또한 피지컬 AI는 교통 서비스와 공공 안전을 개선하고, 공장에서 결함 제품을 탐지하는 등 다양한 분야에서 활용될 수 있다.
이러한 필요성은 그 어느 때보다도 커졌으며, 수치가 이를 보여준다.
전 세계 산업 현장과 공공 안전 현황 통계
인지하고, 추론하고, 행동할 수 있는 인프라는 영상 센서와 최신 비전 AI 기술에 의존한다. 엔비디아 메트로폴리스(Metropolis) 플랫폼을 활용하면, 엣지부터 클라우드까지 영상 분석 AI 에이전트와 서비스의 개발, 배포, 확장을 단순화하며, 개발자들은 시설에 시각 인지 기능을 더 빠르게 통합할 수 있다. 이를 통해 생산성을 높이고, 다양한 환경 전반의 안전을 개선할 수 있다.
엔비디아는 올해 시그라프에서 피지컬 AI를 선도하는 5개 기업과 엔비디아 메트로폴리스의 5가지 주요 업데이트를 발표했다.
피지컬 AI를 선도하는 5개 기업
글로벌 전문 서비스 기업인 액센츄어는 종합 연결 솔루션 제공업체인 벨든과 협력해 공장 내 대형 로봇 주변에 설치할 수 있는 스마트 가상 펜스를 개발했다. 이는 작업자의 사고를 방지함으로써 근로 환경의 안전을 강화하고 있다.
이미지 제공: 액센츄어, 벨든
스마트 가상 펜스는 오픈USD(Universal Scene Description, OpenUSD) 기반 디지털 트윈과 물리 기반 시뮬레이션을 활용해 복잡한 산업 환경을 모델링하는 피지컬 AI 안전 시스템이다. 컴퓨터 비전 기반 매핑과 3D 공간 지능을 활용해 현대의 작업 현장에서 발생하는 동적인 인간-로봇 상호작용의 다양한 변동성에 적응할 수 있다.
액센츄어는 엔비디아 옴니버스(Omniverse) 플랫폼과 메트로폴리스를 활용해 스마트 펜스를 구축하고 시뮬레이션한다. 옴니버스를 통해 로봇 팔과 작업자가 움직이는 공간의 디지털 트윈을 생성하고, 메트로폴리스를 통해 AI 모델을 훈련하고, 영상 입력 기능과 엔비디아 딥스트림(DeepStream) 소프트웨어 개발 키트(software development kit, SDK)의 실시간 추론 기능을 활용해 엣지 환경에 배포했다.
산업 자동화 플랫폼 제공업체인 아바톤은 엔비디아 메트로폴리스의 일부인 영상 검색과 요약(video search and summarization, VSS)용 엔비디아 블루프린트(Blueprint)를 활용했다. 이를 통해 제조와 에너지 시설에 운영 효율성과 작업자 안전을 개선하는 실시간 인사이트를 제공하고 있다.
인도의 연료, 모빌리티 분야의 선도 기업인 릴라이언스 브리티시 페트롤리엄 모빌리티 리미티드(Reliance British Petroleum Mobility Limited)는 주유소 건설 과정에서 아바톤의 비디오 인텔리전스 제품을 활용했다. 이를 통해 안전 규정 준수 기준을 높이고, 안전 위반 사고를 줄이며, 수천 시간의 작업 시간을 절감해 생산성을 향상시켰다.
딥하우는 제조업과 기타 산업 분야 직원들을 위해 '스마트 노하우 컴패니언(Smart Know-How Companion)'을 개발했다. 이는 메트로폴리스 VSS 블루프린트를 활용해 주요 워크플로우를 다국어 지원의 짧은 동영상과 디지털 지침으로 변환함으로써, 온보딩, 안전, 현장 운영 효율성을 개선한다.
숙련된 근로자의 퇴직과 직무 역량 강화 필요성에 직면한 음료 회사인 앤하이저부시 인베브(Anheuser-Busch InBev)는 딥하우 플랫폼을 활용해 표준 운영 절차를 이해하기 쉬운 시각 자료로 변환했다. 이로써 온보딩 시간을 80% 단축하고, 교육 일관성을 높였으며, 직원들의 장기적 지식 유지율을 개선했다.
마일스톤 시스템즈는 복잡한 산업과 도시 환경에서 IP 비디오 센서 데이터를 관리하는 세계 최대 규모의 플랫폼 중 하나를 제공하는 기업이다. 이들은 자사의 프로젝트 하프니아(Project Hafnia) 플랫폼을 통해 세계 최대의 실제 컴퓨터 비전 데이터 라이브러리를 구축하고 있다. 이 플랫폼의 주요 기능 중 하나는 피지컬 AI 개발자들에게 맞춤형 비전 언어 모델(vision language model, VLM)에 대한 접근 권한을 제공하는 것이다.
마일스톤 시스템즈는 엔비디아 네모 큐레이터(NeMo Curator)를 활용해 지능형 교통 시스템용으로 미세 조정된 VLM을 구축했다. 이를 VSS 블루프린트 내에서 사용해 도시 도로를 더 효과적으로 관리하는 AI 에이전트를 개발하고 있다. 이들은 또한 피지컬 AI를 위해 새로운 오픈소스 맞춤형 엔비디아 코스모스 리즌(Cosmos Reason) VLM을 활용할 계획이다.
사물인터넷(IoT) 기업인 텔릿 신테리온은 엔비디아 타오 툴킷 6(TAO Toolkit 6)을 AI 기반 비전 검사 플랫폼에 통합했다. 이 플랫폼은 파운데이션포즈(FoundationPose)와 같은 비전 파운데이션 모델과 기타 엔비디아 모델을 활용해 멀티모달 AI를 지원하고, 고성능 추론을 제공한다. 타오는 텔릿 플랫폼에 로우코드 AI 기능을 제공해 제조업체가 결함 감지와 품질 관리를 위한 정확한 맞춤형 AI 모델을 신속하게 개발하고 배포할 수 있도록 한다.
피지컬 AI를 위한 엔비디아 메트로폴리스 5가지 업데이트
엔비디아 메트로폴리스의 주요 업데이트는 개발자들이 피지컬 AI 애플리케이션을 더 빠르고 쉽게 구축할 수 있도록 지원한다.
코스모스 리즌 VLM
최신 버전의 코스모스 리즌은 피지컬 AI를 위한 엔비디아의 고급 개방형 맞춤화 가능 70억 파라미터 VLM으로, 메트로폴리스 사용 사례에 필요한 상황 기반 영상 이해와 시간적 이벤트 추론을 지원한다. 소형화된 설계로 엣지부터 클라우드까지 손쉽게 배포할 수 있으며, 교통 모니터링, 공공 안전, 비전 검사, 지능형 의사결정 자동화에 이상적이다.
VSS 블루프린트 2.4
VSS 블루프린트 2.4는 코스모스 리즌을 활용해 기존 비전 AI 애플리케이션을 빠르게 확장하고 스마트 인프라에 강력한 신규 기능을 제공할 수 있도록 한다. 확장된 API 세트는 사용자가 특정 VSS 구성 요소와 기능을 직접 선택해 생성형 AI로 컴퓨터 비전 파이프라인을 보강할 수 있도록 더 큰 유연성을 제공한다.
새로운 비전 파운데이션 모델
엔비디아 타오 툴킷에는 새로운 비전 파운데이션 모델 제품군, 고급 미세 조정 기법, 자기 지도 학습, 지식 증류 기능이 포함된다. 이러한 기능은 피지컬 AI 솔루션의 엣지와 클라우드 환경 전반에 걸친 배포를 최적화하는데 도움을 준다. 엔비디아 딥스트림 SDK에는 타오 6 모델의 원활한 배포를 가능하게 하는 새로운 추론 빌더가 추가된다.
애드벡스 AI(Advex AI), 인스트루멘털 AI(Instrumental AI), 스핑전스(Spingence)를 비롯한 전 세계 기업들이 이러한 새로운 모델과 엔비디아 타오를 활용해 산업 운영을 최적화하고 효율성을 높이는 지능형 솔루션을 개발하고 있다.
엔비디아 아이작 심 확장 기능
엔비디아 아이작 심(Isaac Sim) 참조 애플리케이션의 신규 확장 기능은 제한된 라벨링 데이터와 희귀 엣지 케이스 시나리오와 같은 비전 AI 개발의 일반적인 문제를 해결하는 데 도움을 준다. 이 도구들은 인간과 로봇 간 상호작용을 시뮬레이션하고, 풍부한 객체 탐지 데이터세트를 생성한다. 또한, VLM 훈련을 위해 사건 기반 장면과 이미지 캡션 쌍을 생성해 실제 환경에서의 개발 속도를 높이고 AI 성능을 개선한다.
확장된 하드웨어 지원
이 모든 메트로폴리스 구성 요소는 이제 엔비디아 RTX PRO 6000 블랙웰 GPU(RTX PRO 6000 Blackwell GPU), 엔비디아 DGX 스파크(DGX Spark) 데스크톱 슈퍼컴퓨터, 피지컬 AI와 휴머노이드 로보틱스를 위한 엔비디아 젯슨 토르(Jetson Thor) 플랫폼에서 실행될 수 있다. 이를 통해 사용자는 엣지부터 클라우드까지 개발과 배포가 가능하다.
코스모스 리즌 1과 엔비디아 타오 6.0은 현재 다운로드할 수 있다. VSS 블루프린트 2.4, 코스모스 리즌 VLM 미세 조정 업데이트와 엔비디아 딥스트림 8.0의 출시에 대한 알림은 등록을 통해 받아볼 수 있다.
여기에서 시그라프(SIGGRAPH)에서 진행된 엔비디아 리서치(Research) 특별 발표를 확인하고 그래픽, 시뮬레이션 혁신이 불러오는 산업 디지털화에 대해 알아볼 수 있다.
여기에서 소프트웨어 제품 정보에 대한 공지사항을 확인할 수 있다.
엔비디아, NVIDIA, 생산성과, 작업, 환경, 개선, 글로벌, 파트너와, 손잡고, 피지컬 AI로, 운영, 효율, 안전성, 극대화