IT | 엔비디아, 모든 산업에 활용 가능해지는 인공지능과 GPU에 주목

권경욱 기자 IT 1 1 2018.11.07 14:18

엔비디아(NVIDIA)는 11월 6일(화) 서울 잠실 롯데 시그니엘 호텔에서 새로운 인공지능(AI)과 딥 러닝(Deep Learning) 솔루션을 소개하고 엔비디아 기술 적용 업계 사례, 최신 시장 동향과 미래 전망 등을 짚어보는 자리를 마련했다.

최근 컴퓨팅과 자율주행차, 로봇, 드론 등 광범위한 분야에서 인공지능(AI)과 딥 러닝(Deep Learning) 기술이 다양하게 활용되고 있으며 엔비디아는 과거 그래픽 기술이나 칩 제조사로 활약해 왔다면 현재는 인공지능과 딥 러닝 등의 분야에 보다 집중하는 등 컴퓨팅 기반으로 인공지능을 구현하는 회사, 인공지능 (AI) 플랫폼 기업임을 강조해왔다.

마크 해밀턴(Marc Hamilton) 엔비디아 솔루션 아키텍처 및 엔지니어링 부문 부사장

마크 해밀턴(Marc Hamilton) 엔비디아 솔루션 아키텍처 및 엔지니어링 부문 부사장은 엔비디아는 인공지능이 모든 산업에 활용이 가능해지면서 이에 집중하고 있으며 기존 시스템에서 인공지능 및 딥 러닝 등 대규모 데이터 처리를 위해 다양한 AI 기반 애플리케이션을 구축하도록 지원하고 하드웨어 및 소프트웨어의 두 가지가 이들 처리의 핵심이 될 것이라고 강조했다. 또 엔비디아가 투자하는 연구개발(R&D) 자금은 어떤 방식으로든 AI와 연관되고 있다고 전했다.

함께 자리한 유응준 엔비디아코리아 엔터프라이즈 대표는 엔비디아는 AI 컴퓨팅 기업임을 다시금 강조하며 고객들이 AI를 효과적으로 구현할 수 있도록 하드웨어와 소프트웨어 플랫폼을 제공하고 지원하고 있다고 밝혔다.

유응준 엔비디아코리아 엔터프라이즈 대표(제공: 엔비디아)

또한 이번 간담회에서는 엔비디아가 인공지능 및 딥 러닝 연산 가속을 위해 최적화한 차세대 튜링 (Turing) 아키텍처를 비롯하여 최근 열린 GTC 유럽 2018에서 발표한 데이터 사이언스와 빅데이터 및 머신 러닝 용으로 설계된 래피즈(RAPIDS) GPU 가속 플랫폼과 엔비디아 클라라(Clara) 헬스케어 플랫폼, AI 차량용 컴퓨터인 엔비디아 젯슨 AGX 자비에 등을 포함한 엔비디아의 최신 AI 솔루션도 소개했다.

엔비디아 차세대 튜링(Turing) 아키텍처 기반 GPU

엔비디아의 인공지능과 딥 러닝 솔루션 등에 튜링 아키텍처 기반 GPU가 새로 추가되면서 전반적인 성과를 낼 수 있게 됐다. 그동안 엔비디아는 쿠다(CUDA)를 기반으로 했지만 인공지능과 딥 러닝 연산에 대응해 왔으나 새로운 GPU 아키텍처로 등장한 튜링에서는 레이 트레이싱(Ray-Tracing)을 가속하는 새로운 RT 코어와 실시간 레이 트레이싱을 지원하는 AI 추론용 텐서 코어(Tensor Core)가 탑재되면서 시뮬레이션 및 향상된 레스터화(Rasterization)를 통해 보다 강력한 컴퓨팅 성능을 제공하게 됐다.

튜링 아키텍처 기반 GPU의 레이 트레이싱 전용 프로세서인 RT 코어는 초당 최대 10기가레이(GigaRays)의 연산 성능을 제공하며 3D 환경에서 빛과 소리가 이동하는 방식을 보다 빠르게 처리할 수 있게 됐다. 튜링의 실시간 레이 트레이싱 연산 성능은 기존 파스칼(Pascal) 대비 최대 25배, 볼타 아키텍처 대비 최대 6배의 가속이 가능하며 GPU 노드는 CPU 노드의 30배 이상의 속도로 영화 효과를 위한 최종 프레임 렌더링에 사용할 수 있을 만큼 향상됐다.

엔비디아 차세대 튜링(Turing) 아키텍처의 텐서 코어(Tensor Core)

여기에 AI 기반 기능을 제공할 수 있는 텐서 코어와 딥 러닝 훈련 및 추론을 가속하는 프로세서 등도 제공해 초당 최대 500조 회의 텐서 연산을 구현하며 고화질 모션 이미지 생성의 핵심 요소인 딥 러닝 앤티 앨리어싱(DLSS), 디노이징, 해상도 스케일링 및 비디오 리타이밍 등을 제공한다.

엔비디아는 튜링 아키텍처 기반의 전문가 및 고성능 컴퓨팅(HPC) 영역의 활용을 위해 쿼드로(Quadro) RTX 8000과 쿼드로 RTX 6000, 쿼드로 RTX 5000 GPU의 발표에 이어 데스크탑 게이밍용 그래픽카드인 지포스 RTX 20 시리즈로 지포스 RTX 2080 Ti와 지포스 RTX 2080, 지포스 RTX 2070의 3종도 출시했다.

텐서 RT(Tensor RT) 하이퍼스케일 추론 플랫폼 추론 가속용 테슬라 T4(Tesla T4)

추론 가속화 기능을 제공하는 인공지능(AI) 데이터센터 플랫폼인 텐서 RT(Tensor RT) 하이퍼 스케일 추론 플랫폼은 튜링 아키텍처와 일련의 새로운 추론 소프트웨어를 기반으로 구성된다. 하드웨어로는 320개의 튜링 텐서 코어와 2560개의 쿠다 코어 (CUDA Cores)의 테슬라 T4 (Tesla T4) GPU가 있으며 전력과 발열 부분에서 기존의 300W에 이르는 높은 TDP가 아닌 TDP 75W 수준으로 추론과 관련된 전력 소모나 발열을 개선하는데 집중하고 있다. 믹스드 프리시전 Int 4와 Int 8까지 지원하며 텐서 RT 코어 활용 인퍼런스 가속 등에 더해 실시간 추론 소프트웨어와 CPU 대비 최대 40배 빠른 처리 속도로 쿼리를 처리를 통해 데이터 처리량(throughput)과 서버 활용도를 극대화 해준다.

추론 옵티마이저 및 런타임 엔진으로 튜링 텐서 코어를 지원하고 다중 정밀도 워크로드를 위해 신경 네트워크 최적화를 확장하는 엔비디아 텐서 RT 5, 데이터센터 구성 시 애플리케이션이 AI 모델을 사용할 수 있게 돕는 컨테이너형 마이크로 서비스 소프트웨어인 엔비디아 텐서 RT 추론 서버 등도 있다. 인공지능과 딥 러닝 등 처리에서는 하드웨어와 소프트웨어 조합이 중요한데 텐서 RT 하이퍼스케일 플랫폼은 강력하면서도 효율적인 추론에 최적화된 하드웨어와 소프트웨어의 조합으로 이루어지며 낮은 레이턴시(지연시간)과 빠른 성능을 제공한다.

대량의 데이터를 분석해 향상된 속도로 비즈니스 예측 수행, 래피즈 GPU 가속 플랫폼

래피즈 GPU 가속 플랫폼은 대량의 데이터를 분석해 향상된 속도로 정확하게 비즈니스 예측을 수행할 수 있도록 해주는 도구다. 쿠다(CUDA)와 이를 기반으로 GPU 가속 분석과 머신 러닝, 차후 추가될 데이터 시각화를 위한 오픈소스 라이브러리를 제공해 머신 러닝 속도를 향상한다.

로보틱스 개발 플랫폼 젯슨 AGX 자비에(Xavier)

로보틱스 개발 플랫폼 젯슨 AGX 자비에(Xavier)는 인공지능(AI) 기반 로봇에 대한 복잡하고 까다로운 요구사항을 고려하고 개발된 플랫폼이다. 최대 32 TOPS(초당 테라 연산)의 성능을 지원하는 소형 컴퓨터 모듈로 강력한 워크스테이션보다 뛰어난 처리 능력을 제공하며 10W와 15W, 30W 등 여러 운영모드로 이전 제품 대비 10배 이상 높은 에너지 효율을 제공하는 것이 특징이다. 최신 버전의 쿠다(CUDA)와 cuDNN, 텐서 RT (Tensor RT) 등을 포함하는 엔비디아 젯팩(JetPack) SDK를 이용해 AI 애플리케이션 개발 및 배포를 위한 포괄적인 지원이 이루어지며 하드웨어와 소프트웨어 조합으로 기업과 개발자들이 차세대 지능형 시스템을 신속하게 개발하도록 돕는다.

화낙(FANUC), 고마쓰(Komatsu), 무사시 세이미츠(Musashi Semitsu), 카와다 테크놀로지스(Kawada Technologies) 등 유수의 글로벌 기업들은 젯슨 AGX 자비에를 도입해 이전보다 지능적이고 효율적인 작업을 수행하는 공장을 구현할 계획이다. 다양한 제품 라인에 따라 공장을 재구성하고 자동화해 변화하는 소비자의 요구를 충족하고 비용을 절감할 수 있을 것으로 전망된다.

차세대 인공지능(AI) 기반 의료기기용 플랫폼 엔비디아 클라라 AGX

엔비디아 클라라 (NVIDIA Clara)는 차세대 인공지능(AI) 기반 의료기기용 플랫폼으로 하드웨어 및 소프트웨어 조합으로 AI가 질병을 조기에 감지하고 진단 및 치료하는데 강력한 툴로 활용될 수 있도록 하는 것을 목표로 한다.

엔비디아 자비에 (NVIDIA Xavier) AI 컴퓨팅 모듈과 엔비디아 튜링(Turing) GPU는 엔비디아 클라라 AGX의 중요 구성 요소로 클라라 소프트웨어 개발 키트는 개발자들이 기존 시스템에서 데이터 처리를 위해 다양한 AI 기반 애플리케이션을 구축하도록 지원하며 이들 하드웨어 및 소프트웨어 두 가지가 핵심이다.

클라라 플랫폼은 실시간으로 생성되는 수천 기가바이트(GB)의 방대한 데이터를 처리하여 의료진 및 과학자들의 데이터 활용을 돕는다. 이와 같은 슈퍼컴퓨팅을 기존 방식으로 구현하려면 FPGA와 CPU 및 GPU이 세 가지 컴퓨팅 하드웨어의 조합이 필요했다. 하지만 클라라 AGX는 이를 GPU 기반의 단일 아키텍처로 간소화시켰다. 엔비디아 텐서 코어를 통해 업계 최고수준의 AI 추론 성능과 가속 컴퓨팅 플랫폼인 쿠다(CUDA)를 이용한 가속, 최산 엔비디아 RTX 그래픽을 이용할 수 있다. 클라라 SDK는 의료 애플리케이션 개발자들에게 컴퓨팅과 그래픽 및 AI를 위한 일련의 GPU 가속 라이브러리와 재구성, 영상처리 및 렌더링용 에시 애플리케이션, CT, MRI 및 초음파용 컴퓨팅 관련 기술을 제공한다.

2페타플롭스 처리 성능의 엔비디아 DGX-2

이 외에도 엔비디아는 올해 초 단일 서버로 2페타플롭스 처리 성능을 제공하는 DGX-2를 공개한 바 있다. DGX-2는 딥 러닝과 인공지능(AI) 연구의 가속을 목적으로 개발된 세계 최초의 딥 러닝 전용 슈퍼컴퓨터다. GPU 수를 두 배 집적하고 더 많은 그래픽 메모리와 더 빠른 메모리, GPU 상호 연결을 통해 연산 성능을 10배 이상 향상한다.

엔비디아의 HPC 및 AI 기반 카드 제품군 중 최상위 제품인 테슬라 V100 GPU를 기반으로 내장 메모리는 DGX-1 대비 32GB로 두 배 증가했다. NV 스위치(NVSwitch) 칩도 새로 개발해 DGX-2에서 최대 16개의 GPU를 연결하는 NV스위치는 최상급 PCIe 스위치보다 5배 많은 대역폭을 제공한다. 스위치 하나는 18개의 전대역 포트로 900Gb/s의 양방향 대역폭을 지원한다.

또한 엔비디아는 이들 엔비디아의 최신 AI 솔루션 공개에 이어 인공지능(AI)와 딥 러닝 등 AI 솔루션과 시장 상황 전반에 대한 질의 응답을 이어갔다.

엔비디아는 AI가 모든 산업, 모든 데이터센터에서 활용될 것으로 확신하며 GPU 아키텍처에 집중하고 있으며 GPU 방식의 범용성에 주목하고 있다. 기존 AI 가속기는 비메모리 반도체 FPGA와 특수 목적으로 설계된 ASIC(주문형 반도체) 등이 있는데 이들은 GPU보다 범용성이 떨어져 접근성면에서 부족하다고 언급했다.

ASIC는 특수 목적으로 개발되어 효율이 높으나 작은 크기의 ASIC 칩으로 추론이 가능하도록 하기 위해서는 6천개 이상의 칩을 개별로 제작해야 하는 등 변화하는 AI 및 딥 러닝 환경에 대응이 부족하고 FPGA는 ASIC보다 유연성은 높으나 효율이 낮고 전문 프로그래머가 필요하며 간단한 프로그램 개발은 가능하지만 CPU나 GPU 처럼 자유로운 프로그래밍이 어려워 활용도가 낮다고 전했다.

인공지능(AI) 활용 사례에 대해서는 한국의 SK하이닉스는 불량 제품을 찾아내고 수율을 높이는데 AI를 사용하고 있으며 엔비디아의 튜링 아키텍처가 지원하는 딥 러닝 슈퍼샘플링(DLSS)는 컴퓨터 게임에서 보다 부드럽고 자연스럽게 처리해주는 AI 기술 중 하나라고 소개했다.

인공지능 및 딥 러닝 발전을 위해서는 충분한 개발자가 필요한데 여전히 이들 개발자의 수는 많지 않아 개발자의 부재가 커 보이는데 이에 대해 엔비디아는 딥 러닝 인스티튜드에 대해 소개하며 이를 통해 12만명의 데이터 사이언스 인원이 배출되었고 활동하고 있다고 밝혔다. 엔비디아는 현재 연세대학교, 한양대학교, 포항공과대학교와 협력해 AI 전문가를 양성하고 있다. 이처럼 딥 러닝 인스티튜드는 앞으로도 지속되어 전문인력 부족에 대한 방안의 하나가 될 것이라고 언급했다.

자율주행 성과에 대해 엔비디아는 최근의 자율주행차 테스트에서 80마일을 완주한 후 본사로 무사히 도착한 자율주행의 성과를 언급했다. 물론 여전히 자율주행 기술에 대한 개발과 지원, 투자는 전세계에서 진행 중이며 발전이 필요하다고 전했다. 엔비디아는 300여개 사와 자율주행 관련 협력을 진행하고 있다고 밝혔다.

그 중에서도 볼보는 안정성 높은 브랜드로 정평이 나있는데 GTC 유럽에서 차세대 자율주행차를 위해 엔비디아와 협력하는 등 야심찬 계획을 소개했으며 사고 없이 자율주행차를 만들어 가겠다는 의지를 다졌다. 자율주행차 사고 소식 등이 전해지며 안전이 무엇보다 중요한데 이는 보행자도 공감하는 내용이다.

이어 고성능 컴퓨팅(HPC)과 인공지능(AI) 슈퍼컴퓨팅은 분리해 생각하기 어려우며 HPC 운용을 위해 엔비디아 하드웨어를 구입하는 사례가 늘어나고 있다고 전했다. 일본과 대만 등 아시아 태평양 지역의 국가들은 국가 차원의 AI 슈퍼컴퓨터 투자에 나서며 자국의 제조업체를 돕고 있으나 한국은 유일하게 정부 차원의 AI 슈퍼컴퓨터에 대한 투자가 이루어지지 않고 있는데 엔비디아는 적극적으로 협력할 준비가 돼 있다고 전했다. 특히 SK하이닉스 등과 같이 여력 있는 제조사를 제외하고 대부분의 한국의 소규모 및 중소·중견 제조사들은 AI 슈퍼컴퓨터 투자가 현실적으로 어려워 정부 차원의 지원이 필요함을 강조했다.

이 외에도 엔비디아는 딥 러닝을 위한 해커톤을 진행 예정이며 이를 통해 인공지능 및 딥 러닝에 대한 다양한 가능성을 시험할 것이라고 전했다.

한편 엔비디아는 11월7일(수)부터 8일(목)까지 양일간 서울 코엑스 컨벤션센터에서 엔비디아 AI 컨퍼런스 2018(NVIDIA AI Conference 2018)을 개최한다. 인공지능(AI)과 딥 러닝(Deep Learning) 분야의 최신 기술 트렌드와 성공사례를 공유하는 이번 컨퍼런스는 데이터 사이언스 및 머신러닝 용 래피즈(RAPIDS) GPU 가속 플랫폼을 비롯해 최신 AI 솔루션도 공개할 예정이다.