IT | 엔비디아는 인공지능(AI) 플랫폼 기업, GTC 2018 기술 트렌드 소개

권경욱 기자 IT 1 1 2018.04.23 10:27

엔비디아 (NVIDIA)는 지난 3월 26일에서 29일까지 미국 실리콘밸리 산호세에서 개최된 엔비디아 GPU 테크놀로지 컨퍼런스 (GPU Technology Conference, GTC)를 통해 소개한 자율주행, 딥 러닝, 인공지능, 그래픽 등 각 분야 최신 기술 트렌드를 공개한 바 있다.

이처럼 엔비디아는 GTC 2018에서 컴퓨팅 미래를 제시하는 다양한 기술을 선보였고 전 세계 과학자와 엔지니어, 기업인, 미디어 등 약 8,300명이 참여하고 600여 개 세션과 세미나, 약 150개 전시 부스 등으로 높은 관심을 나타냈다. 한국에서도 지난해에 이어 올해에도 참가자가 늘어나는 등 매년 참가 인원이 증가하고 있으며 GTC 2018에서 경험한 것을 실제 프로젝트에 적용하고 있는 추세다.

유응준 엔비디아코리아 엔터프라이즈 대표

엔비디아코리아는 4월 20일(금) 서울 강남구 삼성동에 위치한 엔비디아코리아 사무실 트레이닝룸에서 GTC 2018을 통해 공개한 이들 기술과 엔비디아의 비즈니스 업데이트 등에 대한 내용을 전했다. 이번 GTC 2018 주요 내용과 엔비디아 비즈니스에 대한 내용은 유응준 엔비디아코리아 엔터프라이즈 대표와 엔비디아 각 부문 담당 임원들이 참석해 자율주행차 (self-driving vehicle/ car, autonomous vehicle)와 딥 러닝 (Deep Learning), 인공지능, 그래픽, 과학, 로봇 (Robots) 등 다양한 분야의 기술 트렌드와 컴퓨팅의 미래에 대한 내용을 소개했다.

유응준 엔비디아코리아 엔터프라이즈 대표는 컴퓨팅, 자율주행차, 로봇, 드론 등 광범위한 분야에서 인공지능과 딥 러닝 기술이 다양하게 활용되고 있다고 전하며 엔비디아는 과거 그래픽 기술이나 칩 제조사로 활약해 왔다면 최근에는 인공지능과 딥 러닝 등의 분야에 보다 집중하는 등 컴퓨팅 기반으로 인공지능(AI)를 구현하는 회사, 인공지능 (AI) 플랫폼 기업임을 강조했다.

엔비디아 GTC 2018 - 실시간 레이 트레이싱 기술 엔비디아 RTX

이어 GTC 2018에서 주목받았던 실시간 레이 트레이싱 (Ray Tracing) 기술인 엔비디아 RTX 영상을 시연하고 이를 소개했다.

엔비디아 RTX 기술은 사실성과 리얼리티를 위한 연구와 투자, 마이크로소프트 (Microsoft, MS) DXR 및 협력을 통해 엔비디아의 GPU를 기반으로 최적화되어 개발되었다. 일반적으로 복잡하고 어려우며 대형 데이터 처리에는 SIMD GPU가 어렵다는 의견과 한계가 있었으나 엔비디아는 GPU 컴퓨팅 기술의 발전을 통해 이러한 편견을 깨고 엔비디아 GPU 기반으로 실시간 레이 트레이싱 기술 RTX를 선보일 수 있었다고 전했다.

엔비디아 RTX는 플랫폼화를 통해 진행 중이고 현재는 실시간 구현에 따른 성능 한계로 볼타 (Volta) 아키텍처 기반 GPU를 중심으로 활용이나 개발되고 있지만 향후에는 더 높은 성능의 GPU 등장으로 이러한 한계를 넘어 발전될 것으로 예상했다.

엔비디아코리아 차정훈 상무

엔비디아는 RTX 기술과 같은 그래픽 리얼리티를 강조하고 있는데 이에 대해 엔비디아는 게이밍과 미디어, 엔터테인먼트, 프로덕트 디자인, 아키텍처 등 매년 10억장 이상의 이미지가 렌더링되고 있다고 전하며 이를 위해서는 높은 GPU 컴퓨팅 파워를 필요로 한다고 전했다.

실시간 레이 트레이싱 기술 RTX와 렌더링 이미지 등 높은 GPU 컴퓨팅 파워의 요구에 대응해 엔비디아는 볼타 (Volta) 아키텍처 기반의 쿼드로 (Quardo) GV100을 발표했다.

해당 GPU는 5120 쿠다 코어 (CUDA Cores)와 32GB HBM2 메모리 등을 탑재하며 2개의 쿼드로 GV100 GPU는 NVLink2를 통해 결합되면 10240 쿠다 코어와 64GB HBM2 메모리, 236 TFLOPS 텐서 코어 (Tensor Cores)를 제공한다. 엔비디아 RTX 외에도 엔비디아 OptiX와 벌칸 (Vulkan), MS DXR 등을 구현할 수 있다.

특히 전통적인 렌더 팜 (Render Farm)은 280개의 듀얼 GPU 서버와 168kW의 높은 전력이 필요했다면 엔비디아 쿼드로 GV100 기반으로는 14 Quad-GPU 서버와 24kW의 전력으로 동일 성능을 구현 가능해진다. 이를 통해 비용은 1/5, 공간은 1/7, 전력은 1/7 수준으로 낮아진다. 어도비, 언리얼, 맥스웰 오토데스크, 블렌더, 유니티 등의 많은 기업들이 엔비디아 RTX 기술 활용과 협력을 진행하고 있으며 엔비디아는 오픈 소스화해 GPU 기반에서 레이 트레이싱을 가능하게 하고 렌더링 비디오나 컨텐츠를 구현한다.

이처럼 엔비디아는 실시간 레이 트레이싱 RTX 기술 등 GPU 컴퓨팅에 대해 적극적인 모습을 보이고 있는데 이는 그동안 CPU 업계에서 이어온 무어의 법칙 (Moore's Law)이 2010년 이후부터는 실현이 어려워진 반면 GPU는 이를 극복할 수 있는 대안이 될 수 있기 때문으로 보았다.

실제로 GPU 가속 컴퓨팅을 비롯한 GPU 컴퓨팅은 여전히 폭박전인 증가세에 있으며 5년 사이 100배로 늘어날 것으로 전망하는 등 GPU에 대한 요구는 지속적으로 증가하고 있다. 이를 반영하듯 GPU의 수는 5년내 15배 증가 예상, GPU 개발자는 작년 대비 2배, 올해는 82만명 수준으로 늘어났으며 쿠다 (CUDA) 다운로드는 작년 800만 건, 올해는 지난해 대비 2배, 5년 전 기준 5배로 늘어났다. 엔비디아 GTC 등록자도 매년 증가하고 있으며 지난해 7000명에서 올해는 8500명, 한국에서도 지난해 104명 참가에서 올해는 271명으로 증가했고 참가자 대부분은 기술 세션을 듣고 실제 국내 환경에 적용하고 있다고 전했다.

특히 25.7 페타플롭스 구현에 필요한 서버를 구축하기 위해 전통적인 HPC 클러스터 (HPC Cluster)는 600개의 듀얼 CPU 서버와 360kW의 전력 소모, 넓은 하드웨어 설치 공간이 필요했다면 동일한 구현에 엔비디아 테슬라 V100 (Tesal V100)은 30 Quad-GPU 서버와 48kW의 전력 소모로 가능하다. 이는 비용은 1/5, 설치 공간은 1/7, 전력 소모는 1/7로 혁명적인 수준으며 모든 면에서 과거보다 유리해졌다. 이에 따라 이전처럼 구현할 것인지 아니면 새로운 GPU 기반 형태로 서버를 구성할지를 선택해야 하며 업계의 많은 관계자들은 넓은 설치 공간이나 비용, 전력 효율 등 전반을 고려해 GPU 기반 서버로의 전환을 고려하고 있다고 전했다.

엔비디아 GTC 2018 - 의학 분야, 클라라 플랫폼

이어 엔비디아는 의학 분야에 활용되는 GPU 컴퓨팅 사례를 소개했다. 그동안 의학 분야에서는 흑백 이미지로 판독이나 해독을 통해 병을 진단하는 방법이 이용되었지만 클라라 (CLARA)로 대표되는 의학 이미징 슈퍼컴퓨터 (Medical Imaging Supercomputer)는 이런 이미지를 컬러화 하고 렌더링을 강화해 해독 및 판독률을 개선해 나갈 것으로 전망했다.

여기에는 GPU를 기반으로 하는 인공지능 (AI) 알고리즘과 이미지 비주얼라이징 앱 등으로 렌더링을 강화하고 딥 러닝 기반 렌더링과 이미징 구현 등을 뒷받침을 것으로 알려졌다.

클라라 솔루션은 미국 유명 대학에서 이미 채택하고 구체적 솔루션으로 구현되며 엔비디아는 클라라 플랫폼으로 심장이 뛰는 이미지를 구현한다거나 의료 장비 회사나 애플리케이션 기반 분야에서 확용할 것으로 예상했다. 삼성과 지멘스, 후지필름, 올림푸스 등 주요 업계에서도 파트너로 참여하고 있다.

엔비디아 GTC 2018 - 인공지능(AI) 플랫폼

이러한 시장의 GPU 컴퓨팅 기반의 인공지능 (AI)과 딥 러닝 등의 요구에 맞춰 엔비디아는 다양한 인공지능(AI) 플랫폼을 제시하고 있다.

2배 이상의 성능을 향상한 테슬라 V100 32GB HBM2를 가격 차이 없이 제공하며 이를 기반으로 하는 DGX-1과 DGX-1 스테이션 32GB를 데이터 센터에 활용하고 있다. DGX 스테이션은 데이터 사이언스나 렌더링, 연산 등을 위해 업무에 활용되고 있으며 한국에는 1년 반 동안 100대 이상, 지난해에는 80대 이상, 올해는 150대 이상의 구입을 예상했다.

아마존 AWS, 오라클, 마이크로소프트 AZURE IBM, 레노버, 슈퍼마이크로시스템 등의 주요 클라우스 서비스 업체 대부분은 GPU 기반 서비스를 제공하고 있으며 엔비디아는 GPU 클라우드에 최적화 플랫폼 다운로드 등을 지원하고 GPU 기반 딥 러닝 구현 이전 GPU 트레이닝 추론을 최적화해 효과적으로 구현하는 텐서 RT (TensorRT), 엔비디아 타이탄 V (TITNA V)의 프레임웍 활용이 가능하다고 전했다.

또한 전통적인 네트웍 처리는 간단했으나 현재의 네트웍은 복잡해져 성능이 크게 요구되고 있으며 점점 더 복잡해지는 구조를 통해 CPU로는 감당이 어려워져 GPU 파워가 그만큼 크게 요구되고 있다.

데이터 사이즈가 커지면서 굉장히 큰 단일 PC를 필요로 하게 되는데 이를 반영해 엔비디아는 세계에서 가장 큰 GPU를 발표하기에 이른다. 16개의 테슬라 V100 32GB HBM2를 NVSwitch로 연결해 81920 쿠다 코어를 구성하고 2000 테라 플롭스 텐서 코어를 탑재해 512GB HBM2로 14.4TB/s, GPU-to-GPU는 300GB/s 등의 높은 처리 능력을 제공한다. 16GB에서 32GB로 늘어난 테슬라 V100은 메모리 로딩 빨라지는 등 처리가 향상되었다.

이를 기반으로 하는 DGX-2도 발표됐다. 2페타 플롭스 처리 능력과 10kW의 전력 소모, NVLink Plane Card, 2 Xeon Platinum 등으로 구성되며 DGX-1 V100 16GB가 2017년 9월 출시, DGX-2 V100 32GB는 2018년 3월 발표되었으며 3분기 (Q3) 출시 예정이며 9월부터 본격적인 판매에 들어갈 것으로 알려졌다.

특히 DGX-1이 Fairseq 실행에 15일이 소요된 반면 DGX-2는 1.5일만에 처리해 10배의 차이를 보였는데 이는 20번 실행할 것을 200번 가능하게 해주는 차이를 보인다. 데이터 사이언티스트는 대부분 해외로 이동하고 있어 한명의 데이터 사이언티스트가 더 많은 작업을 해야하는 한국과 같은 환경에서는 빠른 처리가 무엇보다 중요해지는 만큼 이와 같은 GPU 컴퓨팅 기반 하드웨어는 효율을 크게 높일 수 있다.

전통적인 하이퍼스케일 클러스터 (Hyperscale Cluster) 구현에 300 듀얼 GPU 서버와 3백만 달러 ($3M), 180kW의 전력, 넓은 공간이 필요했다면 같은 성능을 구현하는 엔비디아 DGX-2 딥 러닝 (Deel Learning) 시스템은 10kW 전력 소모의 DGX-2 1대로 가능해 비용은 1/8, 공간은 1/60, 전력 소모는 1/18로 크게 줄일 수 있게 된다.

또한 딥 러닝은 2개의 엔비디아 지포스 GTX 580을 이용해 2012년 12월 알렉스넷 (AlexNet) 처리를 위해 사용되면서 본격화되었는데 그 당시 처리에 6일 소요된 작업이 현재의 DGX-2를 이용하면 18분 만에 처리가 가능해졌다.

딥 러닝에는 GPU 파워와 이를 구현하는 프레임웍, 많은 데이터를 기반으로 구현이 되며 풀어야 할 7가지 과제인 PLASTER는 인간이 만든 가장 복잡한 클라우드 컴퓨터를 운용해 해결한다. 인공지능 (AI)을 효율적으로 운용하기 위한 문제점과 프로그램 사이즈, 입출력, 에너지 효율 등 많은 부분이 해결되어야 하고 효율적인 구사를 위해 추론 처리 성능이 필요하고 엔비디아는 이를 위한 엔비디아 AI Inference를 구축하고 있다.

이에 활용하는 텐서 RT는 텐서 RT 3가 등장하며 30배에서 최대 200배로 1년 반 사이 향상되었고 2016년 12월에 시작해 6개월 단위의 업그레이드를 진행하고 속도 향상도 진행할 것으로 알려졌다.

Kubernetes는 GPU 가속 기반 서버에서 스케일 업앤다운이 이루어지고 개발을 위한 엔진으로 이용되며 표준화된 툴 넓은 커버리지 갖추어 활용되어 엔비디아 AI Inference해당 플랫폼에는 삼성전자와 현대, MS, 바이두, SK텔레콤 등 다양한 파트너사가 참여한다.

엔비디아 GTC 2018 - 자율주행차

엔비디아 GTC 2018에서 소개된 자율주행차 부분에 대해서도 소개했다. 엔비디아는 앞으로 자동차 외에도 트럭, 버스, 농기계 등 제한 영역에서 사용하는 것도 자율주행으로 가능해질 것으로 내다봤다.

엔비디아가 개발 중인 자율주행 플랫폼은 크게 데이터 수집, 트레이닝, 시뮬레이션, 실제 차량으로 검증하는 드라이브 과정이 계속 반복되며 개발 후 사용화를 통해 서비스부터 운영까지 실시간으로 진행될 것으로 예상했다.

이를 위해 엔비디아는 엔비디아 PI (Perception Infrastructure)를 구성하고 데이터 팩토리에서 가공 데이터 레이블링, DGX로 트레이닝 과정을 거치는 등의 가공을 거쳐 인증 테스트 데이터가 자율주행차에 적용된다.

기본적으로 자율주행차를 구입하면 데이터 수집 등이 진행되며 자율주행을 위해 날씨와 HD Map, 방향, 길, 패스 등 10개 데이터 수집과 처리가 진행되어 안정적인 자율주행 환경을 갖출 수 있게 된다.

엔비디아는 이를 구현하기 위해 엔비디아 드라이브 (NVIDIA Drive) 플랫폼을 갖추고 있으며 Drive PX Pasrker에서 이를 통합한 Drive PX2, 다시 Drive Xavier에서는 기존 대비 전력을 1/10으로 줄이고 300테라 300W 파워로 구현하는 Drive Pegasus는 Drive Xavier 4개를 탑재, 다시 전력과 컴퓨팅 파워를 향상한 오린 (Orin) 단일 칩으로 구현하는 방식으로 칩의 성능과 전력 효율을 지속적으로 개선해나가고 있다.

최근 우버의 자율주행 사고 등으로 자율주행차에 대한 새로운 인식이 만들어지고 있다. 자율주행차는 매년 1조 마일 운행이 이루어지고 있으며 미국 기준으로 마일 당 770건의 사고가 발생하고 있다. 20대의 테스트카를 이용해 1년에 250일 운용 시 하루 8시간 이용 기준 100만 마일을 주행하게 된다. 이때 사고는 1/1000 정도 예상되지만 자율주행차가 상용화되어 나오면 다양한 변수가 있어 사고 예측 감당이 어려워 더 많은 테스트 과정이 반복되고 있다고 전했다.

NVIDIA Drive SIM and Constellation 플랫폼을 GTC 2018을 통해 소개했는데 이는 비디오와 레이더 등의 다양한 데이터를 실제 센서에 입력을 받아 시뮬레이션 환경에서 테스트와 개발이 이루어진다. 엔비디아 Drive 개발 플랫폼은 370개 이상의 파트너 회사들이 참여해 다양한 구성과 테스트가 진행 중이다.

엔비디아 GTC 2018 - 로봇 (Robots)

엔비디아 GTC 2018에서는 인공지능(AI)과 딥 러닝을 이용하는 로봇 분야에 대해서도 소개가 이루어졌다. 로봇은 배송과 드론, 건강 등 효과적 지원 플랫폼을 제시하고 있다.

엔비디아가 개발 및 테스트 중인 아이작 (ISAAC)은 트레이닝한 로봇의 시뮬레이션을 통해 개발 시뮬레이션과 트레이닝 목적으로 활용되며 시뮬레이션과 트레이닝 개발 SDK를 제공해 개발에 활용하고 있다.

한편 엔비디아가 GTC 2018을 통해 새로운 기술과 그래픽의 사실성 강조, 인공지능 (AI)과 자율주행, 건강, 로봇 아이작 등 다양한 개발을 비롯하여 텐서 플로우 표준 기반으로 활용, Xavier - Pegasus - Orin으로 발전하는 자율주행 플랫폼 등 엔비디아는 GPU의 활용과 구현에 노력을 기울이고 있으며 시장의 요구와 수요를 파악하고 발전시켜 나가고 있다고 전했다.

특히 전통적으로 게이밍 워크스테이션 시장은 15% -20% 성장하는데 반해 인공지능 시장은 지난해 144% 성장하고 한국에서도 3배 이상 성장할 만큼 앞으로가 기대된다. 또 자율주행 분야는 10년 동안 투자되고 있으며 자율주행에 3천명 이상이 개발 등에 참여하는 등 자율주행은 5년 이후를 내다보고 있다고 밝혔다.

이어 플랫폼 형태로 헬스케어 클라라, 로봇 아이작 등도 발전 시켜나갈 것이라고 전했다.

엔비디아, NVIDIA, GTC 2018, GPU Technology Conference, 인공지능, AI, 딥 러닝, 그래픽, 자율주행, 자율주행차, 로봇, Robots, 기술 트렌드,