산업 및 과학 발전 위한 언어 기반 AI 구축 지원, 엔비디아 전세계 기업의 대규모 언어모델(LLM) 개발 지원

IT | 산업 및 과학 발전 위한 언어 기반 AI 구축 지원, 엔비디아 전세계 기업의 대규모 언어모델(LLM) 개발 지원

권경욱 기자 IT 0 0 2021.11.10 11:11

엔비디아(www.nvidia.co.kr, CEO 젠슨 황)는 전세계 기업이 대규모 언어모델(LLM)을 구축하고 개발하도록 지원한다고 밝혔다.

기업은 자체적으로 전례 없는 수준의 섬세함과 뉘앙스로 언어를 이해하는 고유한 도메인별 챗봇, 개인 비서 및 기타 AI 애플리케이션을 구축할 수 있다.

엔비디아는 이를 위해 수조 개의 매개변수가 있는 언어모델 훈련을 위한 엔비디아 네모 메가트론(NeMo Megatron), 새로운 도메인 및 언어에 대해 교육할 수 있는 맞춤형 대규모 언어모델인 메가트론 530B과 다중 GPU, 다중 노드 분산 추론 기능을 갖춘 트리톤 추론서버(Triton Inference Server)를 공개했다.

해당 툴과 엔비디아 DGX 시스템을 함께 사용하면 생산 준비가 완료된 엔터프라이즈급 솔루션을 제공해 대규모 언어모델의 개발 및 배포를 단순화한다.

엔비디아의 응용 딥러닝 리서치 부사장인 브라이언 카탄자로(Bryan Catanzaro)는 "대규모 언어모델은 전문 교육이나 감독 없이도 유연하고 능력 있게 심층 도메인 질문에 대답하고, 언어를 번역하고, 문서를 이해 및 요약하며, 스토리와 컴퓨팅 프로그램을 작성할 수 있는 것으로 입증됐다. 새로운 언어 및 도메인에 대한 모델은 지금까지 가장 큰 슈퍼컴퓨팅 애플리케이션이고, 이제 이러한 기능을 전세계 기업에서 쉽게 사용할 수 있을 것"이라고 말했다.

네모(Nemo) 메가트론과 메가트론 530B 대규모 언어모델 개발

엔비디아 네모 메가트론(Nemo Megatron)은 대규모 변압기 언어모델의 효율적인 훈련을 연구하는 엔비디아 연구진이 주도하는 오픈소스 프로젝트인 메가트론을 기반으로 한다. 메가트론 530B는 세계에서 가장 큰 맞춤형 언어모델이다.

네모 메가트론 프레임워크를 통해 기업은 정교한 자연어처리 모델을 더욱 쉽게 훈련할 수 있다. 네모는 엔비디아의 대규모 가속 컴퓨팅 인프라인 DGX 슈퍼POD(DGX SuperPOD) 전반에서 확장할 수 있도록 최적화됐다.

네모 메가트론은 데이터를 수집, 큐레이팅, 구성 및 정리하는 데이터 처리 라이브러리를 통해 대규모 언어모델의 복잡한 훈련을 자동화한다. 데이터, 텐서(tensor) 및 파이프라인 병렬화에 대한 고급 기술을 사용하여 수천 개의 GPU에 걸쳐 대규모 언어모델을 효율적으로 배포할 수 있다. 기업은 네모 메가트론 프레임워크를 사용해 특정 도메인 및 언어에 대한 대규모 언어모델을 훈련할 수 있다.

트리톤 추론서버로 실시간 대규모 언어모델 추론 강화

이번에 발표된 최신 트리톤 추론서버의 새로운 다중 GPU 다중 노드 기능을 통해 대규모 언어모델 추론 워크로드를 여러 GPU 및 노드에서 실시간으로 확장할 수 있다. 모델은 단일 GPU 또는 다중 GPU가 있는 대형 서버에서 사용할 수 있는 것보다 더 많은 메모리를 필요로 하며, 애플리케이션에서 유용하게 쓰이기 위해서는 추론이 빠르게 실행되어야 한다.

트리톤 추론서버를 사용하는 메가트론 530B는 두 개의 엔비디아 DGX 시스템에서 실행되며, CPU 서버의 처리시간을 1분 이상에서 0.5초로 단축하고 실시간 애플리케이션에 대규모 언어모델을 구현할 수 있다.

전세계에서 개발되는 대규모 맞춤형 언어 모델

엔비디아 DGX 슈퍼POD으로 대규모 언어 모델을 구축하는 선두업체로는 시디(SiDi), JD 익스플로어 아카데미(JD Explore Academy) 및 빈브레인(VinBrain)이 있다.

브라질 최대 AI 연구 개발 기관 중 하나인 시디(SiDi)는 2억명이 넘는 브라질 포르투갈어 사용자가 사용할 수 있도록 삼성의 가상 비서를 채택했다.

시디(SiDi)의 CEO인 존 이(John Yi)는 "시디(SiDi) 팀은 강력한 AI 성능과 특수 소프트웨어를 요하는 가상 비서 및 챗봇을 변화하는 언어의 뉘앙스에 맞게 훈련하고 조정하는 오랜 개발경험을 가지고 있다. 엔비디아 DGX 슈퍼POD는 우리 팀이 선진화된 작업을 통해 브라질의 포르투갈어 사용자에게 세계 최고의 AI 서비스를 제공하는 데 이상적이다."고 말했다.

선도적인 공급망 기반 기술 및 서비스 제공업체인 징둥닷컴(JD.com)의 연구 개발 부서인 JD 익스플로어 아카데미는 엔비디아 DGX 슈퍼POD을 활용해 스마트 고객 서비스, 스마트 소매, 스마트 물류, IoT, 의료 애플리케이션과 같은 서비스를 위한 자연어 처리를 개발하고 있다.

베트남 기반의 AI 의료 회사인 빈브레인은 DGX 슈퍼POD을 통해 100개가 넘는 병원의 600명 이상의 의료 종사자가 사용할 수 있는 방사선 전문의 및 원격 의료를 위한 임상 언어 모델을 개발하여 배포했다.

출시 일정

기업들은 새롭게 공개되는 엔비디아 런치패드(LaunchPad)를 사용하여 큐레이트 랩에서 대규모 언어 모델을 무료로 개발 및 배포할 수 있다.

조직들은 대규모 언어모델 훈련을 위해 가속화된 엔비디아 니모 메가트론 프레임워크에 대한 얼리 액세스 프로그램 가입을 신청할 수 있다.

엔비디아 트리톤은 프레임워크, 툴킷, 사전 훈련된 모델 및 주피터(Jupyter) 노트북을 포함하는 GPU 최적화 AI 소프트웨어용 허브인 엔비디아 NGC 카탈로그와 오픈소스 코드인 트리톤 깃허브(Triton GitHub) 리포지토리에서 이용할 수 있다.

트리톤은 엔비디아에서 최적화 및 인증을 지원하는 AI 엔터프라이즈(AI Enterprise) 소프트웨어 제품군에도 포함되어 있다. 기업은 AI 엔터프라이즈를 사용하여 온프레미스 데이터센터 및 프라이빗 클라우드의 메인스트림 가속 서버에서 언어 모델 추론을 실행할 수 있게 된다.

엔비디아 DGX 슈퍼POD 및 엔비디아 DGX 시스템은 엔비디아의 글로벌 판매업체를 통해 구입할 수 있으며, 구매 자격을 갖춘 고객들에게 가격 상담 또한 제공한다.

한편 11월 11일(현지시간)까지 온라인으로 진행되는 GTC의 무료 참가 등록은 https://www.nvidia.com/ko-kr/gtckr/gtc에서 할 수 있다.

엔비디아, NVIDIA, 전세계 기업, 대규모, 언어모델, LLM, 구축, 개발, 지원, 네모 메가트론, NeMo Megatron, 메가트론 530B, 다중 GPU, 다중 노드 분산 추론 기능, 트리톤 추론서버, Triton Inference Server, 공개

﻿산업 및 과학 발전 위한 언어 기반 AI 구축 지원, 엔비디아 전세계 기업의 대규모 언어모델(LLM) 개발 지원

IT | ﻿산업 및 과학 발전 위한 언어 기반 AI 구축 지원, 엔비디아 전세계 기업의 대규모 언어모델(LLM) 개발 지원

산업 및 과학 발전 위한 언어 기반 AI 구축 지원, 엔비디아 전세계 기업의 대규모 언어모델(LLM) 개발 지원

IT | 산업 및 과학 발전 위한 언어 기반 AI 구축 지원, 엔비디아 전세계 기업의 대규모 언어모델(LLM) 개발 지원