엔비디아 A100 GPU, 주요 대학 및 연구기관 슈퍼컴퓨터에 탑재

홈 > 최신뉴스 > 주요뉴스
주요뉴스

서버 | 엔비디아 A100 GPU, 주요 대학 및 연구기관 슈퍼컴퓨터에 탑재

권경욱 기자 0   0

엔비디아(www.nvidia.co.kr, CEO 젠슨 황)가 자사의 A100 텐서코어(Tensor Core) GPU가 탑재된 AI 슈퍼컴퓨터와 대학 교육 지원 프로그램으로 전 세계 대학과 연구기관을 지원한다고 밝혔다. 



thumb-3696014431_HNWwjymV_9951f3e7fcdcdd0ec747712e182338fc360bcc9b_600x318.jpg

<미국 인디애나 대학은 엔비디아 A100 GPU로 구성된 AI 슈퍼컴퓨터를 구축하고 있다.> 


미국 미네소타 대학(University of Minnesota)는 최신 가속 슈퍼컴퓨터인 에이게이트(Agate)를 구축 중이며, 이번 학기가 마무리되기 전까지 7페타플롭(Petaflop)의 성능을 제공할 예정이다. 미네소타 슈퍼컴퓨팅 연구소(MSI)에 설치되는 에이게이트는 엔비디아 HDR 200Gb/s 인피니밴드(InfiniBand) 네트워크로 265개의 엔비디아 A100 텐서 코어 GPU를 연결한다. 이를 통해 MSI는 사회 경제적 경향부터 천체에 관한 연구까지 완벽하게 진행할 예정이다. 에이게이트는 지난 1월부터 MSI 기존 시스템의 13만 8,612개의 GPU 가속 작업을 실행해 온 1,000명의 주요 조사관을 위해 일하는 약 4,500명의 사용자를 지원할 예정이다. 


미네소타 대학의 연구 컴퓨팅 책임자인 제임스 윌겐부쉬(James Wilgenbusch)는 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise)가 구축하고 있는 가속 슈퍼컴퓨터 에이게이트에 대해 "기초과학 및 인문학을 아울러 모든 분야에 관련된 연구원들과 학생들은 해당 슈퍼컴퓨터를 곧바로 사용하길 바라고 있다"라고 말했다.



thumb-3696014431_UMuqzjca_9951f3e7fcdcdd0ec747712e182338fc360bcc9b_600x353.jpg

<미국 위스콘신 주 치페와 폴스의 에이게이트 슈퍼컴퓨터는 번인 테스트를 거친다. (사진 제공: HPE)>  


윌겐부쉬는 "지질학, 역사학, 정치학 및 마케팅 분야를 비롯해 생명과학 및 인문과학 분야에서 연간 사용자 증가율이 가장 높은 것으로 나타나며, 해당 분야의 관계자들은 방대한 양의 비정형 데이터를 이해하고자 노력하고 있다"라고 말했다.



코로나 19 해결을 돕는 AI 슈퍼컴퓨터


미네소타 보건부(Minnesota Department of Health)는 MSI 시스템의 일부를 활용해 접촉자 추적 및 코로나 19 바이러스의 변이 추적을 위한 게놈 염기서열 분석을 진행하며 코로나 19 대응에 앞장서고 있다.


윌겐부쉬는 미니애폴리스 신문의 한 기사를 가리키며 "이와 같은 협업은 혁신과 생명 구조를 위한 대학의 역할을 대중에게 더욱 분명하게 보여주는 사례"라고 강조했다.



가상 GPU를 통한 인디애나 대학 강의 지원


미국 인디애나 대학(Indiana University)은 총 616개의 엔비디아 A100 GPU로 구성된 AI 슈퍼컴퓨터 2대를 구축하고 있다. 휴렛 팩커드 엔터프라이즈가 구축한 빅 레드(Big Red) 200은 9개의 인디애나 대학 캠퍼스를 지원할 예정이며, 델 테크놀로지스(Dell Technologies)가 구축한 제트스트림-2(Jetstream-2)는 코넬 대학(Cornell University) 및 하와이 대학(University of Hawaii)을 아울러 여러 협력 기관에서 사용될 예정이다. 


제트스트림-2는 프로세서의 일부를 제공하는 A100의 기능을 활용해 수백 명의 학생과 함께 수업을 진행하며, 이들은 각각 GPU 성능을 활용해 이미지 분류 등의 인기 있는 AI 기술을 익히게 된다. 인디애나 대학의 한 연구원은 지난해 11월 가상 GPU 기능을 벤치마킹한 논문을 발표했다. 


인디애나 대학의 퍼베이시브 테크놀로지 인스티튜트(Pervasive Technology Institute) 최고운영책임자(COO) 및 모두를 위한 AI(AI-for-everyone) 이니셔티브 리더인 위노나 스냅차일즈(Winona Snapp-Childs)는 "전체 학생을 한 번에 훈련할 수 있어 더 많은 사람들에게 액세스를 제공할 수 있게 됐다"고 말했다.



다양한 연구를 지원하고 있는 GPU 가속 시스템


현재 2,500명 이상의 학생들이 인디애나 대학의 GPU 가속 시스템을 사용하고 있다. 작년 한 해 동안 178개 학과에 걸친 약 10억 달러 규모의 기록적인 대학 연구 계약 및 보조금 관련 작업의 40% 이상이 해당 시스템에서 이뤄졌다. 


스냅차일즈는 "많은 펀딩 기관에서 다양한 학문 분야에 걸쳐 머신러닝의 중요성을 인지하고 있다”며 "AI와 가속 컴퓨팅은 과학의 경계를 넓히는 데 도움이 된다. 이러한 기술이 연구에 보편화되고 필수가 되면서 향후 5년에서 10년 동안 우리 연구의 절반을 처리하게 될 것"이라고 덧붙였다. 


이러한 연구 작업은 다양한 분야를 폭넓게 지원한다. 연구원들은 소셜 네트워크에서 코로나 19에 관한 잘못된 정보를 추적하는 것부터 수확을 개선하기 위한 쌀의 게놈 연구까지 모든 분야에서 AI를 활용하고 있다.



슈퍼컴퓨팅을 가속하는 델타(Delta)


일리노이 대학교(University of Illinois) 어바나-샴페인(Urbana-Champaign)의 국립 슈퍼컴퓨팅 애플리케이션 센터(NCSA)는 800개 이상의 엔비디아 A100 GPU를 탑재한 AI 슈퍼컴퓨터인 델타를 통해 가속 컴퓨팅 사용을 확장하고 있다. 


델타를 감독하는 NCSA의 수석 연구원 겸 책임자인 윌리엄 그로프(William Gropp)는 "우리는 전산 고고학 및 디지털 농업과 같은 신흥 연구 분야에서 새로운 컴퓨팅 방법과 하드웨어를 활용하는 동시에 연구원들이 고급 시스템을 보다 광범위하고 유용하게 사용하도록 지원할 것"이라고 강조했다. 


국립과학재단(National Science Foundation)은 델타를 통해 GPU 기반 컴퓨팅을 활용하며 연구를 가속하고 있다. 해당 연구는 장애가 있는 사용자들이 델타를 비롯한 미래형 시스템에 쉽게 접근하도록 돕는 이니셔티브를 포함한다.



미국 플로리다 대학(University of Florida)의 AI 활용 사례


미국 플로리다 대학은 하이퍼게이터(HiPerGator) AI 시스템를 통해 가속 컴퓨팅을 활용하고 있다. 조 글로버(Joe Glover) 학장은 헨리 포드(Henry Ford)의 조립 라인이 많은 미국인들에게 자동차를 보급했듯이, 하이퍼게이터 시스템은 많은 이들에게 AI 기술을 보급할 것이라고 설명했다. 미국 플로리다 대학은 향후 약 100명의 AI 중심 교수진을 추가로 구성해 전반적인 교육과정에 머신러닝을 적용하고, 2030년까지 약 3만 명의 AI 활용이 가능한 졸업생을 배출하는 것을 목표로 한다. 


하이퍼게이터 AI는 HDR 200Gb/s 인피니밴드 네트워크로 1,120개의 A100 GPU를 연결하고 있으며, 최근 발표된 세계에서 가장 빠른 슈퍼컴퓨터 상위 500개 목록에서 22위에 올랐다. 하이퍼게이터 AI는 엔비디아 DGX 시스템을 레고와 같은 방식으로 스태킹(stacking)하는 방법인 엔비디아 DGX 슈퍼POD(SuperPOD) 레퍼런스 아키텍처를 사용한 덕분에 단 몇 주 만에 구축됐다.



AI 슈퍼컴퓨팅의 광범위한 활용사례


이 밖에도 AI 슈퍼컴퓨터는 미국과 유럽에 걸친 주요 대학 및 연구기관에서 활용되고 있다.


•캘리포니아 대학교 버클리 캠퍼스(University of California, Berkeley) 연구원들은 6,144개의 A100 GPU를 탑재한 세계에서 5번째로 빠른 시스템인 펄머터(Perlmutter)를 도입했다.


•케임브리지 대학교(University of Cambridge)는 델 EMC 파워엣지(PowerEdge)를 기반으로 구축된 클라우드 네이티브 슈퍼컴퓨터인 CSD3를 선보였으며, 현재 영국에서 가장 빠른 교육 시스템이자 세계에서 가장 에너지 효율적인 시스템인 그린500(Green500) 리스트 3위에 등재됐다.


•에든버러 대학교(University of Edinburgh)는 영국 DiRAC 연구 그룹이 운영하는 4개의 시스템 네트워크 중 최신 버전이자 448개의 A100 GPU를 탑재한 시스템을 구축하고 있다.


•린셰핑 대학교(Linköping University)는 현재 스웨덴에서 가장 큰 슈퍼컴퓨터인 베르셀리우스(BerzeLiUs)의 본거지이다. 베르셀리우스는 국가 AI 이니셔티브를 지원함과 더불어 싱가포르 난양 공과 대학교(Nanyang Technical University) 연구원들과 공유될 예정이다.



딥러닝 인스티튜트(DLI) 교육용 키트 및 대학 앰배서더 프로그램 활용사례


엔비디아는 AI 기술의 저변 확대를 위해 DLI 교육기관을 운영 중이다. AI 기술 구현에 필요한 핵심 기술 및 애플리케이션 도메인과 관련된 기초 및 심화 과정의 핸즈온 교육 과정들을 제공하고 있으며 학생, 교수진 및 연구자들이 DLI 교육에 무료로 액세스할 수 있는 두 가지 프로그램을 제공하고 있다. 


첫 번째 프로그램은 딥러닝, 가속 컴퓨팅 및 로보틱스에 관한 교육 자료를 무료로 다운받을 수 있는 교육용 키트다. 최근에는 데이터 사이언스, 그래픽스 및 옴니버스(Omniverse)에 대한 교육용 키트가 출시되었으며 교육용 키트에는 강의 자료, GPU 클라우드 리소스, 자기주도형 DLI 과정에 대한 액세스 권한 등 대학 커리큘럼을 향상시킬 수 있는 자료가 포함돼 있다. 교육자들은 DLI 홈페이지에서 별도 자격 인증 과정 없이 해당 교육용 키트를 다운받을 수 있다. 


두 번째는 대학 앰배서더 프로그램으로, 자격을 갖춘 교수진과 연구자들이 학생 및 교직원들에게 DLI 워크숍을 무료로 가르칠 수 있는 인증을 받는 프로그램이다. 1인당 500달러(한화 약 59만 원) 상당의 DLI 교육 프로그램을 앰버서더십 취득 시 교내 무료로 도입이 가능하며 교육 자료, 실습 노트북, 글로벌 과정 인증서 및 실습에 활용할 수 있는 고성능의 GPU 클라우드 워크스테이션을 함께 추가 비용 없이 지원하고 있다. 현재 전세계 300개가 넘는 대학 기관에서 앰배서더십을 취득하였으며 국내에서는 서울대, KAIST, 한양대, 연세대, GIST 등 국내 20개 이상의 대학교에서 이미 DLI 앰배서더 프로그램을 도입하거나 도입을 검토 중에 있다. 


엔비디아의 대학 교육 지원 프로그램과 전 세계적으로 분포돼 있는 고성능 시스템인 슈퍼컴퓨터는 머신러닝 및 가속 컴퓨팅을 통해 과학 분야의 발전을 전폭적으로 지원하고 있다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , , , ,

0 Comments
많이 본 뉴스
인기기사