내장 GPU부터 고성능 GPU까지, 인텔 Xe 그래픽 아키텍처

홈 > 기획·특집 > 테크닉
테크닉

PC | 내장 GPU부터 고성능 GPU까지, 인텔 Xe 그래픽 아키텍처

권경욱 기자 0   0

인텔은 8월 13일(현지시간) 아키텍처 데이 2020(Architecture Day 2020)을 열고 새로운 시대의 변화에 맞춰 기술 혁신의 6가지 분야에서의 진전을 소개했다.  


이날 인텔은 6가지 분야의 진전 중 차세대 Xe 그래픽 아키텍처에 대한 내용도 공개했다.



thumb-3696014431_UxpHOwvJ_a8812151bdc93a50e9358b771729af17eb540451_600x336.jpg


인텔 Xe 그래픽 아키텍처는 제온과 내장 등 오픈 소스 기반으로 소프트웨어 최적화와 내장 칩과 패키지 등 다양화, 인공지능(AI)와 비주얼 클라우드(Visual Cloud) 최적화 등을 통한 새로운 워크로드 지원을 목표로 개발되었다. 기존의 GPU가 게이밍을 위한 제품에서 GPGPU와 같은 범용적으로 사용 가능해진 것처럼 Xe 그래픽 아키텍처도 범용 연산부터 게이밍을 위한 외장 GPU, 모바일과 소형 폼팩터 등을 위한 내장 GPU(iGPU), 고성능 컴퓨팅(HPC)에 이르는 다양한 구성이 가능한 것이 특징이다.



thumb-3696014431_bz738rSu_a8812151bdc93a50e9358b771729af17eb540451_600x336.jpg


내장 GPU는 저전력의 Xe-LP, 게이밍에는 Xe-HPG, 고성능 컴퓨팅에는 Xe-HP, 데이터선터용으로는 서버 GPU(SG1), 첫 Xe 기반 외장 GPU로 Xe-LP 기반 코드명 DG1을 공개한 바 있다.


이중 비교적 상세한 내용이 공개된 Xe-LP는 모바일 플랫폼에 최적화된 저전력 아키텍처로 기존 Gen11의 48개 보다 증가한 최대 96개의 실행유닛(EU, Execution Units)를 제공하며 비동기 컴퓨팅과 뷰 인스턴싱, 샘플러 피드백, AV1 코덱으로 업데이트된 미디어 엔진, 최신 디스플레이 엔진, 인스턴트 게임 튜닝과 캡처 및 스트림, 이미지 선명화의 새로운 기능, 새로운 DX11 경로와 최적화된 컴파일러를 통해 드라이버를 개선할 수 있다. Xe-LP 그래픽에 대한 내용은 인텔 차세대 프로세서, 윌로우 코브·타이거 레이크 SoC에서 확인할 수 있다.



thumb-3696014431_l35R0yJp_a8812151bdc93a50e9358b771729af17eb540451_600x336.jpg


또한 Xe 그래픽 아키텍처를 기반으로 하는 외장 GPU는 외부 파운드리를 이용해 제조될 것으로 알려졌으며 TSMC가 유력하게 거론되고 있다. TSMC를 이용한다면 제조 공정은 7nm를 이용할 가능성이 높으며 DG1 외장 GPU와 서버용 SG1이 인텔 10nm 슈퍼핀(SuperFin)을 기반으로 제조되는 것과 차이가 있다. 패키징 기술은 Xe-HP 등이 다중 타일(MCM)로 EMIB 패키징이 필요할 것으로 알려졌는데 Xe-HPG는 초기에는 MCM GPU가 아닌 단일 타일 기반의 외장 GPU가 된다.



thumb-3696014431_io1AMTna_495a145bf08389ea8a5a8cf9c087b2d373033811_600x338.jpg


게이밍용 고성능 외장 GPU가 될 Xe-HPG는 GDDR6 메모리와 단일 HPG 타일로 구성될 것으로 외신을 통해 전해졌다. 고성능 컴퓨팅을 위한 Xe-HP 아키텍처 기반 아틱 사운드(Arctic Sound)를 통해 알려진 GPU의 타일(Tile) 구성은 1 타일이 512개 실행유닛(512EUs, 4096코어), 2타일이 1024개 실행유닛으로 8192코어, 4타일은 2048개 실행유닛으로 16384 코어를 탑재한다. Xe-HPG가 512개 실행유닛(512EUs, 4096코어)를 그대로 탑재하고 등장할지 라인업에 따라 다양하게 구성할지는 차후 공개될 것으로 예상된다.


Xe-HPG는 단일 타일, 1개의 타일로 512개의 실행유닛(4096코어)를 탑재할 것으로 알려졌고 Xe-HP 단일 타일은 4K 60 HEVC 컨텐츠 10개의 개별 스트림을 트랜스코딩할 수 있는 성능을 제공한다. 4타일은 40개의 다른 스트림을 트랜스코딩할 수 있으며 MCM GPU로 1.3GHz 클럭에서 FP32 42 TFLOPs 연산 성능을 제공한다. 


다만 Xe-HP 아키텍처의 이와 같은 성능이 그대로 게이밍용 Xe-HPG 아키텍처에 그대로 적용될 것인지는 확실치 않다. AMD와 엔비디아(NVIDIA)와 같이 전문가용 GPU는 해당 분야의 기능을 축소하거나 제거해 출시하는 경향을 고려하면 게임 지향 Xe-HPG는 게이밍에 집중한 설계로 전환될 가능성이 높아 보인다.



thumb-3696014431_eZuYWnoA_495a145bf08389ea8a5a8cf9c087b2d373033811_600x336.jpg


Xe-HPG는 외장 GPU로 구성되고 게이밍을 위한 성능을 제공해야 하는 만큼 조금 더 세부적으로 공개된 모바일 등을 위한 저전력 Xe-LP 아키텍처와는 차이가 있을 것으로 보인다. 


Xe-LP의 내장 GPU는 연산 엔진이 기존 Gen11 대비 1.5배(1.5x) 더 확장되었으며 2개의 실행유닛(EU)를 제어하는 고효율 스케쥴러를 탑재한다. 기존 Gen 11은 실행유닛(EU) 당 1개의 스레드 컨트롤이 이루어졌다. 최대 96개 실행유닛으로 1536FLOPs/ 1clock, 48 텍셀/ 1클럭 샘플러, 최대 24 픽셀/ clock 픽셀 백엔드, 기존 Gen11은 4-Wide FP/INT ALU, 4-Wide FP/EM ALU인데 반해 Xe-LP에서는 8-Wide FP/INT ALU(2x INT16과 INT32 2배 증가, Fast INT8 with DP4A)과 2-Wide EM ALU로 전환되었다. 메모리 컨트롤러와 상호 연결 대역폭(GTI, Graphics Technology interface)은 2배로 늘어났다. 이러한 변화는 정수 연산 중요성이 높아지는 최근의 상황을 고려한 아키텍처적인 변화다.



thumb-3696014431_TCXuBYyN_495a145bf08389ea8a5a8cf9c087b2d373033811_600x337.jpg


또한 Xe-HPG는 하드웨어어 기반 레이 트레이싱(Ray-Tracing)을 가속한다. 레이 트레이싱은 광선을 픽셀 단위로 추적해 게임의 화면을 구현하는 기법으로 광선을 따라 가면서 빛의 밝기를 계산해 높은 연산 성능이 필요하다. 


엔비디아(NVIDIA)의 실시간 레이 트레이싱 RTX, AMD도 차세대 GPU에서 레이 트레이싱 가속을 지원할 것으로 알려진 바 있다. 엔비디아의 RTX 기능을 구현한 지포스 RTX 20 시리즈는 사실적인 광원 효과 등을 구현해 향상된 게임 화면을 제공하지만 1세대 RT 엔진으로는 RTX를 켜면 프레임(FPS)이 크게 저하되는 만큼 다음 세대인 지포스 RTX 30 시리즈에서의 개선을 기대하고 있다. 그만큼 레이 트레이싱 가속은 높은 연산 성능이 필요한데 Xe-HPG는 초기 제품이 엔비디아 지포스 RTX 20 시리즈와 같이 충분한 성능을 제공하지 못할 가능성도 있어 보인다.



thumb-3696014431_7W35avZD_8173cfec5401eb3dc9485a0c7e919447c7bed18f_600x337.jpg


thumb-3696014431_dtPpKf5T_8173cfec5401eb3dc9485a0c7e919447c7bed18f_600x337.jpg


thumb-3696014431_Er3wX8Ax_8173cfec5401eb3dc9485a0c7e919447c7bed18f_600x336.jpg


인텔은 Xe 그래픽 아키텍처에는 새로운 기능도 추가된다. 인텔 그래픽 커맨드 센터(IGCC)에서는 인스턴트 게임 튜닝과 게임 샤프닝, 캡처 및 스트림 등을 지원한다. 인스턴트 게임 튜닝은 게임에 특화된 드라이버로 전체 드라이버를 다운로드 및 설치하지 않고도 수정 및 최적화를 이전보다 빠르게 적용할 수 있으며 게임당 사용자로부터 한 번의 적용만 필요하다.



thumb-3696014431_UkEhyomF_8173cfec5401eb3dc9485a0c7e919447c7bed18f_600x337.jpg


thumb-3696014431_o8YNIcKi_8173cfec5401eb3dc9485a0c7e919447c7bed18f_600x336.jpg


가변 레이트 쉐이딩(Variable Rate Shading)은 GPU 전체의 쉐이딩 작업을 줄여줘 쉐이더 처리 부하를 줄이고 효율을 개선한다. 게임 샤프닝은 게임 선명도를 높이는 컴퓨트 셰이더(compute shader) 기반 어댑티브 샤프닝 알고리즘인 퍼셉츄얼 어댑티브 샤프닝(Perceptual adaptive sharpening) 기능을 사용해 게임 이미지를 선명하게 만드는 새로운 후처리(Post-processing) 기능이다. 특히 해상도 스케일링을 사용하여 성능과 이미지 품질의 균형을 맞추는 타이틀에 유용하며 IGCC 옵트인 기능으로 활용 가능하다. 가변 레이트 쉐이딩과 게임 샤프닝은 엔비디아와 AMD GPU에서 지원되고 있는 기능들이다.


이러한 Xe-LP의 변화를 고려하면 Xe-HPG 역시 Xe-LP의 효율화와 정수 연산 성능 개선, 레이 트레이싱 가속, 최적화 드라이버, 주요 GPU 제조사가 지원하는 게임 선명도 향상 등 다양한 변화가 예상된다.


한편 인텔 Xe 그래픽 아키텍처를 기반으로 하는 게이밍용 Xe HGP GPU는 2021년 출시 예정이다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , , , , , , , , , , , , , , , , , , , , ,

Facebook Twitter GooglePlus KakaoStory NaverBand Naver Tumblr Pinterest 신고
0 개의 댓글이 있습니다.
많이 본 뉴스
인기기사