Xe2 아키텍처와 XeSS 2 지원, 인텔 아크 B-시리즈 배틀메이지 ARC B580과 ARC B570 발표

홈 > 기획·특집 > 테크닉
테크닉

PC | Xe2 아키텍처와 XeSS 2 지원, 인텔 아크 B-시리즈 배틀메이지 ARC B580과 ARC B570 발표

권경욱 기자 0   0

인텔은 2024년 12월 3일(현지시간) 코드명 배틀메이지(Battlemage) 인텔 아크 B-시리즈(Intel Arc B-Series)를 발표했다.


최신 게이밍 환경은 과거보다 더 다양한 광원 효과와 보다 사실적이면서 디테일한 그래픽을 제공하고 있으며 게이머들은 풀HD(1080p) 해상도에서 QHD(1440p) 해상도로의 전환이 이루어지면서 향상된 성능의 그래픽 카드의 필요성이 높아지고 있다. 이에 인텔은 알케미스트(Alchemist) ARC A-시리즈(Intel Arc A-Series) 후속으로 배틀메이지(Battlemage) ARC B-시리즈(Intel Arc B-Series)를 공개했다.



thumb-e39e30b922ee718f4d5423e182d5b5ca_PwikjQOJ_ad70422f20b56a7206b73140b51c519ed38d4728_600x332.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_DqUoa6M9_bf9ecb66365eb4864201b7ca87297bf78538535a_600x338.jpg

인텔 비비안 리엔(Vivian Lien) 클라이언트 그래픽 부문 총괄 매니저



인텔 아크 B580 및 B570 GPU는 메인스트림 시장을 위한 제품들로 Xe2 아키텍처를 기반으로 Xe 코어당 성능 및 와트 당 성능을 개선해 향상된 효율성과 코어당 성능을 제공하고 소프트웨어 오버헤드를 줄여 향상된 게임 성능과 전력 효율을 제공한다.

2세대 레이 트레이싱 유닛(2Gen Ray Tracing Units)과 최신 AI 업스케일링 기능인 XeSS에 Xe 프레임 제너레이션(Xe Frame Generation, Xe-FG)와 Xe 레이턴시(Xe Lantecy)를 포함하는 XeSS 2로 처리 성능과 응답성 향상, 인텔 Xe 매트릭스 익스텐션(XMX) AI 엔진을 통해 AI 워크로드를 가속할 수 있도록 설계됐다.


thumb-e39e30b922ee718f4d5423e182d5b5ca_oCEmxfdL_1a7726d5e661e66661a74ea8133494330ee2e9a8_600x336.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_I643PFHY_2f47af904a46c3c38a02da06bbd13a1f395fb1b6_600x334.jpg

인텔 ARC B-시리즈 BMG-G21 GPU는 Xe 코어가 최대 70%, 와트당 성능은 50% 이상이 향상되는 고효율에 주안점을 두고 설계됐다. BMG-G21 GPU는 5 렌더 슬라이스(5 Render Slice), 20 Xe2 코어(Xe2-Cores), 160 XMX 엔진(XMX Engines), 20 레이 트레이싱 유닛(Ray Tracing Units), 20 텍스처 샘플러(Texture Samplers), 10 픽셀 백엔드(Pixel Backends), 18MB L2 캐시(L2 Cache), 192bit GDDR6, 2 멀티 포맷 X-코더(Multi-Format X-Coders)를 탑재한다.

 
thumb-e39e30b922ee718f4d5423e182d5b5ca_f5ObtcAn_4a6da518a4ac223e76e00e3803d833951e31fbaf_600x335.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_i0Ek3r8n_894eadb2db08e81ee3244a2750e47f264411f669_600x337.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_t7eOXFUE_bb5f088cc0918676ed648a40e7caef6a2f6d0e1b_600x334.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_p9uRUk3S_613035dd44be5560523c01755a9b38f12c5461b3_600x338.jpg

Xe2 렌더 슬라이스는 그래픽 가속을 기능을 담당하는 주요 부분으로 하드웨어(HW) 및 소프트웨어(SW) 향상과 레이턴시를 최적화하는 등 개선이 이루어졌다. 렌더 슬라이스에는 Xe 코어가 들어가며 코어 당 성능이 이전 세대 대비 향상되며 Native SIMD16 ALUs, 4-deep XMX를 지원한다. 2세대 레이 트레이싱 유닛은 3 TraversalPipelines/ 18 Box Intersections/ 2 Triangle Intersection, 지오메트리(Geometry)는 3x Vertex Fetch/ 3x Mesh Shading 성능 개선, 픽셀 백엔드(Pixel Backend)는 최대 2x 블렌딩 입출력/ 33% 더 많은 픽셀 컬러 캐쉬(Pixel Color Cache)/ 렌더 타겟 프리페치(Render Target Prefetch)를 지원한다. 샘플러(Sampler)는 아웃 오브 오더(Out of Order) 샘플링과 필터링 없이 2x 입출력/ 프로그래머블 오프셋(Programmable Offsets), HiZ에서는 50% 이상의 HiZ/ Z/ 스텐실 캐시(Stencil Cache)/ HiZ 컬링을 위한 원시 단계의 소규모 캐시, L2 캐시는 8:N 압축으로 서브 리소스를 빠르게 제거해 효율을 높여준다.

2세대 Xe 코어는 SIMD16 엔진의 효율을 개선하고 있으며 8개의 512bit 벡터 엔진, 8개의 2048bit XMX 엔진, 64b atomic ops, 256KB 공유 L1$/ SML을 추가했다.새로운 벡터 엔진은 SMID16과 SIMD32를 지원하며 Xe XMX 엔진은 INT2, INT4, INT8, FP16, BF16, TF32 명령어를 지원하며 Math와 FP64를 확장해 SIN, COS, LOG, EXP 지원, 3-Way Co-issue로 FP_INT/ EM + XMX 처리가 가능하다. 새로운 레이 트레이싱 유닛은 3 Traversal pipelines은 1.5배(1.5x), 18 Box Intersections 1.5배(1.5x), 2 Triangle Intersections 2배(2x), 16 KB BVH 캐시 2배(2x)의 향상이 이루어졌다.


thumb-e39e30b922ee718f4d5423e182d5b5ca_qcXbPBtZ_f6bf13e28e5be3d3c909cd4df5b8a96af977b825_600x335.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_Win2hqUJ_ab47ee813b54fc70ba08fe86183c7ffbc5616bc3_600x336.jpg
 
Xe2 아키텍처는 1세대 Xe 아키텍처 대비 픽셀 블렌드 비율과 메시 쉐이더 디스패치, 버텍스 프로세싱, 테셀레이션, 레이 트라이앵글, 심플러 피드백 등 그래픽 처리에 관련된 처리 효율을 높여 1.2배(1.2x, Tessellation)에서 최대 12.5배(12.5x, Draw XI)의 향상이 이루어졌다. 또 최근 게임의 렌더링은 렌더링은 적어지고 AI 연산을 기반으로 하는 생성 기술을 바탕으로 점점 더 높은 비주얼적인 품질을 적용하고 있다.


thumb-e39e30b922ee718f4d5423e182d5b5ca_bZ4HDoBw_7fc92aaef3728fbf9702c1d84a322f70f8a4ea50_600x335.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_QizTpdK1_66de15fc88c784f4a91bd66e7f39ab46e0a6b4c8_600x336.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_KsYnFMqS_9139171479187b30829c55edb3ce15735cd15d8f_600x361.jpg


AI 업스케일링 기술인 XeSS 2는 XeSS 초해상도(XeSS Super Resolution), XeSS 프레임 생성(XeSS Frame Generation, Xe-FG), Xe 저지연(Xe Low Latency)의 세가지로 구성된다.


새로운 AI 기반 XeSS 프레임 생성(XeSS Frame Generation)은 광학 플로우 및 모션 벡터 리프로젝션을 사용해 보간(interpolated) 프레임을 추가한다. 이를 통해 더욱 향상된 게이밍 환경을 제공한다. 또 새로 추가된 Xe 레이턴시(Xe Low Latency, 저지연)는 게임 엔진과 통합되어 지연 시간을 줄여 게이머의 입력에 더욱 빠르게 반응한다.

 




thumb-e39e30b922ee718f4d5423e182d5b5ca_bxSGEW30_9c43195f1a5adb7c69fc959cb1b4e2fafb9a6715_600x335.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_en41DjgR_dac26f11320a566707535c180d98d196946c40b8_600x337.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_JWgHdICj_f3fe95ca1f3ce25a6bc5c54aff9f6e6bcebe2e52_600x338.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_XFV6Uhfy_2af55c2ddb0ed7dbf67e51d51b73cd70614fa576_600x338.jpg


XeSS 2는 XeSS 초해상도(XeSS Super Resolution), XeSS 프레임 생성(XeSS Frame Generation, Xe-FG), Xe 저지연(Xe Low Latency)의 세가지 기술이 모두 활성화되어 초당 프레임(fps)을 최대 3.9배 이상 향상해 AAA급 게임에서도 향상된 성능을 구현할 수 있다.


ARC B580은 1440p 해상도에서 XeSS 적용시 게임에 따라 최소 22%에서 최대 80%, 평균 47% 이상의 성능 향상이 이루어졌다. 레이 트레이싱(RT)과 함께 적용하면 게임에 따라 최소 51%에서 최대 170%의 향상이 이루어진 것으로 소개됐다.


인텔 XeSS는 1세대 XeSS를 통해 지난 2년간 AI 기반 업스케일링을 제공해왔으며 현재 150개 이상의 게임에서 지원한다.



thumb-e39e30b922ee718f4d5423e182d5b5ca_Dzd53QNg_730f4d6b67a1fb42b1f78a56cf6d5913d1b978ed_600x336.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_7SXdtN8c_928ef8f30831e5fa75ec490f2d99619e058e8040_600x335.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_NijE6PM5_9e5c9ec09cfc3cfb2d1cf904dcef429a7eda5152_600x336.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_9lHEmKSj_f83f90f1baa19aa4538aab909e89de12249fa6fb_600x337.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_LtRPdJhn_b14d23bfe9489e045731e93fcf3d1182660de31f_600x337.jpg


XeSS 2에서는 XeSS 프레임 생성(XeSS Frame Generation, Xe-FG)과 Xe 저지연(Xe Low Latency)의 2가지가 새로 추가되었으며 Xe 저지연은 게임 엔진과 통합되어 게이머의 입력에 더 빠르게 반응한다1440p 해상도와 F1 24 게이밍에서 인텔 ARC B580은 네이티브 렌더의 57ms에서 네이티브 렌더와 Xe 레이턴시(XeLL) 조합시 32ms로 45% 가량의 반응속도 향상이 이루어졌다. 드라이버 기반의 로우 레이턴시 메모리(Driver Low Latency Memory)에서도 Xe 레이턴시와 같이 게임에서 지연 시간을 줄여 반응속도를 향상할 수 있다.



thumb-e39e30b922ee718f4d5423e182d5b5ca_KWq5xR0H_988819d8ae70533ae6544bb93e70a710a95a7292_600x337.jpg



인텔 ARC B-시리즈 기반의 ARC B580과 ARC B570은 Xe2 아키텍처를 기반으로 업데이트가 이루어졌다. B580은 5 렌더 슬라이스로 20 Xe-Cores, 20 레이 트레이싱 유닛, 160 XMX AI 엔진, 2670MHz 클럭, 192bit 메모리 버스와 456GB/s 메모리 대역폭, 19Gbps 12GB GDDR6 메모리, 최대 233TOPs, TBP(Total Board Power) 190W를 제공한다. B570은 5 렌더 슬라이스로 18 Xe-Cores, 18 레이 트레이싱 유닛, 144 XMX AI 엔진, 2500MHz 클럭, 160bit 메모리 버스와 380GB/s 메모리 대역폭, 19Gbps 10GB GDDR 메모리, 최대 203TOPs, TBP 150W 스펙을 제공한다. 그 외 PCIe 8핀 1개, PCIe 4.0 x8, DisplayPort 2.1 3개(최대 UHBR 13.5), HDMI 2.1 1개를 공통으로 제공한다. Xe 미디어 엔진은 AV1, HEVC/ H.265(4:2:2 10비트 포함), AVC, VP9, XVAC-H 하드웨어 인코딩 및 디코딩 코덱 지원과 이중 멀티 포맷 트랜스코더(MFX)를 탑재해 더 빠르고 고품질의 멀티미디어(비디오) 생성 및 재생을 지원한다.



thumb-e39e30b922ee718f4d5423e182d5b5ca_XaicNubZ_50772c31b8e69b0b999f341354b7022063412157_600x337.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_tnB1lPXZ_dfff62fe4a4e1a08d5b3d450177ff6937251a9bd_600x337.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_PqH1pl49_3f1cf6cc26204e971342237b6047742fc6a6c3e8_600x336.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_vkb9aiVG_d9280d73bd821391c812a8ab00f39c1df4f00732_600x335.jpg


최신 게이밍 환경은 고품질의 텍스쳐를 비롯하여 레이 트레이싱, 고해상도 설정 등 기존보다 높은 그래픽 메모리 용량을 필요로 하고 있다. 인텔 ARC B-시리즈는 1440p 해상도 고품질 설정에서 10GB 이상의 고용량 메모리가 요구되기 시작하는 게이밍 환경을 고려해 B580/ B570에 각각 12GB/ 10GB를 제공해 이에 대응한다. 포르자 모토스포츠(Forza Motorsport)에서는 12GB 제공하는 B580 기준으로 2.7GB의 여분 메모리 용량, 고품질 RT 설정에서는 최대 64%의 향상이 이루어진다.

인텔 아크-B시리즈 GPU 중 ARC B580은 이전 ARC A750과 1440p 해상도의 게임에서 평균 24% 향상이 이루어졌으며 일부 게임에서는 최대 78% 빠른 성능을 제공한다. ARC B580은 엔비디아(NVIDIA) 지포스 RTX 4060 대비 평균 10% 향상된 성능을 제공한다. 인텔 아크 B580 GPU는 메인스트림 경쟁 제품과 비교시 가격 대비 최대 32%더 높은 성능을 제공한다.


thumb-e39e30b922ee718f4d5423e182d5b5ca_XwZp93WN_a56d453f5173316dfd1725b895d385850e870299_600x337.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_3idrFwuD_f769c0ffcdf8df8194897fe01f93f59c39d591f8_600x336.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_6ECXsgur_3fb3a56d0f2c768d0369caf6a56b73e978683a9f_600x335.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_iCZv7AGy_24a33376017f040fa5a2afac5cab0b04ba819b4b_600x338.jpg


인공지능(AI)이 대세인 현재 생성형 AI(Gen AI)와 앱과 OS 등을 내장한 스마트폰이나 태블릿의 온디바이스 AI(Ondevice AI), 이미지 생성 등 멀티 모달이 사용되고 있다. 지금 당장은 PC 사용자들에게 크게 반향을 일으키지는 못하고 있지만 CPU에 AI 가속을 위한 NPU 통합 등으로 이는 더욱 활발하게 지원될 예정이다. 


인텔은 CPU에서 OpenVINO, GPU에서는 ONNX, NPU에서는 W3C Web NN 등 오픈 소스 기반의 런타임 등을 CPU와 GPU, NPU 등의 하드웨어 가속이 가능하도록 최적화와 지원을 제공하고 있다. 여기에 인텔 ARC B- 시리즈의 Xe2 아키텍처는 인공지능(AI)에 대응하기 위해 XMX AI 엔진을 개선했다. 


ARC B580은 RTX 4060 대비 거대 언어 모델(LLM) Onnxruntime-gennai-directml O5.2 초당 토큰(Tokens) 처리에서 유리한 것으로 나타났다. 또 아크 B580은 오픈 소스 기반 생성형 AI(Gen AI)를 위한 AI 플레이그라운드 2.0(AI Playground 2.0) 등에서 하드웨어 최적화와 지원이 이루어진다. 인텔의 올인원 무료 AI 스타터 애플리케이션은 텍스트-이미지 생성, 사진 편집 및 업스케일링, 데이터 기반 챗봇 커스터마이징 등 생성형 AI 작업을 로컬에서 쉽게 실행할 수 있도록 설계되었다.


 

thumb-e39e30b922ee718f4d5423e182d5b5ca_0qUpNQwz_7715bdea8e509aff68d356b4bd9d1de09e40b8d4_600x337.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_Nf5FbTMA_31d29c73ee614a4733c8d5a09e6faa26ebff2fea_600x335.jpg

thumb-e39e30b922ee718f4d5423e182d5b5ca_r4bCHqxF_63f313f81994a249776607a1b624d92480353932_600x338.jpg


인텔 아크 B 시리즈 GPU는 최신 게임에 대해 최적화된 소프트웨어 및 성능 업데이트를 지속적으로 제공하고 있다. 이와 함께 새로운 인텔 그래픽 소프트웨어(Intel Graphics Software)는 기존 지원에서 한층 업데이트가 이루어졌다. 


색상 및 스케일링 모드와 가변 주사율(VRR) 지원을 포함한 디스플레이 설정, 프레임 제한 및 드라이버 수준의 저지연 모드를 포함한 3D 그래픽 설정, 성능 제어 기능으로는 기본 및 고급 오버클럭 설정과, 프레임 생성 및 지연 측정을 지원하는 오픈소스 프레젠트몬(PresentMon) 기반의 메트릭스 기능이 포함되며, 프레임 생성 및 지연 시간 측정도 지원한다.



thumb-e39e30b922ee718f4d5423e182d5b5ca_JkWlQC0E_5a7db24c243553bdc3d31c678e979ab6a35babe6_600x336.jpg


thumb-e39e30b922ee718f4d5423e182d5b5ca_xsf50cCb_e6c079a58645a080ab23a67d48e85c6856887751_600x337.jpg


인텔 아크 B580 한정판 그래픽 카드 및 에이서(Acer), 애즈락(ASRock), GUNNIR, 오닉스(Onix), 맥스썬(Maxsun), 스파클(Sparkle)의 보드 파트너 모델은 2024년 12월 13일부터 인텔 아크 B570 그래픽 카드는 2025년 1월 16일부터 동일한 파트너를 통해 구매 가능하다. B580은 249달러($249, 35만 2천원 선)부터, B570은 219달러($219, 31만원 선)부터 시작한다.

 

ⓒ 블루프레임(https://www.blueframe.co.kr) 무단전재 및 재배포금지

, , , , , , , , , , , ,

Facebook Twitter GooglePlus KakaoStory NaverBand Naver Tumblr Pinterest 신고
0 개의 댓글이 있습니다.
맨위로↑