تام پترسن اعلام کرده بود که گرافیک Xe3 اینتل از سری Panther Lake استانداردی جدیدی را تعریف خواهد کرد، هماکنون معماری گرافیک Xe3 اینتل بهصورت رسمی معرفی شده و عملکردی بیش از 50 درصد بهتر از Xe2 با واحدهای پیشرفته ردیابی پرتو و 12 هسته Xe برای پردازنده گرافیکی مجتمع Panther Lake سری Arc B دارد؛ همچنین نسخه Xe3P در آینده عرضه میشود.
معرفی معماری نسل سوم Xe اینتل برای پردازنده گرافیکی مجتمع Panther Lake
اینتل سال گذشته معماری Xe2 را معرفی کرد که در دو محصول کلاینت، پردازندههای Lunar Lake سری Core Ultra 200 بهعنوان پردازنده گرافیکی مجتمع و کارتهای گرافیک مجزای Arc B-Series سری Battlemage به کار رفت. این معماری به لطف تجربیات کسبشده از معماری Xe1 و خانواده Arc Alchemist A-series، در هر دو پلتفرم با موفقیت چشمگیری همراه بود. اینتل در بخش نرمافزار نیز پیشرفتهای قابلتوجهی داشته و پشتیبانی درایورهای قوی برای معماری گرافیکی خود ارائه کرده که نهتنها به بازی محدود نمیشود؛ بلکه برای تولید محتوا، رندرینگ و بارهای کاری هوش مصنوعی نیز عملکردی عالی دارد. سری Arc Pro که بهتازگی معرفی شده، از همان شاخه درایورهای Battlemage پشتیبانی میکند.



طی ماههای اخیر، اینتل بهروزرسانیهای قدرتمندی در زمینه گرافیک ارائه کرده است. معماری بهبود یافته و نرمافزار بهینهسازی بهتری برای استفاده از آن انجام میدهد. با عرضه سری Panther Lake سری Core Ultra 300، نسل جدیدی از معماری Xe با نام Xe3 معرفی شده است.

پردازندههای گرافیکی مجتمع Xe3 و معرفی Xe3P
معماری Xe3 اینتل بر پایه Xe2 توسعه یافته و با مقیاسپذیری به پیکربندیهای بزرگتر و طراحی بهینهشده برای توان عملیاتی بالاتر ارائه میشود. پردازندههای گرافیکی مجتمع Xe3 تحت برند Arc B-Series عرضه خواهند شد. در حالی که کارتهای گرافیک مجزای Battlemage سری Arc B بر پایه معماری Xe2 هستند، پردازندههای گرافیکی مجتمع Panther Lake از معماری Xe3 استفاده میکنند. اینتل اعلام کرده که به دلیل شباهتهای Xe2 و Xe3، تصمیم به یکپارچهسازی محصولات در دستههای مجتمع و مجزا گرفته است. با این حال، اینتل برنامهای برای عرضه خانواده جدید Arc با معماری بهروزرسانیشده Xe3P دارد که گامی بزرگ به جلو محسوب میشود.

جزئیات بیشتری اعلام نشده؛ اما به نظر میرسد اینتل به جای حرکت مستقیم به سمت Xe4، معماری Xe3 را برای محصولات آینده، چه مجتمع و چه مجزا، بهینهسازی خواهد کرد. بر اساس طرح کلی، Xe3P ممکن است در راهحلهای گرافیک مجزا یا پیکربندیهای پیشرفتهتر پردازندههای گرافیکی مجتمع برای پردازندههای Nova Lake استفاده شود. پردازنده گرافیکی Xe3P در سری Arc B مانند Battlemage یا Panther Lake قرار نمیگیرد؛ بلکه در خانواده بعدی Arc، احتمالاً سری Arc C، به کار خواهد رفت.
مشخصات Xe3؛ مقیاسپذیری برای عملکرد و توان بالاتر
افزایش مقیاس در پردازش رندر
اینتل در معماری Xe3 تعداد هستههای Xe و واحدهای ردیابی پرتو (ری تریسینگ) را در هر برش رندر افزایش داده است. در Xe2، هر برش رندر شامل 4 هسته Xe و 4 واحد ردیابی پرتو بود؛ اما Xe3 این تعداد را به 6 هسته Xe و 6 واحد ردیابی پرتو افزایش داده که نشاندهنده رشد 50 درصدی است.



این امکان را به اینتل میدهد تا پیکربندیهای متنوعی از کاشیهای گرافیکی در سیستمهای روی چیپ Panther Lake استفاده کند. پیکربندی 4 هستهای Xe برای تراشههای 8C و 16C و پیکربندی 12 هستهای Xe برای تراشه برتر 16C ارائه شده است. در مقایسه، پردازندههای Arrow Lake و Lunar Lake هر دو تا 8 هسته Xe بر پایه معماریهای Xe1 و Xe2 دارند. Panther Lake در مدلهای 8C و 16C از 4 هسته Xe استفاده میکند که نصف تعداد هستههای کنونی است؛ اما بهبودهای معماری گرافیکی، رقابتپذیری را حفظ خواهد کرد.
پیکربندی 4 هستهای Xe
پیکربندی 4 هستهای Xe در دو نسخه تراشه 8C با فناوری فرآیند Intel 3 و تراشه 16C با فناوری فرآیند TSMC N3E عرضه میشود. مشخصات آن به شرح زیر است:
- 4 هسته Xe (معماری Xe3)
- 1 واحد Render Slice
- 32 موتور XMX
- 4 مگابایت حافظه کش L2
- 1 خطلوله هندسی (Geo Pipeline)
- 4 نمونهبردار (Sampler)
- 4 واحد رهگیری پرتو (Ray Tracing Unit)
- 2 بخش پیکسل (Pixel Backend)

پیکربندی 12 هستهای Xe
پیکربندی 12 هستهای Xe با فناوری فرآیند TSMC N3E ساخته شده و مشخصات آن به این صورت است:
- 12 هسته Xe (معماری Xe3)
- 2 واحد Render Slice
- 96 موتور XMX
- 16 مگابایت حافظه کش L2
- 2 خطلوله هندسی (Geo Pipeline)
- 12 نمونهبردار (Sampler)
- 12 واحد رهگیری پرتو (Ray Tracing Unit)
- 4 بخش پیکسل (Pixel Backend)

پیکربندی 4 هستهای Xe با حافظه نهان L2 به ظرفیت 4 مگابایت، نصف حافظه Lunar Lake با 8 مگابایت است؛ اما پیکربندی 12 هستهای Xe دو برابر حافظه نهان دارد. افزایش حافظه نهان، ترافیک روی ساختار سیستم روی چیپ را کاهش داده و در بازیها تا 36 درصد و بهطور میانگین 25 درصد کاهش مییابد.




تغییرات معماری در Xe3
هسته نسل سوم Xe شامل 8 موتور برداری 512 بیتی، 8 موتور XMX با عرض 2048 بیت و 33 درصد حافظه نهان مشترک L1/SLM بیشتر است. موتور برداری Xe با افزایش 25 درصدی تعداد رشتهها، تخصیص متغیر رجیستر و پشتیبانی از دیکوانتیزاسیون FP8، استفاده بهتری در معماری Xe3 ارائه میدهد. این موتور شامل ALUهای بومی SIMD16، صدور سهطرفه، بلوکهای ریاضی پیشرفته و FP64 و افزونههای ماتریسی Xe است.
موتورهای XMX در Xe3 برای شتابدهی هوش مصنوعی مسئول هستند. با 96 موتور XMX، پردازندههای گرافیکی مجتمع 12 هستهای تا 120 ترافلاپس توان محاسباتی ارائه میدهند. بر این اساس، پردازندههای 4 هستهای تا 40 ترافلاپس و پردازندههای 8 هستهای Xe3 تا 67 ترافلاپس توان محاسباتی هوش مصنوعی فراهم میکنند که 25 درصد بهبود نسبت به Xe2 با 67 ترافلاپس دارد.

مشخصات عملیات در هر چرخه به ازای هر هسته Xe به شرح زیر است:
- XMX TF32: با 1024 عملیات/چرخه
- XMX FP16: با 2048 عملیات/چرخه
- XMX BF16: با 2048 عملیات/چرخه
- XMX INT8: با 4096 عملیات/چرخه
- XMX INT4: با 8192 عملیات/چرخه
- XMX INT2: با 8192 عملیات/چرخه

واحد ردیابی پرتو بهبودیافته Xe3 از مدیریت پویای پرتو برای ردیابی پرتو ناهمزمان استفاده میکند. این واحد شامل چندین خط لوله پیمایش، دو واحد تقاطع مثلثی و حافظه نهان BVH است. بهبودها از طریق کاهش سرعت ارسال پرتوهای جدید برای جلوگیری از انسداد در واحد مرتبسازی رشتهها حاصل شده است. مدیر جدید URB امکان بهروزرسانیهای جزئی را فراهم کرده و نیازی به بازنویسی کامل ندارد. معماری جدید همچنین تا 2 برابر فیلترگذاری ناهمسانگرد و نرخ آزمون شابلون را ارائه میدهد.

در بخش رسانه، اینتل از کدگذاری/رمزگشایی AV1، رمزگشایی VVC و پشتیبانی از فناوری eDP 1.5 استفاده کرده است. افزونههای جدید شامل پشتیبانی از AVC 10 بیتی و فرمتهای Sony XAVC-H، XAVC-HS و XAVC-S است.
عملکرد و بنچمارک معماری Xe3 اینتل
اینتل معیارهای اولیه عملکرد پردازندههای گرافیکی Xe3 را بهصورت میکروبنچمارک ارائه کرده که بخشهای مختلف میکرومعماری گرافیکی را ارزیابی میکند. معیارهای ترکیب و بکاند تغییر چندانی نداشتهاند؛ زیرا منابع اختصاصیافته به آنها ثابت مانده است. معیارهای FP16 در GEMM بهبود 50 درصدی را نشان میدهند که متناسب با مقیاس 50 درصدی بزرگتر Xe3 نسبت به Xe2 است. بهبودهای میکرومعماری مانند نرخ ناهمسانگرد، نرخ رندر مش، خوانشهای پراکنده و تقاطع ردیابی پرتو از 2 تا 2.7 برابر افزایش یافتهاند. آزمون عمق و برنامههای سنگین رجیستر تا بیش از 7 برابر بهبود عملکرد نسبت به نسل قبلی نشان میدهند.

در مقایسه عملکرد واقعی، Xe3 در Panther Lake نسبت به Xe2 در Lunar Lake بیش از 50 درصد عملکرد بهتر و نسبت به Xe+ در Arrow Lake-H بیش از 40 درصد بهرهوری توان بالاتر ارائه میدهد.



بهینهسازیهای نرمافزاری Xe3
اینتل بهروزرسانیهایی در پشته نرمافزاری گرافیک ویندوز اعمال کرده است. بهروزرسانیهای کامپایلر از طریق IGC ارائه شده و تخصیص متغیر رجیستر بهبود یافته است. زمانبندی سریعتر با پیشتصرف مستقیم، امکان جابهجایی بین زمینهها بدون تخلیه را فراهم میکند. پشتیبانی از بردارهای همکاری DirectX نیز اضافه شده است. اینتل دمویی از “Neural Radiance Field” را نمایش داد که از بردارهای همکاری استفاده میکند.



مقایسه Xe3 با رقبا
پردازنده گرافیکی مجتمع Xe3 ارتقای قابلتوجهی نسبت به Xe2 ارائه میدهد. معماری Xe2 در حال حاضر با سریعترین پردازندههای گرافیکی مجتمع RDNA 3.5 مانند Radeon 890M و 880M برای لپتاپهای سری اصلی همتراز است. اگرچه به سطح عملکرد Strix Halo با پیادهسازیهای بزرگتر RDNA 3.5 نمیرسد؛ اما همکاری اخیر اینتل و انویدیا در ساخت سیستم روی چیپ سفارشی این بخش را پوشش خواهد داد.
دیدگاهتان را بنویسید