به تازگی جزئیات مربوط به تراشه گرافیکی انویدیا Ada Lovelace AD102 که قرار است به کارتهای گرافیک سری GeForce RTX 40 قدرت بدهد، فاش شده است. این اطلاعات جدید از سوی Kopte7kimi میآید و در مورد بلوک دیاگرام معماری نسل بعدی صحبت میکند.
دیگر معماری گرافیکی انویدیا Ada Lovelace رمز و راز نیست. تا به الان پیکربندیهای خاصی را مشاهده کردهایم که محصولات سری بعدی Gen AD10* را برای کارتهای گرافیک سری GeForce RTX 40 تامین میکند و همچنین مشخصات لو رفتهای از این خط تولید را مشاهده کردهایم. حالا زمان آن رسیده که صرفاً در مورد خود تراشه گرافیکی نسل بعدی صحبت کنیم.
ارتقاء تقریبا دوبرابری نسبت به نسل قبلی خود
پردازنده گرافیکی انویدیا Ada Lovelace AD102 دارای حداکثر 12 GPC (خوشههای پردازش گرافیکی) خواهد بود. این افزایش 70 درصدی نسبت به GA102 است که تنها 7 GPC دارد. هر GPU از 6 TPC و 2 SM تشکیل شده است که همان پیکربندی تراشه موجود است. هر SM (چند پردازنده جریانی) دارای چهار هسته فرعی است که همان پردازنده گرافیکی GA102 است. آنچه تغییر کرده است پیکربندی هسته FP32 و INT32 است. هر هسته فرعی شامل 128 واحد FP32 است اما تعداد واحدهای ترکیبی FP32+INT32 به 192 میرسد.
بنابراین در مجموع، هر زیر هسته شامل 128 FP32 به اضافه 64 واحد INT32 است که به مجموع 192 واحد خواهد رسید. هر SM در مجموع 512 واحد FP32 به اضافه 256 واحد INT32 برای مجموع 768 واحد خواهد داشت. و از آنجایی که در مجموع 24 واحد SM (2 واحد در هر GPC) وجود دارد، ما به دنبال 12288 واحد FP32 و 6144 واحد INT32 برای مجموع 18432 هسته هستیم. هر SM همچنین شامل دو Wrap Schedules (32 نخ/CLK) برای 64 wrap در هر SM خواهد بود. بنابراین در اینجا با افزایش 50 درصدی در هستهها (FP32+INT32) و افزایش 33 درصدی در Wraps/Threads در مقابل GPU GA102 روبهرو هستیم.
با رفتن به حافظه نهان، خواهیم دیدی که انویدیا این بخش را نیز نسبت به پردازندههای گرافیکی موجود Ampere تقویت زیادی کرده است. پردازندههای گرافیکی Ada Lovelace دارای 192 کیلوبایت حافظه نهان L1 در هر SM هستند که 50 درصد نسبت به Ampere افزایش یافته است. این در مجموع 4.5 مگابایت حافظه نهان L1 در GPU برتر AD102 است. حافظه نهان L2 همانطور که فاش شده به 96 مگابایت افزایش خواهد یافت. این یک افزایش 16 برابری نسبت به پردازنده گرافیکی Ampere است که فقط 6 مگابایت حافظه نهان L2 را میزبانی میکنند. حافظه نهان در سراسر GPU به اشتراک گذاشته خواهد شد.
کمک به ارتقاء توان DLSS و Raytracing
در نهایت، ROPهایی داریم که به 32 واحد در هر GPC افزایش یافته است، که افزایش 2 برابری نسبت به پردازنده گرافیکی Ampere است و این یعنی 384 ROP در مقابل فقط 112 ROP در سریعترین پردازنده گرافیکی آمپر، RTX 3090 Ti. همچنین جدیدترین هستههای Tensor نسل چهارم و هستههای RT (Raytracing) نسل سوم وجود خواهند داشت. پردازندههای گرافیکی Ada Lovelace میتوانند به ارتقای عملکرد DLSS و Raytracing به سطح بالاتر کمک فراوانی کنند. به طور کلی، پردازنده گرافیکی Ada Lovelace AD102 ارائه می دهد:
- 2 برابر GPC بیشتر (در مقابل آمپر)
- 50٪ هسته بیشتر (در مقابل آمپر)
- 50% کش L1 بیشتر (در مقابل آمپر)
- 16 برابر حافظه کش L2 بیشتر (در مقابل آمپر)
- دو برابر کردن ROP (در مقابل آمپر)
- تانسور نسل چهارم و هسته های RT نسل سوم
توجه داشته باشید که سرعت کلاک، که گفته شده بین محدوده 2 تا 3 گیگاهرتز است، در این بین لحاظ نشده است، و این در حالی است که آنها نقش مهمی در بهبود عملکرد هر هسته در مقابل پردازنده آمپر خواهند داشت. کارتهای گرافیک سری انویدیا GeForce RTX 40 با پردازندههای گرافیکی بازی Ada Lovelace AD102 در نیمه دوم سال 2022 عرضه میشوند و گفته میشود که از همان گره پردازشی 4 نانومتری TSMC به عنوان پردازنده گرافیکی Hopper H100 استفاده میکنند و طبیعتا تا آن زمان میتوان انتظار جزئیات دقیقتری را هم داشت.
مطالب مرتبط:
ایول
انویدیا اعلام کرد درایورهای جدید خود را متن باز میکند. آیا انویدیا مغلوب هکرهایی شده که چند وقت پیش تهدید به انتشار بیشتر اسرار این شرکت کرده بودند!؟ از درخواستهای این گروه هکری متن باز شدن داریورهای انویدیا برای همه پلتفرمها بود. لطفا شفافسازی کنید ببینبم چه خبره