معماری گرافیکی نسل بعدی انویدیا Ampere یکی از مخفیترین نمونهها در تاریخ کمپانی بوده اما به نظر میرسد شرکای آنها در بازار HPC کم کم ابرها را برای ما کنار میزنند. با توجه به The Next Platform (از طریق Videocardz)، دانشگاه ایندیانا قصد دارد جدیدترین ابرکامپیوتر خود با نام Big Red 200 را راه اندازی کند که از گرافیکهای نسل بعدی انویدیا بهره خواهند برد.
با توجه به سخنان Brad Wheeler معاون فناوری اطلاعات و مدیر ارشد اطلاعات در دانشگاه ایندیانا، ابر کامپیوتر Big Red 200 بزرگداشت سالگرد 200 سالگی دانشگاه خواهد بود. ابر کامپیوتر Big Red 200 قرار است از هر دو بار کاری HPC و AI (هوش مصنوعی) پشتیبانی کند. این ابر کامپیوتر در دو فاز طراحی شده، فاز اول که از همین حالا مشغول کار است، از 672 نود دو سوکت با پردازندههای AMD EPYC 7742 تشکیل شده که از 64 هسته 129 رشته بهره میبرند. این یعنی 86016 هسته و 172032 رشته پردازشی در تمام این ابر کامپیوتر وجود دارد.
فاز دوم اما شاید جذابتر نیز باشد. زمانی که در تابستان عملیاتی شود، این سیستم نه تنها پردازندههای EPYC 7742 را به کار میگیرد بلکه گرافیکهای نسل بعدی انویدیا را نیز در کنار خود خواهد داشت. نکته جالب اینجاست که Big Red 200 در ابتدا قرار بود که از گرافیکهای Tesla V100 بر پایه معماری Volta بهره ببرد اما با توجه به صحبتهای Wheeler، آنها برنامه ریزی کردند تا مدت زمان بیشتری منتظر گرافیکهای نسل بعدی انویدیا بمانند، همین مسئله باعث شد آنها ایده توسعه سیستم در دو فاز را عملی کنند.
در ابتدا قرار بود نهایت کارایی ابر کامپیوتر Big Red 200 در حدود 5.9 پتافلاپ باشد اما حالا انتظار میرود قدرت محاسباتی آن به رقم 8 پتافلاپ افزایش یابد. هر نود در ابر کامپیوتر Big Red 200 به یک یا دو گرافیک نسل بعدی انویدیا مجهز خواهد شد. همچنین اشاره شده که Big Red 200 با این که قرار است از گرافیکهای نسل بعدی کمتری در مقایسه با طراحی اولیه بر پایه Volta V100 استفاده کند، اما 2 پتافلاپ کارایی بالاتری خواهد داشت. دلیل این امر نیز گرافیکهای نسل بعدی ذکر شدهاند که گفته شده قدرتی 70 تا 75 درصد بیشتر از مدلهای فعلی دارند. البته مقایسه ما با گرافیکهای بر پایه Volta مانند Tesla V100 بوده و نه گرافیکهای Tesla بر پایه معماری گرافیکی Turing.
Volta و Turing البته که تشابهات زیادی دارند و Turing در واقع یک نسخه بهینهتر از Volta میباشد. اگر 70 تا 75 درصد افزایش کارایی به واقعیت نزدیک باشد، پس میتوانیم به راحتی شاهد 50 درصد کارایی بالاتر یا حتی بیشتر در نسخههای مصرف کننده باشیم. در نظر داشته باشید که شایعات قبلی به افزایش کارایی 50 درصدی گرافیکهای نسل بعدی Ampere در عین بهره وری انرژی دو برابری در مقایسه با گرافیکهای Turing اشاره داشتند.
در مصاحبهای مدیر عامل انویدیا Jensen Huang تایید کرده بود که بخش اعظمی از گرافیکهای نسل بعد توسط TSMC با فناوری 7 نانومتری تولید میشوند و تنها قسمت کوچکی از تولید بر عهده سامسونگ خواهد بود. سرانجام از ایشان درباره بازه زمانی گرافیکهای نسل بعدی آنها سوال شد که او به سادگی پاسخ داد، فعلا نمیتواند تاریخ خاصی را مشخص کند. Colette Kress از دیگر مدیران انویدیا نیز قبلا گفته بود آنها قصد دارند با معرفی گرافیکهای 7 نانومتری خود همه را شگفت زده کنند اما منتظر زمان مناسب هستند.
گرافیکهای Ampere نه تنها Rasterization و عملکرد سایه زنی را بهبود میدهد بلکه کارایی Ray Tracing را نیز افزایش خواهند داد. از آنجایی که Turing اولین نسلی بود که Ray Tracing سخت افزاری در آن پیاده سازی شد، Ampere با بهینه سازیها و سخت افزار بهتر RT و هستههای Tensor میتواند اوضاع را بهتر کند. گرافیکهای Ampere همچنین احتمال دارد که از PCI Express 4.0 استفاده کنند که البته چندان عجیب نیست زیرا این مدلها برای نسل بعدی پلتفرمهای گیمینگ توسعه مییابند، در این میان پروتکل PCIe 4.0، به علاوه NVLINK قابلیتهایی حیاتی به نظر میرسند.
کارت گرافیک NVIDIA GeForce RTX 3080
همانطور که در بالا اشاره کردیم، NVIDIA GeForce RTX 3080 جانشین GeForce RTX 2080 خواهد بود. این مدل در کل شامل 60SM با 64 هسته CUDA برای هر کدام میباشد که در نهایت 3840 هسته CUDA را تشکیل خواهد داد. این یک پرش عظیم نسبت به تعداد هستههای فعلی RTX 2080 با 3072 عدد است و ما حتی سرعت کلاک را محاسبه نمیکنیم که انویدیا میتواند با فناوری 7 نانومتری پیشرفته از آن به خوبی بهره ببرد.
گفته شده این کارت از گذرگاه 320 بیت استفاده میکند که یعنی پشتیبانی از پیکربندی حافظه 10 یا 20 گیگابایت GDDR6 برای آن فراهم خواهد بود. اگر انویدیا واقعا قصد داشته باشد طرفداران را با Ampere شگفت زده کند، انتخاب 20 گیگابایت حافظه بسیار عالی میباشد. با این حال باید در نظر گرفت که چنین میزانی قیمت را به شدت افزایش میدهد و شایعات مربوط به کمبود حافظه مربوط به تقاضای بالای بازار کنسولها را نیز باید در نظر گرفت.
اجازه دهید محافظه کار باشیم و بگوییم 10 گیگابایت حافظه GDDR6 در این نسخه وجود دارد که همچنان 2 گیگابایت بیش از GeForce RTX 2080 است. اگر شاهد ماژولهای 16 گیگابیت بر ثانیه روی RTX 3080 باشیم، پهنای باند کلی به 640 گیگابایت بر ثانیه خواهد رسید که افزایش قابل توجهی نسبت به 496 گیگابایت بر ثانیه RTX 2080 SUPER با ماژولهای 15.5 گیگابیتی و گذرگاه 256 بیت است.
کارت گرافیک Nvidia GeForce RTX 3070
کارت دوم GeForce RTX 3070 میباشد و همانطور که ادعا شد از چیپ GA104 استفاده خواهد کرد. جانشین GeForce RTX 2070 با چیپ TU106 از تعداد هسته مشابه RTX 2080 یعنی 3072 عدد یا 48 واحد چند پردازنده جریانی (SM) بهره مند است. انتظار میرود این کارت از گذرگاه 256 بیت برای 8 یا 16 گیگابایت حافظه GDDR6 استفاده کند اما باید نکاتی که درباره قیمت و میزان تولید GDDR6 در بالا اعلام کردیم را در نظر بگیرید.
نام کارت گرافیک | Nvidia GeForce RTX 2070 | Nvidia GeForce RTX 2080 | Nvidia GeForce RTX 3070 | Nvidia GeForce RTX 3080 | Nvidia GeForce RTX 2080 Ti |
چیپ و معماری گرافیکی | Turing TU106 | Turing TU104 | Ampere GA104 | Ampere GA104 | Turing TU102 |
فناوری ساخت | 12nm FinFET TSMC | 12nm FinFET TSMC | 7nm FinFET؟ TSMC | 7nm FinFET؟ TSMC | 12nm FinFET TSMC |
تعداد SM | 36 | 48 | 48 | 60 | 72 |
تعداد هستههای CUDA | 2304 | 3072 | 3072 | 3840 | 4608 |
حافظه | 8 گیگابایت GDDR6 | 8 گیگابایت GDDR6 | 8 یا 16 گیگابایت GDDR6 | 10 یا 20 گیگابایت GDDR6 | 11 گیگابایت GDDR6 |
گذرگاه حافظه | 256 بیت | 256 بیت | 256 بیت | 320 بیت | 320 بیت |
فرکانس حافظه | 14 گیگابیت بر ثانیه | 14 گیگابیت بر ثانیه | 16 گیگابیت بر ثانیه؟ | 16 گیگابیت بر ثانیه؟ | 14 گیگابیت بر ثانیه |
پهنای باند حافظه | 448 گیگابایت بر ثانیه | 448 گیگابایت بر ثانیه | 512 گیگابایت بر ثانیه | 640 گیگابایت بر ثانیه | 640 گیگابایت بر ثانیه |
تاریخ معرفی | 2018 | 2018 | 2020 | 2020 | 2018 |
امری که درباره این دو کارت جلب توجه میکند، فضای بسیار زیادیست که برای GeForce RTX 3080 Ti باقی گذاشتهاند تا بتواند یک بار دیگر بخش حرفهای بازار را هدف بگیرد، میباشد. اگر گزارشات درباره معماری Ampere درست باشد شاهد افزایش کارایی 50 درصدی نسبت به Turing هستیم در حالی که بهره وری انرژی دو برابری را نیز مشاهده میکنیم، اگر این ادعا صحت داشته باشد یک RTX 3070 قادر خواهد بود کارایی در حد (یا بهتر) RTX 2080 Ti در قیمتی بسیار پایینتر را ارائه دهد.
با توجه به اطلاعات مطرح شده از سوی Taipei Times گرافیکهای Nvidia Ampere عملکرد به واقع قدرتمندی را در هر دو بخش کارایی و مصرف انرژی به همراه دارند. انتظار میرود کارایی کلی بالغ بر 50 درصد نسبت به مدلهای Turing فعلی افزایش یافته و در عین حال شاهد بهره وری انرژی دو برابر بهتری باشیم. به وضوح اشاره شده که Ampere مصرف انرژی را نسبت به گرافیکهای Turing به نصف خواهد رساند. این یعنی یک گرافیک با توان حرارتی کمتر از RTX 2060 (بین 125 تا 150 وات) میتواند کارایی بهتری از RTX 2080 Ti داشته باشد که واقعا خارق العاده است. چنین عملکردی میتواند رویای گیمینگ واقعی 4K 60FPS به همراه Ray Tracing را به سادگی برای معماری Ampere ممکن کند.
هنوز تاریخ انتشار دقیقی برای گرافیکهای GeForce بر پایه Ampere وجود ندارد اما شایعات به عرضه در نیمه دوم سال 2020 اشاره میکنند، با این حال احتمال عرضه زودتر وجود دارد. انتظار میرود انویدیا کنفرانس سالانه خود در GTC 2020 را در ماه مارس برگزار کند که یعنی احتمال دارد اطلاعات بیشتری درباره معماری نسل بعدی تیم سبز به گوش برسد، حتی اگر تنها شاهد معرفی یک کارت HPC باشیم. این موضوع با کارتهای Turing نیز تکرار شد که در ابتدا با یک کارت ایستگاه کاری رونمایی شدند یا حتی Pascal که با یک مدل مخصوص HPC همراه بود. به هر حال خیلی زود اطلاعات بیشتری از معماری Nvidia Ampere خواهیم شنید تا بازار کارت گرافیکها در سال 2020 بسیار پرهیجان دنبال شود.
ما همین حالا نیز اولین محصول با معماری 7 نانومتری Ampere یعنی سیستم روی چیپ Orin را شاهد بودهایم. بدون شک Ampere محصولی خواهد بود که همه ما باید درباره آن هیجان زده باشیم اما تا نیمه دوم سال 2020 هنوز راه زیادی باقی مانده. با توجه به این که Big Red 200 در تابستان عملیاتی خواهد شد، مشخصا ما میتوانیم شاهد یک رونمایی رسمی از گرافیکهای نسل بعدی Ampere در GTX 2020 باشیم.
دیدگاهتان را بنویسید