کامپیوترهای یادگیری ماشین،یادگیری عمیق و هوشمند جزو برترین سخت افزارهایی هستند که “انویدیا” به آنها توجه ویزه ای را معطوف داشته است.از کامپیوترهای DXG-1 گرفته تا شتاب دهنده های قدرتمند تسلا.
انویدیا به تازگی پرده از سخت افزار یادگیری خود برداشته است.این محصول که با نام Nvidia Parker شناخته خواهد شد،توانایی های بسیار زیادی را از معماری “پاسکال” آزاد می کند.انویدیا برای نخستین بار در تاریخ 5 آوریل،اولین محصول غیر خانگی بر اساس معماری پاسکال را معرفی کرد. TESLA P100 نام عضو جدید خانواده تسلا بود که بر پایه معماری “پاسکال” تهیه شده است.به لطف لیتوگرافی 16 نانومتری،15 میلیارد ترانزیستور برای غلبه بر پردازش ها درون تراشه ی اصلی جای گرفته است. این مقدار از حجم ترانزیستور تقریبا دو برابر مقداری است که تراشه های مشابه و بر پایه معماری مکسول مورد استفاده قرار گرفته بود.P100 از 16 گیگبایت حافظه ی HBM2 برخوردار است که می تواند سرعت در اختیار گذاشتن اطلاعات به پردازنده را بسیار بالا ببرد.لازم به ذکر است که این برای اولین بار است که یک پردازشگر تسلا از لیتوگرافی 16 نانومتری استفاده می کند و مدل های گذشته عموما دارای لیتوگرافی 28 نانومتری بودند. توان حرارتی (TDP) این محصول نیز 300 وات عنوان شده است.4 مگابایت حافظه ی کش L2 و 14 مگابایت حافظه register file برای آن در نظر گرفته شده است.در بخش توان محاسباتی نیز اطلاعات مناسبی ارائه شده است.5.3 ترافلاپ در حالت پردازش هایی به طول 64 بیت،10.63 ترافلاپ در حالت پردازش های 32 بیتی و 21.2 تافلاپ در حالت پردازش هایی به طول 16 بیت از جمله مهترین اطلاعات عضو جدید خانواده تسلا هستند.رابطه حافظه در این سخت افزار به مقدار 4096 بیت رسیده است که به نسبت گذشته رقم بسیار بالایی محسوب می گردد.کلاک GPU در حالت پایه (Boost) برابر با 1408 مگاهرتز و در حالت پایه نیز 1328 مگاهرتز است.همچنین 224 واحد بافت نیز در اطلاعات به چشم میخورد.حافظه ی نصب شده از فناوری ECC استفاده می کند که می تواند ضریب خطا را به خوبی کاهش دهد.
کمی بعد،انویدیا به طور رسمی مشخصات مدل های تسلا را معرفی کرد.پس از معرفی شتاب دهنده گرافیکی P100،انویدیا ابر کامپیوتر DGX-1 را معرفی کرد.DGX-1 یک کامپیوتر برای یاد گیری عمیق است که شاید بتوان آن را در حوزه یادگیری ماشین هم وارد کرد.انویدیا سینه خود را سپر کرده و در اوایل اطلاعات این محصول گفت:DGX-1 توانی برابر با 250 کامپیوتر سرور X86 دارد.امکاناتی که این کامپیوتر در اختیار دانش جهان می گذارد،به واقع جای تقدیر و تشکر دارد.DGX-1 به دلیل توانای هایی که از تراشه GPU به دست می آورد،می تواند در یادگیری های حوزه تحقیق پزشکی کمک کرده و روند آنها را تسریع کند. 7 ترابایت حافظه ی SSD در کنار 8 شتاب دهنده ی تسلا P100 که هر کدام دارای 16 گیگابایت حافظه ی HBM2 هستند،در خدمت این کامپیوتر است.این کامپیوتر در ماه ژوئن در دسترس عمومی قرار خواهد گرفت.توان پردازشی این کامپیوتر 170 ترافلاپ است و توانی برابر با 3200 وات را طلب می کند که در اختیار آن گذاشته شده است. این غول پردازشی قیمتی برابر با 129 هزار دلار دارد که به واقع توانایی های آن پوششی بر این برچسب قیمت گذاری هستند.اما امکانات DXG-1 به سخت افزار محدود نمی گردد.انویدیا از نسخه 5 کتابخانه ی CUDA با نام cuDNN در این کامپیوتر بهره برده است و کتابخانه های دیگری برای توسعه،بالا بردن توانایی ها و شناسایی اجسام و الگوها برای آن در نظر گرفته شده است.انویدیا اعلام کرده است که در صورت تمایل خریداران،خدمات پس از فروش ویژه ای در اختیار آنها قرار خواهد گرفت.به عنوان مثال به روزرسانی و پشتیبانی نرم افزاری برای بهبود بهره وری از جمله آنها است.
سخت افزار Nvidia Parker را می توان نسخه ای دیگر از PX2 دانست.این کامپیوتر،قادر به یادگیری و اجرای تصمیمات بوده و می تواند در اتومبیل،هواگرد و تمامی ماشین آلات مشابه مورد استافاده قرار گیرد.انویدیا همچنان از ترکیب GPU و CPU در این محصول استفاده کرده است.طبیعی است که پردازنده های GPU به منظور پوشش دستورهای مشابه بهتر عمل خواهند کرد.این کامپیوتر می تواند توان عملیت مستقیم خود را به آسانی تا 1.5 ترافلاپ افزایش دهد.SOC های نصب شده بر روی این محصول به دو عدد می رسد که انویدیا نام Parker را بر روی آنها نهاده است.هر تراشه دارای مشخصاتی است که در هر دوی آنها یکسان است.در قسمتی که معماری Pascal GPU وجود دارد،هر SOC به 256 هسته CUDA مجهز شده است.در این قسمت،انویدیا پشتیبانی از کتابخانه های سطح میانی و پایین مانند DX12،OpenGL 4.5،CUDA 8.0،OpenGL ES 3.1 و Vulkan را محیا کرده است.در نتیجه،توسعه دهندگان و برنامه نویسان برای تولید پلتفرم های نرم افزاری بسیار توانمند و منعطف خواهند بود.این SOC به آسانی از پس پردازش های 4K با 60 فریم در ثانیه بر خواهد آمد.سوی دیگر SOC،شاهد اضافه کردن هنرمندانه یک CPU هستیم.این CPU نیز به خودی خود دارای چندین قسمت متفاوت است!هر CPU از 2 پردازنده Denver 2.0 از نوع 64 بیتی و 4 پردازنده ARM A57 بهره می برد که این پردازنده ها نیز 64 بیتی هستند.انویدیا از حافظه های هماهنگ با ECC استفاده کرده است.بدین ترتیب،خطای ایجاد شده به شدت کاهش پیدا می کند.یک رابط 128 بیتی،مهمترین واصل LPDDR4 مورد استفاده در PX2 های نسل جدید است.
اما این پایان کار نیست؛این کامپیوتر به واحدهای متعدد دیگر نیز مجهز است.به عنوان مثال می توان به موتورهای Video Encoder،Video Decoder،موتور صدا،موتور امنیتی،موتور حفاظت و…اشاره کرد.در نهایت انویدیا دست به کار شده و قابلیت کد گذاری و کد گشایی H.265 و VP9 را برای این کامپیوتر فراهم ساخته است.پیشرفت علوم در جهان،در سایه بدون تبلیغات چنین سخت افزارهایی صورت می گیرد.
دیدگاهتان را بنویسید