در جریان نمایشگاه CES 2025، دیجیتال فاندری با برایان کاتانزارو، معاون تحقیقات یادگیری عمیق کاربردی انویدیا، مصاحبهای انجام داد و در مورد معرفی DLSS 4 و ویژگیهای جدید آن در زمینههای Super Resolution ،Ray Reconstruction و Frame Generation بحث کرد. پشتیبانی از تولید فریم برای کارت گرافیک های RTX 30 یکی از استراتژیهای جدید انویدیا برای سال 2025 است که اتفاقات خوبی رقم خواهد زد.
کاتانزارو در مورد مدلهای جدید ترنسفورمر که جایگزین شبکههای عصبی کانولوشنی (CNN) برای Super Resolution و Ray Reconstruction شدهاند، توضیح داد. این مدلها به مراتب هوشمندتر از گذشته هستند، قادر به آموزش روی دادههای بزرگتری هستند و به همین دلیل تصمیمات بهتری اتخاذ میکنند که به رفع مشکلات پیشین DLSS، مانند لرزش یا شبحزنی، کمک میکند. به طور خاص، مدل جدید Super Resolution نسبت به نسخه قبلی چهار برابر قدرت محاسباتی بیشتری دارد. هرچند کاتانزارو زمان اضافی رندر را تخمین نزد، اما تأکید کرد که انویدیا معتقد است این روش، بهترین تجربه بازی را روی کارتهای گرافیک جدید GeForce RTX 50 با معماری Blackwell که به زودی وارد بازار میشوند، ارائه خواهد داد.
پشتیبانی از تولید فریم (Frame Generation) در حال بازسازی است و مدل قبلی که بر اساس شتابدهنده سختافزاری Optical Flow بود، جای خود را به یک راهحل کاملاً مبتنی بر هوش مصنوعی داده است. در اینجا دلیل این تغییر توضیح داده شده است:
زمانی که NVIDIA DLSS 3 Frame Generation را طراحی کردیم، برای محاسبه Optical Flow به شتابدهی سختافزاری نیاز داشتیم. چون نه تعداد کافی Tensor Core داشتیم و نه الگوریتم Optical Flow مناسبی در دسترس بود. ما هیچ الگوریتم Optical Flow واقعیزمانی که روی Tensor Core ها اجرا شود و متناسب با بودجه محاسباتی ما باشد، نداشتیم. در عوض، شتابدهنده Optical Flow را داشتیم که انویدیا آن را برای سالها به عنوان تکامل فناوری کدک ویدیویی خود توسعه داده بود و همینطور در شتابدهندههای بینایی ماشین برای خودروهای خودران استفاده میشد.
برایان کاتانزارو
او ادامه داد: استفاده از این شتابدهنده در DLSS 3 Frame Generation منطقی بود، اما مشکل پیادهسازی هر الگوریتم سختافزاری مانند Optical Flow این است که به سختی میتوان آن را بهبود داد. به نوعی، محدودیتهای آن مشخص است و شکستهایی که از شتابدهنده Optical Flow بهوجود آمد، با یک شبکه عصبی هوشمندتر قابل اصلاح نبود. تا اینکه تصمیم گرفتیم آن را کنار بگذاریم و به راهحلی کاملاً مبتنی بر هوش مصنوعی روی بیاوریم. اینچنین بود که تولید فریم در DLSS 4 را به طور کامل بر اساس هوش مصنوعی ساختیم.
بروزرسانیهای جدید انویدیا برای سری RTX 30
مدل جدید تولید فریم حالا بیشتر به Tensor Core ها وابسته است، اما از VRAM کمتری استفاده میکند، کیفیت تصویر بهتری ارائه میدهد (که کاتانزارو آن را برای Multi Frame Generation جدید در کارتهای گرافیک RTX 50 بسیار حیاتی میداند) و همچنین از نظر کارایی بهبود یافته است، زیرا هزینه محاسباتی آن بین چندین فریم تقسیم شده است.
آلکس باتالیای دیجیتال فاندری از برایان کاتانزارو پرسید که آیا مدل جدید DLSS میتواند به سختافزارهای قدیمیتر مانند کارتهای گرافیک GeForce RTX 30 منتقل شود یا خیر، و کاتانزارو در پاسخ در این باره درب را بسته نگذاشت.
او گفت: «این بیشتر یک مسئله بهینهسازی و مهندسی است و در نهایت به تجربه کاربری بستگی دارد. ما این فناوری تولید فریم را، که بهترین تکنولوژی Multi Frame Generation است، با سری 50 معرفی میکنیم و باید ببینیم که در آینده چه چیزهایی از سختافزارهای قدیمیتر میتوان استخراج کرد.»
یادآوری میشود که وقتی انویدیا فناوری تولید فریم را با کارتهای گرافیک GeForce RTX 40 معرفی کرد، کاتانزارو اشاره کرده بود که این ویژگی اختصاصی کارتهای گرافیک جدید است، چرا که آنها شتابدهنده سختافزاری Optical Flow بهبودیافتهتری نسبت به سری RTX 30 داشتند. در آن زمان، او همچنین گفته بود که بهطور تئوری این قابلیت میتواند به سختافزارهای قدیمیتر منتقل شود، ولی احتمالاً به اندازه کارتهای جدید کارآمد نخواهد بود.
اما با توجه به حذف شتابدهنده سختافزاری Optical Flow در مدل جدید، به نظر میرسد که انتقال این فناوری به سختافزارهای قدیمیتر ممکن است. با این حال، کاتانزارو تاکید کرد که نیازمندیهای بیشتر برای Tensor Core ها وجود دارد و معماری قدیمیتر GPU ها عملکرد ضعیفتری در این زمینه دارند. بنابراین باید دید که آیا انویدیا میتواند این ویژگی را بهطور واقعی روی سختافزارهای قدیمیتر پیادهسازی کند یا خیر.
در ادامه مصاحبه، کاتانزارو به اهمیت جداکردن بهروزرسانی متریس فلیپ از پردازنده مرکزی (CPU) اشاره کرد تا زمان تغییر فریمها کاهش یابد و بهبود چشمگیری در پایایی فریمها (frame pacing) ایجاد کند. او گفت که این تغییر موجب بهبود پنج تا ده برابری در ثبات فریمها نسبت به گذشته میشود. همچنین، او افزود که بازی با Reflex 2 (که آنهم مبتنی بر هوش مصنوعی است) حس “اتصال” بیشتری ایجاد میکند و به اعتقاد او گیمرهای حساس به تأخیر، از این ویژگی بسیار استقبال خواهند کرد.
مطالب مرتبط:
دیدگاهتان را بنویسید