آرم (Arm) از پلتفرم جدید Lumex Compute Subsystem (CSS) رونمایی کرد که با هدف ارتقای پردازش هوش مصنوعی در گوشیهای هوشمند، کامپیوترها و فرمفکتورهای کوچکتر طراحی شده است. این پلتفرم ترکیبی از پردازندههای مجهز به SME2، خانواده جدید پردازشگرهای گرافیکی Mali و پشتیبانی گسترده از فریمورکهای هوش مصنوعی را در اختیار توسعهدهندگان قرار میدهد.
هستههای C1 با معماری Armv9.3
خوشه پردازشی C1 نخستین نمونه مبتنی بر معماری Armv9.3 به شمار میرود که قابلیت Scalable Matrix Extension 2 (SME2) را ادغام کرده است. این ارتقا نسبت به نسل قبل توان پردازش هوش مصنوعی را تا 5 برابر افزایش میدهد؛ تأخیر گفتاری را 4.7 برابر کاهش میدهد و تولید صوت را 2.8 برابر سریعتر انجام میدهد. در نمونههای واقعی، SME2 عملکرد تبدیل متن به گفتار را 2.4 برابر بهبود داد و زمان پاسخ مدلهای زبانی بزرگ را در همکاری با Alipay و vivo تا 40 درصد کاهش داد.


مدلهای پردازنده C1
خانواده C1 شامل چهار مدل زیر میشود:
- C1-Ultra؛ با 25 درصد عملکرد تکترد بالاتر نسبت به Cortex-X925 که شش سال رشد پایدار در IPC را ادامه میدهد.
- C1-Premium؛ با ابعاد 35 درصد کوچکتر از مدل Ultra که برای دستگاههای میانرده نزدیک به پرچمدار طراحی شده است.
- C1-Pro؛ با 16 درصد عملکرد پایدار بیشتر، مناسب برای اجرای بازیها و پخش ویدیو.
- C1-Nano؛ با 26 درصد بهرهوری انرژی بهتر نسبت به Cortex-A520 که هدف آن دستگاههای پوشیدنی است.


جدول ویژگیها
پردازنده | مزیت اصلی | بهبود عملکرد و بهرهوری | کاربرد پیشنهادی |
C1-Ultra | اوج عملکرد در پرچمدارها | 25 درصد افزایش عملکرد تکترد، رشد IPC دو رقمی سالانه | استنتاج مدلهای بزرگ، عکاسی محاسباتی، تولید محتوا، هوش مصنوعی مولد |
C1-Premium | عملکرد Ultra با بهرهوری بالاتر در ابعاد | 35 درصد ابعاد کوچکتر از Ultra | دستگاههای میانرده نزدیک پرچمدار، دستیارهای صوتی، چندوظیفگی |
C1-Pro | بهرهوری پایدار | 16 درصد عملکرد پایدار بیشتر | پخش ویدیو، استنتاج استریمینگ |
C1-Nano | بهرهوری انرژی بسیار بالا | 26 درصد بهرهوری بیشتر با اشغال فضای کمتر | دستگاههای پوشیدنی، کوچکترین فرمفکتورها |
پردازشگر گرافیکی Mali G1-Ultra
پردازشگر گرافیکی Mali G1-Ultra با استفاده از RTU v2 عملکرد رهگیری پرتو را دو برابر افزایش میدهد و بهبود 20 درصدی در اجرای بازیها و استنتاج هوش مصنوعی ارائه میدهد. آرم اعلام کرده این پردازشگر کیفیت تصویر و واکنشپذیری در بازیهایی مانند Fortnite، Genshin Impact، Arena Breakout و Honkai Star Rail را ارتقا میدهد. نسخههای کوچکتر G1-Premium و G1-Pro بر بهرهوری در دستگاههای میانرده تمرکز دارند.


ارتقاهای RTUv2
نسخه جدید RTUv2، پردازش شتابیافته سختافزاری در واحد رهگیری پرتو را جایگزین روش Compute Shader نسخه قبلی (RTUv1) کرده است و از مدل پرتو تکی به جای مدل پرتو فشرده استفاده میکند که انعطاف بیشتری در پردازش پرتوهای غیرهمگن فراهم میکند. درحالیکه مدل فشرده در همگامسازی پرتوها کارآمد بود، در مواجهه با بازتابهای متعدد دچار مشکل میشد اما مدل پرتو تکی که در Mali G1-Ultra استفاده شده برای بازتابها و نورپردازی واقعی مناسبتر است.
آرم اعلام کرده در بنچمارکهای کوچک، عملکرد رهگیری پرتو تا 2 برابر افزایش یافته است هرچند نتایج واقعی متفاوت است؛ بهبودها شامل 40 درصد در دموی لومیلینگز، 17 درصد در گنشین ایمپکت، 11 درصد در فورتنایت، 25 درصد در Arena Breakout و 26 درصد در دموی Mori گزارش شدهاند.


آینده Lumex و SME2
آرم انتظار دارد SME و SME2 تا سال 2030 بیش از 10 میلیارد TOPS توان محاسباتی را در بیش از 3 میلیارد دستگاه فراهم کنند. سامسونگ، Tencent، Alibaba، vivo و Alipay از جمله شرکای فعلی هستند که Lumex را به کار گرفتهاند.
کاربردهای پلتفرم Lumex
پلتفرم Lumex ترکیب پردازندهها، پردازشگرهای گرافیکی و IP سیستمی را بهگونهای ارائه میدهد که امکان دستیارهای سریعتر، ترجمه همزمان، عکاسی پیشرفته و بازیهای موبایلی نزدیک به کیفیت دسکتاپ را فراهم میسازد.
دیدگاهتان را بنویسید