شرکت چینی DeepSeek به زودی مدل جدیدی به نام DeepSeek R2 را معرفی خواهد کرد. اطلاعات منتشر شده نشان میدهد که هزینههای این مدل 97 درصد کمتر از GPT-4 است و فرآیند آموزش آن به طور کامل با استفاده از تراشههای Ascend هوآوی انجام شده است.
DeepSeek R2 و احتمال ایجاد تحول در بازار هوش مصنوعی
مدل اولیه DeepSeek با نام R1 ثابت کرد که چین در مسیر توسعه مدلهای پیشرفته هوش مصنوعی رقابتی عمل میکند. معرفی این مدل تأثیر عمیقی بر بازارهای سهام ایالات متحده گذاشت و باعث کاهش میلیاردها دلار از ارزش بازار شد. این موضوع همچنین اثبات کرد که توسعه مدلهای هوش مصنوعی نیازی به هزینههای هنگفتی که توسط شرکتهایی مانند OpenAI اعلام شده است، ندارد.
حالا شایعاتی در رسانههای چینی درباره مدل جدید DeepSeek به نام R2 منتشر شده است که انتظار میرود تغییرات قابلتوجهی در بازارهای هوش مصنوعی غربی ایجاد کند.
قبل از پرداختن به جزئیات، لازم است تأکید شود که این اطلاعات هنوز تأیید رسمی نشدهاند. منابع گزارش میدهند که R2 از معماری پیشرفته MoE (ترکیب خبرگان) بهرهمند خواهد بود که نسبت به نسخه فعلی این معماری بهبود یافته است. این مدل احتمالا دارای مکانیزمهای دروازهای پیشرفته و ترکیبی از لایههای MoE و متراکم خواهد بود تا بهینهسازی بارهای کاری پیچیده را تسهیل کند. R2 با داشتن 1.2 تریلیون پارامتر، دو برابر بیشتر از مدل R1 خواهد بود.

براساس این اطلاعات، R2 توانایی رقابت با مدلهایی مانند GPT-4 Turbo و Gemini 2.0 Pro گوگل را خواهد داشت. اما جذابیت اصلی آن در زمینه کاهش هزینههاست؛ به طوری که هزینه هر توکن در R2 تقریبا 97.4 درصد کمتر از GPT-4 برآورد شده است. این صرفهجویی شامل هزینه ورودی 0.07 دلار و خروجی 0.27 دلار برای هر میلیون توکن میشود که آن را به یکی از اقتصادیترین گزینههای موجود برای شرکتها تبدیل خواهد کرد. عرضه این مدل میتواند نقطه عطفی در تحولات هوش مصنوعی و اقتصاد مرتبط با آن باشد.
استفاده از تراشههای Ascend هوآوی در DeepSeek R2
یکی از اطلاعات جالب درباره DeepSeek R2 این است که این مدل از 82 درصد ظرفیت خوشه تراشه Ascend 910B هوآوی بهره میبرد. قدرت محاسباتی آن به 512 پتافلاپس با دقت FP16 میرسد و نشاندهنده تصمیم DeepSeek برای استفاده از منابع داخلی در طراحی مدل جدیدش است. شرکت چینی DeepSeek با آموزش R2 بر تجهیزات داخلی، عملا زنجیره تأمین هوش مصنوعی خود را بهصورت عمودی یکپارچه کرده است.
با این حال، باید توجه داشت که اخبار مرتبط با DeepSeek R2 بیشتر در حد شایعات هستند و ممکن است در نسخه نهایی مدل تغییراتی وجود داشته باشد. اما بر اساس گزارشهای رسانههای چینی، انتظار میرود R2 بار دیگر شرکتهای پیشرو در حوزه هوش مصنوعی را شگفتزده کند.
دیدگاهتان را بنویسید