انویدیا شرکت Groq را تصاحب نمیکند؛ اما جنسن هوانگ یک کلاس درس تخصصی و غیرمنتظره را اجرا کرده است که هیچکس انتظار آن را نداشت. مدیرعامل انویدیا احتمالا به تیم تراشه خود یک هدیه کریسمس که هیچکس انتظارش را نداشت داده است؛ زیرا گزارشها نشان میدهند تیم سبز با شرکت Groq که سختافزارهای تخصصی هوش مصنوعی تولید میکند، وارد یک توافقنامه شده است. این تراشهها قطعات سادهای محسوب نمیشوند، بلکه میتوانند دروازه ورود انویدیا برای تسلط بر بارهای کاری کلاس استنتاج باشند. برای درک این که چرا این اقدام یک شاهکار است، باید دو جبهه متمایز یعنی خلاءهای قانونی که جنسن از آنها بهره برده است و سلطه سختافزاری که او تضمین کرده را بررسی کنیم.
انویدیا همچنین قصد دارد تراشههای هوش مصنوعی H200 خود را با قیمت رقابتی به بازار چین عرضه کند.
در ظاهر شبیه تصاحب؛ در باطن یک قرارداد غیر انحصاری
شبکه CNBC اولین رسانهای بود که این تحول را گزارش داد. این رسانه ادعا کرد انویدیا شرکت Groq Inc را در یک معامله عظیم 20 میلیارد دلاری خریداری میکند که بزرگترین تصاحب توسط جنسن محسوب میشود. این خبر با سرعت زیادی در صنعت منتشر شد؛ بهگونهای که برخی بر این باور بودند تحقیقات نظارتی میتواند مانع انجام این اقدام شود؛ در حالی که برخی دیگر آن را پایان کار Groq دانستند. با این حال، Groq بعدا بیانیهای رسمی در وبسایت خود منتشر کرد که نشان میداد یک قرارداد مجوز غیر انحصاری با انویدیا امضا کرده است تا به این غول هوش مصنوعی اجازه دسترسی به فناوری استنتاج را بدهد.
ما قصد داریم پردازندههای کمتاخیر Groq را در معماری کارخانه هوش مصنوعی انویدیا ادغام کنیم تا پلتفرم را برای پوشش طیف گستردهتری از استنتاج هوش مصنوعی و بارهای کاری بلادرنگ گسترش دهیم. در حالی که ما کارمندان بااستعداد را به صفوف خود اضافه میکنیم و لیسانس مالکیت معنوی Groq را به دست میآوریم؛ شرکت Groq را به عنوان یک مجموعه تصاحب نمیکنیم.
ایمیل جنسن هوانگ
استراتژی تصاحب معکوس برای دور زدن قوانین
این یک حرکت کلاسیک تصاحب معکوس استخدامی از سوی انویدیا محسوب میشود. اگر کسی با معنای این اصطلاح آشنایی ندارد؛ باید گفت این یک حرکت از روی کتابچه راهنمای مایکروسافت است. این غول فناوری در سال 2024 معاملهای به ارزش 653 میلیون دلار با Inflection را اعلام کرد که شامل پیوستن افرادی مانند مصطفی سلیمان و کارن سیمونیان به این شرکت بود که استراتژی هوش مصنوعی این شرکت را پیش بردند.

تصاحب معکوس استخدامی به معنای استخدام استعدادهای کلیدی یک استارتاپ توسط یک شرکت بزرگ و باقی گذاشتن یک ساختار شرکتی حداقلی است که در نهایت مانع از تبدیل شدن چنین حرکتی به یک ادغام رسمی میشود. اکنون به نظر میرسد جنسن موفق شده است چیزی مشابه را اجرا کند تا تحت بازرسی FTC قرار نگیرد؛ زیرا با قالببندی معامله Groq به عنوان یک قرارداد مجوز غیر انحصاری، انویدیا اساسا خارج از محدوده قانون Hart-Scott-Rodino یا همان HSR قرار میگیرد. جالب اینجاست که Groq ذکر میکند GroqCloud به فعالیت خود ادامه میدهد اما تنها به عنوان یک ساختار حداقلی باقی میماند.
آنچه اتفاق افتاد این بود که انویدیا استعدادها و مالکیت معنوی Groq را با مبلغ گزارش شده 20 میلیارد دلار به دستآورد. این شرکت موفق شد از تحقیقات نظارتی فرار کند که به آنها اجازه داد معامله را در عرض چند روز اجرا کنند.
معماری LPU شرکت Groq و قطعه گمشده پازل انویدیا
Groq یک اکوسیستم سختافزاری دارد که میتواند موفقیت انویدیا در دوران آموزش مدلها را تکرار کند. صنعت هوش مصنوعی در چند ماه گذشته از نظر تقاضای پردازشی بهطور چشمگیری تکامل یافته است. در حالی که شرکتهایی مانند OpenAI، متا و گوگل مشغول آموزش مدلهای پیشرو و به دنبال داشتن یک پشته استنتاجی قدرتمند نیز هستند، زیرا اکثر از این بخش درآمد کسب میکنند.
برتری SRAM بر HBM در پردازش استنتاجی
زمانی که گوگل تراشههای Ironwood TPU را معرفی کرد؛ صنعت آن را به عنوان یک گزینه متمرکز بر استنتاج مورد استقبال قرار داد. این ASICها به عنوان جایگزینی برای انویدیا معرفی شدند؛ عمدتا به این دلیل که ادعا میشد جنسن هنوز راهکاری که بر توان استنتاجی مسلط باشد ارائه نکرده است. وقتی در مورد استنتاج صحبت میکنیم، تقاضای پردازشی بهطور چشمگیری تغییر میکند؛ زیرا در آموزش مدلها، صنعت به توان عملیاتی بیشتر از تاخیر و شدت محاسباتی بالا نیاز دارد. به همین دلیل شتابدهندههای مدرن با HBM و هستههای تنسور عظیم تقویت میشوند.

از آنجا که شرکتهای بزرگ به سمت استنتاج تغییر مسیر میدهند، اکنون به یک موتور اجرایی سریع و پیشبینیپذیر و مستقیم نیاز دارند؛ زیرا تاخیر در پاسخگویی گلوگاه اصلی به شمار میرود. برای ارائه محاسبات سریع، شرکتهایی مانند انویدیا بارهای کاری مانند استنتاج با بافت عظیم (پیشپر کردن و استنتاج عمومی) را با Rubin CPX هدف قرار دادهاند. شرکت گوگل نیز خود را به عنوان انتخابی با بهرهوری انرژی بالاتر با TPUها معرفی میکند. با این حال وقتی نوبت به رمزگشایی میرسد، گزینههای زیادی در دسترس نیست.
رمزگشایی به مرحله تولید توکن در استنتاج یک مدل ترنسفورمر اشاره دارد. این موضوع به عنوان یک جنبه کلیدی در طبقهبندی بارهای کاری هوش مصنوعی اهمیت فزایندهای پیدا کرده است. رمزگشایی به رفتار قطعی و با تاخیر کم نیاز دارد. با توجه به محدودیتهای ناشی از استفاده از HBM (تاخیر و توان مصرفی) در محیطهای استنتاج، Groq چیز منحصربهفردی به نام SRAM یا همان رم استاتیک در اختیار دارد.
ترکیب رمزگشایی با تاخیر کم و شکست رقبا
واحدهای LPU ساخته مدیرعامل سابق Groq یعنی جاناتان راس هستند که پس از قرارداد اخیر به انویدیا ملحق میشود. راس به دلیل کار روی TPUهای گوگل شناخته میشود؛ بنابراین میتوانیم مطمئن باشیم تیم سبز یک دارایی بزرگ را به داخل مجموعه خود میآورد. واحدهای LPU یا همان واحدهای پردازش زبان، راهکار Groq برای بارهای کاری کلاس استنتاج هستند. این شرکت خود را بر پایه دو شرط اصلی از دیگران متمایز میکند. اولین مورد اجرای قطعی و استفاده از SRAM روی تراشه به عنوان ذخیرهساز اصلی وزنها است. این رویکرد Groq برای دستیابی به سرعت با تضمین پیشبینیپذیری است.
شرکت Groq قبلا دو راهکار پیشرو را به نمایش گذاشته بود که شامل GroqChip و GroqCard مبتنی بر شریک تجاری میشد. بر اساس اطلاعات منتشر شده در اسناد رسمی، این تراشهها دارای 230 مگابایت SRAM روی تراشه با پهنای باند حافظه تا 80 ترابایت بر ثانیه هستند. استفاده از SRAM یکی از مزیتهای کلیدی LPUها محسوب میشود، زیرا اجازه میدهد تاخیر چندین برابر کمتر شود. با در نظر گرفتن تاخیر ناشی از دسترسی به DRAM و صفهای کنترلکننده حافظه در HBM، حافظه SRAM با اختلاف قابل توجهی پیروز میشود. حافظه SRAM روی تراشه به Groq اجازه میدهد به دهها ترابایت بر ثانیه پهنای باند داخلی دست یابد که به این شرکت امکان ارائه توان عملیاتی پیشرو را میدهد.

حافظه SRAM همچنین Groq را قادر میسازد یک پلتفرم با بهرهوری انرژی بالا ارائه دهد؛ زیرا دسترسی به SRAM به انرژی بسیار کمتری در هر بیت نیاز دارد و سربار PHY را حذف میکند. در عملیات رمزگشایی، LPUها منجر به بهبود چشمگیر انرژی مصرفی به ازای هر توکن میشوند که با توجه به حافظهمحور بودن بارهای کاری رمزگشایی، یک فاکتور حیاتی است.
در حالی که هنوز مشخص نشده LPUها چگونه میتوانند در محصولات انویدیا ادغام شوند؛ یک راه برای ادغام LPUها در محصولات انویدیا انجام آنها به عنوان بخشی از سیستمهای استنتاج در مقیاس رک (مشابه Rubin CPX) همراه با زیرساخت شبکه است. این کار به پردازندههای گرافیکی اجازه میدهد بخش پیشپر کردن یا بافتهای طولانی را مدیریت کنند، در حالی که LPUها بر رمزگشایی تمرکز میکنند. این موضوع اساسا به این معنا است که در وظایف استنتاجی، انویدیا همه چیز را مرتب کرده و LPUها را از یک گزینه آزمایشی به یک روش استنتاج استاندارد تغییر داده و پذیرش گسترده آنها را تضمین کند.


شکسی نیست که این معامله یکی از بزرگترین دستاوردها برای انویدیا در زمینه پیشبرد سبد محصولاتش محسوب میشود. تمام شاخصها به این واقعیت اشاره دارند که استنتاج گزینه بعدی خواهد بود که انویدیا درباره آن صحبت میکند و LPUها بخش اصلی استراتژی شرکت برای این زمینه از بارهای کاری هوش مصنوعی خواهند بود.








دیدگاهتان را بنویسید