در کنفرانس Google I/O، گوگل امروز از راهاندازی PaLM 2، جدیدترین مدل زبان بزرگ خود (LLM) خبر داد. PalM 2 ابزار به روز شده چت Bard گوگل، رقیب این شرکت برای ChatGPT OpenAI را نیرو میدهد و به عنوان مدل پایه برای اکثر ویژگیهای هوش مصنوعی جدیدی که شرکت امروز اعلام میکند، عمل خواهد کرد. PalM 2 اکنون از طریق Google’s Palm API، Firebase و در Colab در دسترس توسعه دهندگان است.
برای گوگل همه چیز اندازهی مدل زبانی نیست
گوگل نیز مشابه OpenAI، جزئیات فنی زیادی در مورد نحوه آموزش این مدل نسل بعدی، از جمله شمارش پارامترها ارائه نکرده است (PaLM 2 یک مدل پارامتری 540 میلیاردی است که ارزشش را دارد). تنها جزئیات فنی ارائه شده توسط گوگل در اینجا این است که PalM 2 بر روی آخرین زیرساخت های JAX و TPU v4 گوگل ساخته شده است.
زوبین قهرمانی، معاون DeepMind، در یک نشست مطبوعاتی پیش از اعلام امروز، گفت:
«آنچه در کارمان یافتیم این است که واقعاً اندازه مدل نیست – اینکه بزرگتر همیشه بهتر نیست–به همین دلیل است که ما خانوادهای از مدلها با اندازههای مختلف ارائه کردهایم. ما فکر میکنیم که شمارش پارامترها واقعاً روش مفیدی برای فکر کردن به قابلیتهای مدلها نیست و قابلیتها باید واقعاً توسط افرادی که از مدلها استفاده میکنند قضاوت کنند و بفهمند که آیا آنها در آزمایشهایی که سعی میکنند با این مدلها به دست آورند مفید هستند یا خیر. “
در عوض، این شرکت تصمیم گرفت بر قابلیتهای خود تمرکز کند. گوگل میگوید مدل جدید در استدلال عقل سلیم، ریاضیات و منطق بهتر عمل خواهد کرد. در واقع، همانطور که آقای قهرمانی خاطرنشان کرد، این شرکت این مدل را بر روی حجم زیادی از متون ریاضی و علوم و همچنین عبارات ریاضی آموزش داده است. بر کسی پوشیده نیست که مدلهای زبان بزرگ – با تمرکز بر زبان – با مدیریت سوالات ریاضی بدون توسل به افزونههای شخص ثالث مشکل دارند. با این حال، استدلال گوگل این است که PalM 2 میتواند به راحتی پازلهای ریاضی را حل کند، از طریق مسائل استدلال کند و حتی نمودارها را ارائه دهد.
PALM 2 همچنین اکنون دارای پشتیبانی بهبود یافته برای نوشتن و اشکال زدایی کد است. این مدل بر روی 20 زبان برنامه نویسی، از جمله زبانهای محبوب مانند جاوا اسکریپت، پایتون و همچنین مانند Prolog، Verilog و Fortran آموزش دیده است. PalM 2 اساس Codey، مدل تخصصی گوگل برای کدنویسی و اشکال زدایی را تشکیل میدهد، که امروز نیز به عنوان بخشی از خدمات تکمیل و تولید کد، از جمله موارد دیگر، راهاندازی میشود. همچنین گوگل تاکید کرد که PalM 2 بر روی مجموعهای با بیش از 100 زبان آموزش داده شده است و به قول گوگل، آن را «در کارهای چند زبانه برتر» میسازد، از جمله عبارتهای ظریفتر از مدلهای قبلی.
گوگل در مورد PalM به عنوان خانوادهای از مدلها صحبت میکند، که شامل مدلهایی مانند Codey و همچنین Med-PaLM 2 میشود، مدلی که این شرکت بر دانش پزشکی متمرکز است. همچنین Sec-PaLM وجود دارد، نسخهای که بر موارد استفاده امنیتی تمرکز دارد و یک مدل کوچکتر PaLM 2 که میتواند روی تلفنهای هوشمند اجرا شود، که به طور بالقوه میتواند PalM را به موارد استفاده با محوریت حریم خصوصی باز کند، اگرچه Google به هیچ جدول زمانی متعهد نیست. گوگل میگوید این مدل میتواند 20 توکن در ثانیه پردازش کند، که شاید رقم چندان سریعی نباشد، اما ممکن است برای برخی موارد قابل قبول باشد.
بر کسی پوشیده نیست که گوگل رویکرد بسیار جدی برای راهاندازی این ویژگیهای هوش مصنوعی در پیش گرفته است، چیزی که این شرکت تأیید کرده است. اما در عین حال، خط استاندارد نمایندگان گوگل در این مورد این است که این ابزارها را مسئولانه و با در نظر گرفتن جنبههای ایمنی بسازد و این همان چیزی است که شرکت در مورد پالم میگوید. بدیهی است که بدون هیچگونه آزمایشی، نمیتوان متوجه شد که عملکرد آن تا چه حد خوب است و چگونه موارد لبه را کنترل میکند.
مطالب مرتبط:
دیدگاهتان را بنویسید