مدل هوش مصنوعی جدید متا با پشتیبانی از زبان فارسی معرفی شد

توسط مهرانه راجعی ·1 شهریور 14021 شهریور 1402· 0

مدل هوش مصنوعی جدید متا که به تازگی معرفی شده است، از زبان‌های مختلفی پشتیبانی می‌کند. مدل SeamlessM4T متا می‌تواند ترجمه گفتار به نوشتار، گفتار به گفتار، متن به گفتار و متن به متن را برای حداکثر 100 زبان از جمله فارسی انجام دهد.

شرکت مادر فیس‌بوک، یعنی متا روز گذشته یک مدل هوش مصنوعی را منتشر کرد که قادر به ترجمه و رونویسی گفتار به ده‌ها زبان است. این مدل امکان برقراری ارتباط بلادرنگ بین زبان‌ها را فراهم می‌کند.

شرکت متا در یک پست وبلاگی اعلام کرد که مدل SeamlessM4T می‌تواند از ترجمه بین متن و گفتار نزدیک به 100 زبان و همچنین ترجمه کامل گفتار به گفتار برای 35 زبان از جمله عربی استاندارد، فارسی غربی و اردو پشتیبانی کند.

مشخصات مدل هوش مصنوعی SeamlessM4T

متا برای ایجاد این مدل چندزبانه یکپارچه، از نوآوری‌های گذشته استفاده کرده است. این مدل فناوری‌هایی مانند No Language Left Behind (NLLB) و Universal Speech Translator را که قبلاً فقط در مدل‌های جداگانه موجود بود، ترکیب کرده است.

مدل هوش مصنوعی جدید متا با پشتیبانی از زبان فارسی معرفی شد

تیم تحقیقاتی متا اعلام کرده است که هوش مصنوعی SeamlessM4T قابلیت بهبود عملکرد زبان‌های دارای منابع کم و متوسط را دارد. از طرف دیگر، برای زبان‌هایی با منابع بالا مانند انگلیسی، اسپانیایی و آلمانی، عملکرد فوق‌العاده‌ای را به نمایش می‌گذارد.

درحال‌حاضر، نسخه دمو این هوش مصنوعی به‌طور رایگان برای استفاده در حداکثر 3 زبان، ازجمله فارسی، در‌دسترس است. هرچند ترجمه عبارت‌های انگلیسی به فارسی از طریق SeamlessM4T چندان دقیق نیست، اما این هوش مصنوعی توانایی تشخیص زبان‌های مختلف را دارد و پیشرفت قابل‌توجهی نسبت به نسل قبلی خود داشته است.

مارک زاکربرگ، مدیرعامل شرکت، اعلام کرد که چنین ابزارهایی تعامل بین کاربران از سراسر جهان را در متاورس، مجموعه‌ای از جهان‌های مجازی به‌هم‌پیوسته ‌که آینده شرکت متا به آن متکی است، آسان‌تر می‌کند.

در پست وبلاگ آمده است که متا این مدل را برای استفاده غیرتجاری دردسترس عموم قرار می‌دهد.

بزرگ‌ترین شرکت رسانه‌های اجتماعی جهان امسال مجموعه‌ای از مدل‌های عمدتاً رایگان هوش مصنوعی را منتشر کرده است. مدل زبان بزرگ این شرکت به نام Llama، چالشی جدی برای مدل‌های اختصاصی فروخته‌شده توسط OpenAI تحت حمایت مایکروسافت و گوگل آلفابت محسوب می‌شود.

زاکربرگ معتقد است که یک اکوسیستم هوش مصنوعی باز به نفع متا عمل می‌کند. زیرا این شرکت بیشتر ازطریق جمع‌سپاری مؤثر در ایجاد ابزارهای مخصوص مصرف‌کننده برای پلتفرم‌های اجتماعی خود بهره برده است تا دریافت هزینه برای دسترسی به مدل‌ها.

چالش‌های روبروی مدل‌های هوش مصنوعی

با این وجود، متا نیز مانند بقیه مهرهای این صنعت با سوالات حقوقی مشابهی در مورد جمع‌آوری داده‌های اولیه برای ایجاد مدل‌های خود مواجه است.

در ماه ژوئیه، کمدین سارا سیلورمن و دو نویسنده دیگر شکایت‌هایی را برای نقض حق چاپ علیه متا و OpenAI تنظیم کردند‌. آنها این شرکت‌ها را متهم کردند که از کتاب‌هایشان به‌عنوان داده‌های آموزشی بدون مجوز استفاده می‌کنند.

محققان متا در یک مقاله تحقیقاتی در مورد مدل SeamlessM4T توضیح دادند که داده‌های آموزشی صوتی را از 4 میلیون ساعت صوت خام که از یک منبع دردسترس عموم از داده‌های وب منشا می‌گیرد، جمع‌آوری کردند‌. البته آنها مشخص نکردند که منظورشان دقیقاً کدام منبع است.

سخنگوی متا نیز به سوالات مربوط به منشأ داده‌های صوتی پاسخ نداد. این مقاله تحقیقاتی مدعی است که داده‌های متنی از منابعی مثل ویکی‌پدیا و وب‌سایت‌های مرتبط استخراج شده است.

گفته می‌شود که متا تحقیقات گسترده‌ای در زمینه کاهش سمیت و سوگیری در مدل‌های هوش مصنوعی مولد خود انجام داده است که نتیجه آن مدلی است که نسبت به مسائل احتمالی آگاه‌تر است.

در اوایل سال جاری، متا به آلفابت، مایکروسافت و OpenAI پیوست تا چارچوب مشترکی را برای استفاده مسئولانه از هوش مصنوعی به منظور کاهش خطرات مرتبط با ابزارهای هوش مصنوعی مولد ایجاد کند.

برچسب‌ها: متا

امتیاز: 5.0 از 5 (1 رای)

کمی صبر کنید...

دیدگاهتان را بنویسید لغو پاسخ

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.