مدل هوش مصنوعی جدید متا که به تازگی معرفی شده است، از زبانهای مختلفی پشتیبانی میکند. مدل SeamlessM4T متا میتواند ترجمه گفتار به نوشتار، گفتار به گفتار، متن به گفتار و متن به متن را برای حداکثر 100 زبان از جمله فارسی انجام دهد.
شرکت مادر فیسبوک، یعنی متا روز گذشته یک مدل هوش مصنوعی را منتشر کرد که قادر به ترجمه و رونویسی گفتار به دهها زبان است. این مدل امکان برقراری ارتباط بلادرنگ بین زبانها را فراهم میکند.
شرکت متا در یک پست وبلاگی اعلام کرد که مدل SeamlessM4T میتواند از ترجمه بین متن و گفتار نزدیک به 100 زبان و همچنین ترجمه کامل گفتار به گفتار برای 35 زبان از جمله عربی استاندارد، فارسی غربی و اردو پشتیبانی کند.
مشخصات مدل هوش مصنوعی SeamlessM4T
متا برای ایجاد این مدل چندزبانه یکپارچه، از نوآوریهای گذشته استفاده کرده است. این مدل فناوریهایی مانند No Language Left Behind (NLLB) و Universal Speech Translator را که قبلاً فقط در مدلهای جداگانه موجود بود، ترکیب کرده است.
تیم تحقیقاتی متا اعلام کرده است که هوش مصنوعی SeamlessM4T قابلیت بهبود عملکرد زبانهای دارای منابع کم و متوسط را دارد. از طرف دیگر، برای زبانهایی با منابع بالا مانند انگلیسی، اسپانیایی و آلمانی، عملکرد فوقالعادهای را به نمایش میگذارد.
درحالحاضر، نسخه دمو این هوش مصنوعی بهطور رایگان برای استفاده در حداکثر 3 زبان، ازجمله فارسی، دردسترس است. هرچند ترجمه عبارتهای انگلیسی به فارسی از طریق SeamlessM4T چندان دقیق نیست، اما این هوش مصنوعی توانایی تشخیص زبانهای مختلف را دارد و پیشرفت قابلتوجهی نسبت به نسل قبلی خود داشته است.
مارک زاکربرگ، مدیرعامل شرکت، اعلام کرد که چنین ابزارهایی تعامل بین کاربران از سراسر جهان را در متاورس، مجموعهای از جهانهای مجازی بههمپیوسته که آینده شرکت متا به آن متکی است، آسانتر میکند.
در پست وبلاگ آمده است که متا این مدل را برای استفاده غیرتجاری دردسترس عموم قرار میدهد.
بزرگترین شرکت رسانههای اجتماعی جهان امسال مجموعهای از مدلهای عمدتاً رایگان هوش مصنوعی را منتشر کرده است. مدل زبان بزرگ این شرکت به نام Llama، چالشی جدی برای مدلهای اختصاصی فروختهشده توسط OpenAI تحت حمایت مایکروسافت و گوگل آلفابت محسوب میشود.
زاکربرگ معتقد است که یک اکوسیستم هوش مصنوعی باز به نفع متا عمل میکند. زیرا این شرکت بیشتر ازطریق جمعسپاری مؤثر در ایجاد ابزارهای مخصوص مصرفکننده برای پلتفرمهای اجتماعی خود بهره برده است تا دریافت هزینه برای دسترسی به مدلها.
چالشهای روبروی مدلهای هوش مصنوعی
با این وجود، متا نیز مانند بقیه مهرهای این صنعت با سوالات حقوقی مشابهی در مورد جمعآوری دادههای اولیه برای ایجاد مدلهای خود مواجه است.
در ماه ژوئیه، کمدین سارا سیلورمن و دو نویسنده دیگر شکایتهایی را برای نقض حق چاپ علیه متا و OpenAI تنظیم کردند. آنها این شرکتها را متهم کردند که از کتابهایشان بهعنوان دادههای آموزشی بدون مجوز استفاده میکنند.
محققان متا در یک مقاله تحقیقاتی در مورد مدل SeamlessM4T توضیح دادند که دادههای آموزشی صوتی را از 4 میلیون ساعت صوت خام که از یک منبع دردسترس عموم از دادههای وب منشا میگیرد، جمعآوری کردند. البته آنها مشخص نکردند که منظورشان دقیقاً کدام منبع است.
سخنگوی متا نیز به سوالات مربوط به منشأ دادههای صوتی پاسخ نداد. این مقاله تحقیقاتی مدعی است که دادههای متنی از منابعی مثل ویکیپدیا و وبسایتهای مرتبط استخراج شده است.
گفته میشود که متا تحقیقات گستردهای در زمینه کاهش سمیت و سوگیری در مدلهای هوش مصنوعی مولد خود انجام داده است که نتیجه آن مدلی است که نسبت به مسائل احتمالی آگاهتر است.
در اوایل سال جاری، متا به آلفابت، مایکروسافت و OpenAI پیوست تا چارچوب مشترکی را برای استفاده مسئولانه از هوش مصنوعی به منظور کاهش خطرات مرتبط با ابزارهای هوش مصنوعی مولد ایجاد کند.
دیدگاهتان را بنویسید