موضوعات داغ
  • بتلفیلد 6
  • گوشی‌های سری گلکسی S26
  • آیفون 17 اپل
  • بازی GTA VI
  • گلکسی S25 FE
  • دینو
سخت افزار مگ
  • اخبار و مقالات
    • گوشی موبایل
      • لوازم جانبی موبایل
    • تبلت
    • لپ تاپ
    • دسکتاپ
      • مادربرد
      • پردازنده مرکزی
      • کارت گرافیک
      • تجهیزات ذخیره سازی
      • حافظه
      • صفحه نمایش
      • تجهیزات جانبی
    • تصویرگری دیجیتال
    • صوتی و تصویری
    • شبکه
    • نرم افزار و بازی
    • کالبدشکافی قطعات
    • مطالب گوناگون
  • بررسی
    • بررسی گوشی موبایل
    • بررسی تبلت
    • بررسی لپ تاپ
    • دسکتاپ
      • بررسی کولر و فن
      • بررسی مادربرد
      • بررسی کارت گرافیک
      • بررسی تجهیزات ذخیره سازی
      • بررسی حافظه
      • بررسی منبع تغذیه و کیس
      • بررسی تجهیزات جانبی
      • بررسی صفحه نمایش
    • بررسی تصویرگری دیجیتال
    • بررسی صوتی و تصویری
    • بررسی شبکه
    • بررسی نرم افزار و بازی
    • بررسی گوناگون
  • راهنمای خرید
    • سیستم پیشنهادی
  • لیست قیمت
    • گوشی موبایل
      • لیست قیمت روز گوشی‌های سامسونگ
      • لیست قیمت روز گوشی‌های شیائومی
      • لیست قیمت روز گوشی‌های هواوی
      • لیست قیمت روز گوشی های آنر
    • تبلت
    • لپ‌تاپ
    • قطعات کامپیوتر
      • لیست قیمت پردازنده
    • محصولات اپل
    • تجهیزات شبکه
    • لوازم خانگی
    • صوتی و تصویری
    • دوربین دیجیتال
    • تجهیزات بازی
    • خودرو
  • ویژه
    • مسابقات
    • نمایشگاه
تبلیغات
تبلیغات
تبلیغات

اخبار و مقالات / مطالب گوناگون

ترجمه همزمان چند گوینده در دنیای واقعی با هوش مصنوعی

Avatarتوسط مهرانه راجعی ·20 اردیبهشت 140420 اردیبهشت 1404· 0

پژوهشگران دانشگاه واشنگتن (UW) دستاوردی خارق‌العاده ارائه داده‌اند: هدفون‌های هوشمندی که به کمک هوش مصنوعی می‌توانند صدای چند گوینده را به‌طور همزمان ترجمه کنند. این دستگاه مانند یک فرد چندزبانه در یک امکان شلوغ عمل می‌کند که قادر است هرآنچه اطرافیان به زبان‌های مختلف بیان می‌کنند، به‌طور همزمان درک کند.

هدفون‌های بی‌سیم Google Pixel Buds مدت‌هاست که امکان ترجمه همزمان و لحظه‌ای را ارائه می‌دهند. در سال‌های اخیر، برندهایی مانند Timkettle نیز هدفون‌های مشابهی برای مشتریان تجاری عرضه کرده‌اند. با این حال، تمام این دستگاه‌ها تنها قادر به ترجمه یک جریان صوتی در هر لحظه هستند.

ترجمه گفتار فضایی: نوآوری جدید

تیم دانشگاه واشنگتن از نوآوری خود با عنوان «ترجمه گفتار فضایی» (Spatial Speech Translation) یاد می‌کند که به لطف هدفون‌های دوگوشی (باینورال) امکان‌پذیر شده است. برای کسانی که با این مفهوم آشنا نیستند، صدای دوگوشی تلاشی است برای شبیه‌سازی جلوه‌های صوتی به همان شکلی که گوش‌های انسان آن‌ها را طبیعی می‌شنوند. برای ضبط این صداها، میکروفون‌ها روی یک سر مصنوعی قرار می‌گیرند و با فاصله‌ای مشابه گوش‌های انسان تنظیم می‌شوند.

این رویکرد اهمیت زیادی دارد، زیرا گوش‌های انسان تنها صدا را نمی‌شنوند، بلکه جهت منبع صدا را نیز تشخیص می‌دهند. هدف اصلی این فناوری، تولید یک صحنه صوتی طبیعی با افکت استریو است که حس شنیدن زنده یک کنسرت را به کاربر القا می‌کند؛ یا به عبارتی، تجربه شنیداری فضایی در عصر مدرن.

این پروژه به سرپرستی پروفسور شیام گالاکوتا انجام شده است. گالاکوتا پروژه‌های متعددی را در کارنامه خود دارد؛ از اپلیکیشن‌هایی که GPS زیرآبی را به ساعت‌های هوشمند اضافه می‌کنند گرفته تا ایمپلنت‌های مغزی که می‌توانند با دستگاه‌های الکترونیکی ارتباط برقرار کنند

ترجمه همزمان چند گوینده

پروفسور گالاکوتا توضیح می‌دهد: برای اولین بار، ما صدای هر فرد و جهت منبع آن را حفظ کرده‌ایم. این فناوری مانند یک رادار عمل می‌کند و تعداد گویندگان حاضر در محیط را شناسایی کرده و این تعداد را به‌صورت لحظه‌ای به‌روزرسانی می‌کند، حتی زمانی که افراد وارد یا خارج از محدوده شنیداری می‌شوند. این فرآیند کاملاً در خود دستگاه انجام می‌شود و نیاز به ارسال صداها به سرور ابری برای ترجمه ندارد؛ به همین دلیل، حریم خصوصی کاربران حفظ می‌شود.

ترجمه همزمان چند گوینده در دنیای واقعی با هوش مصنوعی

علاوه بر ترجمه گفتار، این سیستم کیفیت بیان و حجم صدای هر گوینده را نیز حفظ می‌کند. همچنین، با حرکت گوینده در اتاق، تنظیمات جهت و شدت صدا به‌صورت خودکار تغییر می‌کنند. جالب اینجاست که گفته می‌شود شرکت اپل نیز در حال توسعه سیستمی مشابه برای ترجمه لحظه‌ای با هدفون‌های AirPods است.

مراحل آزمایش و عملکرد

تیم دانشگاه واشنگتن قابلیت‌های ترجمه این هدفون‌های هوشمند را در تقریباً دوازده محیط داخلی و خارجی آزمایش کرده است. از نظر عملکرد، سیستم می‌تواند صدا را دریافت، پردازش و ترجمه کند و خروجی را ظرف 2 تا 4 ثانیه ارائه دهد. شرکت‌کنندگان در آزمایش‌ها ترجیح دادند که تأخیری 3 تا 4 ثانیه‌ای وجود داشته باشد، اما تیم تحقیقاتی درحال کار بر روی کاهش زمان تأخیر است.

تا به حال، این سیستم تنها برای ترجمه زبان‌های اسپانیایی، آلمانی و فرانسوی آزمایش شده است، اما تیم امیدوار است زبان‌های بیشتری را به این مجموعه اضافه کند. از لحاظ فنی، آن‌ها فرآیندهای جداسازی منبع صوتی، مکان‌یابی، ترجمه بیانی لحظه‌ای و پردازش دوگوشی را در یک جریان واحد ادغام کرده‌اند که خود یک دستاورد بزرگ محسوب می‌شود.

این سیستم از مدلی برای ترجمه گفتار بهره می‌برد که قادر است به‌صورت لحظه‌ای روی تراشه اپل M2 کار کند و استنتاج‌های بلادرنگ انجام دهد. وظایف صوتی نیز با استفاده از هدفون‌های نویزگیر Sony WH-1000XM4 و میکروفون باینورال Sonic Presence SP15C انجام شده است.

بهترین بخش ماجرا؟

کد این دستگاه نمونه اولیه برای استفاده دیگران دردسترس است. این یعنی جامعه علمی و علاقه‌مندان بمی‌توانند از این پروژه به‌عنوان پایه‌ای برای توسعه پروژه‌های پیشرفته‌تر بهره ببرند.

  • بزرگ‌ترین گسترش محتوایی در تاریخ دولینگو: 148 دوره مبتنی‌بر هوش مصنوعی
  • هوش مصنوعی می‌تواند زبان حیوانات خانگی را بفهمد!
  • مقیاس‌ دهی هوش مصنوعی آن را هوشمندتر نمی‌کند

برچسب‌ها: هوش مصنوعی

امتیاز: 5.0 از 5 (2 رای)
کمی صبر کنید...
تبلیغات
تبلیغات
سرخط خبرها:
  1. کارت گرافیک RX 9070 XT Monster Hunter Wilds ازراک لیست شد
  2. فروش باورنکردنی آیفون ایر در چین؛ رکورد جدید اپل فقط در چند دقیقه!
  3. معرفی بازی Assetto Corsa Rally؛ اولین عنوان ریسینگ مبتنی بر Unreal Engine 5
  4. گیمرها راه‌هایی برای سوءاستفاده از باگ‌های بازی بتلفیلد 6 پیدا می‌کنند
  5. شیائومی از ساعت هوشمند ردمی واچ 6 رونمایی کرد

مطالب مرتبط ...

  • 0

    هوش مصنوعی GPT-5 معرفی شد؛ سریع‌تر، دقیق‌تر و محتاط‌تر از همیشه

    Avatarتوسط مهرانه راجعی · 17 مرداد 1404 · 17 مرداد 1404

  • 1

    تماشا کنید: روبات کوچولوی سخنگوی تویوتا

    Avatarتوسط سینا راد · 13 مهر 1395 · 13 مهر 1395

  • مدل هوش مصنوعی جدید فیسبوک ، یک زبان را مستقیماً به زبان دیگر ترجمه می‌کند 0

    مدل هوش مصنوعی جدید فیسبوک ، یک زبان را مستقیماً به زبان دیگر ترجمه می‌کند

    Avatarتوسط امیرحسین جمشیدی · 29 مهر 1399 · 29 مهر 1399

مطالب گوناگون از دینو

کدام داروها می‌توانند تحمل گرما را سخت‌تر کنند؟

10 فیلم فوق‌ العاده که به شما کمک می کند بچه ها را بهتر درک کنید

چگونه از نشخوار افکار منفی و تجربیات گذشته خودداری کنیم؟

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.

پربحث‌ترین‌ها

  • 1

    قیمت پردازنده دایمنسیتی 9500 مدیاتک 55 درصد ارزان‌تر از اسنپدراگون 8 الیت نسل 5 است

  • ویژگی‌های جدید آپدیت اکتبر ویندوز 11؛ هوش مصنوعی در اکسپلورر، تنظیمات پیشرفته و امنیت بیشتر 1

    ویژگی‌های جدید آپدیت اکتبر ویندوز 11؛ هوش مصنوعی در اکسپلورر، تنظیمات پیشرفته و امنیت بیشتر

  • نسخه فاش‌ شده FSR 4 روی RDNA 2 و 3 اجرا می‌شود؛ افت عملکرد تا 13 درصد اما کیفیت بهتر از FSR 3.1 1

    نسخه فاش‌ شده FSR 4 روی RDNA 2 و 3 اجرا می‌شود؛ افت عملکرد تا 13 درصد اما کیفیت بهتر از FSR 3.1

  • طرح افزایش تعرفه اینترنت 1

    طرح افزایش تعرفه اینترنت همچنان در دست بررسی قرار دارد

آخرین بررسی‌ها

9.1

تماشا کنید: بررسی گلکسی زد فلیپ 7 سامسونگ | تکامل با شیب ملایم

9.1

بررسی مانیتور گیمینگ Gigabyte M27QA ICE: انتخاب جذاب گیمرهای QHD

9

بررسی پاور FSP VITA GM 1000W

8.7

بررسی پاور GREEN GP800A-UK EVO V3.1 GOLD

9.1

تماشا کنید: بررسی گوشی گلکسی زد فولد 7 سامسونگ - این لاکچریِ جذاب!

آخرین مطالب دینو

آیا باید زمانی که هنوز از تمرین قبلی‌ درد دارید، ورزش کنید؟

اگر پس از یک جلسه دویدن یا تمرین در…

  • گیاهان دارویی و ادویه‌هایی که به بهبود گوارش کمک می‌کنند

  • ماه زنگ زده و مقصر زمین است!

  • راز پیوند شیمیایی میان انسان و گربه‌ها؛ هورمون عشق وارد عمل می‌شود

  • شناسایی رسمی دیابت نوع 5؛ همه چیز درباره علائم، علت و درمان

  • مطلب بعدی پردازنده‌های AMD Strix Halo به صورت جداگانه در چین فروخته می‌شوند
  • مطلب قبلی جزئیات جدیدی از میزان رم کنسول پلی استیشن 6 منتشر شد
  • آخرین مطالب
  • محبوب‌ترین مطالب
  • کارت گرافیک RX 9070 XT Monster Hunter Wilds ازراک لیست شد

  • فروش باورنکردنی آیفون ایر در چین؛ رکورد جدید اپل فقط در چند دقیقه!

  • بازی ریسینگ Assetto Corsa Rally

    معرفی بازی Assetto Corsa Rally؛ اولین عنوان ریسینگ مبتنی بر Unreal Engine 5

  • باگ‌های بازی بتلفیلد 6

    گیمرها راه‌هایی برای سوءاستفاده از باگ‌های بازی بتلفیلد 6 پیدا می‌کنند

  • شیائومی از ساعت هوشمند ردمی واچ 6 رونمایی کرد

    شیائومی از ساعت هوشمند ردمی واچ 6 رونمایی کرد

  • 1

    قیمت پردازنده دایمنسیتی 9500 مدیاتک 55 درصد ارزان‌تر از اسنپدراگون 8 الیت نسل 5 است

  • ویژگی‌های جدید آپدیت اکتبر ویندوز 11؛ هوش مصنوعی در اکسپلورر، تنظیمات پیشرفته و امنیت بیشتر 1

    ویژگی‌های جدید آپدیت اکتبر ویندوز 11؛ هوش مصنوعی در اکسپلورر، تنظیمات پیشرفته و امنیت بیشتر

  • امولاتور YMIR (شبیه‌ساز کنسول سگا ساترن 1

    معرفی امولاتور YMIR؛ یکه‌تاز در اجرای 90 درصد بازی‌های سگا ساترن

  • نسخه فاش‌ شده FSR 4 روی RDNA 2 و 3 اجرا می‌شود؛ افت عملکرد تا 13 درصد اما کیفیت بهتر از FSR 3.1 1

    نسخه فاش‌ شده FSR 4 روی RDNA 2 و 3 اجرا می‌شود؛ افت عملکرد تا 13 درصد اما کیفیت بهتر از FSR 3.1

  • طرح افزایش تعرفه اینترنت 1

    طرح افزایش تعرفه اینترنت همچنان در دست بررسی قرار دارد

آخرین دیدگاه‌ها

  • Avatar
    حسن قهرمانی گفته است:
    در صورت نیاز حمایت دونیتی هم بد نیست
  • Avatar
    Tohid گفته است:
    انویدیا نیازی به چین نداره وقتی غول های فناوری تو خود...
  • Avatar
    Tohid گفته است:
    حقیقتا با ماد و بی ماد این بازی از لحاظ گرافیکی...
  • Avatar
    سیمین نوربخش گفته است:
    درود. حجم ویدئوهای بررسی عموماً زیاده و واقعا امکانش نیست که...
  • Avatar
    سیمین نوربخش گفته است:
    ممنون از توجهتون دوست عزیز.
  • Avatar
    آشتیانی گفته است:
    کاش ویدیو توی خود سایت بدون نیاز به فیلترشکن باز بشه.
  • Avatar
    Milad Graphix گفته است:
    کلمه "سخاوت" رو تازه یاد گرفتی؟
  • Avatar
    غلام رضا منتظرالمهدی گفته است:
    باسلام من گوشی سامسونگ A34 5G 128G ویتنام دارم که قبلآ...
  • Avatar
    . گفته است:
    آقا این گیم عملا گرافیک نسل۷ داره کجاش قراره تمجید بشه؟...
  • Avatar
    رایان گفته است:
    عالی
راهنمای خرید سیستم ۵۰ میلیون تومانی برای بازی بتلفیلد ۶ (حداقل بودجه) 0
راهنمای خرید و مشاوره سیستم پیشنهادی هایلایت ویژه
راهنمای خرید سیستم اقتصادی برای اجرای بازی بتلفیلد 6 (بودجه 50 میلیون تومانی)
22 مهر 1404
راهنمای خرید تبلت 8
تبلت راهنمای خرید و مشاوره
راهنمای خرید تبلت بر اساس بودجه‌های مختلف (پاییز 1404)
12 مهر 1404
راهنمای خرید ساعت هوشمند 4
راهنمای خرید و مشاوره
راهنمای خرید ساعت هوشمند و مچ بند با بودجه‌های مختلف (پاییز 1404)
9 مهر 1404
راهنمای خرید پاور بانک با بودجه‌های مختلف 1
راهنمای خرید و مشاوره
راهنمای خرید پاور بانک با بودجه‌های مختلف (پاییز 1404)
7 مهر 1404
راهنمای خرید ماوس و کیبورد 2
راهنمای خرید و مشاوره
راهنمای خرید موس و کیبورد با بودجه‌های مختلف (پاییز 1404)
5 مهر 1404
راهنمای خرید لپ تاپ گیمینگ 469
راهنمای خرید و مشاوره
راهنمای خرید لپ تاپ گیمینگ با بودجه های مختلف (مهر 1404)
4 مهر 1404
  • سخت‌افزارمگ
  • درباره ما
  • تبلیغات
  • استخدام
سخت‌افزارمگ

© 2025 Sakhtafzarmag.Com. All Rights Reserved.

صفحه نخست » اخبار و مقالات » ترجمه همزمان چند گوینده در دنیای واقعی با هوش مصنوعی

ورود

عضویت

رمزتان را گم کرده‌اید؟

عضویت | رمزتان را گم کرده‌اید؟
| بازگشت به ورود