موضوعات داغ
  • گلکسی S25 FE سامسونگ
  • آیفون 17 اپل
  • بازی GTA VI
  • هوش مصنوعی
  • نمایشگاه کامپیوتکس ۲۰۲۵
  • دینو
سخت افزار مگ
  • اخبار و مقالات
    • گوشی موبایل
      • لوازم جانبی موبایل
    • تبلت
    • لپ تاپ
    • دسکتاپ
      • مادربرد
      • پردازنده مرکزی
      • کارت گرافیک
      • تجهیزات ذخیره سازی
      • حافظه
      • صفحه نمایش
      • تجهیزات جانبی
    • تصویرگری دیجیتال
    • صوتی و تصویری
    • شبکه
    • نرم افزار و بازی
    • کالبدشکافی قطعات
    • مطالب گوناگون
  • لیست قیمت
    • گوشی موبایل
      • لیست قیمت روز گوشی‌های سامسونگ
      • لیست قیمت روز گوشی‌های شیائومی
      • لیست قیمت روز گوشی‌های هواوی
      • لیست قیمت روز گوشی های آنر
    • تبلت
    • لپ‌تاپ
    • قطعات کامپیوتر
      • لیست قیمت پردازنده
    • محصولات اپل
    • تجهیزات شبکه
    • لوازم خانگی
    • صوتی و تصویری
    • دوربین دیجیتال
    • تجهیزات بازی
    • خودرو
  • بررسی
    • بررسی گوشی موبایل
    • بررسی تبلت
    • بررسی لپ تاپ
    • دسکتاپ
      • بررسی کولر و فن
      • بررسی مادربرد
      • بررسی کارت گرافیک
      • بررسی تجهیزات ذخیره سازی
      • بررسی حافظه
      • بررسی منبع تغذیه و کیس
      • بررسی تجهیزات جانبی
      • بررسی صفحه نمایش
    • بررسی تصویرگری دیجیتال
    • بررسی صوتی و تصویری
    • بررسی شبکه
    • بررسی نرم افزار و بازی
    • بررسی گوناگون
  • راهنمای خرید
    • سیستم پیشنهادی
  • دانلود
  • ویژه
    • مسابقات
    • نمایشگاه
تبلیغات
تبلیغات
تبلیغات

مطالب گوناگون

تبدیل گفتار به نوشتار

Avatarتوسط امیرحسین آریایی ·17 تیر 139517 تیر 1395· 3

فناوری تشخیص گفتار نرم‌افزاری است که قادر است صوت را به متن تبدیل کند. فناوری تشخیص گفتار به کامپیوتری که توانایی دریافت صدا را دارد برای مثال به یک میکروفن مجهز است این قابلیت را می‌دهد که صحبت کاربر را متوجه شود،این فناوری در تبدیل گفتار به متن و یا به عنوان جایگزین برای ارتباط با رایانه کاربرد دارد. برقراری ارتباط گفتاری با کامپیوترها به جای استفاده از صفحه کلید و ماوس یکی از زمینه‌های تحقیقاتی مهم چند دههٔ اخیر است و شرکت‌های بزرگی چون مایکروسافت،IBM و فیلیپس سالانه هزینه‌های هنگفتی را برای این منظور پرداخت کرده و می‌کنند.

 

هدف بلند مدت سیستم‌های بازشناسی خودکار گفتار‚ طراحی ماشینی است که سیگنال صوتی مربوط به یک جملهٔ بیان شده را به دنباله‌ای از کلمات نوشته شده تبدیل نماید. سیستم‌های بازشناسی خودکار گفتار اطلاعات متنوعی ازمنابع دانش گوناگون را در جهت دستیابی به جملهٔ بیان شده از روی سیگنال صوتی دریافت شده‚به کار می‌گیرند. پردازش گفتار به عنوان یکی از زیر شاخه‌های پردازش سیگنال به سرعت در حال گسترش است. تکنیک‌های پیچیده و نواوری‌های روز افزون این دانش٫همگی در راستای دستیابی به این ارزو هستند که امکان بیابیم مفاهیم در قالب ابزارهای ریاضی فراهم گردد. در این مقاله٫به بیان خلاصه‌ای از انواع روش‌های پردازش گفتار می‌پردازیم:

تحت تاثیر قرار گرفتن کیفیت سیگنال صوتی به وسیلهٔ نویز محیط و تابع انتقال سیستم انتقال مانند میکروفن‚تلفن

عدم وضوح مرز ما بین کلمات و واج‌ها در سیگنال صوتی

تنوع وسیع سرعت بیان

دقت ناکافی در بیان کلمات و به خصوص انتهای انها در گفتار محاوره‌ای نسبت به گفتار مجزا

تاپیر تنوعات متعدد گوینده از جمله جنسیت‚شرایط فیزیولوژیک و روانی بر گفتار

به کارگیری محدودیت‌های معنایی-نهوی زبان برای گفتار زبان طبیعی به روشی مشابه ارتباط انسان با انسان در سیستم بازشناسی

در جهت غلبه بر مشکلات مذکور تاکنون روش‌های متنوعی پیشنهاد شده‌است که از جمله انها روش‌های اماری مبتنی بر قانون تصمیم گیری بیز‚روش‌های مبتنی بر شبکهٔ عصبی و در برخی موارد ترکیب روش‌های اماری و شبکهٔ عصبی است. با بررسی روش‌های فوق می‌توان دریافت که شناسایی کلمه یا واج بدون خطا بدون استفاده از دانش سطوح بالاتر به خصوص در بازشناسی گفتار پیوسته با حجم لغت نامهٔ بزرگ‚امکان پذیر نیست.

تولید سیستم نرم افزاری

از جمله قابلیت‌های این نرم‌افزار این است که این نرم‌افزار قادر است فایلهای WAV،mp3 را مستقل از صدای گوینده به متن تبدیل کند ولی کیفیت ان کمتر از ان است که صدای فرد را به نرم‌افزار معرفی کنیم. از دیگر قابلیت‌های سیستم‌های گفتاری می‌توان به ترجمهٔ گفتار به سایر زبان‌ها اشاره کرد. از این قابلیت در جنگ امریکا و عراق استفاده شد. امریکایی‌ها سیستم‌هایی را طراحی و تولید کردند که قادر بود کلام عربی را به انگلیسی ترجمه کند. همچنین در انجام اقدامات امنیتی بهره برداری می‌کنند که می‌تواند کلمات کلیدی را برای این نرم‌افزار شناسایی کرد تا نسبت به ان کلمه خاص حساس شود تا در صورت استفاده از آن، سیستم این کلمات را رکورد کند. این قابلیت در سال ۱۹۹۴ در آمریکا طراحی و تولید شد و در سیستم‌های تلفنی به کار گرفته شد.

کاربردها

ه عنوان یک کاربر رایانه‚احتمالا با قابلیت گفتاری مجموعهٔ افیس به عنوان یکی از ویژگی‌های جذاب و تا حدی فانتزی برخورد کرده و یا با ان کار کرده‌اید. به کمک این قابلیت شما به جای استفاده از صفحه کلید برای تایپ مطالبتان ‚به راحتی با خواندن متن مورد نظرتان و انتقال گفتارتان به کمک یک میکروفن معمولی به رایانه ‚مطلب مورد نظرتان را تایپ شده می‌بینید. حتی برای ذخیره کردن ‚کپی کردن‚گذاشتن عکس در متن‚….. به جای کلیک‌های پشت سر هم و گاهی با تعداد بالا‚می‌توانید فرمان مربوطه را به کمک گفتار به نرم‌افزار داده تا کار شما را انجام دهد. جدای از اینکه توانایی درست کار کردن این قابلیت افیس چقدر باشد‚یک محدودیت بزرگ در سر راه استفاده از ان برای ما ایرانیان وجود دارد ‚این قابلیت فقط برای زبان انگلیسی است.(البته زبان‌های چینی و ژاپنی را نبز شامل می‌شود!). ایجاد چنین سیستمی که ان را تشخیص یا بازشناسی گفتار می‌نامند¸در زبان فارسی¸چندین سال از تحقیقات محققان اساتیدو دانشجویان دانشگاه‌های مختلف کشور را به خود اختصاص داده‌است. اما جدی‌ترین جهشی که در حدود ده سال پیش در این زمینه ایجاد شد ایجاد دادگان گفتاری فارسی دات و یک سیستم اولیه نشخیص گفتار فارسی در مرکز هوشمند علائم بوده‌است.

بازشناسی

تکنولوژی بازشناسی گفتار ،شیوه‌ای جدید برای تشخیص پیام هاو دستورهای صوتی و حاصل پژوهش جمعی از متخصصین دانشگاه صنعتی شریف در زمینهٔ پردازش گفتار است. این نرم‌افزار، به خوبی در محیط پرنویز، عمل می‌کند مثلاً در خودرویی با سرعت ۱۰۰ کیلومتر در ساعت با شیشه‌های باز و در بزرگراه تست شده و پاسخ مناسب گرفته‌است. دیگر مزیت این نرم‌افزار، حجم بسیار پایین آن است که به راحتی قابل برنامه ریزی برروی یک ای سی است (نسخه دمو روی pc) به راحتی تا ۱۰۰ فرمان را پردازش می‌کند) نرم‌افزار مورد بحث، با این مشخصات در ایران مشابه ندارد و موارد موجود در دنیا نیز مانند فرمانی توسط صدا حداقل نیاز به پردازنده پنتیوم با حجم زیاد حافظه دارند. نکته دیگر اینکه این نرم‌افزار، هوشمند بوده و قابل آموزش دادن است و پس از آموزش (مثلاً با صدای اعضای یک خانواده) صدار هرکدام از آنها را که بشنود (و در کل هر زمانی که کلمه یا فرمانی را بشنود) مستقل از این که چه کسی آن را ادا کرده‌است (صدای زن یا مرد، کلفت یا نازک) فرمان را اجرا می‌کند.

نکته:شاید این مورد برای ما ایرانیان یک جهش علمی محسوب گردد،اما امروزه حتی تلویزیون های هوشمند ساده نیز قادر به انجام همین اعمال بوده و دستورات صوتی را به سرعت اجرا می کنند.

ترکیب و تشخیص

کاربردهای نیازمند پردازش صحبت اغلب در دو دستهٔ ترکیب صحبت و تشخیص صحبت مورد بررسی قرار می‌گیرند. ترکیب صحبت عبارت است از فن آوری تولید مصنوعی صحبت به وسیلهٔ ماشین و به طور عمده از پرونده‌های متنی به عنوان ورودی آن استفاده می‌گردد. در اینجا باید به یک نکتهٔ مهم اشاره شود که بسیاری از تولیدات تجاری که صدای شبیه به صحبت انسان ایجاد می‌کنند در واقع ترکیب صحبت انجام نمی‌دهند بلکه تنها یک تکهٔ ضبط شده به صورت دیجیتال از صدای انسان را پخش می‌کنند. این روش کیفیت صدای بالایی ایجاد می‌کند اما به واژه‌ها و عبارات از پیش ضبط شده محدود است. از کاربردهای عمدهٔ ترکیب صحبت می‌توان به ایجاد ابزارهایی برای افراد دارای ناتوانی بینایی برای مطلع شدن از آنچه بر روی صفحهٔ کامپیوتر می‌گذرد اشاره کرد.

نکته:در برخی از نرم افزارهای جدید،ارتباط آنها با سرور اصلی از طریق اینترنت،قابلیت ها را بسیار افزایش داده و محدودیت کارایی برداشته شده است.

بیشتر صداهای مربوط به صحبت انسان به دو دستهٔ صدادار و سایشی تقسیم می‌شوند. اصوات صدادار وقتی که هوا از ریه‌ها و از مسیر تارهای صوتی به بیرون دهان یا بینی رانده می‌شوند ایجاد می‌گردند. تارهای صوتی دو رشتهٔ آویخته از بافت هستند که در مسیر جریان هوا کشیده شده‌اند. در پاسخ به کشش ماهیچ‌های متفاوت تارهای صوتی با فرکانسی بین ۵۰ تا ۱۰۰۰ هرتز ارتعاش می‌کنند که باعث انتقال حرکتهای متناوب هوا. در مقایسه، اصوات سایشی به صورت نویز تصادفی و نه حاصل از ارتعاش تارهای صوتی به وجود می‌آیند.

ارزش ایجاد ف نآوریهای ترکیب و تشخیص صحبت بسیار زیاد است. صحبت سریع‌ترین و کاراترین روش ارتباط انسانهاست. تشخیص صحبت پتانسیل جایگزینی نوشتن، تایپ، ورود صفح هکلید و کنترل الکترونیکی را که توسط کلیدها و دکمه‌ها اعمال می‌شود را داراست و فقط نیاز به آن دارد که کمی برای پذیرش توسط بازار تجاری بهتر کار کند. ترکیب صحبت علاوه بر آن که همانند تشخیص صحبت می‌تواند استفاده از کامپیوتر را برای کلیهٔ افراد ناتوان بدنی که دارای تواناییهای شنوایی و گفتاری مناسب هستند آسا نتر سازد به عنوان یک وسیل هی خروجی کاربرپسند در محیطهای مختلف می‌تواند با جایگزین کردن بسیاری از علائم دیداری(انواع چراغها و…) و شنوایی (انواع زنگهای اخطار و …) با گفتارهای بیان کنندهٔ کامل پیامها استفاده از و رسیدگی به سیستمهای نیازمند این گونه پیامها را بهینه کند. در اینجا لازم است به این نکته اشاره شود که پیشرفت در فن آوری تشخیص صحبت (و همچنین تشخیص گوینده) همان قدر که محدودهٔ دی. اس. پی را در بر می‌گیرد نیازمند دانش به دست آمده از محدوده‌های هوش مصنوعی و شبکه‌های عصبی است. شاید این تنوع دانشهای مورد نیاز به عنوان عامل دشواری مطالع هی مبحث پردازش صحبت در نظر گرفته شود حال آن که این گونه نیست و این تنوع راهکارها بخت رسیدن به سیستم با کارایی مطلوب را افزایش می‌دهد. تواناییهای ابزارهایی که در بخش اول این فصل به آنها اشاره شد امیدواریهای فراوانی را در زمینهٔ موفقیت ابزارهای موجود فراهم می‌آورد و دامنهٔ وسیع شرکتها و مراکز دانشگاهی که در این زمینه فعالیت می‌کنند بر تنوع در قابلیتها و کاربردهای پیاده سازی شدهٔ این ابزارها می‌افزاید.

در حال حاضر به دلیل کمبود استقبال از زبان فارسی در این زمینه،ابداعات و نوآوری های بسیار کمی را شاهد هستیم.بسیاری از نرم افزارهای تولید شده در سطح علوم دانشگاهی،فاقد کیفیت کافی برای استفاده های کامل هستند.برای مطالعه بیشتر در این زمینه،پیشنهاد ما به شما کتاب های پایه مانند کتاب دکتر سعید آیت است.

برچسب‌ها: مقالات سخت افزاری, مقالات فناوری

امتیاز: 3.3 از 5 (3 رای)
کمی صبر کنید...
تبلیغات
تبلیغات
سرخط خبرها:
  1. سورپرایز اپل برای پاییز 1404: سه محصول غیرمنتظره در راهند!
  2. آیفون 18 اپل، سال آینده عرضه نخواهد شد!
  3. کارت گرافیک عرضه نشده RTX TITAN ADA انویدیا از یک آداپتور 6×8 پین استفاده می‌کرد
  4. خط‌ونشان ایرانسل: قیمت تعرفه‌ها بالا نرود، قطعی‌های اینترنت روزانه خواهیم داشت!
  5. چرا نباید پهنای باند حافظه را در زمان خرید کارت گرافیک دست کم بگیرید؟

مطالب مرتبط ...

  • 4

    افزایش عملکرد CPU ها به وسیله نوعی حافظه کش جدید

    Avatarتوسط امیرحسین آریایی · 19 تیر 1396 · 19 تیر 1396

  • 0

    چرا مردم از برند اپل و محصولاتش نفرت دارند؟

    Avatarتوسط سیمین نوربخش · 14 دی 1398 · 14 دی 1398

  • 5

    قسمت دوم:آشنایی با مفاهیم پردازش و شیوه کار پردازنده (CPU)

    Avatarتوسط امیرحسین آریایی · 6 دی 1394 · 22 اسفند 1398

مطالب گوناگون از دینو

کدام داروها می‌توانند تحمل گرما را سخت‌تر کنند؟

10 فیلم فوق‌ العاده که به شما کمک می کند بچه ها را بهتر درک کنید

چگونه از نشخوار افکار منفی و تجربیات گذشته خودداری کنیم؟

3 دیدگاه

  • دیدگاه3
  1. Avatar حسام پورخلیل گفت:
    29 آذر 1395 در 9:42 ب.ظ

    سلام
    خیر
    به همون صورت که گفته شده.

    پاسخ
  2. Avatar 2b گفت:
    29 آذر 1395 در 6:33 ق.ظ

    سلام وقت بخیر
    این نرم‌افزار قابلیت این را دارد که وویس ضبط شده را هم به نوشتار تبدیل کند؟!
    اگر تبدیل می‌کند به صورت محاوره تبدیل می‌کند یا نوشتار کتابی؟!

    پاسخ
  3. Avatar kia گفت:
    17 تیر 1395 در 4:59 ب.ظ

    این که چیز تازه ای نیست

    پاسخ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.

پربحث‌ترین‌ها

  • قطعی‌های اینترنت به‌صورت روزانه 4

    خط‌ونشان ایرانسل: قیمت تعرفه‌ها بالا نرود، قطعی‌های اینترنت روزانه خواهیم داشت!

  • ماجرای از کار افتادن تلویزیون های هوشمند اسنوا و دوو چیست؟ 3

    ماجرای از کار افتادن تلویزیون های هوشمند اسنوا و دوو (به‌روزرسانی: مشکل برطرف شد)

  • بررسی ریلمی C75 – این گوشی اقتصادیِ جان سخت 2

    بررسی ریلمی C75 – این گوشی اقتصادیِ جان سخت

  • گوشی نوکیا تقلبی در ایران 2

    تولید گوشی نوکیا تقلبی در ایران؛ قانونی‌تر از همیشه

آخرین بررسی‌ها

8.4

بررسی ریلمی C75 – این گوشی اقتصادیِ جان سخت

8.6

بررسی مادربرد گیگابایت B860 GAMING X WIFI6E

9

بررسی کیس گیگابایت AORUS C500 GLASS

8.5

بررسی کیس آراد گرین - گیمینگ خوش قیمت و خوش ساخت (اعلام برنده)

9.4

بررسی سلطان ایرکولینگ دنیا  ASSASSIN IV VC VISION دیپ کول

آخرین مطالب دینو

هوای پاک چین زمین را گرم‌تر می‌کند!

گرمایش جهانی از حدود سال 2010 با سرعت بیشتری…

  • نشانه‌های پنهان افسردگی در کودکان که نباید نادیده بگیرید!

  • چرا زوال عقل در افراد جوان نادیده گرفته می‌شود؟

  • خواندن یا گوش دادن؟ کدام یک مغز را بیشتر درگیر می‌کند؟

  • اگر نوزادی در فضا به دنیا بیاید، چه بر سرش می‌آید؟

  • مطلب بعدی تصویر رندر شده ی گوشی هوشمند اندرویدی Nokia P1 منتشر شد
  • مطلب قبلی حاصل استفاده سامسونگ از طراحان جهانی در تولید تلویزیون
  • آخرین مطالب
  • محبوب‌ترین مطالب
  • سورپرایز اپل برای پاییز 1404: سه محصول غیرمنتظره در راهند!

  • آیفون 18 اپل، سال آینده عرضه نخواهد شد!

  • کارت گرافیک عرضه نشده RTX TITAN ADA انویدیا از یک آداپتور 6×8 پین استفاده می‌کرد

  • قطعی‌های اینترنت به‌صورت روزانه

    خط‌ونشان ایرانسل: قیمت تعرفه‌ها بالا نرود، قطعی‌های اینترنت روزانه خواهیم داشت!

  • چرا نباید پهنای باند حافظه را در زمان خرید کارت گرافیک دست کم بگیرید؟

    چرا نباید پهنای باند حافظه را در زمان خرید کارت گرافیک دست کم بگیرید؟

  • قطعی‌های اینترنت به‌صورت روزانه 4

    خط‌ونشان ایرانسل: قیمت تعرفه‌ها بالا نرود، قطعی‌های اینترنت روزانه خواهیم داشت!

  • ماجرای از کار افتادن تلویزیون های هوشمند اسنوا و دوو چیست؟ 3

    ماجرای از کار افتادن تلویزیون های هوشمند اسنوا و دوو (به‌روزرسانی: مشکل برطرف شد)

  • بررسی ریلمی C75 – این گوشی اقتصادیِ جان سخت 2

    بررسی ریلمی C75 – این گوشی اقتصادیِ جان سخت

  • گوشی نوکیا تقلبی در ایران 2

    تولید گوشی نوکیا تقلبی در ایران؛ قانونی‌تر از همیشه

  • فرایند توسعه ریمیک Max Payne 1+2 1

    گزارش رمدی؛ راکستار روی فرایند توسعه ریمیک Max Payne 1+2 مستقیم نظارت می‌کند

آخرین دیدگاه‌ها

  • Avatar
    رضا گفته است:
    همین چندوقت پیش اینا گرون کردن وزیر ارتباطات که یادم نمیاد...
  • Avatar
    پیمان گفته است:
    میتونید از ایران برید با این اینترنت دو هزاریتون وقتی برق...
  • Avatar
    مهمان گفته است:
    خیلی وقت نیست که گرون کردید، همین زمان زارع پور بود...
  • Avatar
    خداداد گفته است:
    اصل ما تو دنیا با پیشرفت و خلاقیت در زمینه های...
  • Avatar
    مهدی گفته است:
    سلام خدا قوت سعوال. ابعاد کیس میگه تا ۳۴۰ میلی متر...
  • Avatar
    افسون گفته است:
    دقیقا منم همین مشکل و دارم
  • Avatar
    پویا رضایی گفته است:
    اگه اب نچکیده باشه اوکی
  • Avatar
    نگار خداپرست گفته است:
    برای تلویزیون
  • Avatar
    نگار خداپرست گفته است:
    سلام تگه مایع نچکه ازش مناسب برای تلویزیون
  • Avatar
    پری گفته است:
    من یک کنکوری بودم کل کارامو با این بسته انجام می‌دادم...
راهنمای خرید ماوس و کیبورد 2
راهنمای خرید و مشاوره
راهنمای خرید موس و کیبورد با بودجه‌های مختلف (مرداد 1404)
16 مرداد 1404
راهنمای خرید لپ تاپ گیمینگ 469
راهنمای خرید و مشاوره
راهنمای خرید لپ تاپ گیمینگ با بودجه های مختلف (مرداد 1404)
13 مرداد 1404
راهنمای خرید مانیتور 68
راهنمای خرید و مشاوره
راهنمای خرید مانیتور با بهترین قیمت در بودجه‌های مختلف (مرداد 1404)
12 مرداد 1404
راهنمای خرید لپ تاپ با بودجه های مختلف 1,300
راهنمای خرید و مشاوره
راهنمای خرید لپ تاپ با بودجه های مختلف (مرداد 1404)
6 مرداد 1404
راهنمای خرید گوشی موبایل 491
راهنمای خرید و مشاوره
راهنمای خرید گوشی موبایل بر اساس بودجه‌های مختلف (مرداد 1404)
5 مرداد 1404
راهنمای خرید تبلت 7
تبلت راهنمای خرید و مشاوره هایلایت
راهنمای خرید تبلت بر اساس بودجه‌های مختلف (تابستان 1404)
25 تیر 1404
  • سخت‌افزارمگ
  • درباره ما
  • تبلیغات
  • استخدام
سخت‌افزارمگ

© 2025 Sakhtafzarmag.Com. All Rights Reserved.

صفحه نخست » اخبار و مقالات » مطالب گوناگون » تبدیل گفتار به نوشتار

ورود

عضویت

رمزتان را گم کرده‌اید؟

عضویت | رمزتان را گم کرده‌اید؟
| بازگشت به ورود