اگر فیلم علمی تخیلی معروف استیون ایپیلبرگ با نام گزارش اقلیت یا Minority Report را دیده باشید، حتما حرکات بدن و دستان شخصیت اول فیلم با بازی تام کروز را نیز به خاطر دارید که چگونه با چرخش دستان خود، با سیستم عامل کامپیوتر ارتباط برقرار میکرد. حالا دانشمندان موفق به شناسایی روشهای جدیدی برای شناسایی حرکات دست توسط کامپیوترها شدند که میتواند نحوهی تعامل ما با کامپیوترها در آینده را تغییر دهد.
- بشنوید: سمفونی 10 بتهوون با یادگیری ماشین تکمیل شد
- بکارگیری یادگیری ماشین در پزشکی -بزرگترین پایگاه داده کرونا در
- پیش بینی تشنج صرع با الگوریتم یادگیری ماشین
نحوهی شناسایی حرکات دست توسط کامپیوترها
در فیلم گزارش اقلیت، تام کروز برای ارتباط گرفتن با کامپیوتر از یک دستکش مخصوص استفاده میکرد تا کامپیوتر بتواند حرکات دست او را شناسایی و تشخیص دهد. این حرکات او باعث میشد تا عملگرهایی مانند زوم کردن، ورق زدن و یا سوییچ کردن بین محیطهای مختلف کامپیوتر به سادگی وبا یک حرکت دست عملی شود اما نکتهای که باید به آن توجه کنیم این است که با این که فیلم تقریبا 20 سال پیش ساخته شده اما از آن زمان تاکنون نحوهی تعاملات ما با کامپیوترها تغییری نکرده است! ما هنوز از ماوس و کیبرد برای وارد کردن دستورات مورد نظرمان استفاده میکنیم و نهایت پیشرفتی که در طول این سالها به دست آمده، ارتباط برقرار کردن با کامپیوتر آن هم به صورت لمسی است. موردی که در تمام کامپیوترها وجود ندارد و رفته رفته جای خود را در بازار کامپیوترها پیدا میکند.
همین موضوعات سبب شده تا دانشمندان به دنبال ایجاد راهی جدید برای تعامل انسان با کامپیوتر باشد. دستورات صوتی یکی از این موارد هستند که چند سالی در میان انسانها جا افتادهاند. نمود واقعی آنها را میتوانیم در دستیارهای صوتی گوگل و اپل و مایکروسافت ببینیم. اما همچنان تعامل با حرکات دست یکی از مهمترین و سادهترین راههای تعامل انسان و کامپیوتر باقی مانده است و به صورت غیر ارادی نیز برای بسیاری از انسانها راحتتر است. پیشرفتهای اخیر دانشمندان در زمینهی دوربینهای تشخیص دست و البته الگوریتمهای یادگیری ماشین سبب شده تا هر چه بیشتر به آن مدینهی فاضلهی فیلم گزارش اقلیت نزدیکتر شویم اما همچنان یک مشکل دیگر بر سر راه عمومی شدن آن قرار گرفته است و آن پر هزینه بودن تامین قطعات آن، سرعت کم پردازش تصویر و دقت کم در تشخیص حرکات است.
اخیرا دانشمندان چینی موفق شدند تا یک الگوریتم جدیدی برای شناسایی حرکات دست توسعه دهند که از یک تعادل خوبی در میان سرعت، دقت و هزینه برخوردار است. جزئیات این الگوریتم در مقالهی منتشر شدهی آنها در ژورنال Electronic Imaging منتشر شده که به صورت مفصل به استراتژیهای اتخاذ شده توسط این گروه برای غلبه کردن به این مشکلات میپردازد. استراتژیهایی که ما را یک قدم به عمومی شدن این حرکات دست در میان کاربران معمولی نزدیکتر میکند.
یکی از بزرگترین مشکلاتی که بر سر راه این دانشمندان قرار گرفته این بود که در دنیا انواع مختلفی از شکل و رنگ دستها وجود دارد. الگوریتم آنها باید به گونهای میبود که اول اندازه، رنگ و میزان بزرگی دست کاربر را شناسایی کند. مرحلهی بعدی شناسایی حرکات دست کاربر و مقایسهی آن با نمونهی موجود در الگوریتم خود است تا بتواند حتی نوع حرکت دستهای کاربر را دسته بندی و شناسایی کند. همانطور که بالاتر نیز به این موضوع اشاره کردیم، یکی از بزرگترین مشکلات مدلهای قبلی این بود که ضعف زیادی در تشخیص دست و نوع حرکات آن داشتند اما اکنون با الگوریتم جدید و دسته بندی کردن انواع مختلف حرکات دست، سرعت و دقت این الگوریتم بسیار افزایش یافته است.
مولفهی مهم دیگر این الگوریتم در دسته بندی کردن نوع حرکات دست و دستورات حرکتی است. اگر قرار باشد کامپیوتر از بین 9 حرکت دست، یکی را شناسایی کند، مدت زمان بسیار زیادی تا رسیدن به جواب نهایی تلف میشود. اما در الگوریتم جدید دانشمندان چینی این 9 حرکت اصلی در 3 دسته بندی تقسیم شدهاند. یعنی الگوریتم اول دسته بندی را مشخص میکند و بعد در دسته بندیها به دنبال نمونهی درست حرکت میگردد و همین موضوع سرعت رسیدن به جواب را بسیار افزایش خواهد داد.
دانشمندان چینی برای امتحان الگوریتم جدید خود، از کامپیوترهای معمولی بازار و پلتفرمهای FPGA با یک دوربین USB استفاده کردند. 40 داوطلب تمامی حرکات دست تعیین شده را در برابر کامپیوتر انجام دادند و نتایج نشان داد که کامپیوتر با استفاده از الگوریتم دانشمندان توانست بیش از 93 درصد حرکات را درست تشخیص دهد! این موضوع میتواند نوید دهندهی آیندهای روشن برای تغییر نحوهی تعامل انسان با کامپیوترها باشد.
دیدگاهتان را بنویسید