ممکن است در نگاه اول Minecraft ابزار مهمی برای تحقیقات پیشرفته هوش مصنوعی به نظر نرسد. اما به هر حال، چه چیزی میتواند در مورد آموزش یک ماشین برای بازی کردن یک بازی ساده که بیش از یک دهه پیش منتشر شده است، اینقدر مهم باشد؟ بر اساس تلاشهای اخیر OpenAI، یک ربات Minecraft که به خوبی آموزش دیده است، بیش از آن چیزی که بیشتر مردم تصور میکنند به پیشرفت هوش مصنوعی کمک کرده است.
استفاده از 70،000 ساعت ویدیو برای آموزش به روش تقلید
OpenAI همیشه بر هوش مصنوعی (AI) و پیشرفتهای یادگیری ماشینی تمرکز کرده است. اخیرا نیز، این شرکت با موفقیت یک ربات را برای بازی Minecraft با استفاده از بیش از 70،000 ساعت ویدیوی گیم پلی آموزش داده است. این دستاورد بسیار بیشتر از یک ربات ساده است که فقط مانند یک NPC یک بازی را انجام میدهد. این یک گام بزرگ رو به جلو در یادگیری ماشینی پیشرفته با استفاده از مشاهده و تقلید است.
ربات OpenAI یک نمونه عالی از یادگیری تقلید (که “یادگیری تحت نظارت” نیز نامیده میشود) در عمل است. بر خلاف یادگیری تقویتی، که در آن عامل یادگیری پس از رسیدن به هدف از طریق آزمون و خطا، پاداش میگیرد، یادگیری تقلید شبکههای عصبی را آموزش میدهد تا وظایف خاصی را با مشاهده کامل انسانها انجام دهند. در این مورد، OpenAI از ویدیوها و آموزشهای گیمپلی موجود استفاده کرد تا به ربات خود آموزش دهد تا توالیهای پیچیده درون بازی را اجرا کند که برای دستیابی به تقریباً 24،000 اقدام فردی برای بازیکن معمولی انجام میشود.
یادگیری به روش تقلید مستلزم برچسب گذاری ورودیهای ویدئویی برای ارائه زمینه عمل و نتیجه مشاهده شده است. متأسفانه، این رویکرد میتواند فشرده باشد و منجر به مجموعه دادههای محدود شود. این کمبود مجموعه دادههای موجود، در نهایت توانایی عامل را برای یادگیری از طریق مشاهده محدود میکند.
استفاده از روش پیشآموزش ویدیویی باری افزایش کارآیی
تیم تحقیقاتی OpenAI بهجای انجام تمرینات گسترده برچسبگذاری دادهها، از رویکرد خاصی به نام «پیشآموزش ویدیویی» (VPT) برای افزایش چشمگیر تعداد ویدیوهای برچسبگذاریشده در دسترس استفاده کرد. محققان در ابتدا 2،000 ساعت از گیم پلی بازی Minecraft شرح داده شده را ضبط کردند و از آن برای آموزش یک عامل برای مرتبط کردن اقدامات خاص با نتایج خاص روی صفحه استفاده کردند. سپس مدل به دست آمده برای تولید خودکار برچسبها برای 70،000 ساعت محتوای Minecraft که قبلاً برچسبگذاری نشده بود، بهراحتی در دسترس قرار گرفت و مجموعه داده بسیار بزرگتری را جهت مرور و تقلید توسط ربات Minecraft آنها فراهم کرد.
کل این فرآیند و آموزشها به خوبی ارزش بالقوه منابع ویدئویی موجود، مانند یوتیوب را به عنوان یک منبع آموزشی هوش مصنوعی به نمایش گذاشته است. دانشمندان یادگیری ماشینی، میتوانند از ویدئوهای موجود و دارای برچسب مناسب برای آموزش هوش مصنوعی برای انجام وظایف خاص، از ناوبری ساده وب تا کمک به کاربرانی که نیازهای فیزیکی واقعی دارند، استفاده کنند.
مطالب مرتبط:
دیدگاهتان را بنویسید