با پیشرفت تکنولوژی، محققان هر چه بیشتر به دنبال یافتن راههای جدیدی برای استفاده از قابلیتهای فناوری هوش مصنوعی و یادگیری ماشینی هستند. در اوایل این هفته، محققان از تولید فناوری Transframer هوش مصنوعی گوگل، یک چارچوب جدید با قابلیت تولید ویدیوهای کوتاه بر اساس تصویر انتخابی کاربران خبر دادند. فناوری جدید تولید ویدیو از یک تصویر میتواند روزی مشکل رندر سنتی را برطرف کند و به توسعهدهندگان این امکان را میدهد تا محیطهای مجازی را بر اساس قابلیتهای یادگیری ماشین ایجاد کنند.
- شناسایی حرکات دست توسط کامپیوترها با یادگیری ماشین چینی!
- فیزیک کوانتومی و یادگیری ماشین – دست در دست هم
جزئیات فناوری Transframer هوش مصنوعی گوگل
نام فناوری جدید گوگل (و به نوعی مفهوم) اشارهای به مدل مبتنی بر هوش مصنوعی به نام Transformer است. Transformer که در ابتدا در سال 2017 معرفی شد، یک معماری جدید شبکه عصبی با قابلیت تولید متن با مدل سازی و مقایسه کلمات دیگر در یک جمله است. این مدل از آن زمان در چارچوبهای یادگیری عمیق استاندارد مانند TensorFlow و PyTorch گنجانده شده است.
همانطور که Transformer از زبان برای پیشبینی خروجیهای بالقوه استفاده میکند، Transframer هم از تصاویر زمینه با ویژگیهای مشابه همراه با حاشیهنویسی برای ایجاد ویدیوهای کوتاه استفاده میکند. فیلمهای تولید شده توسط این تکنولوژی در اطراف تصویر هدف حرکت میکنند و با وجود اینکه هیچ داده هندسی در ورودیهای تصویر اصلی ارائه نکردهاند، پرسپکتیوهای دقیقی از آن جسم را تجسم میکنند.
این فناوری جدید که با استفاده از پلتفرم هوش مصنوعی DeepMind گوگل نشان داده شده است، با تجزیه و تحلیل یک تصویر زمینه عکس برای به دست آوردن قطعات کلیدی دادههای تصویر و تولید تصاویر اضافی عمل میکند. در طی این تجزیه و تحلیل، سیستم گوگل در ابتدا عکس را شناسایی میکند که به نوبه خود به سیستم کمک میکند تا محیط اطراف عکس را پیش بینی کند.
سپس از تصاویر زمینه برای پیش بینی بیشتر نحوه ظاهر شدن یک تصویر از زوایای مختلف استفاده میشود. فریمهای دیگر تصویر توسط این تکنولوژی و بر اساس دادهها و هر اطلاعات دیگری که از فریمهای زمینه موجود است، تولید میشود.
این چارچوب با ارائه توانایی تولید ویدیوی دقیق و معقول بر اساس مجموعه بسیار محدودی از دادهها، گام بزرگی را در فناوری ویدیو نشان میدهد. نتایج Transframer بسیار امیدوارکننده است و نتایج جالبی را در سایر مدلها و معیارهای مرتبط با ویدئو مانند تقسیمبندی معنایی و طبقهبندی تصویر نشان دادهاند.
این تکنولوژی در قسمتهای مختلفی مانند توسعه بازی و رندر تصاویر مختلف، میتواند به طور بالقوه مورد استفاده قرار گیرد. محیطهای توسعه بازی کنونی بر تکنیکهای رندر اصلی مانند سایهزنی، نقشهبرداری بافتهای مختلف، عمق میدان و ردیابی پرتو تکیه دارند. فناوریهایی مانند Transframer این پتانسیل را دارند که با استفاده از هوش مصنوعی و یادگیری ماشین برای ساخت محیطهایشان مسیر توسعهای کاملاً جدید به توسعهدهندگان ارائه دهند و در عین حال زمان، منابع و تلاش لازم برای ایجاد آنها را کاهش دهند.
دیدگاهتان را بنویسید