آیا می دانید چرا کتاب های آشپزی دارای تصویر هستند؟ به این دلیل که بیشتر ما نمی توانیم از روی لیست مواد اولیه و دستور تهیه ها چیزی را که در نهایت از فر یا سایر وسایل پخت و پز خارج می شود را تصور کنیم. اما بر اساس یک مقاله اخیرا منتشر شده به نظر می رسد که هوش مصنوعی در این زمینه مشکلی ندارد.محققان با استفاده از یک مجموعه داده آموزشی متشکل از 52000 دستور تهیه نوشته شده به همراه تصاویر نهایی غذاها توانستند سیستمی را طراحی کنند که قادر است یک دستور تهیه را خوانده و سپس تصویری را تولید کند که نتیجه نهایی مربوط به دستور تهیه مورد نظر را نشان می هد.
این سیستم دستور تهیه را به عنوان ورودی دریافت کرده و سپس تصویری را از ابتدا تولید می کند که باور دارد دستور تهیه آن را توصیف می کند. ویژگی مهم این پروژه این است که سیستم به هیچ عنوان به عنوان دستور تهیه دسترسی ندارد؛ چرا که در این صورت انجام این کار بسیار آسان می شود. همچنین متن دستور تهیه نیز هیچ گونه توصیفی را از تصویر نهایی غذا انجام نمی دهد که این مسئله کار را برای انسان و بیشتر کامپیوتر ها سخت می کند.عملیات تولید تصویر در دو مرحله توسط یک شبکه نرونی انجام می شود. در مرحله اول که به آن جاسازی اعداد می گویند دستور تهیه به یک بردار از اعداد تبدیل می شود. این نماینده های عددی تلاش می کنند تا با ترسیم مفهوم مربوط به آیتم های متنی و بستن بردار در ناحیه جاسازی، به معنای متن دست پیدا کنند. بعد از انجام این کار، یک شبکه مجزا بردار و تصویر متناسب با آن را ترسیم می کند. در مرحله دوم، سیستم از یک شبکه مولد تخاصمی (GAN) استفاده می کند که تصاویر را تولید و ارزیابی می کند. با توجه به اینکه GAN سعی می کند تا خود را فریب دهد که تصاویر تولید شده واقعی هستند، تصاویر حاصل از سیستم بسیار کاربردی و حقیقی جلوه می کنند.
دیدگاهتان را بنویسید