گوگل ابزار هوش مصنوعی تولید ویدیو Flow و مدل‌ جدید هوش مصنوعی Veo 3 را معرفی کرد

توسط مهتا مجدی ·30 اردیبهشت 140430 اردیبهشت 1404· 0

در کنفرانس I/O، گوگل برنامه جدیدی برای «فیلمسازی با هوش مصنوعی» به نام Flow را به سازندگان معرفی کرد. ابزار هوش مصنوعی تولید ویدیو Flow توانست، Veo، Imagen و Gemini را برای ایجاد کلیپ‌ها و صحنه‌های سینمایی گرد هم می‌آورد. در نتیجه کاربران می‌توانند خروجی نهایی مورد نظر خود را به زبان طبیعی توصیف کنند و Flow برای آنها کار ساخت ویدیو را انجام خواهد داد. همانطور که گفتیم این ابزار جدید در حال حاضر فقط برای مشترکین Google AI Pro و Ultra در ایالات متحده در دسترس خواهد بود، اما به گفته‌ی گوگل به زودی در کشورهای بیشتری عرضه خواهد شد.

شما می‌توانید از مهارت‌های زبان طبیعی Gemini برای ساخت و تنظیم خروجی ویدیو استفاده کنید، و افراد خلاق می‌توانند دارایی‌های خود را وارد کنند یا از طریق ورودی متن ساده، محتوایی را با Imagen ایجاد کنند. نکته قابل توجه، توانایی ادغام خلاقیت‌ها و صحنه‌های شما در کلیپ‌ها و صحنه‌های مختلف است.

Flow همچنین کنترل مستقیم بر حرکت دوربین شما را خواهد داشت و حتی زاویه دوربین را انتخاب می‌کند. همچنین می‌توانید عکس‌ها را ویرایش کنید و گسترش دهید. شایان ذکر است که Flow سیستم مدیریت دارایی مخصوص به خود را برای سازماندهی دارایی‌ها و حتی پیام‌های شما خواهد داشت. این کنترل‌ها و قابلیت‌های ویرایش، می‌توانند به مرور زمان آثار جذاب‌تری را خلق کنند. در نهایت Flow اکنون برای مشترکین AI Pro و AI Ultra در ایالات متحده در دسترس است و به زودی در سایر کشورها نیز عرضه خواهد شد.

همانطور که گفتیم، گوگل در کنفرانس توسعه‌دهندگان I/O، از جدیدترین مدل‌های تولید رسانه خود رونمایی کرد. شاید قابل توجه‌ترین مدل هوش مصنوعی گوگل که در رویداد معرفی شده، Veo 3 باشد که می‌تواند ویدیوها را با صدا تولید کند. به عنوان مثال، می‌تواند ویدیویی از پرندگان با صدای آواز آنها یا یک ویدیو از شهر با صدای ترافیک در پس‌زمینه ایجاد کند. در حال حاضر، این مدل فقط برای مشترکین Gemini Ultra در ایالات متحده در برنامه Gemini و برای کاربران سازمانی در Vertex AI در دسترس است. همچنین در Flow، موجود خواهد بود.

در حالی که این شرکت یک مدل تولید ویدیوی کاملاً جدید منتشر کرده است، هنوز Veo 2 را رها نکرده است. کاربران می‌توانند تصاویر افراد، صحنه‌ها، سبک‌ها و اشیاء را به Veo 2 بدهند تا به عنوان مرجع برای خروجی مورد نظر خود در Flow استفاده کنند. آنها به کنترل‌های دوربین نیز دسترسی خواهند داشت که به آنها این امکان را می‌دهد تا صحنه‌ها را بچرخانند و روی اشیاء خاص در Flow زوم کنند. به علاوه، در صورت تمایل می‌توانند فریم‌های خود را از عمودی به افقی گسترش دهند و اشیاء را به ویدیوهای خود اضافه یا حذف کنند.

گوگل همچنین جدیدترین مدل تولید تصویر خود، Imagen 4، را در این رویداد معرفی کرده است. این شرکت اعلام کرد که Imagen 4 جزئیات دقیقی مانند پارچه‌های پیچیده و خز حیوانات را با وضوح قابل توجه نمایش می‌دهد و در تولید تصاویر واقع‌گرایانه و انتزاعی عالی است. همچنین در رندر تایپوگرافی نسبت به مدل‌های قبلی خود به طور قابل توجهی بهتر است و می‌تواند تصاویر را در نسبت‌های ابعاد مختلف با وضوح تا 2K ایجاد کند. Imagen 4 اکنون از طریق برنامه Gemini، Vertex AI و برنامه‌های Workspace، از جمله Docs و Slides، در دسترس است. گوگل اعلام کرد که به زودی نسخه‌ای از Imagen 4 را نیز منتشر خواهد کرد که ۱۰ برابر سریع‌تر از Imagen 3 است.

در نهایت، برای شناسایی محتوای تولید شده توسط هوش مصنوعی که روز‌به‌روز دشوارتر می‌شود، گوگل SynthID Detector را راه‌اندازی کرده است. SynthID Detector پورتالی است که کاربران می‌توانند در آن قطعه‌ای از ویدیوهایی را که فکر می‌کنند ممکن است توسط هوش مصنوعی تولید شده باشد، آپلود کنند و گوگل تشخیص خواهد داد که آیا این محتوا توسط انسان ایجاد شده یا هنر هوش مصنوعی است.

برچسب‌ها: گوگل

امتیاز: 5.0 از 5 (2 رای)

کمی صبر کنید...

دیدگاهتان را بنویسید لغو پاسخ

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.