در کنفرانس I/O، گوگل برنامه جدیدی برای «فیلمسازی با هوش مصنوعی» به نام Flow را به سازندگان معرفی کرد. ابزار هوش مصنوعی تولید ویدیو Flow توانست، Veo، Imagen و Gemini را برای ایجاد کلیپها و صحنههای سینمایی گرد هم میآورد. در نتیجه کاربران میتوانند خروجی نهایی مورد نظر خود را به زبان طبیعی توصیف کنند و Flow برای آنها کار ساخت ویدیو را انجام خواهد داد. همانطور که گفتیم این ابزار جدید در حال حاضر فقط برای مشترکین Google AI Pro و Ultra در ایالات متحده در دسترس خواهد بود، اما به گفتهی گوگل به زودی در کشورهای بیشتری عرضه خواهد شد.
شما میتوانید از مهارتهای زبان طبیعی Gemini برای ساخت و تنظیم خروجی ویدیو استفاده کنید، و افراد خلاق میتوانند داراییهای خود را وارد کنند یا از طریق ورودی متن ساده، محتوایی را با Imagen ایجاد کنند. نکته قابل توجه، توانایی ادغام خلاقیتها و صحنههای شما در کلیپها و صحنههای مختلف است.
Flow همچنین کنترل مستقیم بر حرکت دوربین شما را خواهد داشت و حتی زاویه دوربین را انتخاب میکند. همچنین میتوانید عکسها را ویرایش کنید و گسترش دهید. شایان ذکر است که Flow سیستم مدیریت دارایی مخصوص به خود را برای سازماندهی داراییها و حتی پیامهای شما خواهد داشت. این کنترلها و قابلیتهای ویرایش، میتوانند به مرور زمان آثار جذابتری را خلق کنند. در نهایت Flow اکنون برای مشترکین AI Pro و AI Ultra در ایالات متحده در دسترس است و به زودی در سایر کشورها نیز عرضه خواهد شد.

همانطور که گفتیم، گوگل در کنفرانس توسعهدهندگان I/O، از جدیدترین مدلهای تولید رسانه خود رونمایی کرد. شاید قابل توجهترین مدل هوش مصنوعی گوگل که در رویداد معرفی شده، Veo 3 باشد که میتواند ویدیوها را با صدا تولید کند. به عنوان مثال، میتواند ویدیویی از پرندگان با صدای آواز آنها یا یک ویدیو از شهر با صدای ترافیک در پسزمینه ایجاد کند. در حال حاضر، این مدل فقط برای مشترکین Gemini Ultra در ایالات متحده در برنامه Gemini و برای کاربران سازمانی در Vertex AI در دسترس است. همچنین در Flow، موجود خواهد بود.
در حالی که این شرکت یک مدل تولید ویدیوی کاملاً جدید منتشر کرده است، هنوز Veo 2 را رها نکرده است. کاربران میتوانند تصاویر افراد، صحنهها، سبکها و اشیاء را به Veo 2 بدهند تا به عنوان مرجع برای خروجی مورد نظر خود در Flow استفاده کنند. آنها به کنترلهای دوربین نیز دسترسی خواهند داشت که به آنها این امکان را میدهد تا صحنهها را بچرخانند و روی اشیاء خاص در Flow زوم کنند. به علاوه، در صورت تمایل میتوانند فریمهای خود را از عمودی به افقی گسترش دهند و اشیاء را به ویدیوهای خود اضافه یا حذف کنند.
گوگل همچنین جدیدترین مدل تولید تصویر خود، Imagen 4، را در این رویداد معرفی کرده است. این شرکت اعلام کرد که Imagen 4 جزئیات دقیقی مانند پارچههای پیچیده و خز حیوانات را با وضوح قابل توجه نمایش میدهد و در تولید تصاویر واقعگرایانه و انتزاعی عالی است. همچنین در رندر تایپوگرافی نسبت به مدلهای قبلی خود به طور قابل توجهی بهتر است و میتواند تصاویر را در نسبتهای ابعاد مختلف با وضوح تا 2K ایجاد کند. Imagen 4 اکنون از طریق برنامه Gemini، Vertex AI و برنامههای Workspace، از جمله Docs و Slides، در دسترس است. گوگل اعلام کرد که به زودی نسخهای از Imagen 4 را نیز منتشر خواهد کرد که ۱۰ برابر سریعتر از Imagen 3 است.
در نهایت، برای شناسایی محتوای تولید شده توسط هوش مصنوعی که روزبهروز دشوارتر میشود، گوگل SynthID Detector را راهاندازی کرده است. SynthID Detector پورتالی است که کاربران میتوانند در آن قطعهای از ویدیوهایی را که فکر میکنند ممکن است توسط هوش مصنوعی تولید شده باشد، آپلود کنند و گوگل تشخیص خواهد داد که آیا این محتوا توسط انسان ایجاد شده یا هنر هوش مصنوعی است.
دیدگاهتان را بنویسید