قابلیتهای حیرتانگیز هوش مصنوعی Veo 2 گوگل؛ حذف اشیا، تنظیم زاویه دوربین و اعمال افکتهای سینمایی

قابلیتهای حیرتانگیز هوش مصنوعی Veo 2 گوگل؛ حذف اشیا، تنظیم زاویه دوربین و اعمال افکتهای سینمایی
گوگل با ارتقاء مدل هوش مصنوعی ویدیویی خود بهنام Veo 2، ابزارهای پیشرفتهای برای تولید و ویرایش ویدیوهای سینمایی در اختیار کاربران قرار داده است. این قابلیتها که در پلتفرم Vertex AI گوگل کلاد دردسترس قرار گرفتهاند، در کنار بهروزرسانیهای مدلهای دیگر گوگل مانند Imagen 3 برای تولید تصویر و مدلهای صوتی این شرکت منتشر شدهاند.
از مهمترین ویژگیهای جدید Veo 2 میتوان به ابزار inpainting برای حذف خودکار اشیای ناخواسته، لوگوها یا عناصر مزاحم در پسزمینهی ویدیو اشاره کرد. همچنین قابلیت OutPainting به کاربران اجازه میدهد ویدیوهای خود را گسترش دهند. این فضا با محتوای ویدیویی تولیدشده با هوش مصنوعی پر میشود و بهطور طبیعی با ویدیوی اصلی ترکیب میگردد. این ویژگی عملکردی مشابه ابزار Generative Expand ادوبی برای تصاویر دارد.
به گفتهی گوگل، کاربران میتوانند هنگام تولید ویدیو با متن با Veo 2، از پیشتنظیمهایی با سبک سینمایی مانند تایملپس، نمای پهپادی یا حرکات دوربین به جهات مختلف استفاده کنند. این تنظیمات کمک میکنند تا ترکیببندی صحنه، زاویهی دوربین و ریتم کلی ویدیو به شکل حرفهایتری طراحی شود.
یکیدیگر از ابزارهای جذاب اضافهشده به Veo 2، قابلیت interpolation است. این ویژگی میتواند بین دو تصویر ثابت، ویدیوی پیوسته و طبیعی تولید و فریمهایی برای آغاز و پایان ایجاد کند. این قابلیت شباهت زیادی به ابزارهای مدل Firefly شرکت ادوبی دارد که اخیراً در نرمافزار پریمیر پرو ارائه شدهاند.
از طرف دیگر، مدل تولید تصویر گوگل یعنی Imagen 3 نیز بهروزرسانی شده است تا فرایند حذف اشیای مزاحم بهشکل طبیعیتری انجام گیرد. درحالحاضر برندهایی مثل L’Oreal و Kraft Heinz برای تولید محتوای تبلیغاتی از این مدلها استفاده میکنند. بهگفتهی مدیر دیجیتال برند Heinz، کاری که قبلاً ۸ هفته زمان میبرد، حالا فقط در ۸ ساعت انجام میشود.
گوگل در حوزهی صوت، مدل Lyria را بهصورت پیشنمایش خصوصی برای تبدیل متن به موسیقی منتشر کرده و همچنین قابلیت Instant Custom Voice را به مدل گفتار مصنوعی Chirp 3 افزوده است. این ابزار میتواند فقط با ۱۰ ثانیه صدای منبع، صدای واقعگرایانه و سفارشی تولید کند. همچنین قابلیت جدیدی برای تشخیص و تفکیک گویندگان مختلف در تماس تلفنی دردسترس کاربران قرار دارد.
نسخهی جدید مدل سریع گوگل با نام جمینای ۲٫۵ فلش نیز بهزودی در Vertex AI منتشر خواهد شد. این مدل میتواند زمان پردازش را باتوجه به پیچیدگی درخواست، بهطور خودکار تنظیم کند.
در نهایت، گوگل ایجنتهای هوش مصنوعی را بهروزرسانی کرده است تا بتوانند با یکدیگر ارتباط برقرار کنند و در پلتفرمهایی مثل پیپال و Salesforce وظایف پیچیدهتری انجام دهند. همچنین بخش جدید Cloud Marketplace گوگل به شرکتها اجازه میدهد ایجتهای هوش مصنوعی شرکای خود را خریداری کنند.
منبع : زومیت