zoomit

قابلیت‌های حیرت‌انگیز هوش مصنوعی Veo 2 گوگل؛ حذف اشیا، تنظیم زاویه دوربین و اعمال افکت‌های سینمایی

قابلیت‌های حیرت‌انگیز هوش مصنوعی Veo 2 گوگل؛ حذف اشیا، تنظیم زاویه دوربین و اعمال افکت‌های سینمایی

گوگل با ارتقاء مدل هوش مصنوعی ویدیویی خود به‌نام Veo 2، ابزارهای پیشرفته‌ای برای تولید و ویرایش ویدیوهای سینمایی در اختیار کاربران قرار داده است. این قابلیت‌ها که در پلتفرم Vertex AI گوگل کلاد دردسترس قرار گرفته‌اند، در کنار به‌روزرسانی‌های مدل‌های دیگر گوگل مانند Imagen 3 برای تولید تصویر و مدل‌های صوتی این شرکت منتشر شده‌اند.

از مهم‌ترین ویژگی‌های جدید Veo 2 می‌توان به ابزار inpainting برای حذف خودکار اشیای ناخواسته، لوگوها یا عناصر مزاحم در پس‌زمینه‌ی ویدیو اشاره کرد. همچنین قابلیت OutPainting به کاربران اجازه می‌دهد ویدیوهای خود را گسترش دهند. این فضا با محتوای ویدیویی تولیدشده با هوش مصنوعی پر می‌شود و به‌طور طبیعی با ویدیوی اصلی ترکیب می‌گردد. این ویژگی عملکردی مشابه ابزار Generative Expand ادوبی برای تصاویر دارد.

به گفته‌ی گوگل، کاربران می‌توانند هنگام تولید ویدیو با متن با Veo 2، از پیش‌تنظیم‌هایی با سبک سینمایی مانند تایم‌لپس، نمای پهپادی یا حرکات دوربین به جهات مختلف استفاده کنند. این تنظیمات کمک می‌کنند تا ترکیب‌بندی صحنه، زاویه‌ی دوربین و ریتم کلی ویدیو به شکل حرفه‌ای‌تری طراحی شود.

یکی‌دیگر از ابزارهای جذاب اضافه‌شده به Veo 2، قابلیت interpolation است. این ویژگی می‌تواند بین دو تصویر ثابت، ویدیوی پیوسته و طبیعی تولید و فریم‌هایی برای آغاز و پایان ایجاد کند. این قابلیت شباهت زیادی به ابزارهای مدل Firefly شرکت ادوبی دارد که اخیراً در نرم‌افزار پریمیر پرو ارائه شده‌اند.

از طرف دیگر، مدل تولید تصویر گوگل یعنی Imagen 3 نیز به‌روزرسانی شده است تا فرایند حذف اشیای مزاحم به‌شکل طبیعی‌تری انجام گیرد. درحال‌حاضر برندهایی مثل L’Oreal و Kraft Heinz برای تولید محتوای تبلیغاتی از این مدل‌ها استفاده می‌کنند. به‌گفته‌ی مدیر دیجیتال برند Heinz، کاری که قبلاً ۸ هفته زمان می‌برد، حالا فقط در ۸ ساعت انجام می‌شود.

گوگل در حوزه‌ی صوت، مدل Lyria را به‌صورت پیش‌نمایش خصوصی برای تبدیل متن به موسیقی منتشر کرده و همچنین قابلیت Instant Custom Voice را به مدل گفتار مصنوعی Chirp 3 افزوده است. این ابزار می‌تواند فقط با ۱۰ ثانیه صدای منبع، صدای واقع‌گرایانه و سفارشی تولید کند. همچنین قابلیت جدیدی برای تشخیص و تفکیک گویندگان مختلف در تماس تلفنی دردسترس کاربران قرار دارد.

نسخه‌ی جدید مدل سریع گوگل با نام جمینای ۲٫۵ فلش نیز به‌زودی در Vertex AI منتشر خواهد شد. این مدل می‌تواند زمان پردازش را باتوجه به پیچیدگی درخواست، به‌طور خودکار تنظیم کند.

در نهایت، گوگل ایجنت‌های هوش مصنوعی را به‌روزرسانی کرده است تا بتوانند با یکدیگر ارتباط برقرار کنند و در پلتفرم‌هایی مثل پی‌پال و Salesforce وظایف پیچیده‌تری انجام دهند. همچنین بخش جدید Cloud Marketplace گوگل به شرکت‌ها اجازه می‌دهد ایجت‌های هوش مصنوعی شرکای خود را خریداری کنند.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا