رونمایی Kling از Video O1؛ مدل هوشمصنوعی یکپارچه برای ویدیو

رونمایی Kling از Video O1؛ مدل هوشمصنوعی یکپارچه برای ویدیو
شرکت هوشمصنوعی چینی Kling مدل جدید خود با نام «Video O1» را معرفی کرد و آن را «اولین مدل ویدیویی چندرسانهای یکپارچه جهان» خواند. بهگفته این شرکت، این مدل تولید و ویرایش ویدیو را در یک پلتفرم واحد ادغام میکند و دیگر نیازی به ابزارهای جداگانه برای انجام فرایندهای مختلف نیست.
به گزارش نیوزلن، «Video O1» قادر است کلیپهای کوتاه سه تا ده ثانیهای را بر پایه دستورات متنی یا تصاویر مرجع تولید کند. علاوه بر تولید، این مدل امکانات ویرایشی پیشرفتهای نیز در اختیار کاربر میگذارد؛ از جمله تعویض شخصیتها، تغییر شرایط آب و هوایی، و اصلاح سبک و رنگهای بصری تنها با یک دستور واحد.
قابلیتهای ویرایشی مدل شامل افزودن عناصر جدید، تغییر پسزمینه، و اصلاح همزمان اثر هنری در همان صحنه است. «Video O1» برای پردازش همزمان چند نوع ورودی طراحی شده و تا هفت عنصر مختلف (از جمله تصویر، ویدیو و متن) را پشتیبانی میکند.
کاربر میتواند با فرامین سادهای مانند «حذف رهگذران» یا «تبدیل روشنایی روز به شب» و بدون دخالت دست، تغییرات مورد نظر را روی ویدیو اعمال کند. همچنین امکان بارگذاری شخصیتها، اشیاء یا صحنهها برای استفاده مکرر در زمینههای مختلف وجود دارد و مدل میتواند ثبات این عناصر را در نماهای متعدد حفظ کند.
شرکت Kling اعلام کرده که مقایسههای داخلی بین «Video O1» و مدلهای دیگری همچون Google Veo 3.1 و Runway Aleph انجام داده است. بر مبنای این مقایسهها، بهخصوص در تولید ویدیو بر پایه تصویر مرجع، «Video O1» عملکرد برجستهتری نمایش داده و از ویژگی «Ingredients to Video» گوگل پیشی گرفته است. بهعلاوه، بهگزارش شرکت، منتقدان در زمینهی تبدیل ویدیو، «Video O1» را نسبت به Runway Aleph با ترجیحی معادل ٪۲۳۰ به نفع O1 ارزیابی کردهاند.
در حال حاضر مدل «Video O1» از طریق پلتفرم وب Kling در دسترس کاربران قرار دارد؛ عرضهای که در فضای رقابتی و پرشتاب حوزهی هوشمصنوعی و تولید محتوای ویدیویی انجام میشود.



