شرکت Runway که ابزارهای هوش مصنوعی مولد را برای تولید عکس و محتوای ویدئویی ارائه میدهد، مدل Gen-3 Alpha را معرفی کرد. این مدل هوش مصنوعی کلیپهای ویدئویی را از درخواستهای متنی و تصاویر ثابت ایجاد میکند.
رانوی ادعا میکند که مدل جدید بهبود چشمگیری ازنظر سرعت و کیفیت نتایج درمقایسهبا مدل Gen-2 پیدا کرده است و میتواند کنترلهای دقیقتری روی ویدئو ایجاد کند.
Gen-3 در روزهای آینده برای مشترکان ویژه، ازجمله مشتریان کسبوکاری و تولیدکنندگان محتوای عضو برنامهی شرکای خلاق رانوی دردسترس قرار خواهد گرفت.
رانوی در پست وبلاگ خود نوشت: «Gen-3 Alpha در تولید شخصیتهای انسانی با دامنهی گستردهای از رفتارها و حرکات و احساسات، در حد بسیار عالی عمل میکند.»
درحالحاضر، Gen-3 Alpha فقط میتواند کلیپهای ۱۰ ثانیهای تولید کند؛ اما مدیرعامل رانوی ادعا میکند که این مدل بخشی از سری مدلهایی با قابلیتهای پیشرفتهتر است که در آینده بهوجود خواهند آمد.
Gen-3 Alpha مانند ابزارهای توید ویدئو دیگر، براساس نمونههای متعددی از ویدئوها و تصاویر گوناگون آموزش دیده است تا بتواند از آنها برای ساخت محتوای جدید الگو بگیرد. مشخص نیست که رانوی از چه منابعی برای تعلیم مدل خود بهره برده است.
مدیر این شرکت میگوید: «ما تیم تحقیقات داخلی داریم که بر تمام آموزشهای ما نظارت میکند و از مجموعه دادههای داخلی بهمنظور آموزش مدلهای خود استفاده میکنیم.»
رانوی اعلام کرده است که قصد دارد Gen-3 را همراه با مجموعهای از الگوریتمهای محافظتی جدید منتشر کند تا از تولید ویدئو از تصاویر دارای حق نشر و محتواهایی جلوگیری کند که با قوانین شرکت مغایرت دارند. بهگفتهی مدیر رانوی، الگوریتمهای تشخیص متن و تصویر بهطور خودکار از تولید محتواهای نامناسب پیشگیری خواهند کرد.
منبع : زومیت