گوگل در آینده جمنای و Veo را ادغام میکند

گوگل در آینده جمنای و Veo را ادغام میکند
دمیس هاسابیس، مدیرعامل گوگل دیپمایند، در قسمتی از پادکست Possible به میزبانی یکی از بنیانگذاران لینکدین، اعلام کرد که گوگل قصد دارد مدلهای هوش مصنوعی جمنای را با مدلهای ساخت ویدیو Veo ادغام کند تا درک مدلهای قبلی از دنیای فیزیکی بهبود یابد.
مدیرعامل دیپمایند توضیح میدهد که جمنای از ابتدا با هدف چندوجهیبودن طراحی شد و این تصمیم بهدلیل چشمانداز گوگل برای ایجاد یک دستیار دیجیتال جهانی اتخاذ شده است؛ دستیار دیجیتالیای که بتواند در دنیای واقعی به کاربران کمک کند.
صنعت هوش مصنوعی بهطور تدریجی به سمت مدلهای «همهکاره» پیش میرود؛ مدلهایی که قادر به درک و ترکیب اشکال مختلف محتوا هستند. مدلهای جمنای گوگل قادر به تولید صدا، تصویر و متن هستند، از سوی دیگر مدل GPT-4o از OpenAI نیز میتواند تصویر ایجاد کند.
ایجاد چنین مدلهایی نیازمند دادههای آموزشی فراوان است؛ از جمله تصویر، ویدیو صدا و متن. هاسابیس اشاره کرده که دادههای ویدیویی Veo عمدتاً از یوتیوب استخراج میشوند.
مقالهی مرتبط
هاسابیس میگوید که با مشاهدهی تعداد زیادی ویدیو در یوتیوب، Veo 2 میتواند مفاهیمی چون قوانین فیزیکی جهان را شناسایی کند.
گوگل پیشتر گفته بود که مدلهایش ممکن است با «برخی» محتواهای یوتیوب، مطابق توافقنامهای با خالقان محتوا، آموزش ببینند. گفته میشود گوگل سال گذشته شرایط خدمات خود را گسترش داد تا امکان دسترسی بیشتر به دادههای یوتیوب برای آموزش مدلهای هوش مصنوعیاش فراهم شود.
منبع : زومیت