zoomit

هوش مصنوعی جمنای ۱٫۵ گوگل حالا می‌تواند صدای شما را بشنود

هوش مصنوعی جمنای ۱٫۵ گوگل حالا می‌تواند صدای شما را بشنود

هوش مصنوعی Gemini 1.5 Pro به‌لطف آپدیت جدید گوگل می‌تواند به فایل‌های صوتی آپلودشده گوش دهد و اطلاعات را از تماس‌های دریافتی یا صدای ویدئوها بدون نیاز به دستورهای متنی استخراج کند.

در رویداد Cloud Next، گوگل اعلام کرد که مدل زبانی بزرگ جمنای ۱٫۵ پرو را برای اولین‌بار ازطریق ابزار Vertex AI دردسترس عموم ازجمله توسعه‌دهندگان قرار می‌دهد.

در‌حال‌حاضر، نسخه‌ی جدید جمنای پرو ازنظر عملکرد، از بزرگ‌ترین و قدرتمندترین مدل جمنای، یعنی اولترا ۱٫۰، پیشی گرفته است. گوگل ادعا می‌کند که جمنای ۱٫۵ پرو می‌تواند دستورالعمل‌های پیچیده را درک کند.

Gemini 1.5 Pro برای افرادی کاربردی نیست که به Vertex AI دسترسی ندارند. ناگفته نماند که جمنای اولترا به چت‌بات پیشرفته‌ی جمنای قدرت می‌دهد. این مدل زبانی بزرگ قدرتمند است و می‌تواند دستورهای متنی طولانی را درک کند؛ اما سرعت جمنای ۱٫۵ پرو را ندارد.

جمنای ۱٫۵ پرو، تنها مدل زبانی بزرگ گوگل نیست که به‌روزرسانی می‌شود. Imagen 2 ابزار تولید متن به تصویر است که به توانمندسازی قابلیت‌های تولید تصویر جمنای کمک می‌کند. این ابزار در آپدیت جدیدش به کاربران اجازه می‌دهد تا سوژه‌ها را به تصویر اضافه یا از آ‌ن‌ حذف کنند. گوگل نیز قابلیت واترمارک دیجیتال SynthID خود را در تمامی تصاویر ایجادشده با مدل‌های Imagen دردسترس قرار داده است.

گوگل در حال آزمایش ویژگی پاسخ هوش مصنوعی در صفحه‌ی نتایج اصلی جست‌وجو به‌صورت عمومی است و کاربران بدون نیاز به عضویت در Search Labs می‌توانند پاسخ هوش مصنوعی را مشاهده کنند.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا