هوش مصنوعی جمنای ۱٫۵ گوگل حالا میتواند صدای شما را بشنود
هوش مصنوعی جمنای ۱٫۵ گوگل حالا میتواند صدای شما را بشنود
هوش مصنوعی Gemini 1.5 Pro بهلطف آپدیت جدید گوگل میتواند به فایلهای صوتی آپلودشده گوش دهد و اطلاعات را از تماسهای دریافتی یا صدای ویدئوها بدون نیاز به دستورهای متنی استخراج کند.
در رویداد Cloud Next، گوگل اعلام کرد که مدل زبانی بزرگ جمنای ۱٫۵ پرو را برای اولینبار ازطریق ابزار Vertex AI دردسترس عموم ازجمله توسعهدهندگان قرار میدهد.
درحالحاضر، نسخهی جدید جمنای پرو ازنظر عملکرد، از بزرگترین و قدرتمندترین مدل جمنای، یعنی اولترا ۱٫۰، پیشی گرفته است. گوگل ادعا میکند که جمنای ۱٫۵ پرو میتواند دستورالعملهای پیچیده را درک کند.
Gemini 1.5 Pro برای افرادی کاربردی نیست که به Vertex AI دسترسی ندارند. ناگفته نماند که جمنای اولترا به چتبات پیشرفتهی جمنای قدرت میدهد. این مدل زبانی بزرگ قدرتمند است و میتواند دستورهای متنی طولانی را درک کند؛ اما سرعت جمنای ۱٫۵ پرو را ندارد.
جمنای ۱٫۵ پرو، تنها مدل زبانی بزرگ گوگل نیست که بهروزرسانی میشود. Imagen 2 ابزار تولید متن به تصویر است که به توانمندسازی قابلیتهای تولید تصویر جمنای کمک میکند. این ابزار در آپدیت جدیدش به کاربران اجازه میدهد تا سوژهها را به تصویر اضافه یا از آن حذف کنند. گوگل نیز قابلیت واترمارک دیجیتال SynthID خود را در تمامی تصاویر ایجادشده با مدلهای Imagen دردسترس قرار داده است.
گوگل در حال آزمایش ویژگی پاسخ هوش مصنوعی در صفحهی نتایج اصلی جستوجو بهصورت عمومی است و کاربران بدون نیاز به عضویت در Search Labs میتوانند پاسخ هوش مصنوعی را مشاهده کنند.
منبع : زومیت