هوش مصنوعی جدید گوگل بدون نیاز به دخالت شما مشغول وبگردی میشود
هوش مصنوعی جدید گوگل بدون نیاز به دخالت شما مشغول وبگردی میشود
گوگل از نسخهی جدید مدل هوش مصنوعی جمنای با نام Gemini 2.5 Computer Use رونمایی کرد؛ مدلیکه میتواند بهطور مستقل در مرورگر وب گشتوگذار کند و با رابطهای کاربری طراحیشده برای انسانها تعامل داشته باشد. این هوش مصنوعی با بهرهگیری از «درک و استدلال بصری» درخواستهای کاربر را تحلیل میکند و وظایفی مانند پر کردن و ارسال فرمها را انجام میدهد.
هدف از توسعهی Gemini 2.5 Computer Use، فراهمکردن امکان انجام کارها در رابطهایی است که فاقد API یا راه ارتباطی مستقیم هستند. گوگل پیشتر نسخههای اولیهی این فناوری را در پروژههایی مانند AI Mode و Project Mariner بهکار گرفته است؛ پروژههایی که در آن هوش مصنوعی بهصورت خودکار اقداماتی مانند افزودن اقلام به سبد خرید بر اساس فهرست مواد اولیه انجام میدهد.
زمان معرفی مدل Gemini 2.5 Computer Use درست یک روز پس از رویداد سالانهی Dev Day شرکت OpenAI بود که در آن نسخهی جدید اپلیکیشنهای ChatGPT معرفی شد. درحالی که OpenAI تمرکز خود را روی قابلیت Agent گذاشته و آنتروپیک نیز سال گذشته نسخهای از Claude AI با توانایی استفاده از کامپیوتر ارائه کرده بود، گوگل اکنون وارد رقابت مستقیم با این دو غول هوش مصنوعی شده است.
مقالههای مرتبط:
گوگل برای نمایش تواناییهای جمنای ۲٫۵ چند ویدیو از عملکرد آن منتشر کرده است که با سرعت سهبرابر پخش میشوند. طبق ادعای گوگل این مدل در چندین بنچمارک وب و موبایل عملکرد بهتری نسبت به رقبای اصلی دارد. مدل گوگل برخلاف ChatGPT Agent و ابزار مشابه آنتروپیک، فقط به مرورگر دسترسی دارد و هنوز برای کنترل در سطح سیستمعامل دسکتاپ بهینهسازی نشده است. درحال حاضر از ۱۳ عمل مختلف مانند باز کردن مرورگر، تایپ متن و کشیدن و رها کردن المانها پشتیبانی میکند.
مدل Gemini 2.5 Computer Use از طریق Google AI Studio و Vertex AI در اختیار توسعهدهندگان قرار گرفته و نسخهی نمایشی آن نیز در Browserbase قابل مشاهده است؛ جاییکه میتوانید عملکرد هوش مصنوعی را در انجام وظایفی مانند بازی ۲۰۴۸ یا مرور بحثهای داغ Hacker News تماشا کنید.
منبع : زومیت