هوش مصنوعی جدید مایکروسافت کنترل رابطهای نرمافزاری و سیستمهای رباتیک را ممکن میکند

هوش مصنوعی جدید مایکروسافت کنترل رابطهای نرمافزاری و سیستمهای رباتیک را ممکن میکند
مایکروسافت مدل هوش مصنوعی Magma را معرفی کرد؛ مدلی که برای انجام وظایف دیجیتال و فیزیکی طراحی شده است.
هوش مصنوعی جدید مایکروسافت با ترکیب پردازش تصویری، زبانی و فضایی، نهتنها قادر به درک محیط اطراف خود است، بلکه میتواند براساس آن اقدام کند.
در نتایج بنچمارکها، مدل مگما در تست پاسخگویی تصویری VQAv2 امتیاز ۸۰٫۰ را کسب کرد و عملکردی بهتر از GPT-4V با امتیاز ۷۷٫۲ داشت. مگما در انجام وظایف رباتیک با ثبت امتیاز POPE 87.4 برتری خود را نشان داد.
طبق گفتهی توسعهدهندگان، مگما برای «طرحریزی و اجرای اقدامات با هدف دستیابی به یک هدف مشخص» طراحی شده است. پژوهشگران مایکروسافت میگویند: «مگما در ناوبری رابطهای کاربری و کنترل رباتها، نتایجی در سطح پیشرفتهی جهانی ارائه میدهد و مدلهای قبلی را که بهطور ویژه برای این وظایف طراحیشدهاند، پشت سر میگذارد.»
چنین قابلیتهایی به مگما امکان میدهد تا رابطهای نرمافزاری را پیمایش و سیستمهای رباتیک را کنترل کند. با وجود نتایج چشمگیر، این مدل همچنان در تصمیمگیریهای پیچیده و بلندمدت با چالشهایی روبهرو است. مایکروسافت میخواهد کد مگما را در گیتهاب منتشر کند تا توسعهدهندگان بتوانند آن را بهبود دهند.
قابلیتهای چندوجهی مگما و عملکرد رقابتیاش در ناوبری رابطهای کاربری و کنترل رباتها، آن را از مدلهای قبلی متمایز میکند. تیم توسعهدهنده میگوید: «مگما پلی میان هوش زبانی، فضایی و زمانی ایجاد میکند.»
مقالههای مرتبط
رقابت برای پیشتازی در دنیای هوش مصنوعی بیش از پیش داغ شده و شرکت OpenAI که حمایت مالی مایکروسافت را دارد، اخیراً ایجنت هوش مصنوعی Operator را در دسترس کاربران سرویس ChatGPT Pro قرار داده است.
Operator هنوز در اروپا در دسترس نیست؛ اما این ایجنت میتواند وظایفی مانند پرکردن فرمها، رزرو خدمات و سفارش مواد غذایی را انجام دهد.
منبع : زومیت