zoomit

هوش مصنوعی جدید مایکروسافت کنترل رابط‌های نرم‌افزاری و سیستم‌های رباتیک را ممکن می‌کند

هوش مصنوعی جدید مایکروسافت کنترل رابط‌های نرم‌افزاری و سیستم‌های رباتیک را ممکن می‌کند

مایکروسافت مدل هوش مصنوعی Magma را معرفی کرد؛ مدلی که برای انجام وظایف دیجیتال و فیزیکی طراحی شده است.

هوش مصنوعی جدید مایکروسافت با ترکیب پردازش تصویری، زبانی و فضایی، نه‌تنها قادر به درک محیط اطراف خود است، بلکه می‌تواند براساس آن اقدام کند.

در نتایج بنچمارک‌ها، مدل مگما در تست پاسخ‌گویی تصویری VQAv2 امتیاز ۸۰٫۰ را کسب کرد و عملکردی بهتر از GPT-4V با امتیاز ۷۷٫۲ داشت. مگما در انجام وظایف رباتیک با ثبت امتیاز POPE 87.4 برتری خود را نشان داد.

طبق گفته‌ی توسعه‌دهندگان، مگما برای «طرح‌ریزی و اجرای اقدامات با هدف دستیابی به یک هدف مشخص» طراحی شده است. پژوهشگران مایکروسافت می‌گویند: «مگما در ناوبری رابط‌های کاربری و کنترل ربات‌ها، نتایجی در سطح پیشرفته‌ی جهانی ارائه می‌دهد و مدل‌های قبلی را که به‌طور ویژه برای این وظایف طراحی‌شده‌اند، پشت سر می‌گذارد.»

چنین قابلیت‌هایی به مگما امکان می‌دهد تا رابط‌های نرم‌افزاری را پیمایش و سیستم‌های رباتیک را کنترل کند. با وجود نتایج چشمگیر، این مدل همچنان در تصمیم‌گیری‌های پیچیده و بلندمدت با چالش‌هایی روبه‌رو است. مایکروسافت می‌خواهد کد مگما را در گیت‌هاب منتشر کند تا توسعه‌دهندگان بتوانند آن را بهبود دهند.

قابلیت‌های چندوجهی مگما و عملکرد رقابتی‌اش در ناوبری رابط‌های کاربری و کنترل ربات‌ها، آن را از مدل‌های قبلی متمایز می‌کند. تیم توسعه‌دهنده می‌گوید: «مگما پلی میان هوش زبانی، فضایی و زمانی ایجاد می‌کند.»

مقاله‌های مرتبط

رقابت برای پیشتازی در دنیای هوش مصنوعی بیش از پیش داغ شده و شرکت OpenAI که حمایت مالی مایکروسافت را دارد، اخیراً ایجنت هوش مصنوعی Operator را در دسترس کاربران سرویس ChatGPT Pro قرار داده است.

Operator هنوز در اروپا در دسترس نیست؛ اما این ایجنت می‌تواند وظایفی مانند پرکردن فرم‌ها، رزرو خدمات و سفارش مواد غذایی را انجام دهد.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا