zoomit

هوش مصنوعی قدرتمند جدید علی‌بابا یک تریلیون پارامتر دارد!

هوش مصنوعی قدرتمند جدید علی‌بابا یک تریلیون پارامتر دارد!

شرکت بزرگ تجارت الکترونیک چین، علی‌بابا، بار دیگر توجه جامعه‌ی فناوری را به خود جلب کرد. تیم تحقیقاتی هوش مصنوعی این شرکت با نام Qwen پس از عرضه مجموعه‌ای از مدل‌های متن‌باز قدرتمند در تابستان گذشته، اکنون از بزرگ‌ترین مدل زبانی خود با نام Qwen3-Max-Preview (Instruct) رونمایی کرد؛ مدلی با بیش از یک تریلیون پارامتر که در حد و اندازه‌ی غول‌های آمریکایی مثل گوگل، OpenAI و آنتروپیک ظاهر می‌شود.

به‌نوشته‌ی VentureBeat، پارامترها همان تنظیمات داخلی هستند که رفتار مدل‌های زبانی را هدایت می‌کنند؛ هرچه تعدادشان بیشتر باشد، قدرت پردازش و کیفیت خروجی مدل هوش مصنوعی نیز بالاتر می‌رود. درحالی که بسیاری از آزمایشگاه‌های هوش مصنوعی به سمت مدل‌های کوچک‌تر حرکت کرده‌اند، تصمیم Qwen برای انتشار مدل فوق‌العاده بزرگ توجهات زیادی را جلب کرده است.

براساس داده‌های بنچمارک منتشرشده، Qwen3-Max-Preview نه‌تنها از بهترین مدل قبلی این شرکت پیشی گرفته است، بلکه موفق شد در تست‌هایی مثل SuperGPQA ،AIME25 ،Arena-Hard v2 و LiveBench رقبای مطرحی مثل Claude Opus 4 و Deepseek-V3.1 را هم پشت سر بگذارد.

مدل Qwen3-Max درحال حاضر از طریق وب‌سایت Qwen Chat، رابط ابری Alibaba Cloud API و همچنین OpenRouter قابل استفاده است و به‌طور پیش‌فرض در ابزار متن‌باز AnyCoder نیز فعال دردسترس قرار دارد. بااین حال، برخلاف نسخه‌های پیشین Qwen، این مدل فعلاً به‌صورت متن‌باز منتشر نشده است و توسعه‌دهندگان فقط از طریق API پولی یا پلتفرم‌های توزیع معرفی‌شده می‌توانند به آن دسترسی داشته باشند.

ویژگی‌های فنی Qwen3-Max قابل‌توجه است: ورودی متنی ۲۶۲ هزار توکن، پشتیبانی از Context Caching برای افزایش سرعت، توانایی انجام استدلال پیچیده، تولید محتوا، پردازش داده‌های ساختاریافته مثل JSON و حتی کدنویسی. این مدل در تست‌های اولیه نه‌تنها سریع‌تر از ChatGPT پاسخ می‌دهد، بلکه بسیاری از خطاهای رایج مدل‌های زبانی را نیز مرتکب نمی‌شود.

علی‌بابا برای استفاده از Qwen3-Max ساختار قیمت‌گذاری پلکانی در نظر گرفته است؛ هزینه‌ها بسته به حجم ورودی بین ۰٫۸۶۱ تا ۲٫۱۵۱ دلار به‌ازای هر یک میلیون توکن و خروجی بین ۳٫۴۴۱ تا ۸٫۶۰۲ دلار متغیر خواهد بود. این ساختار باعث می‌شود استفاده در مقیاس کوچک مقرون‌به‌صرفه‌تر باشد و در حجم‌های بزرگ هزینه‌ها متناسب افزایش یابد.

معرفی Qwen3-Max بازتاب گسترده‌ای در شبکه‌های اجتماعی داشته است. اعضای تیم Qwen تأکید کرده‌اند که این مدل فعلاً آزمایشی ارائه می‌شود و نسخه‌ی نهایی با قدرتی بیشتر از راه خواهد رسید. برخی کاربران نیز در تست‌های خود گزارش داده‌اند که مدل موردبحث توانسته است به سؤالات پیچیده‌ی منطقی پاسخ‌های مرحله‌به‌مرحله و دقیق بدهد؛ حتی در مسائلی که برخی مدل‌های پیشرفته مثل جمنای ۲٫۵ پرو و GPT-5 Thinking دچار مشکل بودند.

مقاله‌های مرتبط:

برای کسب‌وکارها، Qwen3-Max-Preview می‌تواند مزایای بزرگی به همراه داشته باشد؛ از کاهش نیاز به فاین‌تیونینگ مداوم گرفته تا افزایش کارایی در پردازش داده‌های حجیم و اجرای وظایف چندمرحله‌ای. البته، ساختار هزینه، وضعیت آزمایشی و نگرانی‌های امنیتی استفاده از API ابری از جمله چالش‌هایی است که شرکت‌ها باید پیش از تصمیم‌گیری در نظر بگیرند.

در مجموع، انتشار مدل Qwen3-Max-Preview نشان‌دهنده‌ی سرمایه‌گذاری جدی علی‌بابا در مقیاس‌پذیری سیستم‌های هوش مصنوعی است. اگر نسخه‌ی نهایی با همین روند منتشر شود، این مدل می‌تواند یکی از رقبای اصلی غول‌های آمریکایی در رقابت مدل‌های زبانی فوق‌العاده بزرگ باشد.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا