هوش مصنوعی قدرتمند جدید علیبابا یک تریلیون پارامتر دارد!
هوش مصنوعی قدرتمند جدید علیبابا یک تریلیون پارامتر دارد!
شرکت بزرگ تجارت الکترونیک چین، علیبابا، بار دیگر توجه جامعهی فناوری را به خود جلب کرد. تیم تحقیقاتی هوش مصنوعی این شرکت با نام Qwen پس از عرضه مجموعهای از مدلهای متنباز قدرتمند در تابستان گذشته، اکنون از بزرگترین مدل زبانی خود با نام Qwen3-Max-Preview (Instruct) رونمایی کرد؛ مدلی با بیش از یک تریلیون پارامتر که در حد و اندازهی غولهای آمریکایی مثل گوگل، OpenAI و آنتروپیک ظاهر میشود.
بهنوشتهی VentureBeat، پارامترها همان تنظیمات داخلی هستند که رفتار مدلهای زبانی را هدایت میکنند؛ هرچه تعدادشان بیشتر باشد، قدرت پردازش و کیفیت خروجی مدل هوش مصنوعی نیز بالاتر میرود. درحالی که بسیاری از آزمایشگاههای هوش مصنوعی به سمت مدلهای کوچکتر حرکت کردهاند، تصمیم Qwen برای انتشار مدل فوقالعاده بزرگ توجهات زیادی را جلب کرده است.
براساس دادههای بنچمارک منتشرشده، Qwen3-Max-Preview نهتنها از بهترین مدل قبلی این شرکت پیشی گرفته است، بلکه موفق شد در تستهایی مثل SuperGPQA ،AIME25 ،Arena-Hard v2 و LiveBench رقبای مطرحی مثل Claude Opus 4 و Deepseek-V3.1 را هم پشت سر بگذارد.
مدل Qwen3-Max درحال حاضر از طریق وبسایت Qwen Chat، رابط ابری Alibaba Cloud API و همچنین OpenRouter قابل استفاده است و بهطور پیشفرض در ابزار متنباز AnyCoder نیز فعال دردسترس قرار دارد. بااین حال، برخلاف نسخههای پیشین Qwen، این مدل فعلاً بهصورت متنباز منتشر نشده است و توسعهدهندگان فقط از طریق API پولی یا پلتفرمهای توزیع معرفیشده میتوانند به آن دسترسی داشته باشند.
ویژگیهای فنی Qwen3-Max قابلتوجه است: ورودی متنی ۲۶۲ هزار توکن، پشتیبانی از Context Caching برای افزایش سرعت، توانایی انجام استدلال پیچیده، تولید محتوا، پردازش دادههای ساختاریافته مثل JSON و حتی کدنویسی. این مدل در تستهای اولیه نهتنها سریعتر از ChatGPT پاسخ میدهد، بلکه بسیاری از خطاهای رایج مدلهای زبانی را نیز مرتکب نمیشود.
علیبابا برای استفاده از Qwen3-Max ساختار قیمتگذاری پلکانی در نظر گرفته است؛ هزینهها بسته به حجم ورودی بین ۰٫۸۶۱ تا ۲٫۱۵۱ دلار بهازای هر یک میلیون توکن و خروجی بین ۳٫۴۴۱ تا ۸٫۶۰۲ دلار متغیر خواهد بود. این ساختار باعث میشود استفاده در مقیاس کوچک مقرونبهصرفهتر باشد و در حجمهای بزرگ هزینهها متناسب افزایش یابد.
معرفی Qwen3-Max بازتاب گستردهای در شبکههای اجتماعی داشته است. اعضای تیم Qwen تأکید کردهاند که این مدل فعلاً آزمایشی ارائه میشود و نسخهی نهایی با قدرتی بیشتر از راه خواهد رسید. برخی کاربران نیز در تستهای خود گزارش دادهاند که مدل موردبحث توانسته است به سؤالات پیچیدهی منطقی پاسخهای مرحلهبهمرحله و دقیق بدهد؛ حتی در مسائلی که برخی مدلهای پیشرفته مثل جمنای ۲٫۵ پرو و GPT-5 Thinking دچار مشکل بودند.
مقالههای مرتبط:
برای کسبوکارها، Qwen3-Max-Preview میتواند مزایای بزرگی به همراه داشته باشد؛ از کاهش نیاز به فاینتیونینگ مداوم گرفته تا افزایش کارایی در پردازش دادههای حجیم و اجرای وظایف چندمرحلهای. البته، ساختار هزینه، وضعیت آزمایشی و نگرانیهای امنیتی استفاده از API ابری از جمله چالشهایی است که شرکتها باید پیش از تصمیمگیری در نظر بگیرند.
در مجموع، انتشار مدل Qwen3-Max-Preview نشاندهندهی سرمایهگذاری جدی علیبابا در مقیاسپذیری سیستمهای هوش مصنوعی است. اگر نسخهی نهایی با همین روند منتشر شود، این مدل میتواند یکی از رقبای اصلی غولهای آمریکایی در رقابت مدلهای زبانی فوقالعاده بزرگ باشد.
منبع : زومیت