نسخه جدید هوش مصنوعی دیپسیک بیسروصدا معرفی شد

نسخه جدید هوش مصنوعی دیپسیک بیسروصدا معرفی شد
استارتاپ چینی دیپسیک، نسخهی جدیدی از مدل زبانی بزرگ خود با نام DeepSeek V3.1 را منتشر کرد. این آپدیت بیسروصدا و تنها از طریق گروه کاربری این شرکت در ویچت اعلام شد. مدل جدید، ظرفیت پردازش داده را به ۱۲۸ هزار توکن (معادل یک کتاب ۳۰۰ تا ۴۰۰ صفحهای) و تعداد پارامترها را به ۶۸۵ میلیارد افزایش داده است.
مهمترین تغییر در این نسخه، همین افزایش طول متن ورودی است که به مدل اجازه میدهد در تولید محتوای طولانی، تحلیل اسناد فنی و مکالمههای پیچیده، عملکرد بهتری داشته باشد.
DeepSeek V3.1 همچنان از معماری «ترکیب متخصصان» (Mixture-of-Experts) استفاده میکند که انعطافپذیری بیشتری در محیطهای مختلف فراهم میکند. این مدل از طریق API و بهصورت متنباز در دسترس توسعهدهندگان قرار دارد.
بر اساس آزمایشهای اولیه، V3.1 در تستهای کدنویسی Aider نمره ۷۱٫۶ درصد را کسب کرد تا بالاتر از مدل Claude Opus 4 قرار بگیرد و به یکی از قویترین مدلهای کدنویسی متنباز تبدیل شود.
برخی کاربران اشاره کردهاند که این مدل در استدلال، پیشرفت چشمگیری نسبتبه نسخهی قبلی ندارد. دیپسیک تمام ارجاعات به مدل قدیمی خود را از چتباتش حذف کرده تا بر یک مدل ترکیبی واحد متمرکز شود.
مقالههای مرتبط
هزینهی آموزش مدل جدید هنوز اعلام نشده، اما مدل اصلی V3 با ۲٫۷۸۸ میلیون ساعت استفاده از پردازندههای انویدیا H800 آموزش دیده بود که هزینهای حدود ۵٫۶ میلیون دلار داشت.
انتظار میرفت که دیپسیک مدل R2 را با قابلیتهای استدلال پیشرفتهتر معرفی کند؛ اما به جای آن، نسخهی V3.1 منتشر شد. گفته میشود انتشار مدل R2 بهدلیل مشکلات فنی با تراشههای هوش مصنوعی هواوی به تعویق افتاده است.
منبع : زومیت