zoomit

نسخه جدید هوش مصنوعی دیپ‌سیک بی‌سروصدا معرفی شد

نسخه جدید هوش مصنوعی دیپ‌سیک بی‌سروصدا معرفی شد

استارتاپ چینی دیپ‌سیک، نسخه‌ی جدیدی از مدل زبانی بزرگ خود با نام DeepSeek V3.1 را منتشر کرد. این آپدیت بی‌سروصدا و تنها از طریق گروه کاربری این شرکت در وی‌چت اعلام شد. مدل جدید، ظرفیت پردازش داده را به ۱۲۸ هزار توکن (معادل یک کتاب ۳۰۰ تا ۴۰۰ صفحه‌ای) و تعداد پارامترها را به ۶۸۵ میلیارد افزایش داده است.

مهم‌ترین تغییر در این نسخه، همین افزایش طول متن ورودی است که به مدل اجازه می‌دهد در تولید محتوای طولانی، تحلیل اسناد فنی و مکالمه‌های پیچیده، عملکرد بهتری داشته باشد.

DeepSeek V3.1 همچنان از معماری «ترکیب متخصصان» (Mixture-of-Experts) استفاده می‌کند که انعطاف‌پذیری بیشتری در محیط‌های مختلف فراهم می‌کند. این مدل از طریق API و به‌صورت متن‌باز در دسترس توسعه‌دهندگان قرار دارد.

بر اساس آزمایش‌های اولیه، V3.1 در تست‌های کدنویسی Aider نمره ۷۱٫۶ درصد را کسب کرد تا بالاتر از مدل Claude Opus 4 قرار بگیرد و به یکی از قوی‌ترین مدل‌های کدنویسی متن‌باز تبدیل شود.

برخی کاربران اشاره کرده‌اند که این مدل در استدلال، پیشرفت چشمگیری نسبت‌به نسخه‌ی قبلی ندارد. دیپ‌سیک تمام ارجاعات به مدل قدیمی خود را از چت‌باتش حذف کرده تا بر یک مدل ترکیبی واحد متمرکز شود.

مقاله‌های مرتبط

هزینه‌ی آموزش مدل جدید هنوز اعلام نشده، اما مدل اصلی V3 با ۲٫۷۸۸ میلیون ساعت استفاده از پردازنده‌های انویدیا H800 آموزش دیده بود که هزینه‌ای حدود ۵٫۶ میلیون دلار داشت.

انتظار می‌رفت که دیپ‌سیک مدل R2 را با قابلیت‌های استدلال پیشرفته‌تر معرفی کند؛ اما به جای آن، نسخه‌ی V3.1 منتشر شد. گفته می‌شود انتشار مدل R2 به‌دلیل مشکلات فنی با تراشه‌های هوش مصنوعی هواوی به تعویق افتاده است.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا