نسخه جدید هوش مصنوعی دیپسیک در راه است؟
نسخه جدید هوش مصنوعی دیپسیک در راه است؟
براساس جدیدترین گزارشها، مدل زبانی بزرگ بعدی دیپسیک بین تاریخ ۱۵ تا ۳۰ آگوست (بین ۲۴ مرداد تا ۸ شهریور) و با نام DeepSeek-R2 از راه خواهد رسید.
انتظار میرود با استفاده از نسخهی پیشرفتهتر سیستم Mixture of Experts، جهش قابلتوجهی در معماری و عملکرد هوش مصنوعی دیپسیک صورت بگیرد. گفته میشود DeepSeek-R2 حدود ۱٫۲ تریلیون پارامتر خواهد داشت، یعنی تقریباً دو برابر DeepSeek-R1 با ۶۷۱ میلیارد پارامتر.
در راستای کاهش وابستگی چین به آمریکا، مدل DeepSeek-R2 کاملاً با تراشههای Ascend 910B هواوی آموزش دیده است. این تراشه با عملکرد ۵۱۲ پتافلاپسی و بهرهوری ۸۲ درصدی، معادل ۹۱ درصد از کارایی تراشهی A100 انویدیا را ارائه میدهد.
مقالههای مرتبط
گفته میشود بهدلیل استفاده از سختافزار داخلی و تکینکهای بهینهسازی، هزینهی آموزش DeepSeek-R2 حدود ۹۷ درصد کمتر از مدل GPT-4 است. انتشار مدل جدید دیپسیک میتواند بهشدت مدلهای فعلی OpenAI و Anthropic را تحت تأثیر قرار بدهد.
خبرهای پیرامون DeepSeek-R2 باعث رشد ۲۰ درصدی سهام شرکت Cambricon شدهاند و ارزش بازار این شرکت اکنون به حدود ۴۹٫۷ میلیارد دلار رسیده است. شرکت نامبرده در حوزهی توسعهی پردازندههای هوش مصنوعی فعالیت میکند.
منبع : زومیت