محققان برکلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی کردیم!
محققان برکلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی کردیم!
علاوهبر بازی Countdown، تیم دانشگاه کالیفرنیا آزمایش ضرب اعداد را نیز روی مدل اجرا کرد. مدل از ویژگی توزیعی ضرب برای تجزیه و حل گامبهگام مسائل استفاده کرد؛ مشابه روشی که برخی از افراد هنگام محاسبه ذهنی اعداد بزرگ به کار میبرند.
محققان دنشگاه کالیفرنیا آزمایش خود را با مدلهایی در مقیاسهای مختلف انجام دادند. در ابتدا، مدلی با ۵۰۰ میلیون پارامتر را آزمایش کردند که تنها پاسخ تصادفی ارائه میداد و بدون بررسی بیشتر متوقف میشد. بااینحال، با افزایش تعداد پارامترها به ۱٫۵ میلیارد، مدل روشهای پیچیدهتری برای افزایش دقت پاسخ خود یاد گرفت. در مقیاسهای ۳ تا ۷ میلیارد پارامتر، مدل میتوانست با مراحل کمتر پاسخ صحیح را پیدا کند.
نکتهی شگفتانگیز این است که تیم برکلی ادعا میکند که تنها با ۳۰ دلار این پروژه را اجرا کرده است. در مقام مقایسه، API مدلهای OpenAI برای هر میلیون توکن ورودی ۱۵ دلار هزینه دارد؛ درحالیکه هزینهی دیپسیک R1 فقط ۰٫۵۵ دلار بهازای هر میلیون توکن ورودی است؛ یعنی ۲۷ برابر ارزانتر. پان میگوید که این پروژه در راستای دسترسپذیرکردن تحقیق روی مقیاسپذیری یادگیری تقویتی انجام شده است.
مقالههای مرتبط
بااینحال، نیتن لمبرت، متخصص یادگیری ماشینی، دربارهی هزینه واقعی دیپسیک تردید دارد. او اشاره کرده است که هزینه اعلامشده ۵ میلیون دلاری برای آموزش مدل ۶۷۱ میلیارد پارامتری تمام واقعیت را نشان نمیدهد.
لمبرت دربارهی هزینهی توسعهی دیپسیک میافزاید که هزینههایی مانند حقوق محققان و زیرساختها و برق در محاسبات لحاظ نشدهاند و او تخمین میزند که هزینهی سالانه اجرای دیپسیک AI بین ۵۰۰ میلیون تا بیش از ۱ میلیارد دلار باشد. بااینحال، این پروژه همچنان دستاوردی بزرگ محسوب میشود؛ مخصوصاً وقتی در نظر بگیریم که مدلهای آمریکایی در حال رقابت، سالانه ۱۰ میلیارد دلار برای توسعهی هوش مصنوعی هزینه میکنند.
منبع : زومیت