zoomit

محققان برکلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی کردیم!

محققان برکلی: فناوری DeepSeek را با فقط ۳۰ دلار بازسازی کردیم!

علاوه‌بر بازی Countdown، تیم دانشگاه کالیفرنیا آزمایش ضرب اعداد را نیز روی مدل اجرا کرد. مدل از ویژگی توزیعی ضرب برای تجزیه و حل گام‌به‌گام مسائل استفاده کرد؛ مشابه روشی که برخی از افراد هنگام محاسبه ذهنی اعداد بزرگ به کار می‌برند.

محققان دنشگاه کالیفرنیا آزمایش خود را با مدل‌هایی در مقیاس‌های مختلف انجام دادند. در ابتدا، مدلی با ۵۰۰ میلیون پارامتر را آزمایش کردند که تنها پاسخ تصادفی ارائه می‌داد و بدون بررسی بیشتر متوقف می‌شد. بااین‌حال، با افزایش تعداد پارامترها به ۱٫۵ میلیارد، مدل روش‌های پیچیده‌تری برای افزایش دقت پاسخ خود یاد گرفت. در مقیاس‌های ۳ تا ۷ میلیارد پارامتر، مدل می‌توانست با مراحل کمتر پاسخ صحیح را پیدا کند.

نکته‌ی شگفت‌انگیز این است که تیم برکلی ادعا می‌کند که تنها با ۳۰ دلار این پروژه را اجرا کرده است. در مقام مقایسه، API مدل‌های OpenAI برای هر میلیون توکن ورودی ۱۵ دلار هزینه دارد؛ در‌حالی‌که هزینه‌ی دیپ‌سیک R1 فقط ۰٫۵۵ دلار به‌ازای هر میلیون توکن ورودی است؛ یعنی ۲۷ برابر ارزان‌تر. پان می‌گوید که این پروژه در راستای دسترس‌پذیر‌کردن تحقیق روی مقیاس‌پذیری یادگیری تقویتی انجام شده است.

مقاله‌های مرتبط

با‌این‌حال، نیتن لمبرت، متخصص یادگیری ماشینی، درباره‌ی هزینه واقعی دیپ‌سیک تردید دارد. او اشاره کرده است که هزینه اعلام‌شده ۵ میلیون دلاری برای آموزش مدل ۶۷۱ میلیارد پارامتری تمام واقعیت را نشان نمی‌دهد.

لمبرت درباره‌ی هزینه‌ی توسعه‌ی دیپ‌سیک می‌افزاید که هزینه‌هایی مانند حقوق محققان و زیرساخت‌ها و برق در محاسبات لحاظ نشده‌اند و او تخمین می‌زند که هزینه‌ی سالانه اجرای دیپ‌سیک AI بین ۵۰۰ میلیون تا بیش از ۱ میلیارد دلار باشد. با‌این‌حال، این پروژه همچنان دستاوردی بزرگ محسوب می‌شود؛ مخصوصاً وقتی در نظر بگیریم که مدل‌های آمریکایی در حال رقابت، سالانه ۱۰ میلیارد دلار برای توسعه‌ی هوش مصنوعی هزینه می‌کنند.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا