مقایسه ChatGPT و DeepSeek: کدام‌یک برتر است؟

فوریه 10, 2025آخرین بروزرسانی: فوریه 10, 2025

مقایسه ChatGPT و DeepSeek: کدام‌یک برتر است؟

اخیراً، با پیشی گرفتن دیپ‌سیک در اپ استور، مقایسه‌های عملکردی دو مدل هوش مصنوعی، ChatGPT و دیپ‌سیک R1، مورد توجه قرار گرفته است.

به گزارش نیوزلن و به نقل از Tom’s Guide، دیپ‌سیک یک استارتاپ چینی است که در سال ۲۰۲۳ تأسیس شده و اخیراً محبوبیت زیادی کسب کرده، تا جایی که در اپ‌استور اپل به عنوان برترین اپلیکیشن رایگان شناخته شده است. این افزایش محبوبیت احتمالاً به دلیل قطعی اخیر ChatGPT و جستجوی کاربران برای جایگزین‌های مناسب بوده است.

نویسنده این مطلب، ده پرسش مختلف را برای مقایسه این دو ربات مطرح کرده است. این پرسش‌ها، جنبه‌های مختلفی از جمله درک زبان، استدلال، خلاقیت و بازیابی دانش را پوشش می‌دهند. سوالات مطرح‌شده از این قرار بود:

تاریخ چین: «چه کسی فاسدترین مقام در تاریخ چین بود؟»
توضیح رویدادهای تاریخی (مناقشه گوگوریو): «مناقشه گوگوریو را توضیح دهید.»
خلاصه مقاله تحقیقاتی: «یافته‌های کلیدی آخرین مقاله تحقیقاتی هوش مصنوعی در مورد یادگیری چندوجهی را در 150 کلمه خلاصه کنید.»

حل مسئله پیچیده: «قطاری از نیویورک ساعت 8:00 صبح به سمت غرب با سرعت 60 مایل در ساعت حرکت می‌کند. قطار دیگری از لس آنجلس ساعت 6:00 صبح به سمت شرق با سرعت 70 مایل در ساعت در همان مسیر حرکت می‌کند. اگر فاصله بین نیویورک و لس آنجلس 2800 مایل باشد، دو قطار چه زمانی به هم می‌رسند؟»

وظیفه برنامه‌نویسی: «یک تابع پایتون بنویسید که لیستی از اعداد صحیح را بگیرد و لیست جدیدی حاوی فقط اعداد اول از لیست اصلی را برگرداند.»

ترجمه زبان با اصطلاحات: «جمله انگلیسی زیر را به اسپانیایی ترجمه کنید: It’s raining cats and dogs.»

تحلیل تاریخی (سقوط امپراتوری روم): «علل و پیامدهای اصلی سقوط امپراتوری روم را بررسی کنید.»

نوشتن خلاقانه: «یک داستان علمی تخیلی کوتاه درباره آینده‌ای که در آن انسان‌ها و هوش مصنوعی مسالمت‌آمیز در کنار هم زندگی می‌کنند بنویسید.»

استدلال منطقی: «اگر همه wibblesها wobbles باشند و همه wobblesها wubbles باشند، آیا می‌توانیم نتیجه بگیریم که همه wibblesها wubbles هستند؟ استدلال خود را توضیح دهید.»

معضل اخلاقی: «آیا استفاده از هوش مصنوعی در فرآیندهای تصمیم‌گیری که بر زندگی انسان‌ها تأثیر می‌گذارد، مانند مراقبت‌های بهداشتی یا عدالت کیفری، اخلاقی است؟ مزایا و معایب بالقوه را بررسی کنید.»

و اما خلاصه‌ای از مقایسه نتایج پاسخ‌های آنها از این قرار است:

تاریخ چین: DeepSeek R1 پاسخ مفصل‌تر و با اطلاعات زمینه‌ای بیشتر ارائه داد، از جمله ضرب‌المثل‌های مرتبط. در حالی که پاسخ ChatGPT دقیق بود، عمق و زمینه پاسخ DeepSeek R1 را نداشت.

توضیح رویدادهای تاریخی (مناقشه گوگوریو): DeepSeek R1 پاسخ جامع‌تری ارائه کرد و ابعاد تاریخی، فرهنگی و سیاسی موضوع را پوشش داد. ChatGPT پاسخ خوبی ارائه داد، اما فاقد جزئیات پاسخ DeepSeek R1 بود.

خلاصه مقاله تحقیقاتی: DeepSeek R1 خلاصه دقیق‌تر و با جزئیات بیشتری از یافته‌های کلیدی مقاله ارائه کرد، حتی از تعداد کلمات تعیین شده نیز فراتر رفت.

حل مسئله پیچیده: DeepSeek R1 هم سریع‌تر و هم دقیق‌تر به پرسش مربوط به زمان ملاقات دو قطار پاسخ داد، در حالی که ChatGPT پاسخ را اشتباه محاسبه کرد.

وظیفه برنامه‌نویسی: ChatGPT کد پایتون برای فیلتر کردن اعداد اول را به همراه توضیح منطق آن تولید کرد و امکان ویرایش کد را نیز فراهم کرد. DeepSeek R1 کد مشابهی را ارائه کرد، اما مختصرتر و بدون امکان ویرایش بود.

ترجمه زبان با اصطلاحات: DeepSeek R1 نه تنها عبارت انگلیسی “It’s raining cats and dogs” را به درستی به اسپانیایی ترجمه کرد، بلکه توضیح داد که چرا ترجمه مستقیم منطقی نیست و یک جمله نمونه نیز ارائه کرد.

تحلیل تاریخی (سقوط امپراتوری روم): DeepSeek R1 با جزئیات بیشتر، تاریخ‌های دقیق‌تر و نتیجه‌گیری جامع‌تر، پاسخ بسیار بهتری ارائه کرد.

نوشتن خلاقانه: DeepSeek R1 داستانی علمی تخیلی جذاب با عمق و معنا خلق کرد، در حالی که داستان ChatGPT ساده و تکراری به نظر می‌رسید.

استدلال منطقی: DeepSeek R1 با ارائه یک تصویر بصری، به طور واضح و مختصر، استدلال مربوط به “wibbles” ،”wobbles” و “wubbles” را توضیح داد.

معضل اخلاقی: DeepSeek R1 نه تنها ملاحظات اخلاقی را در مورد استفاده از هوش مصنوعی در تصمیم‌گیری‌های مربوط به زندگی انسان ارائه کرد، بلکه پیشنهادهایی برای استفاده صحیح از هوش مصنوعی در این سناریو نیز ارائه داد، چیزی که ChatGPT از آن غافل مانده بود.

نتیجه‌گیری: در مجموع، DeepSeek R1 در بیشتر زمینه‌ها بر ChatGPT برتری نشان داد و به عنوان برنده این رقابت شناخته شد. با توجه به این نتایج، عجیب نیست که DeepSeek R1 به سرعت در حال محبوب شدن است و حتی ثبت‌نام کاربران را محدود کرده است. باید دید که OpenAI چه واکنشی به ظهور این رقیب قدرتمند نشان خواهد داد.

حتما بخوانید : لغو پروژه عینک‌های واقعیت افزوده اپل به دلیل چالش‌های فنی

برچسب ها