zoomit

راز عدد ۲۷؛ چرا چت‌بات‌های هوش مصنوعی به یک سوال ساده، پاسخ تکراری می‌دهند؟

راز عدد ۲۷؛ چرا چت‌بات‌های هوش مصنوعی به یک سوال ساده، پاسخ تکراری می‌دهند؟

در دیگر توضیحات، برخی چت‌بات‌ها ادعا کردند که عددی در محدوده‌ی میانی انتخاب کرده‌اند و از انتخاب‌های واضح مثل مضرب‌های ۵ یا ۱۰ پرهیز کرده‌اند.

وب‌سایت آی‌اف‌ال‌ساینس در گفتگو با چت‌جی‌پی‌تی این پاسخ را دریافت کرد: «مطالعات نشان داده‌اند که وقتی به انسان‌ها گفته می‌شود یک عدد تصادفی انتخاب کن، اغلب به سراغ اعداد ۱۷ یا ۳۷ می‌روند، چون آن‌ها را تصادفی احساس می‌کنند؛ اما چون این اعداد بیش‌ازحد شناخته‌شده‌اند، من عددی را انتخاب کردم که همچنان غیرقابل پیش‌بینی باشد ولی خیلی عجیب هم نباشد: ۲۷.»

بیشتر بخوانید:

البته  نباید پاسخ مدل‌های زبانی را به‌عنوان حقیقت قطعی در نظر گرفت؛ زیرا این مدل‌ها کلماتی را به‌گونه‌ای کنار هم می‌چینند که کاربر را راضی کنند  و این الزاماً به معنای واقعی‌بودن پاسخ آن‌ها نیست.

مطالعاتی درباره‌ی توانایی مدل‌های زبانی در تولید اعداد تصادفی انجام شده است؛ وظیفه‌ای که همه‌ی ماشین‌ها در آن دچار مشکل‌اند. این مطالعات نشان داده‌اند که مدل‌ها تمایل دارند برخی اعداد را بیشتر از بقیه انتخاب کنند و به‌ویژه به اعداد اول علاقه‌ی خاصی دارند.

بااین‌حال، مدل‌های زبانی، عددها را به‌عنوان مفاهیم ریاضی درک نمی‌کنند، بلکه به‌عنوان توکن‌هایی مجرد با کاراکترهایی خاص پردازش می‌کنند. به‌عبارتی، عددی مانند «۲» برای یک مدل زبانی هیچ معنای متفاوت‌تری نسبت به «۳»، «+» یا کلمه‌ی «اسب» ندارد؛  همه‌ی آن‌ها صرفاً توکن‌هایی هستند با بردارهایی خاص که در فضایی پنهان از مدلی تعبیه‌شده قرار دارند.

انسان‌ها گرایش دارند اعداد بزرگ‌تر را انتخاب کنند تا اعداد کوچک‌تر

براساس یافته‌های پژوهش، وقتی از مدل‌ها خواسته می‌شود عددی تصادفی بین ۱ تا ۵ انتخاب کنند، معمولاً عدد ۳ یا ۴ را انتخاب می‌کنند. انتخاب آن‌ها  در بازه‌ی ۱ تا ۱۰، اکثراً عدد ۵ یا ۷ و در بازه‌ی ۱ تا ۱۰۰، اغلب عددهای ۳۷، ۴۷ یا ۷۳ هستند. به‌جز عدد ۴، به نظر می‌رسد مدل‌ها هنگام تولید عدد تصادفی، تمایل زیادی به اعداد اول دارند.

البته انسان‌ها نیز از این سوگیری‌ها در امان نیستند. آن‌ها گرایش دارند که بیشتر اعداد بزرگ‌تر را انتخاب کنند تا اعداد کوچک‌تر. هرچند تاکنون مطالعه‌ای مستقیم درباره‌ی این پدیده وجود نداشته، این سوگیری به‌شکلی منظم در نتایج ما در سه بازه‌ی عددی مشاهده شد.

درخواست از یک مدل زبانی بزرگ  برای تولید عددی تصادفی و درخواست از آن برای حدس‌زدن عددی تصادفی، در واقع دو وظیفه کاملاً متفاوت هستند. در حالی‌ که مدل‌ها هنوز راه زیادی در پیش دارند تا بتوانند اعداد تصادفی را به‌طور واقعاً «تصادفی» تولید کنند، انتخاب عدد ۲۷ به‌عنوان حدس ممکن است چندان هم بد نباشد.

بااین‌حال، اینکه مدل‌ها عدد ۲۷ را تا این حد زیاد انتخاب می‌کنند، به نکته‌ی مهمی اشاره دارد. دنیل کنگ، استادیار دانشگاه ایلینوی در اربانا-شمپین می‌گوید: «داده‌های آموزشی تأثیر بسیار زیادی بر رفتار مدل دارند. عوامل دیگری که بر خروجی‌های مدل اثر می‌گذارند، شامل فرآیند یادگیری تقویتی با بازخورد انسانی (RLHF) و مکانیزم نمونه‌گیری هستند. به‌ویژه، گمان می‌رود RLHF باعث پدیده‌ای به فروپاشی حالت شود؛ بنابراین ممکن است این پدیده مستقیماً با این رفتار مدل مرتبط باشد.»

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا