ویکیپدیا و نشانههای زبانی متنهای هوش مصنوعی

ویکیپدیا و نشانههای زبانی متنهای هوش مصنوعی
نوشتار تولیدشده توسط هوش مصنوعی هنوز با چالش جدی اعتبارسنجی مواجه است. در حوزه دانشگاهی، این نوع محتوا بیشتر بهعنوان یک میانبر و گاه حتی تهدیدی برای اعتبار علمی تلقی میشود. ویکیپدیا نمونه بارزی از این حساسیت است؛ جایی که بهطور کامل مقالات نوشتهشده توسط رباتها ممنوع شده و فهرستی از نشانههای زبانی و ساختاری برای شناسایی متنهای ماشینی گردآوری شده است.
به گزارش نیوزلن و به نقل از تکاسپات، یکی از برجستهترین نشانهها در لحن متن دیده میشود. نوشتههای هوش مصنوعی معمولاً پر از عباراتی است که اهمیت یا تاریخی بودن یک موضوع را بیش از حد برجسته میکنند؛ لحنی که بیش از آنکه علمی یا بیطرف باشد، نمایشی به نظر میرسد. همچنین این متنها غالباً بخشها را با نتیجهگیریهای مرتب و جملات جمعبندیکننده به پایان میرسانند؛ چیزی شبیه انشای دبیرستانی، نه مقالهای دایرهالمعارفی. استفاده بیشازحد از واژگانی مانند «علاوه بر این»، «همچنین» یا «بهعلاوه» نیز از دیگر نشانههای تکراری بودن متنهای هوش مصنوعی است.
در بخش فرمتبندی هم تفاوتها آشکار است. فهرستهای غیرمعمول با نشانهگذاری عجیب، تیترهایی با حروف بزرگشده غیرضروری، یا پررنگکردن بیشازحد عبارتها از الگوهای رایج هستند. گاهی حتی علائم نگارشی مانند خط تیره بلند یا گیومههای نادرست بیشازحد بهکار میروند. مواردی چون گذاشتن شکلک در تیترها یا نوشتن عباراتی مانند «دانش مدل تا سال …» نیز در برخی پیشنویسها مشاهده شده است.
ارجاعات و منابع نقطهضعف جدی دیگری است. هوش مصنوعی اغلب منابعی خیالی تولید میکند: لینکهایی که به جایی نمیرسند، شمارههای ISBN یا DOI ساختگی و حتی نقلقول از متخصصانی که وجود خارجی ندارند. در بعضی موارد، منابع در متن ذکر میشوند اما هیچگاه در بخش منابع ظاهر نمیشوند.
خطا در کدنویسی ویکیپدیا نیز سرنخی مهم است؛ مثلاً استفاده نادرست از الگوها یا دستهبندیها. همه این نشانهها باعث میشوند متنهای تولیدشده توسط رباتها قابلپیشبینیتر، یکنواختتر و کمتر «زنده» به نظر برسند.
البته هیچکدام از این ویژگیها بهتنهایی سند قطعی برای ماشینی بودن یک متن نیستند. از آنجا که هوش مصنوعی بر پایه میلیونها نمونه انسانی آموزش دیده است، خروجی آن میتواند بسیار شبیه نوشتههای واقعی باشد. اما وقتی چندین نشانه همزمان دیده شوند، معمولاً ارزش بررسی دقیقتر دارد.