هوش مصنوعی یا پزشک؛ کدام همدلتر است؟
هوش مصنوعی یا پزشک؛ کدام همدلتر است؟
نتایج یک مطالعه که نشان میداد هوش مصنوعی (AI) نسبت به یک پزشک واقعی همدلتر برخورد کرده بود، سال ۲۰۲۳ منتشر شد. نشریه بهداشت دانشگاه هاروارد این مطالعه و نتایج آن را بررسی کرد تا ببیند آیا هوش مصنوعی واقعا بهتر از یک پزشک است و «چت جیپیتی» (یکی از سرویسهای گفتوگوی هوشمند ساخت شرکت اوپن ایآی) از نظر شفقت و کیفیت مشاوره بهتر از پزشکان عمل میکند؟
در نگاه اول، این ایده که یک «بات گفتوگو» با استفاده از هوش مصنوعی بتواند به سوالات بیماران خوب پاسخ دهد، تعجبآور نیست؛ اما اینکه بیشتر از پزشک همدلی نشان دهد چه؟ قبل از اعلام نظر نهایی در مورد کیفیت و همدلی هر دو طرف، اجازه دهید دوباره به این ماجرا نگاهی بیندازیم.
هوش مصنوعی در مراقبتهای بهداشتی و پزشکی چه وظایفی را بر عهده میگیرد؟
در حال حاضر، فهرستی از کاربردهای پزشکی هوش مصنوعی وجود دارد که بهسرعت در حال رشد است؛ این کاربردها عبارتاند از تهیه پیشنویس یادداشتهای پزشک، پیشنهاد تشخیص، کمک به خواندن عکسهای اشعه ایکس و اسکنهای امآرآی و نظارت همزمان بر دادههای سلامتی مانند ضربان قلب یا سطح اکسیژن.
اما اینکه پاسخهای تولید هوش مصنوعی ممکن است همدلانهتر از پزشکان واقعی باشد، شگفتانگیز و البته کمی ناراحتکننده بود. چگونه یک ماشین، حتی اگر بسیار پیشرفته باشد، میتواند در نشان دادن فضیلتی انسانی از یک پزشک پیشی بگیرد؟
آیا هوش مصنوعی میتواند به سوالات بیمار پاسخهای خوبی بدهد؟
تصور کنید برای سوال در مورد یکی از داروهایتان با مطب پزشک تماس گرفتهاید. در ادامه یک پزشک در تیم بهداشتی با شما تماس میگیرد تا در مورد این موضوع صحبت کنید. اکنون سناریو متفاوتی را تصور کنید: پرسشتان را از طریق ایمیل یا پیامک مطرح و در عرض چند دقیقه پاسخی دریافت کنید که یک رایانه با استفاده از هوش مصنوعی تولید کرده است. پاسخهای پزشکی در این دو موقعیت از نظر کیفیت چگونه با هم مقایسه میشوند؟ و چگونه میتوانند از نظر همدلی نسبت به هم ارزیابی شوند؟
برای پاسخ به این سوالات، محققان ۱۹۵ پرسش و پاسخ از کاربران ناشناس یک شبکه اجتماعی آنلاین را جمعآوری و سوالات را به پزشکانی که داوطلب پاسخ دادن بودند، منتقل کردند. این سوالات در ادامه به چت جیپیتی ارسال و پاسخهای آن نیز جمعآوری شد.
سپس گروهی متشکل از سه پزشک یا پرستار هر دو مجموعه پاسخها را از نظر کیفیت و همدلی رتبهبندی کردند. مقیاس پنج درجهای گزینههای رتبهبندی برای کیفیت عبارت بودند از: بسیار ضعیف، ضعیف، قابل قبول، خوب، یا بسیار خوب. گزینههای رتبهبندی برای همدلی هم اینها بودند: بدون همدلی، کمی همدلانه، نسبتا همدلانه، همدلانه و بسیار همدلانه.
یافتههای مطالعه
نتایج حتی نزدیک هم نبود و در نزدیک به ۸۰ درصد موارد، پاسخهای چت جیپیتی بهتر از پزشکان ارزیابی شد.
پاسخهای با کیفیت خوب یا خیلی خوبــ چت جیپیتی بابت ۷۸ درصد از پاسخهایش این نمرات را دریافت کرد، در حالی که پزشکان فقط در ۲۲ درصد از پاسخها این رتبهها را گرفتند.
برای پاسخهای همدلانه یا بسیار همدلانه: چت جیپیتی ۴۵ درصد و پزشکان ۴.۶ درصد امتیاز گرفتند.
باید یادآوری کنیم که طول پاسخهای پزشکان (میانگین ۵۲ کلمه) بسیار کوتاهتر از چت جیپیتی (میانگین ۲۱۱ کلمه) بود.
همانطور که گفته شد، نتایج حتی نزدیک هم نبود اما زود نتیجه نگیرید؛ باید محدودیتهای مهم این تحقیق را هم در نظر گرفت.
این مطالعه طوری طراحی نشده بود که به دو سوال کلیدی پاسخ دهد:
ــ آیا پاسخهای هوش مصنوعی اطلاعات پزشکی دقیقی هم ارائه میدهد که سلامتی بیمار را به او بازگرداند و از سردرگمی یا آسیب جلوگیری کند؟
ــ آیا بیماران این ایده را که یک ربات به سوالاتی که از پزشک میپرسند، پاسخ دهد، میپذیرند؟
در ارزیابی و مقایسه پاسخها، ارزیابیکنندگان برای کیفیت و همدلی معیارهای ذهنی و آزمایشنشدهای را اعمال کردند. اما نکته این است که آنها دقت واقعی پاسخها را ارزیابی نکردند و پاسخها از نظر ساختگی بودن هم ارزیابی نشدند؛ مشکلی که در چت جیپیتی دیده شده است.
در پایان این پرسش مطرح است که آیا پزشکان میتوانند در مورد ابراز همدلی از پاسخهای هوش مصنوعی بیاموزند؟ احتمالا بله. هوش مصنوعی میتواند به عنوان یک ابزار مشارکتی خوب عمل کند و پاسخهایی خلق کند که یک پزشک بتواند از آنها پس از بررسی و بازبینی، استفاده کند. در واقع، هماکنون نیز برخی سیستمهای پزشکی از هوش مصنوعی به این روش استفاده میکنند.
با این حال به نظر میرسد که تکیه کردن بر پاسخهای هوش مصنوعی برای پاسخ به سوالات بیماران، بدون تاییدیه و نظارت واقعی متخصصان مراقبتهای بهداشتی هنوز زود است.
حتی خود چت جیپیتی نیز با این نتیجهگیری موافق است. وقتی از چت جیپیتی پرسیده شد که آیا میتواند بهتر از یک پزشک به سوالات پزشکی پاسخ دهد؟ جوابش منفی بود.