
Image by ODISSEI, from Unsplash
وجدت دراسة أن ما يقرب من نصف الردود على الاستبيانات الإلكترونية قد يأتي من الذكاء الصناعي.
البحث السلوكي عبر الإنترنت، الذي كان يُعتبر سابقًا طريقة موثوقة لدراسة علم النفس البشري، يواجه الآن مشكلة كبيرة حيث يستخدم المشاركون أدوات الذكاء الصناعي مثل الدردشة الآلية لتوليد ردودهم.
في عجلة من أمرك؟ ها هي الحقائق السريعة:
- أفاد 45% من مشاركي استطلاع Prolific بأنهم نسخوا الردود التي أنشأها الذكاء الصناعي.
- وجد الباحثون أن نص الدردشة الآلية كثيرًا ما يبدو “مطوّلًا بشكل زائد” أو “غير بشري”.
- يصف الخبراء المشكلة بأنها “تلوث LLM”، مما يهدد صحة البحوث السلوكية.
أجرى الباحثون في معهد ماكس بلانك لتطوير الإنسان في برلين مؤخراً دراسة لمعرفة مدى انتشار المشكلة على المنصات مثل Prolific، التي تدفع للمتطوعين مقابل إكمال الاستبيانات.
“كانت معدلات الحوادث التي كنا نلاحظها صادمة حقًا”، كما تقول الباحثة الرئيسية آن-ماري نوسبرغر، كما أفادت نيو ساينتست (NS).
في اختبار واحد، بدا أن 45 في المائة من المشاركين يلصقون المحتوى الذي تم إنشاؤه بواسطة الدردشة الآلية في صندوق الرد المفتوح. غالبًا ما تظهر الردود علامات مثل “الثراء الزائد” أو “اللغة غير البشرية بوضوح”.
“من البيانات التي جمعناها في بداية هذا العام، يبدو أن نسبة كبيرة من الدراسات تعاني من التلوث”، قالت نوسبرجر لـ NS.
للكشف عن الردود المشبوهة، أدخل فريقها فخوخ خفية. رفعت اختبارات reCAPTCHA الأساسية العلم على 0.2 في المئة من المستخدمين، بينما أمسكت نسخة أكثر تقدمًا 2.7 في المئة، والتي أثارت مطالبة نصية غير مرئية بكلمة “hazelnut” 1.6 في المئة، وكشف حظر النسخ واللصق عن 4.7 في المئة أخرى.
تطورت المشكلة إلى ما يطلق عليه الخبراء الآن بـ “تلوث LLM”، والذي يمتد إلى ما بعد الغش. تكشف الدراسة البحثية عن ثلاثة أنماط تدخل الذكاء الاصطناعي: الوساطة الجزئية (الذكاء الاصطناعي يساعد في صياغة الكلمات أو الترجمة)، التفويض الكامل (الذكاء الاصطناعي يجري الدراسات الكاملة)، والتدفق (البشر يغيرون سلوكياتهم لأنهم يتوقعون وجود الذكاء الاصطناعي).
“ما نحتاج إليه ليس هو الشك في الأبحاث عبر الإنترنت بشكل كامل، ولكن الاستجابة والرد”، كما تقول نوسبرغر، داعية المنصات إلى أخذ المشكلة على محمل الجد، كما أفادت NS..
تحذر مات هودجكينسون، مستشارة في أخلاقيات البحث، في تصريح لـ NS: “كانت سلامة البحث السلوكي عبر الإنترنت يتم التحدي لها بالفعل […] يتعين على الباحثين إما أن يجدوا طرقًا مشتركة للتحقق من مشاركة البشر عن بعد أو العودة إلى النهج التقليدي للاتصال الوجه إلى وجه”.
رفضت Prolific التعليق على NS.