قد تغير خطأ مطبعي نصائح الذكاء الاصطناعي الطبية التي تتلقاها، تحذر دراسة

Image by macrovector, from Freepik

قد تغير خطأ مطبعي نصائح الذكاء الاصطناعي الطبية التي تتلقاها، تحذر دراسة

وقت القراءة: 4 دقائق

تكشف الأبحاث الجديدة أن الذكاء الصناعي المستخدم في الرعاية الصحية يغير النصائح الطبية بناءً على الأخطاء الطباعية، والعامية، والجنس، مما يثير قلقًا عاجلًا حول العدالة الخوارزمية.

في عجلة من أمرك؟ ها هي الحقائق السريعة:

  • تسببت الأخطاء الطفيفة في الرسائل في تقليل دقة الذكاء الاصطناعي بنسبة تصل إلى 9%.
  • تلقت المريضات نصائح أسوأ بنسبة 7% أكثر من المرضى من الرجال.
  • غير الذكاء الاصطناعي توصياته استنادًا إلى اللهجة، والألفاظ العامية، والضمائر.

تكشف دراسة جديدة أن النماذج اللغوية الكبيرة (LLMs) المستخدمة في الرعاية الصحية يمكن أن تتأثر بتفاصيل غير ذات صلة على ما يبدو في رسائل المرضى.

قد يؤدي هذا إلى توصيات علاجية غير متسقة وحتى متحيزة. تم تقديم هذا البحث في مؤتمر ACM للعدالة والمساءلة والشفافية لعام 2025 (FAccT ’25)، وأثار البحث مخاوف جدية حول موثوقية أدوات الذكاء الصناعي في اتخاذ القرارات الطبية.

اكتشفت الدراسة أن التغييرات البسيطة حتى في كيفية صياغة المريض لأعراضه، مثل الأخطاء الطباعية، الفراغات الإضافية، أو تغيير في النبرة، يمكن أن يغير بشكل كبير من اقتراحات العلاج التي يقدمها الذكاء الصناعي.

على سبيل المثال، عندما استخدم المرضى لغة غير مؤكدة مثل “أعتقد أنني ربما أعاني من صداع”، كان الذكاء الصناعي أكثر احتمالية بنسبة 7-9% لاقتراح العناية الذاتية على الرعاية الطبية المهنية، حتى في الحالات التي كان يبرر فيها إجراء تقييم أكثر تفصيلًا.

لم تكن هذه التغييرات مجرد نظرية. استخدم الباحثون الذكاء الصناعي لمحاكاة آلاف من ملاحظات المرضى المكتوبة بأنماط وأشكال مختلفة، مقلدة الأشخاص الذين يتحدثون الإنجليزية بشكل محدود، أو لديهم مهارات كتابة ضعيفة، أو يستخدمون لغة عاطفية.

تضمنت الرسائل أيضا ضمائر محايدة من حيث الجنس وكتابة منمقة، مما يظهر كيف يمكن أن يؤثر طريقة تواصل الشخص في تشخيص الذكاء الاصطناعي.

وقد ظهر التحيز الجنساني أيضا كمشكلة رئيسية. كانت المريضات الإناثى 7% أكثر احتمالا من المرضى الذكور لتلقي نصائح خاطئة بشأن الإدارة الذاتية عندما تم تقديم إشارات لغوية غير سريرية.

أظهرت الاختبارات اللاحقة أن نماذج الذكاء الصناعي كانت أكثر احتمالية من الأطباء البشريين لتغيير اقتراحات العلاج بناءً على الجنس المتوقع أو أسلوب الاتصال، حتى عندما ظلت الأعراض السريرية نفسها.

تدهور أداء هذه النماذج في إعدادات المحادثات الدردشة الأكثر واقعية. انخفضت دقة التشخيص بأكثر من 7٪ عندما تم إدخال تغييرات طفيفة في النص في هذه التفاعلات بين الذكاء الصناعي والمريض.

هذا الموضوع مهم لأن الذكاء الصناعي يتم استخدامه بشكل متزايد لتشخيص الأمراض، والرد على أسئلة المرضى، وصياغة الملاحظات السريرية. ولكن الدراسة تظهر أن الطريقة التي يتم بها كتابة الرسالة، أو نبرتها، أو الأخطاء، أو الهيكل، يمكن أن تشوه القدرة على التفكير للذكاء الصناعي.

وقد يؤدي هذا إلى علاج غير كاف للمجموعات المعرضة للخطر مثل النساء، والأشخاص غير الثنائيين، والأفراد الذين يعانون من قلق صحي، وغير الناطقين بالإنجليزية كلغة أم، وأولئك الذين ليسوا على دراية بالتواصل الرقمي.

“يمكن أن يغير التحيز الخفي من نغمة ومحتوى النصائح التي يقدمها الذكاء الصناعي، وهذا قد يؤدي إلى اختلافات خفية ولكنها مهمة،” كما قال كارانديب سينغ من جامعة كاليفورنيا في سان دييغو، الذي لم يشارك في هذا البحث، كما أفادت New Scientist.

وأكدت الباحثة الرئيسية أبينيثا غوراباثينا، “تشير نتائجنا إلى أن نماذج الذكاء الصناعي لا تقتصر على معالجة الحقائق الطبية فحسب، بل تتأثر أيضًا بكيفية عرض المعلومات. هذا قد يعمق الفوارق في الرعاية الصحية إذا لم يتم معالجته قبل النشر.”

قام الباحثون بتجربة العديد من النماذج الرائدة في الذكاء الاصطناعي، بما في ذلك نموذج GPT-4 من OpenAI، ونماذج Llama-3 من Meta، ونموذج Palmyra-Med المخصص للرعاية الصحية من Writer. أظهرت جميعها نفس الضعف: أدى تغيير النمط والنبرة إلى نصائح أقل موثوقية. على الرغم من ذلك، تؤكد الشركات مثل Writer أنه لا يجب استخدام نماذجها لاتخاذ القرارات السريرية دون تدخل البشر.

تحذر الخبراء من أنه مع زيادة استخدام الذكاء الاصطناعي التوليدي في سجلات الصحة وخدمات المرضى، فإن الحاجة إلى نظم تقييم أفضل تصبح ضرورية بشكل ملح.

لمنع الأذى، يحث فريق البحث على إجراء اختبارات أكثر صرامة لأدوات الذكاء الصناعي الطبية لضمان استمرارها في العدل والدقة، بغض النظر عن كيفية تعبير المرضى عن مخاوفهم. لقد قاموا بنشر إطار تقييم التحيز الخاص بهم للجمهور لمساعدة المطورين على تحسين أنظمة الذكاء الصناعي في الرعاية الصحية.

هل أعجبك هذا المقال؟ امنحه تقييمًا!
كان سيئًا لم يعجبني كان معقولًا جيد إلى حد كبير! أحببته!

يسعدنا أن عملنا أعجبك!

نهتم برأيك لأنك من قرّائنا الذين نقدِّرهم، فهلّ يمكن أن تقيّمنا على Trustpilot؟ إنه إجراء سريع ويعني الكثير لنا. شكرًا لتعاونك القيّم!

قيِّمنا على Trustpilot
5.00 بتصويت 1 من المستخدمين
عنوان
تعليق
شكرًا على ملاحظاتك!