تتهم الحيرة بتصفح المواقع بطريقة غير قانونية باستخدام بوتات مخفية

Image by Marco Verch, from Unsplash

تتهم الحيرة بتصفح المواقع بطريقة غير قانونية باستخدام بوتات مخفية

وقت القراءة: 3 دقائق

اتهمت Cloudflare المحرك الذكي للإجابات Perplexity بأنه يستخدم تقنيات التخفي لزحف المواقع الإلكترونية دون الرغبة في ذلك، مما أثار مخاوف حول خصوصية البيانات والثقة عبر الإنترنت.

هل أنت في عجلة من أمرك؟ ها هي الحقائق السريعة:

  • ألغت Cloudflare اعتماد Perplexity كروبوت معتمد.
  • أظهرت الاختبارات أن Perplexity قد وصل إلى مواقع إنترنت خاصة ومحددة.
  • الروبوتات غير المعلنة تقلد Chrome وتغير عناوين IP لتجنب الكشف.

في تقرير مفصل، تقول Cloudflare إن Perplexity تقوم بـ “تعديل وكيل المستخدم الخاص بها وتغيير ASNs المصدر لإخفاء نشاطها في الزحف”، حتى عندما يتم حظرها صراحة عبر ‘robots.txt’ وقواعد جدار الحماية.

تحدد Cloudflare هذا السلوك على أنه انتهاك لمعايير الويب، مما أدى إلى إزالتهم لـ Perplexity من قائمة البوت الموثوقة.

قامت Cloudflare بتطوير مواقع خاصة بدون قيود على الزحف لاختبار أساليب Perplexity. اكتشفت الشركة أن Perplexity استمرت في تقديم معلومات كاملة عن تلك الصفحات رغم قواعد عدم الزحف.

“كانت هذه الردود غير متوقعة، حيث اتخذنا جميع الاحتياطات اللازمة لمنع هذه البيانات من التقاطها محركات البحث الخاصة بهم”، كما قالت Cloudflare.

أظهرت التحقيقات أن الروبوتات الرسمية لـ Perplexity استخدمت هوية متصفح مزيفة تقلد Google Chrome لتجاوز الحماية عندما تم حجبها. قامت هذه المحركات الخفية بعمل 3-6 ملايين طلب يومياً، متنقلة عبر عناوين IP غير معروفة وتمويه مصدرها.

بالمقابل، أشادت Cloudflare بـ OpenAI لمتابعتها سلوك الويب الجيد. عند الاختبار تحت نفس الظروف، “استعادت ChatGPT-User ملف الروبوتات وتوقفت عن الزحف عندما تم منعها”.

تقول Cloudflare إنها قد حدثت أنظمة الحماية الخاصة بها للكشف عن ومنع زواحف Perplexity المخفية. كما أنهم يحثون مشغلي الروبوتات على أن يكونوا أكثر شفافية وأن يتبعوا الممارسات الأخلاقية على الويب.

“هناك تفضيلات واضحة يجب أن تكون الزاحفات شفافة، تخدم غرضًا واضحًا، تنفذ نشاطًا محددًا، والأهم من ذلك، أن تتبع توجيهات وتفضيلات الموقع الإلكتروني،” هكذا أعلنت شركة Cloudflare.

ArsTechnica تلاحظ أن Cloudflare ليست وحدها في الإشارة إلى تكتيكات Perplexity. وصف الرئيس التنفيذي لـ Reddit، ستيف هوفمان، عملية حجب Perplexity و Microsoft و Anthropic بأنها “مشكلة حقيقية” لأنها تعاملت مع جميع المحتويات الإلكترونية كأنها معرضة للنهب.

مؤخرًا، هددت هيئة البث البريطانية BBC أيضًا باتخاذ إجراءات قانونية، متهمة Perplexity بالتصيد من موقعها الإلكتروني لتدريب نموذج الذكاء الصناعي الافتراضي الخاص بها بدون إذن.

كما لاحظت ArsTechnica أن Forbes و Wired قد اتهما Perplexity بالسرقة الأدبية. أفادت Wired أن الشركة تجاوزت قيود robots.txt بينما كانت تستخدم عناوين IP مشبوهة وتخفي الروبوت الخاص بها لتجنب التدابير الرامية للحجب.

مع زيادة طلب شركات الذكاء الاصطناعي على بيانات التدريب، تزداد حدة الصراع حول من يتحكم في المحتوى الرقمي على الإنترنت. يسلط تحرك “كلاودفلير” الضوء على المقاومة المتزايدة من قِبل الناشرين والمنصات الرقمية الراغبين في حماية حدودهم الرقمية.

هل أعجبك هذا المقال؟ امنحه تقييمًا!
كان سيئًا لم يعجبني كان معقولًا جيد إلى حد كبير! أحببته!

يسعدنا أن عملنا أعجبك!

نهتم برأيك لأنك من قرّائنا الذين نقدِّرهم، فهلّ يمكن أن تقيّمنا على Trustpilot؟ إنه إجراء سريع ويعني الكثير لنا. شكرًا لتعاونك القيّم!

قيِّمنا على Trustpilot
0 بتصويت 0 من المستخدمين
عنوان
تعليق
شكرًا على ملاحظاتك!