في تصعيد جديد ضد ممارسات بعض شركات الذكاء الاصطناعي، كشفت شركة Cloudflare أن منصة Perplexity تقوم بجمع محتوى من مواقع إلكترونية رغم وجود تعليمات صريحة تمنع ذلك.
تجاهل ملف Robots.txt وخداع أنظمة الحماية
أفاد تقرير نشرته شركة Cloudflare يوم الإثنين بأن منصة Perplexity نفذت عمليات زحف لمواقع إلكترونية بشكل متخفٍ، من خلال تغيير هوية الروبوت وتبديل الشبكات المستقلة، في محاولة واضحة لتجاوز آليات الحظر التي تفرضها المواقع.
وأوضحت Cloudflare أن Perplexity لم تكتف بتجاهل تعليمات ملف الروبوت، بل عمدت أيضًا إلى التنكر كزائر عادي يستخدم متصفح جوجل كروم، بهدف إخفاء هويتها الحقيقية والتحايل على أنظمة الحماية لجمع البيانات دون إذن.
جمع ضخم للبيانات من آلاف المواقع
أشار التقرير إلى أن هذه الأنشطة تم توثيقها على نطاق واسع، حيث تم جمع بيانات من عشرات آلاف النطاقات وملايين الطلبات يوميًا. واستخدمت Cloudflare تقنيات تعلم آلي وتحليلات شبكة للكشف عن هذه الممارسات.
Perplexity تنفي الاتهامات وتصف التقرير بأنه “دعاية”
من جهته، رد المتحدث باسم Perplexity، جيسي دواير، على تقرير Cloudflare قائلًا إن المنشور عبارة عن عرض ترويجي تسويقي، مدعيًا أن الصور المرفقة لا تُظهر أي وصول فعلي إلى المحتوى. وأضاف لاحقًا أن الروبوت المسمى في التقرير “لا يتبع لشركتنا”.
شكاوى متزايدة من أصحاب المواقع
ذكرت Cloudflare أن هذه التحقيقات بدأت بعد تلقي شكاوى مباشرة من عملائها، تفيد بأن Perplexity تقوم بجمع محتواهم رغم إدراج قواعد واضحة في ملفات robots.txt لمنع ذلك، إضافةً إلى محاولات حظر الروبوتات المعروفة التابعة لـ Perplexity.
Cloudflare تتخذ خطوات لمواجهة انتهاكات الذكاء الاصطناعي
ردًا على هذه الانتهاكات، أعلنت Cloudflare أنها قامت بشطب روبوتات Perplexity من قائمتها الموثقة، وأضافت وسائل جديدة لحظر نشاطها. وكانت الشركة قد أطلقت في وقت سابق أدوات مجانية لحماية المواقع من روبوتات التدريب على الذكاء الاصطناعي، كما أعلنت مؤخرًا عن سوق لتمكين الناشرين من فرض رسوم على روبوتات الذكاء الاصطناعي التي تزور مواقعهم.
سوابق سابقة لشركة Perplexity
تجدر الإشارة إلى أن هذه ليست المرة الأولى التي تواجه فيها شركة Perplexity اتهامات مماثلة. ففي العام الماضي، اتهمتها وسائل إعلام مثل Wired بانتهاك حقوق النشر وسرقة المحتوى. وعندما سئل الرئيس التنفيذي للشركة، أرافيند سرينيفاس، عن تعريفهم للسرقة الأدبية خلال مؤتمر Disrupt 2024، لم يتمكن من تقديم إجابة واضحة.
في النهاية، يثير هذا الجدل المتزايد بين Cloudflare وPerplexity تساؤلات عميقة حول أخلاقيات جمع البيانات في عصر الذكاء الاصطناعي. في الوقت الذي تتسابق فيه الشركات لتطوير نماذجها، يبدو أن حماية حقوق الناشرين والمواقع الإلكترونية باتت أكثر إلحاحًا من أي وقت مضى.




