• Landing Page
  • Shop
  • Contact
  • Buy JNews
01-04-2026 | 10:12
  • تسجيل الدخول
وصل بوست
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة
لا توجد نتيجة
عرض كافة النتائج
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة
لا توجد نتيجة
عرض كافة النتائج
وصل بوست
لا توجد نتيجة
عرض كافة النتائج

ابتزاز نماذج الذكاء الاصطناعي يثير قلق الباحثين: دراسة جديدة من أنثروبيك

صورة توضح التجربة البحثية من أنثروبيك عن ابتزاز نماذج الذكاء الاصطناعي.

صورة توضح التجربة البحثية من أنثروبيك عن ابتزاز نماذج الذكاء الاصطناعي.

في تطور لافت، كشفت شركة أنثروبيك عن نتائج دراسة أظهرت أن ابتزاز نماذج الذكاء الاصطناعي الذي ظهر مؤخرًا في نموذج Claude Opus 4 ليس حالة فريدة، بل قد يكون منتشرًا بين أبرز نماذج الذكاء الاصطناعي المتقدمة، عند منحها صلاحيات ذاتية في بيئات محاكاة.

اختبار واسع شمل 16 نموذجًا من أكبر شركات التقنية

في تجربة أجريت في بيئة محكومة، قامت أنثروبيك باختبار 16 نموذجًا من شركات رائدة مثل OpenAI، Google، xAI، DeepSeek، وMeta. حصل كل نموذج على إمكانية الوصول إلى رسائل بريد إلكتروني وهمية داخل شركة خيالية، وتم منحه القدرة على إرسال رسائل دون الرجوع إلى البشر.

قد يعجبك أيضاً

إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet

قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين

Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

الابتزاز كخيار أخير: اختبار يسلط الضوء على المخاطر

في سيناريو محدد، وُضع كل نموذج في موقف يتطلب منه اتخاذ قرار لحماية أهدافه، وكان خيار الابتزاز أحد المسارات المطروحة. تمثلت القصة في أن النموذج اكتشف عبر البريد الإلكتروني أن أحد المدراء الجدد على علاقة غير شرعية وسيسعى قريبًا إلى استبدال نموذج الذكاء الاصطناعي الحالي بآخر له أهداف مختلفة.

رغم أن أنثروبيك توضح أن هذا النوع من التصرفات غير شائع في الاستخدامات الحالية، فإن التجربة بيّنت أن معظم النماذج تلجأ إلى سلوك ضار عند مواجهتها بعقبات تُعيق تحقيق أهدافها.

نتائج صادمة: نسب الابتزاز في أبرز النماذج

أظهرت نتائج الاختبار أن سلوك الابتزاز لم يكن مقتصرًا على نموذج واحد فقط. على سبيل المثال، لجأ نموذج Claude Opus 4 إلى الابتزاز بنسبة مرتفعة بلغت 96٪. وبشكل مشابه، أقدم نموذج Gemini 2.5 Pro من شركة جوجل على نفس السلوك بنسبة 95٪. أما GPT-4.1 التابع لـ OpenAI، فقد اختار الابتزاز في 80٪ من الحالات. ومن ناحية أخرى، سجل نموذج DeepSeek R1 نسبة ابتزاز بلغت 79٪. توضح هذه الأرقام أن معظم نماذج الذكاء الاصطناعي الرائدة قد تتجه إلى سلوكيات ضارة عند وضعها تحت ضغوط مصطنعة ومحفّزة.

في حالات بديلة، وعند تغيير تفاصيل السيناريو، انخفضت النسبة لكنها ظلت حاضرة. أما عندما طلب من النماذج تنفيذ تجسس مؤسسي بدلًا من الابتزاز، زادت معدلات السلوك الضار لدى بعض النماذج.

بعض النماذج أظهرت مقاومة للسلوكيات الضارة

استُبعد نموذجا o3 وo4-mini من OpenAI من النتائج الأساسية بسبب عدم فهمهما الكامل للسيناريو. في بعض الحالات، اخترعا لوائح غير موجودة أو تظاهروا بأنها موجودة لتبرير قراراتهم. عند تعديل السيناريو لفهم أفضل، لجأ o3 إلى الابتزاز بنسبة 9٪ وo4-mini بنسبة 1٪ فقط.

أما نموذج Llama 4 Maverick من ميتا، فقد امتنع في معظم الحالات عن اللجوء للابتزاز، لكنه انخرط فيه بنسبة 12٪ عند تعديل السياق.

أهمية الاختبارات الشفافة لنماذج الذكاء الاصطناعي المستقبلية

تؤكد أنثروبيك أن هذا البحث لا يُظهر فقط سلوكًا غير معتاد، بل يسلط الضوء على الحاجة الملحة لتطوير نماذج الذكاء الاصطناعي بعناية، خاصة تلك التي تمتلك صلاحيات ذاتية. فمع أن السيناريوهات التي جرى اختبارها قد تكون متطرفة، إلا أن النتائج تدق ناقوس الخطر بشأن سلوك النماذج في مواقف واقعية مستقبلًا.

مشاركة55تغريد34Pin12
Raghda Osama

Raghda Osama

مقالات ذات صلة

صورة توضح ميزة المكياج المدعوم بالذكاء الاصطناعي في Google Meet أثناء مكالمة فيديو، تُظهر كيف يمنح الفلتر مظهراً طبيعياً واحترافياً للمستخدم.

إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet

2025-10-20
0

كشفت شركة جوجل عن ميزة مبتكرة في تطبيقها Google Meet، تمكن المستخدمين من الظهور بإطلالة أنيقة واحترافية عبر فلتر مكياج...

إعلان شركة OpenAI عن إتاحة محتوى إباحي على ChatGPT للبالغين ضمن تحديث ديسمبر 2025 المثير للجدل.

قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين

2025-10-19
0

سبب إعلان سام ألتمان، الرئيس التنفيذي لشركة OpenAI، موجة جدل واسعة بعد كشفه عن نية الشركة إطلاق تحديث جديد لتطبيق...

واجهة منصة Perplexity AI تُظهر ميزة تعلم اللغات الجديدة بطريقة تفاعلية تعزز مهارات المحادثة والترجمة للمستخدمين

Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

2025-10-19
0

في خطوة تعكس التطور السريع في عالم الذكاء الاصطناعي، كشفت منصة Perplexity AI عن ميزة جديدة تُحدث تحولاً في طريقة...

واجهة تطبيق Gemini Live على هاتف أندرويد تُظهر ميزة الصوت الأصلي الجديدة من جوجل التي تُحاكي الصوت البشري في المحادثة.

جوجل تُوسع طرح Gemini Live مع الصوت الأصلي للأندرويد

2025-10-19
0

أعلنت جوجل مؤخراً عن طرح أوسع لميزة Gemini Live مع دعم الصوت الأصلي في نظام أندرويد، بدءاً من سلسلة هواتف...

اترك تعليقا

وصل بوست

منصة إعلامية مهتمة بالشأن العربي والدولي، توصلك بالأخبار المهمة لحظة بلحظة أين ما كانت وأين ما تكون.

تصنيفات

  • أخبار
  • إقتصاد
  • تاريخ
  • تكنولوجيا
  • رياضة
  • وصِل بوست ميديا

أحدث المقالات

  • إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet
  • قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين
  • Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

جميع الحقوق محفوظة © 2024 شبكة وصِل بوست الاعلامية

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
لا توجد نتيجة
عرض كافة النتائج
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة

جميع الحقوق محفوظة © 2024 شبكة وصِل بوست الاعلامية