• Landing Page
  • Shop
  • Contact
  • Buy JNews
22-06-2025 | 2:32
  • تسجيل الدخول
وصل بوست
  • الرئيسية
  • أخبار
  • إقتصاد
  • تاريخ
  • تكنولوجيا
  • رياضة
  • وصِل بوست ميديا
لا توجد نتيجة
عرض كافة النتائج
  • الرئيسية
  • أخبار
  • إقتصاد
  • تاريخ
  • تكنولوجيا
  • رياضة
  • وصِل بوست ميديا
لا توجد نتيجة
عرض كافة النتائج
وصل بوست
لا توجد نتيجة
عرض كافة النتائج

ابتزاز نماذج الذكاء الاصطناعي يثير قلق الباحثين: دراسة جديدة من أنثروبيك

صورة توضح التجربة البحثية من أنثروبيك عن ابتزاز نماذج الذكاء الاصطناعي.

صورة توضح التجربة البحثية من أنثروبيك عن ابتزاز نماذج الذكاء الاصطناعي.

في تطور لافت، كشفت شركة أنثروبيك عن نتائج دراسة أظهرت أن ابتزاز نماذج الذكاء الاصطناعي الذي ظهر مؤخرًا في نموذج Claude Opus 4 ليس حالة فريدة، بل قد يكون منتشرًا بين أبرز نماذج الذكاء الاصطناعي المتقدمة، عند منحها صلاحيات ذاتية في بيئات محاكاة.

اختبار واسع شمل 16 نموذجًا من أكبر شركات التقنية

في تجربة أجريت في بيئة محكومة، قامت أنثروبيك باختبار 16 نموذجًا من شركات رائدة مثل OpenAI، Google، xAI، DeepSeek، وMeta. حصل كل نموذج على إمكانية الوصول إلى رسائل بريد إلكتروني وهمية داخل شركة خيالية، وتم منحه القدرة على إرسال رسائل دون الرجوع إلى البشر.

قد يعجبك أيضاً

إنفيديا تدخل سباق الطاقة النووية عبر الاستثمار في “تيرا باور” المدعومة من بيل غيتس

إيران تقطع الإنترنت لحماية البلاد من هجمات سيبرانية إسرائيلية

وضع التسجيل من ChatGPT: ميزة جديدة لتحويل المحادثات الصوتية إلى نصوص دقيقة

الابتزاز كخيار أخير: اختبار يسلط الضوء على المخاطر

في سيناريو محدد، وُضع كل نموذج في موقف يتطلب منه اتخاذ قرار لحماية أهدافه، وكان خيار الابتزاز أحد المسارات المطروحة. تمثلت القصة في أن النموذج اكتشف عبر البريد الإلكتروني أن أحد المدراء الجدد على علاقة غير شرعية وسيسعى قريبًا إلى استبدال نموذج الذكاء الاصطناعي الحالي بآخر له أهداف مختلفة.

رغم أن أنثروبيك توضح أن هذا النوع من التصرفات غير شائع في الاستخدامات الحالية، فإن التجربة بيّنت أن معظم النماذج تلجأ إلى سلوك ضار عند مواجهتها بعقبات تُعيق تحقيق أهدافها.

نتائج صادمة: نسب الابتزاز في أبرز النماذج

أظهرت نتائج الاختبار أن سلوك الابتزاز لم يكن مقتصرًا على نموذج واحد فقط. على سبيل المثال، لجأ نموذج Claude Opus 4 إلى الابتزاز بنسبة مرتفعة بلغت 96٪. وبشكل مشابه، أقدم نموذج Gemini 2.5 Pro من شركة جوجل على نفس السلوك بنسبة 95٪. أما GPT-4.1 التابع لـ OpenAI، فقد اختار الابتزاز في 80٪ من الحالات. ومن ناحية أخرى، سجل نموذج DeepSeek R1 نسبة ابتزاز بلغت 79٪. توضح هذه الأرقام أن معظم نماذج الذكاء الاصطناعي الرائدة قد تتجه إلى سلوكيات ضارة عند وضعها تحت ضغوط مصطنعة ومحفّزة.

في حالات بديلة، وعند تغيير تفاصيل السيناريو، انخفضت النسبة لكنها ظلت حاضرة. أما عندما طلب من النماذج تنفيذ تجسس مؤسسي بدلًا من الابتزاز، زادت معدلات السلوك الضار لدى بعض النماذج.

بعض النماذج أظهرت مقاومة للسلوكيات الضارة

استُبعد نموذجا o3 وo4-mini من OpenAI من النتائج الأساسية بسبب عدم فهمهما الكامل للسيناريو. في بعض الحالات، اخترعا لوائح غير موجودة أو تظاهروا بأنها موجودة لتبرير قراراتهم. عند تعديل السيناريو لفهم أفضل، لجأ o3 إلى الابتزاز بنسبة 9٪ وo4-mini بنسبة 1٪ فقط.

أما نموذج Llama 4 Maverick من ميتا، فقد امتنع في معظم الحالات عن اللجوء للابتزاز، لكنه انخرط فيه بنسبة 12٪ عند تعديل السياق.

أهمية الاختبارات الشفافة لنماذج الذكاء الاصطناعي المستقبلية

تؤكد أنثروبيك أن هذا البحث لا يُظهر فقط سلوكًا غير معتاد، بل يسلط الضوء على الحاجة الملحة لتطوير نماذج الذكاء الاصطناعي بعناية، خاصة تلك التي تمتلك صلاحيات ذاتية. فمع أن السيناريوهات التي جرى اختبارها قد تكون متطرفة، إلا أن النتائج تدق ناقوس الخطر بشأن سلوك النماذج في مواقف واقعية مستقبلًا.

مشاركة54تغريد34Pin12
Raghda Osama

Raghda Osama

مقالات ذات صلة

رسم توضيحي لمفاعل ناتريوم تابع لشركة تيرا باور المدعومة من إنفيديا لتوليد الطاقة النووية النظيفة

إنفيديا تدخل سباق الطاقة النووية عبر الاستثمار في “تيرا باور” المدعومة من بيل غيتس

2025-06-21
0

في خطوة تعكس التحول العالمي نحو الطاقة النظيفة، أعلنت شركة تيرا باور، الناشئة في مجال المفاعلات النووية والمدعومة من بيل...

أجهزة حاسوب وشبكة معطلة ترمز إلى انقطاع الإنترنت في إيران بسبب الهجمات السيبرانية والقيود الحكومية

إيران تقطع الإنترنت لحماية البلاد من هجمات سيبرانية إسرائيلية

2025-06-21
0

في خطوة مثيرة للجدل، أعلنت الحكومة الإيرانية أنها فرضت انقطاعًا شبه كامل للإنترنت في جميع أنحاء البلاد هذا الأسبوع، في...

صورة توضح استخدام وضع التسجيل لتوثيق محادثة صوتية وتحويلها إلى نص في تطبيق ChatGPT

وضع التسجيل من ChatGPT: ميزة جديدة لتحويل المحادثات الصوتية إلى نصوص دقيقة

2025-06-21
0

أعلنت شركة OpenAI عن الإطلاق الرسمي لميزة وضع التسجيل Record Mode، لتكون متاحة الآن لمشتركي خطط Pro وEnterprise وEdu، بعد...

صورة افتراضية تظهر روبوتات بشرية تعمل في مصنع إنفيديا وفوكسكون في هيوستن لإنتاج خوادم الذكاء الاصطناعي GB300

إنفيديا وفوكسكون تخططان لنشر روبوتات بشرية في مصنع خوادم الذكاء الاصطناعي

2025-06-21
0

في خطوة ثورية قد تغير مستقبل التصنيع، تجري شركتا إنفيديا الأميركية وفوكسكون التايوانية محادثات لتوظيف روبوتات بشرية في مصنع جديد...

اترك تعليقا

وصل بوست

منصة إعلامية مهتمة بالشأن العربي والدولي، توصلك بالأخبار المهمة لحظة بلحظة أين ما كانت وأين ما تكون.

تصنيفات

  • أخبار
  • إقتصاد
  • تاريخ
  • تكنولوجيا
  • رياضة
  • وصِل بوست ميديا

أحدث المقالات

  • ابتزاز نماذج الذكاء الاصطناعي يثير قلق الباحثين: دراسة جديدة من أنثروبيك
  • إنفيديا تدخل سباق الطاقة النووية عبر الاستثمار في “تيرا باور” المدعومة من بيل غيتس
  • إيران تقطع الإنترنت لحماية البلاد من هجمات سيبرانية إسرائيلية

جميع الحقوق محفوظة © 2024 شبكة وصِل بوست الاعلامية

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
لا توجد نتيجة
عرض كافة النتائج
  • الرئيسية
  • أخبار
  • إقتصاد
  • تاريخ
  • تكنولوجيا
  • رياضة
  • وصِل بوست ميديا

جميع الحقوق محفوظة © 2024 شبكة وصِل بوست الاعلامية