أعلنت شركة OpenAI عن إطلاق نموذجين جديدين يحملان اسم o3 وo4-mini، وذلك بعد أيام قليلة فقط من إعلانها عن النموذج المتقدّم GPT-4.1. ويمثل النموذجان الجديدان نقلة نوعية في تطوير الذكاء الاصطناعي القادر على “التفكير العميق” واستخدام أدوات متعددة لحل مشاكل معقدة بسرعة ودقة.
نموذج o3: أقوى نموذج للاستدلال متعدد المهارات
يُعد نموذج OpenAI o3 الأذكى والأكثر دقة في سلسلة o-series حتى الآن. وقد تم تدريبه خصيصًا على التفكير المطوّل قبل إصدار الردود، مما يمنحه قدرة غير مسبوقة على:
- حل مشكلات متعددة الخطوات
- تحليل البيانات البرمجية والعلمية والرياضية
- فهم الرسومات والمخططات والصور المعقدة
كما يتمتع النموذج بقدرة عالية على استخدام أدوات ChatGPT مثل التصفح، وتوليد الصور، وتحليل البيانات، مما يمنحه ميزة تنافسية عن الإصدارات السابقة.
وقد حقق النموذج o3 أداءً متميزًا في اختبارات أكاديمية مرجعية، مما يؤكد تفوقه في مجالات متعددة. من أبرز هذه الاختبارات Codeforces في البرمجة التنافسية، وSWE-bench في هندسة البرمجيات الواقعية، إلى جانب MMMU وMathVista التي تقيس قدرات الاستدلال البصري ومتعدد الوسائط. وبالإضافة إلى نتائجه القوية، أظهر o3 انخفاضًا بنسبة 20% في عدد الأخطاء الحرجة مقارنة بنموذج o1، وهو ما يعزز مكانته كأداة موثوقة في البرمجة، والاستشارات التجارية، والهندسة، وعلوم الأحياء.
نموذج o4-mini: ذكاء قوي بتكلفة أقل
أما نموذج o4-mini، فهو مخصص لمن يبحث عن أداء فعّال بتكلفة منخفضة، ويقدم “نتائج مبهرة” في نفس المجالات مع مرونة أكبر في الاستخدام داخل المشاريع.
قدرات جديدة: تحليل الصور والتصرف الذاتي
من أبرز مزايا النموذجين:
- تحليل الصور المعقدة، بما في ذلك الرسوم والمخططات والكتابات اليدوية.
- فهم واستيعاب محتوى الصور بجودة منخفضة.
- القدرة على تعديل الصور كجزء من عملية التفكير.
- اتخاذ قرارات متعددة الخطوات للوصول إلى نتائج دقيقة، بما يشبه التصرف البشري المستقل.
تكامل مع أدوات ChatGPT
لأول مرة، يمكن للنموذجين استخدام جميع أدوات ChatGPT بطريقة ذكية وتلقائية تشمل:
- البحث على الإنترنت
- تشغيل كود Python
- تحليل الملفات والبيانات
- إنشاء الصور
- التفكير مع الصور وتحليلها وتعديلها
يتمكن النموذجان من اختيار الأداة المناسبة في الوقت المناسب، لتنفيذ تسلسل منطقي لحل الأسئلة المعقدة، مثل توقع استهلاك الطاقة أو تحليل بيانات مالية من الإنترنت.
التفكير البصري: نموذج يفكر من خلال الصور
ميزة “التفكير بالصور” تفتح آفاقًا جديدة في معالجة المعلومات متعددة الوسائط. حيث يمكن للمستخدم:
- رفع صورة للوحة بيضاء أو رسم يدوي أو رسم بياني.
- يحصل على تفسير دقيق للمحتوى حتى لو كانت الصورة غير واضحة أو مقلوبة.
- يطلب من النموذج تدوير أو تعديل الصورة ضمن خطوات الحل.
Codex CLI: أداة جديدة للمبرمجين
إلى جانب النماذج الجديدة، أطلقت OpenAI أداة جديدة للمطورين تُدعى Codex CLI، وهي:
- واجهة برمجية تفاعلية تتيح دمج النماذج في المشاريع المحلية بسهولة.
- تدعم مباشرة o3 و o4-mini، مع دعم قريب لنموذج GPT-4.1.
- مصممة لتوفير بيئة مرنة وسريعة للمطورين.
- تدعم التفكير بالصور ودمج الرسوم والبيانات النصية في الوقت الحقيقي.
كما أطلقت OpenAI مبادرة تمويل بقيمة مليون دولار لدعم مشاريع تستخدم Codex CLI، مع منح بقيمة 25 ألف دولار كرصيد API.
كيف يمكن الوصول إلى النماذج؟
يتوفر النموذجان الجديدان الآن لمشتركي خطط ChatGPT Plus وPro وTeam، مما يتيح لهم الوصول الفوري إلى قدرات o3 وo4-mini. في الوقت نفسه، يمكن لمستخدمي النسخة المجانية تجربة نموذج o4-mini من خلال اختيار وضع “Think” قبل إرسال السؤال. ومن جهة أخرى، تخطط OpenAI لإطلاق نموذج o3-pro خلال الأسابيع المقبلة لمشتركي خطة Pro. كذلك، تتاح النماذج عبر واجهتي Chat Completions API وResponses API، مما يمنح المطورين القدرة على دمج هذه النماذج بسهولة في تطبيقاتهم.
تغييرات في خارطة الطريق
الرئيس التنفيذي لشركة OpenAI، سام ألتمان، أعلن مؤخرًا عن تغيير في خطة فبراير، التي كانت تتجه نحو دمج الأدوات في نموذج واحد. وبدلاً من ذلك، قررت الشركة إطلاق o3 و o4-mini بشكل مستقل بعد صعوبات في توحيد الأدوات ضمن نموذج موحد.
ويتوقع تأجيل عملية دمج النماذج إلى ما بعد إصدار النموذج القادم GPT-5، المتوقع خلال الأشهر القليلة المقبلة.
تمثل نماذج o3 وo4-mini تحولًا جوهريًا في مسار تطوير ChatGPT، من مجرد مساعد نصي إلى شريك تفكير ذكي يمكنه استخدام الأدوات وتنفيذ المهام المعقدة. ومع تكامل الأدوات والقدرات البصرية والتفكير العميق، تفتح OpenAI الباب أمام جيل جديد من الذكاء الاصطناعي القادر على التحليل والتصرف والاستنتاج.




