أطلقت شركة علي بابا الصينية أحدث إصداراتها من نماذج الذكاء الاصطناعي تحت اسم Qwen2.5-VL، والتي تتمتع بقدرات متقدمة في تحليل النصوص والصور، مع ميزات استثنائية مثل فهم مقاطع الفيديو، وتحليل المستندات، والتحكم في التطبيقات والأجهزة مثل وكيل الذكاء الاصطناعي Operator الذي أطلقته OpenAI مؤخرًا.
ما هو نموذج Qwen2.5-VL؟
Qwen2.5-VL هو نموذج ذكاء اصطناعي متعدد القدرات تم تطويره بواسطة شركة علي بابا. يتميز بقدرته على:
- تحليل النصوص والصور بدقة فائقة.
- فهم محتوى الفيديوهات الطويلة.
- استخراج البيانات من المستندات الممسوحة ضوئيًا مثل الفواتير والنماذج.
- التحكم في التطبيقات والأجهزة على أجهزة الكمبيوتر والهواتف المحمولة.
تفوّق Qwen2.5-VL على المنافسين
بحسب اختبارات الأداء التي أجراها فريق Qwen، أظهر النموذج الرئيسي Qwen2.5-VL-72B تفوقًا ملحوظًا على نماذج الذكاء الاصطناعي الرائدة مثل GPT-4o من OpenAI، وClaude 3.5 Sonnet من Anthropic، وGemini 2.0 Flash من Google.
يتميز هذا النموذج بقدراته المتقدمة في التعامل مع المهام المعقدة مثل فهم محتوى الفيديوهات الطويلة، تنفيذ العمليات الحسابية الدقيقة، وتحليل المستندات باحترافية عالية. هذا التفوق يعزز من مكانة شركة علي بابا كواحدة من اللاعبين الرئيسيين في سباق الذكاء الاصطناعي، مما يجعل نموذج Qwen2.5-VL خيارًا مثاليًا للشركات التي تبحث عن حلول مبتكرة وفعالة لتحليل البيانات وفهم النصوص والصور.
أهم ميزات نموذج Qwen2.5-VL
تتميز نماذج Qwen2.5-VL بقدرات تقنية متطورة تجعلها مناسبة لمجموعة واسعة من الاستخدامات، بما في ذلك:
- تحليل الرسوم البيانية والجداول: توفير رؤى دقيقة من البيانات.
- فهم المستندات الممسوحة ضوئيًا: مثل الفواتير والنماذج.
- التعرف على الشخصيات والأعمال الفنية: بما يشمل الأفلام والمسلسلات.
- فهم مقاطع الفيديو الطويلة: تحليل شامل وفعّال للمحتوى.
- التحكم في الأجهزة والتطبيقات: يمكنه التحكم في التطبيقات مثل تطبيقات الحجز أو التنقل بين علامات التبويب في أنظمة الحواسيب.
وفقًا للاختبارات، حقق النموذج أداءً بنسبة 15% أفضل في تحليل المستندات مقارنة بـ GPT-4o و20% أفضل في فهم مقاطع الفيديو الطويلة.
أداء محدود في بيئات الحواسيب
على الرغم من الميزات المتقدمة لنموذج Qwen2.5-VL، أظهرت اختبارات الأداء بعض التحديات عند العمل في بيئات الحواسيب الواقعية. في تجربة تم إجراؤها على نظام تشغيل Linux، اقتصر أداء النموذج على التنقل بين علامات التبويب دون القدرة على تنفيذ مهام معقدة بشكل كامل.
كما سجل النموذج نتائج ضعيفة في اختبار OSWorld، وهو اختبار متخصص يحاكي بيئة الحواسيب الحقيقية ويتطلب قدرات ذكاء اصطناعي أكثر شمولاً. هذه التحديات تشير إلى وجود قيود عند استخدام النموذج في أنظمة تشغيل معقدة، مما قد يدفع المطورين إلى تحسينه لتحقيق أداء أفضل في هذا السياق.
Don’t Miss @Alibaba_Qwen 2.5 VL! Despite all the Deepseek Hype, Qwen just dropped the best open Multimodal! Qwen 2.5 VL is a Vision Language Model that can control your computer, similar to the @OpenAI operator, extract structured information from charts, and more!!
TL;DR;
3️⃣… pic.twitter.com/GeEGVdl0tI— Philipp Schmid (@_philschmid) January 27, 2025
التوافر والشروط
تتوفر نماذج Qwen2.5-VL بسهولة عبر تطبيق Qwen Chat الخاص بشركة علي بابا، مما يتيح للمستخدمين تجربة قدرات الذكاء الاصطناعي المتقدمة مباشرة. بالإضافة إلى ذلك، يمكن للمطورين تنزيل النماذج من منصة Hugging Face، المشهورة بدعم مطوري الذكاء الاصطناعي. كما تُتاح نماذج Qwen2.5-VL-3B وQwen2.5-VL-7B بترخيص متساهل، مما يجعلها مناسبة للشركات الصغيرة والمطورين الأفراد.
أما النموذج الرئيسي Qwen2.5-VL-72B، فهو يخضع لترخيص خاص من علي بابا، حيث يتطلب موافقة مسبقة لاستخدامه التجاري للشركات التي تمتلك أكثر من 100 مليون مستخدم نشط شهريًا. هذه الخطوة تضمن تنظيم استخدام النموذج وتوفير حلول متخصصة للشركات الكبرى التي تسعى للاستفادة من إمكانياته المتقدمة في تحليل النصوص والصور.
علي بابا في سباق الذكاء الاصطناعي
من خلال إطلاق سلسلة Qwen2.5-VL، تُواصل شركة علي بابا تعزيز مكانتها كمنافس رئيسي في سوق الذكاء الاصطناعي، حيث تسعى لتقديم حلول مبتكرة تُلبي احتياجات المستخدمين والمطورين على حد سواء، كما تسعى لتحقيق تقدم بارز ينافس الشركات الكبرى مثل DeepSeek الصينية.
احتمالية التدريب على محتويات محمية
أشارت تقارير إلى أن النموذج يمكنه التعرف على الملكية الفكرية من الأفلام والمسلسلات. قد تكون هذه البيانات جزءًا من عملية تدريب النموذج، مما يثير تساؤلات حول استخدام مواد محمية بحقوق الطبع والنشر.
مع استمرار التنافس بين عمالقة التكنولوجيا في مجال الذكاء الاصطناعي، تأتي نماذج Qwen2.5-VL لتقدّم تقنيات ثورية يمكنها تلبية متطلبات الشركات والمطورين، مع توفير حلول مبتكرة تجعلها خيارًا جذابًا في السوق.
هل ترغب في تجربة القدرات الفائقة لنموذج Qwen2.5-VL؟ قم بتنزيل النموذج الآن عبر منصة Hugging Face واستمتع بالتقنيات الرائدة في الذكاء الاصطناعي!




