أعلنت شركة جوجل “Google” مؤخرًا عن إطلاق نموذجها الجديد Veo لتوليد الفيديو باستخدام الذكاء الاصطناعي، عبر منصة Vertex AI الخاصة بها، مما يوفر للشركات فرصة مبتكرة لدمج هذه التقنية في عمليات إنتاج المحتوى. يأتي هذا الإعلان بعد إطلاق نموذج Imagen 3 لتحويل النصوص إلى صور، ما يعزز مكانة جوجل الريادية في مجال الذكاء الاصطناعي التوليدي.
ما هو نموذج Veo؟ وكيف يغير مستقبل إنتاج الفيديو؟
نموذج Veo هو نظام ذكاء اصطناعي متطور يمكنه إنشاء مقاطع فيديو عالية الجودة بدقة تصل إلى 1080 بكسل، باستخدام أوامر نصية أو صور. ويتميز بقدرته على توليد مقاطع فيديو بأنماط بصرية وسينمائية متنوعة. هذه التقنية ستحدث تحولًا في صناعة إنتاج المحتوى، حيث تمكن الشركات من إنشاء مقاطع فيديو في وقت قصير وجودة عالية، مما يوفر عليها الكثير من التكاليف والوقت.
أبرز مزايا نموذج Veo:
- دقة عالية (1080p): تمكن هذه التقنية الشركات من إنتاج مقاطع فيديو بجودة عالية، بما يتماشى مع معايير صناعة الفيديو الحديثة.
- التنوع البصري والسينمائي: يمكن لنموذج Veo توليد مقاطع فيديو بألوان وأنماط سينمائية متنوعة، مما يجعله مناسبًا لمجموعة واسعة من الاستخدامات التجارية، من الإعلانات إلى محتوى الوسائط الاجتماعية.
- المرونة في الاستخدام: يعتمد Veo على الأوامر النصية أو الصور لإنشاء الفيديوهات، ما يتيح للمستخدمين مستوى عالٍ من التخصيص في التصميمات.
- إمكانية إنشاء مقاطع تتجاوز دقيقة واحدة دون تحديد حدود طول الفيديو.
في اختبارات جوجل الأولية، قدم النموذج نتائج يصعب تمييزها عن الفيديوهات الحقيقية، وهو ما يعكس تطورًا هائلًا في تقنية الذكاء الاصطناعي. من بين الأمثلة اللافتة، مقطع فيديو يعرض كلبًا بدقة تفاصيل عالية، حيث كانت حركة الفرو والياقة واضحة ومتماسكة، مما يعكس قدرة النموذج على محاكاة الحياة الواقعية.

مقارنة بين Veo و Sora من OpenAI
أعلنت شركة OpenAI في وقت سابق عن نموذجها المنافس Sora لتوليد الفيديوهات، إلا أن جوجل تفوقت عليها في إصدار Veo أولًا. على الرغم من أن Sora لا يزال قيد التطوير ولم يتم إطلاقه بعد بشكل كامل، فإن جوجل تمكنت من تجاوز منافستها في هذا المجال بشكل واضح.
إطلاق نموذج Imagen 3: تحويل النصوص إلى صور بدقة عالية
إلى جانب Veo، أعلنت جوجل عن إصدار Imagen 3 لتحويل النصوص إلى صور بدقة عالية. هذا النموذج سيكون متاحًا لعملاء خدمات جوجل السحابية (Google Cloud) عبر منصة Vertex AI اعتبارًا من الأسبوع المقبل. تتيح هذه التقنية الجديدة إمكانية تحرير الصور بناءً على الأوامر النصية، إضافة الشعارات أو العناصر الخاصة بالمستخدمين.
أهم ميزات Imagen 3:
- تحويل النصوص إلى صور باستخدام الذكاء الاصطناعي.
- تحرير الصور وتخصيصها بناءً على الأوامر النصية.
- إمكانية إضافة شعارات أو عناصر خاصة على الصور المنتجة.
التحديات والعيوب
رغم التطور الكبير الذي يقدمه Veo، فإن هناك بعض العيوب التي قد تظهر في بعض الحالات. على سبيل المثال، في أحد المقاطع التجريبية، كانت هناك مشكلة في الإضاءة حيث اخترق الضوء يد أحد الأشخاص بشكل غير طبيعي. ومع ذلك، تواصل جوجل تطوير هذه التقنية لضمان تحسين النتائج.
حماية حقوق الملكية الفكرية ومكافحة المعلومات المضللة
من أجل ضمان استخدام آمن لهذه التقنيات، قامت جوجل بتضمين تقنية SynthID من DeepMind في كافة المحتويات المُنتجة باستخدام Veo و Imagen 3. هذه التقنية تضيف علامة مائية رقمية غير مرئية تهدف إلى تمييز المحتوى المولد بالذكاء الاصطناعي، مما يساهم في منع انتشار المعلومات المضللة وحماية حقوق الملكية الفكرية.
جوجل تتفوق في مجال الذكاء الاصطناعي التوليدي
وفقًا لبيانات جوجل، تشير الإحصائيات إلى أن 86% من المؤسسات التي اعتمدت الذكاء الاصطناعي التوليدي في حملاتها الإعلانية قد شهدت زيادة ملحوظة في الإيرادات. هذا يدفع الشركات إلى تبني تقنيات جوجل مثل Veo و Imagen 3 للاستفادة من هذه التقنيات المتطورة دون انتظار المنافسين.
في مثال على ذلك، عرضت جوجل مقطعًا دعائيًا لشركة Agoda للسياحة والسفر، التي استخدمت نماذج الذكاء الاصطناعي Veo و Imagen 3 لإنشاء مقاطع فيديو وصور ترويجية.
التطبيقات التجارية لـ Veo و Imagen 3
- التسويق والإعلانات: يمكن استخدام Veo في الإعلانات التجارية عبر الإنترنت، حيث يُمكن توليد مقاطع فيديو مبتكرة عالية الجودة بسرعة. على سبيل المثال، يمكن لشركات مثل Coca-Cola استخدام هذه التقنية في حملات الإعلانات الموسمية.
- إنتاج الوسائط الاجتماعية: تُمكن هذه التقنيات الشركات من إنشاء محتوى مخصص و صور وفيديوهات فريدة لزيادة التفاعل مع جمهورها على منصات مثل إنستجرام و تيك توك.
بإطلاق نموذج Veo و Imagen 3، تؤكد جوجل ريادتها في مجال الذكاء الاصطناعي التوليدي، مما يقدم فرصًا كبيرة للشركات لتحسين جودة المحتوى الرقمي وزيادة الإيرادات. وبفضل الميزات المتطورة والقدرة على إنتاج مقاطع فيديو وصور عالية الجودة باستخدام الأوامر النصية أو الصور، فإن الشركات لن تكون مضطرة بعد الآن للانتظار طويلاً لتطوير محتوى مبتكر.