أعلنت جوجل خلال مؤتمر Google I/O 2025 عن إطلاق Veo 3، الجيل الجديد من نماذجها لتوليد الفيديو بالذكاء الاصطناعي. لا يكتفي هذا النموذج بإنشاء مشاهد مرئية واقعية فحسب، بل أصبح قادرًا أيضًا على توليد مؤثرات صوتية، وحوارات، وأصوات خلفية متزامنة بدقة مع المحتوى.
نقلة نوعية بعد Veo 2
بالمقارنة مع الإصدار السابق Veo 2، يتميز Veo 3 بجودة أفضل في إنتاج الفيديوهات، إلى جانب إضافة الصوت كمكون أساسي. ويمكن للمستخدمين تزويده بنصوص أو صور لإنشاء مقاطع فيديو متكاملة داخل تطبيق Gemini للمشتركين في باقة AI Ultra التي تبلغ تكلفتها 249.99 دولارًا شهريًا.
أول خطوة للخروج من “عصر الفيديو الصامت”
صرح “ديميس هاسابيس”، الرئيس التنفيذي لجوجل ديب مايند (Google DeepMind)، أن Veo 3 يمثل أول خطوة للخروج من عصر الفيديو الصامت. وأوضح أنه يمكن للمستخدمين وصف الشخصيات والمكان وحتى اقتراح الحوارات، مع تحديد النغمة الصوتية المطلوبة.
منافسة محتدمة في سوق توليد الفيديو
يشهد سوق توليد الفيديو بالذكاء الاصطناعي نموًا سريعًا. إلى جانب جوجل، تعمل شركات مثل Runway، Pika، Luma، Genmo، OpenAI، وعلي بابا على إطلاق نماذج مماثلة. ولكنّ Veo 3 يتميز بقدرته على توليد صوت متزامن بدقة مع الصورة، ما يمنحه تفوقًا تنافسيًا واضحًا.
تقنية متقدمة من ديب مايند
يرجح أن Veo 3 جاء نتيجة لتجارب ديب مايند السابقة في مجال توليد الصوت من الفيديو. كما كشفت الشركة في يونيو 2024 عن تقنيات تدرب النماذج على توليف الصوتيات باستخدام مقاطع الفيديو ونصوص الحوار.
محتوى التدريب: يوتيوب في دائرة الشك
لم تكشف جوجل عن المصادر الدقيقة التي استخدمتها لتدريب النموذج، لكن منصة يوتيوب تظل من أقوى الاحتمالات، خاصةً وأن ديب مايند صرّحت سابقًا بأن بعض النماذج قد تكون استندت إلى محتوى من يوتيوب.
حماية من التزييف العميق (Deepfake)
لمواجهة مخاطر التزييف، تعتمد جوجل على تقنية SynthID الخاصة بها، والتي تضيف علامات مائية غير مرئية داخل إطارات الفيديو لضمان التحقق من الأصالة.
مخاوف صناع المحتوى والفنانين
رغم الإمكانيات المبهرة، يعبر العديد من المبدعين عن قلقهم من تأثير هذه النماذج على مستقبل الصناعات الإبداعية. رغم الإمكانيات المبهرة، يعبر العديد من المبدعين عن قلقهم من تأثير هذه النماذج على مستقبل الصناعات الإبداعية. في عام 2024، نشرت نقابة الرسامين في هوليوود دراسة كشفت نتائج مقلقة بشأن مستقبل الوظائف الإبداعية. ووفقًا للدراسة، من المتوقع أن يتأثر أكثر من 100 ألف منصب عمل في مجالات السينما والتلفزيون والرسوم المتحركة بتقنيات الذكاء الاصطناعي بحلول عام 2026. كما تسلط هذه التقديرات الضوء على التحديات التي قد تواجهها الصناعات الفنية في ظل التطور المتسارع للأدوات التوليدية.
تحديثات إضافية على Veo 2
إلى جانب Veo 3، أعلنت جوجل عن تحديثات جديدة لنموذج Veo 2. تشمل التحديثات إمكانية إدخال صور لأشخاص أو مشاهد لضمان الاتساق البصري، إلى جانب دعم حركات الكاميرا مثل التدوير والتكبير، وإمكانية توسيع الإطار وتحويله من عمودي إلى أفقي.
توفر قريب عبر Vertex AI
أكدت جوجل أن هذه المزايا الجديدة سيتم توفيرها قريبًا عبر منصة Vertex AI API، ما يتيح دمجها في تطبيقات وخدمات أخرى.
في النهاية مع إطلاق Veo 3، تؤكد جوجل موقعها الريادي في سباق تقنيات الذكاء الاصطناعي التوليدي، مقدمة نموذجًا متقدمًا لا يكتفي فقط بإنتاج الفيديوهات بل يدمج الصوت معها بطريقة طبيعية وواقعية. وبينما تفتح هذه الأدوات آفاقًا واسعة أمام صناع المحتوى والمبدعين، فإنها تطرح أيضًا تساؤلات جوهرية حول مستقبل العمل الإبداعي.
في المقابل، تمثل التقنيات المصاحبة مثل Flow وVertex AI فرصًا جديدة لتعزيز الإنتاج الإعلامي بأساليب أكثر احترافية ومرونة. كما أن Veo 3 ليس مجرد تحديث تقني، بل خطوة كبيرة نحو مستقبل تُعيد فيه التكنولوجيا تعريف كيفية صناعة الصور والأصوات والروايات المرئية.