• Landing Page
  • Shop
  • Contact
  • Buy JNews
12-02-2026 | 2:38
  • تسجيل الدخول
وصل بوست
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة
لا توجد نتيجة
عرض كافة النتائج
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة
لا توجد نتيجة
عرض كافة النتائج
وصل بوست
لا توجد نتيجة
عرض كافة النتائج

جوجل تطلق نموذج الصوت الأصلي في Gemini لتجربة محادثات طبيعية غير مسبوقة

نموذج الصوت الأصلي في Gemini Live API يظهر تحسين المحادثات الصوتية في بيئة تفاعلية واقعية

نموذج الصوت الأصلي في Gemini Live API يظهر تحسين المحادثات الصوتية في بيئة تفاعلية واقعية

كشفت جوجل عن خطوة جديدة تعزز مكانتها في مجال الذكاء الاصطناعي الصوتي، حيث أعلنت عن إطلاق نموذج الصوت الأصلي (Native Audio Model) ضمن واجهة Gemini Live API بنسخته التجريبية. يمثل هذا التحديث نقلة نوعية في عالم المحادثات التفاعلية، إذ يَعِد بجعل التجربة الصوتية أكثر طبيعية وواقعية، مع تقليل الأخطاء وتحسين دقة استجابة الوكلاء الصوتيين في الزمن الحقيقي.

إضافة ميزات أساسية آخرى

كشفت الشركة أن التحديث يتضمن ميزتين محوريتين:

قد يعجبك أيضاً

إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet

قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين

Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

  • تحسين وظائف الاتصال (Function Calling) لزيادة الدقة في ربط المحادثات بالخدمات الخارجية.
  • تعزيز انسيابية المحادثات الصوتية لتصبح أكثر قرباً من التفاعل البشري.

تحسين وظائف الاتصال

تسمح ميزة Function Calling للنظام بالاتصال ببيانات وخدمات خارجية، مثل حجز المواعيد أو جلب معلومات مباشرة.
التحديث الجديد يضاعف من دقة هذه العمليات، مما يقلل من الأخطاء في السيناريوهات المعقدة متعددة الوظائف، وهو أمر حاسم لضمان موثوقية التفاعلات الصوتية.

محادثات أكثر طبيعية

أضافت جوجل تحسينات تسمح للنموذج بالتعامل مع المقاطعات والتوقفات بشكل أفضل، حيث يمكن للواجهة التوقف مؤقتاً عند وجود ضوضاء أو أسئلة جانبية، ثم استئناف المحادثة بمجرد أن يكون المستخدم جاهزاً، مما يقلل من الطابع الآلي ويجعل التجربة أكثر إنسانية.

دعم لغات وأصوات متعددة

النموذج الصوتي الجديد يدعم أكثر من 24 لغة ويتيح اختيار أصوات مختلفة، بما يصل إلى 30 صوتاً. كما يقدم إمكانيات متقدمة للتعرف على المتحدثين المتعددين، مما يفتح المجال لاستخدامه في المحادثات الجماعية والتطبيقات العالمية.

تقليل من الانقطاعات غير الصحيحة

أكدت جوجل أن النموذج يقلل من المقاطعات غير المقصودة عندما يتوقف المستخدم للتفكير أو يلتزم الصمت. كما بات قادراً على التمييز بين التوقفات الطبيعية والمقاطعات المقصودة والاستجابة لها بذكاء.

إضافة ميزة التفكير للاستفسارات المعقدة

تخطط جوجل لإطلاق ميزة Thinking Mode التي تمنح النظام وقتاً إضافياً لمعالجة الاستفسارات المعقدة متعددة المراحل. كما ستجعل هذه الميزة النموذج قادراً على تقديم إجابات أكثر دقة وعمقاً، خصوصاً في الأسئلة التقنية أو البحثية.

استخدامات عملية متنوعة

يمهد هذا التحديث الطريق أمام استخدامات متعددة تشمل:

  • المساعدات المنزلية الذكية وخدمة العملاء عبر المحادثة الصوتية.
  • مراقبة العمليات الصناعية والبث الصوتي المباشر.
  • إنشاء محتوى صوتي مثل البودكاست أو تحويل النصوص إلى أصوات طبيعية عالية الجودة.

الأمان والشفافية

أشارت الشركة إلى أن جميع المخرجات الصوتية من Gemini تحمل علامة مائية اصطناعية (SynthID)، تضمن الشفافية وتساعد على تتبع المحتوى المولَّد صوتياً. هذه الخطوة تأتي في إطار التزام جوجل بمعايير المسؤولية والحوكمة في تطوير تقنيات الذكاء الاصطناعي.

الأسئلة الشائعة (FAQ)

1. ما هو نموذج الصوت الأصلي في Gemini Live API من جوجل؟

نموذج الصوت الأصلي هو تحديث جديد أطلقته جوجل ضمن Gemini Live API يتيح للمستخدمين التفاعل الصوتي بشكل طبيعي وسلس، مع دعم لغات متعددة وتقليل الأخطاء في المحادثات الفورية.

2. كيف يحسن نموذج الصوت الأصلي دقة المحادثات الصوتية؟

يعمل التحديث على مضاعفة دقة Function Calling، مما يسمح بالاتصال بالخدمات الخارجية مثل حجز المواعيد أو جلب المعلومات بشكل أسرع وأكثر موثوقية.

3. ما هي اللغات التي يدعمها نموذج الصوت الأصلي من جوجل؟

النموذج يدعم أكثر من 24 لغة ويتيح للمستخدمين اختيار ما يزيد عن 30 صوتاً مختلفاً، مما يجعله مناسباً للتطبيقات العالمية والمحادثات متعددة الثقافات.

4. هل يمكن استخدام Gemini Live API في البيئات المليئة بالضوضاء؟

نعم، يدعم النموذج ميزة Proactive Audio التي تقلل من تأثير الضوضاء والمحادثات الجانبية، مما يضمن استمرارية التفاعل الصوتي بدقة حتى في البيئات المزدحمة.

5. ما هي ميزة “Thinking Mode” التي تخطط جوجل لإطلاقها؟

ميزة التفكير Thinking Mode تمنح النموذج وقتاً إضافياً لمعالجة الاستفسارات المعقدة متعددة المراحل، ما يساعد على تقديم إجابات أكثر دقة وعمقاً مقارنة بالمحادثات التقليدية.

يُعد إطلاق نموذج الصوت الأصلي في Gemini Live API خطوة استراتيجية من جوجل لتطوير مستقبل المحادثات الصوتية.
هذا التحديث يفتح الباب أمام تجارب أكثر طبيعية، ويعزز من موثوقية التطبيقات الذكية التي تعتمد على الذكاء الاصطناعي في التواصل الفوري.

مشاركة54تغريد34Pin12
Raghda Osama

Raghda Osama

مقالات ذات صلة

صورة توضح ميزة المكياج المدعوم بالذكاء الاصطناعي في Google Meet أثناء مكالمة فيديو، تُظهر كيف يمنح الفلتر مظهراً طبيعياً واحترافياً للمستخدم.

إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet

2025-10-20
0

كشفت شركة جوجل عن ميزة مبتكرة في تطبيقها Google Meet، تمكن المستخدمين من الظهور بإطلالة أنيقة واحترافية عبر فلتر مكياج...

إعلان شركة OpenAI عن إتاحة محتوى إباحي على ChatGPT للبالغين ضمن تحديث ديسمبر 2025 المثير للجدل.

قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين

2025-10-19
0

سبب إعلان سام ألتمان، الرئيس التنفيذي لشركة OpenAI، موجة جدل واسعة بعد كشفه عن نية الشركة إطلاق تحديث جديد لتطبيق...

واجهة منصة Perplexity AI تُظهر ميزة تعلم اللغات الجديدة بطريقة تفاعلية تعزز مهارات المحادثة والترجمة للمستخدمين

Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

2025-10-19
0

في خطوة تعكس التطور السريع في عالم الذكاء الاصطناعي، كشفت منصة Perplexity AI عن ميزة جديدة تُحدث تحولاً في طريقة...

واجهة تطبيق Gemini Live على هاتف أندرويد تُظهر ميزة الصوت الأصلي الجديدة من جوجل التي تُحاكي الصوت البشري في المحادثة.

جوجل تُوسع طرح Gemini Live مع الصوت الأصلي للأندرويد

2025-10-19
0

أعلنت جوجل مؤخراً عن طرح أوسع لميزة Gemini Live مع دعم الصوت الأصلي في نظام أندرويد، بدءاً من سلسلة هواتف...

اترك تعليقا

وصل بوست

منصة إعلامية مهتمة بالشأن العربي والدولي، توصلك بالأخبار المهمة لحظة بلحظة أين ما كانت وأين ما تكون.

تصنيفات

  • أخبار
  • إقتصاد
  • تاريخ
  • تكنولوجيا
  • رياضة
  • وصِل بوست ميديا

أحدث المقالات

  • إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet
  • قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين
  • Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

جميع الحقوق محفوظة © 2024 شبكة وصِل بوست الاعلامية

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
لا توجد نتيجة
عرض كافة النتائج
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة

جميع الحقوق محفوظة © 2024 شبكة وصِل بوست الاعلامية