أعلنت جوجل مؤخراً عن طرح أوسع لميزة Gemini Live مع دعم الصوت الأصلي في نظام أندرويد، بدءاً من سلسلة هواتف Pixel 10 وصولاً إلى معظم هواتف أندرويد المدعومة. يهدف التحديث إلى تحسين تجربة المحادثة وجعلها أكثر تفاعلية وطبيعية، من خلال استخدام تقنية متقدمة تأخذ في الاعتبار نبرة الصوت، الإيقاع، والطبقة الصوتية.
الاعتماد على نموذج Gemini 2.5 Flash Live API لتجربة صوتية محسنة
يعتمد Gemini Live الجديد على نموذج Gemini 2.5 Flash Live API، الذي يُمكنه تحسين جودة الصوت بشكل كبير ليعكس التعبيرات البشرية الحقيقية. يأخذ النظام في الحسبان مشاعر المستخدم، فتنعكس هذه المشاعر في طريقة استجابة المساعد. مثلاً، إذا بدا المتحدث متوتراً، يرد Gemini Live بصوت هادئ ومطمئن، مما يعطي المحادثة طابعاً إنسانياً أكثر.
تحكم المستخدم في الصوت واللهجة
يتيح التحديث الجديد للمستخدمين تخصيص الصوت بحيث يمكن اختيار لهجات مختلفة مثل البريطانية أو الأسترالية، مع إمكانية تعديل سرعة الكلام حسب الرغبة سواء بتسريعها أو إبطائها، وتستمر هذه الإعدادات طوال مدة المحادثة. يمكن للمستخدمين العودة لهذه الإعدادات بسهولة عبر زر “Live” الموجود في سجل المحادثات، مع إعادة تعيينها تلقائياً عند بدء جلسة جديدة.
توسع ميزة التوجيه البصري مع تفعيلها على أندرويد مجاناً
تعد خاصية التوجيه البصري من أبرز الإضافات التي جاءت مع تحديث Gemini Live، حيث تسمح بتمييز وتسليط الضوء على الأشياء في العالم الحقيقي بواسطة كاميرا الهاتف. جاءت الميزة في البداية مع Pixel 10، لكن تم توسيعها لتشمل معظم هواتف الأندرويد، حتى تلك التي تستخدم حسابات مجانية. تفعيل الميزة يتم بسهولة من خلال أوامر مثل “أرني” أو “أين”، حيث يظهر إطار مضيء يسلط الضوء على الهدف المطلوب مع تغميق خلفية المشهد.
تحديث تصميم واجهة حساب جوجل في تطبيق Gemini
شملت التحديثات الأخيرة إعادة تصميم لقائمة حساب جوجل في تطبيق Gemini على أندرويد وiOS، حيث أصبحت تعرض القائمة الآن بعرض الشاشة بالكامل، مع توفير إمكانية التمرير لأسفل للوصول إلى الإعدادات المختلفة بسهولة وأسلوب أكثر تنظيماً. هذا التحديث ينسجم مع تصميم تطبيق جوجل الأساسي ليقدم تجربة أكثر سلاسة واحترافية.
تثبت جوجل من خلال إطلاق ميزة الصوت الأصلي في Gemini Live أنها تمضي بخطوات واثقة نحو جعل التواصل مع الذكاء الاصطناعي أكثر قربًا من التواصل البشري الحقيقي. فالتفاعل لم يعد مجرد تبادل كلمات على الشاشة، بل أصبح تجربة صوتية ووجدانية تنقل المشاعر والنبرات كما يفعل الإنسان.
وبينما تتوسع الميزة عالميًا وتقترب من دعم لغات جديدة بينها العربية، يبدو واضحًا أن جوجل ترسم ملامح جيل جديد من المساعدات الذكية التي تسمعك، تفهمك، وتجيبك كما لو كانت تتحدث إليك وجهًا لوجه.




