كشفت جوجل عن ميزة جديدة في تطبيق Google Meet تتيح الترجمة الفورية للصوت أثناء المحادثات. جاء ذلك بفضل تعاون فرق Google Meet وDeepMind ووحدة الأبحاث، في خطوة تهدف إلى كسر حواجز اللغة وربط الناس حول العالم في اجتماعاتهم اليومية.
تحديات اللقاءات العابرة للغات
يقضي مهندسو جوجل، مثل فريدريك ليندستروم من السويد وهويب كلاينهوت من النرويج، ساعات طويلة في اجتماعات跨القارات. وللتغلب على صعوبة اختلاف اللغات، بدأوا منذ عامين تطوير خاصية Speech Translation التي تحوّل الصوت إلى ترجمة فورية بصوت مشابه لصوت المتحدث. الهدف كان جعل المحادثات سلسة، سواء في اجتماعات عمل أو مكالمات شخصية.
من الترجمة النصية إلى الصوت الفوري
في السابق، كانت أنظمة الترجمة تعتمد على خطوات متعددة: نسخ الكلام، ترجمته، ثم تحويله إلى صوت. هذه العملية كانت تستغرق حتى 20 ثانية، ما يجعل المحادثة غير طبيعية. لكن التقدم المفاجئ حدث مع استخدام نماذج كبيرة قادرة على الترجمة الفورية “one-shot”، حيث يبدأ النظام بإخراج الصوت المترجم خلال ثوانٍ قليلة فقط. هذا التطور جعل المحادثة أكثر قرباً للتفاعل البشري المباشر.
تحسين الجودة ومواجهة التحديات
لم يكن الطريق سهلاً. التحدي الأكبر كان في دقة الترجمة، خاصة مع اختلاف اللهجات أو وجود ضوضاء في الخلفية. تعاونت فرق جوجل مع خبراء لغويين لاختبار النماذج وضبطها لتفهم الفوارق الدقيقة بين اللغات.
اللغات المتقاربة مثل الإسبانية والبرتغالية والفرنسية كانت أسهل في المعالجة، بينما مثّلت الألمانية ولغات أخرى أكثر تعقيداً صعوبة إضافية بسبب الاختلافات النحوية والتعبيرات. رغم ذلك، تستمر جوجل في تطوير الميزة بدعم نماذج لغوية أكثر تقدماً قادرة على التقاط النبرة والسخرية والمعاني الضمنية.
دعم اللغات وتوافر الخدمة
حالياً تدعم الميزة الترجمة الفورية بين الإنجليزية والإسبانية، مع خطط لإضافة لغات جديدة مثل الإيطالية، الألمانية، والبرتغالية قريباً. الخدمة متاحة أولاً لمشتركي Google One AI Pro وAI Ultra، ومن المتوقع طرحها لمؤسسات Google Workspace لاحقاً.
تجربة استخدام طبيعية
أشارت جوجل إلى أن زمن التأخير في الترجمة لا يتجاوز 2–3 ثوانٍ، ما يتيح محادثات أكثر سلاسة. والأهم أن الصوت المترجم يحافظ على إيقاع ونبرة المتحدث ليبدو طبيعياً قدر الإمكان، وليس مجرد صوت آلي.
الخصوصية والأمان
أكدت الشركة أن الأصوات المترجمة لا تُخزن، وأن البيانات الصوتية لا تُستخدم في تدريب النماذج، التزاماً بسياسات الخصوصية وحماية المستخدمين.
خطوة لتقريب العالم
بفضل هذه الميزة، أصبح بإمكان المشاركين في الاجتماعات التواصل دون عوائق لغوية. كما قال أحد المطورين: “الآن لديهم لغة مشتركة، فجأة يمكنهم التحدث وكأن الحواجز لم تكن موجودة”. هذه التقنية تعكس كيف يمكن للذكاء الاصطناعي أن يعزز التواصل العالمي ويمهّد لعصر جديد من التفاعل الإنساني.




