• Landing Page
  • Shop
  • Contact
  • Buy JNews
12-02-2026 | 11:28
  • تسجيل الدخول
وصل بوست
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة
لا توجد نتيجة
عرض كافة النتائج
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة
لا توجد نتيجة
عرض كافة النتائج
وصل بوست
لا توجد نتيجة
عرض كافة النتائج

ميتا تكشف عن نموذج الذكاء الاصطناعي Spirit LM لإنتاج أصوات بشرية طبيعية

صورة توضيحية لنموذج Spirit LM من ميتا، لتوليد أصوات بشرية طبيعية بواسطة تقنيات الذكاء الاصطناعي

صورة توضيحية لنموذج Spirit LM من ميتا، لتوليد أصوات بشرية طبيعية بواسطة تقنيات الذكاء الاصطناعي

أطلقت شركة ميتا “Meta” مؤخرًا نموذجها الجديد “Spirit LM” المفتوح المصدر، الذي يهدف إلى معالجة التحديات المرتبطة بالنماذج المتعددة الوسائط في الذكاء الاصطناعي، خاصة في مجال توليد الأصوات. يتميز هذا النموذج بتقديم تجربة صوتية طبيعية وأكثر تعبيرًا، مما يمثل قفزة نوعية نحو تطوير الروبوتات الذكية القادرة على التواصل الصوتي بطرق معقدة وواقعية.

ما هو نموذج “Spirit LM”؟

يعتمد “Spirit LM” على نموذج لغوي مُدرّب مسبقًا يحتوي على 7 مليارات معلمة، ويتميز بقدرته على معالجة الأصوات بطريقة مختلفة عن النماذج التقليدية التي تعتمد على تقنيات التعرف التلقائي على الكلام (ASR). تُشير ميتا إلى أن تلك النماذج التقليدية تفقد العديد من التعبيرات الطبيعية في الصوت.

قد يعجبك أيضاً

إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet

قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين

Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

تقنيات جديدة للتواصل الصوتي الطبيعي

للتغلب على هذه القيود، يعتمد “Spirit LM” على رموز الفونيم (الوحدات الصوتية) بالإضافة إلى النغمات ودرجات الصوت. هذا التوجه يُمكّن النموذج من إنتاج أصوات طبيعية أكثر، بالإضافة إلى تحسين قدراته في مهام متنوعة مثل تحويل النص إلى صوتالتعرف على الكلام، وتصنيف الأصوات.

التطبيقات المحتملة لـ “Spirit LM”

بفضل ميزاته المتقدمة، يفتح “Spirit LM” الباب أمام العديد من التطبيقات العملية في مجالات مثل:

  • المساعدات الافتراضية: النموذج يمكن أن يحسن من تجربة المساعدات الافتراضية مثل أمازون أليكسا وجوجل أسيستنت، بتقديم تفاعلات صوتية أكثر تعبيرًا وواقعية.
  • خدمة العملاء: تحسين المحادثات مع العملاء لتصبح أكثر طبيعية، مما يزيد من رضى المستخدمين وتقديم خدمة أكثر فعالية.
  • التعليم الإلكتروني: من خلال تقديم محتوى صوتي تعليمي يتفاعل مع الطلاب بطرق طبيعية ويُعزز من فهمهم للمادة.

مقارنة مع النماذج المنافسة

مقارنةً بالنماذج الأخرى في السوق مثل نموذج Whisper من OpenAI أو النماذج الصوتية التي تقدمها Google DeepMind، يتفوق “Spirit LM” بتركيزه على تحسين التعبيرات الصوتية الطبيعية. بينما تعتمد النماذج التقليدية على التعرف التلقائي على الكلام فقط، يُعزز “Spirit LM” من هذه التقنية باستخدام الفونيمات والنغمات لإنتاج تفاعلات صوتية أكثر واقعية.

دعم مفتوح المصدر للمطورين

من الجدير بالذكر أن ميتا كشفت عن تفاصيل البحث الذي أدى إلى تطوير “Spirit LM” في ورقة بحثية، وقدمت عينات من الأداء الصوتي للنموذج لعرض قدراته المستقبلية. النموذج متاح الآن كمشروع مفتوح المصدر للباحثين والمطورين لاستخدامه وتطويره، مما يتيح إمكانية دمجه في تطبيقات ميتا مثل واتساب وإنستاجرام وفيسبوك. مما سيوفر للمستخدمين تجربة محادثات صوتية طبيعية مليئة بالتعبيرات، على غرار ما قدمته شركة OpenAI مؤخرًا.

مستقبل الذكاء الاصطناعي الصوتي

مع تقدم تكنولوجيا الذكاء الاصطناعي، من المتوقع أن يُشكل “Spirit LM” حجر الأساس لتطبيقات الصوت المتقدمة في المستقبل. سنشهد دمجًا أوسع للنماذج الصوتية في حياتنا اليومية، مما سيتيح لنا التفاعل مع الأجهزة الذكية بشكل طبيعي وسلس، مما يعزز من التواصل والتفاعل بين الإنسان والآلة.

مشاركة54تغريد34Pin12
Raghda Osama

Raghda Osama

مقالات ذات صلة

صورة توضح ميزة المكياج المدعوم بالذكاء الاصطناعي في Google Meet أثناء مكالمة فيديو، تُظهر كيف يمنح الفلتر مظهراً طبيعياً واحترافياً للمستخدم.

إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet

2025-10-20
0

كشفت شركة جوجل عن ميزة مبتكرة في تطبيقها Google Meet، تمكن المستخدمين من الظهور بإطلالة أنيقة واحترافية عبر فلتر مكياج...

إعلان شركة OpenAI عن إتاحة محتوى إباحي على ChatGPT للبالغين ضمن تحديث ديسمبر 2025 المثير للجدل.

قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين

2025-10-19
0

سبب إعلان سام ألتمان، الرئيس التنفيذي لشركة OpenAI، موجة جدل واسعة بعد كشفه عن نية الشركة إطلاق تحديث جديد لتطبيق...

واجهة منصة Perplexity AI تُظهر ميزة تعلم اللغات الجديدة بطريقة تفاعلية تعزز مهارات المحادثة والترجمة للمستخدمين

Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

2025-10-19
0

في خطوة تعكس التطور السريع في عالم الذكاء الاصطناعي، كشفت منصة Perplexity AI عن ميزة جديدة تُحدث تحولاً في طريقة...

واجهة تطبيق Gemini Live على هاتف أندرويد تُظهر ميزة الصوت الأصلي الجديدة من جوجل التي تُحاكي الصوت البشري في المحادثة.

جوجل تُوسع طرح Gemini Live مع الصوت الأصلي للأندرويد

2025-10-19
0

أعلنت جوجل مؤخراً عن طرح أوسع لميزة Gemini Live مع دعم الصوت الأصلي في نظام أندرويد، بدءاً من سلسلة هواتف...

اترك تعليقا

وصل بوست

منصة إعلامية مهتمة بالشأن العربي والدولي، توصلك بالأخبار المهمة لحظة بلحظة أين ما كانت وأين ما تكون.

تصنيفات

  • أخبار
  • إقتصاد
  • تاريخ
  • تكنولوجيا
  • رياضة
  • وصِل بوست ميديا

أحدث المقالات

  • إطلاق فلتر المكياج المدعوم بالذكاء الاصطناعي في Google Meet
  • قرار صادم من OpenAI: إطلاق محتوى إباحي على ChatGPT للمستخدمين البالغين
  • Perplexity تطلق ميزة جديدة لتعلم اللغات بأسلوب تفاعلي

جميع الحقوق محفوظة © 2024 شبكة وصِل بوست الاعلامية

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
لا توجد نتيجة
عرض كافة النتائج
  • الرئيسية
  • أخبار
  • إقتصاد
  • تكنولوجيا
  • رياضة

جميع الحقوق محفوظة © 2024 شبكة وصِل بوست الاعلامية