تكلم بأي صوت و أي لغة بغيتي مع الذكاء الاصطناعي ديال Meta VoiceBox

meta voicebox

الباحثون في مجال الذكاء الاصطناعي في ميتا دارو مؤخرا تقدم كبير في مجال توليد الأصوات والكلام. حيت صنعو نموذج كايتسمى ب “Voicebox”، لي هو أول نموذج قادر يصاوب ليك هضرة عمرها كانت بلا تا ماتحتاج تدرب عليها، جوج ثواني من اي صوت كافي ليه باش يخليك تغول اي كلام بالصوت لي عجبك.

  Voicebox خدام بواحد النهج مبتكر بزايد  يُسمى “مطابقة التدفق” او “Flow Matching” كايخليك تصاوب تسجيلات صوتية بجودة عالية و ببزاف ديال اللغات، لأغراض مختلفة بحال تصنع الصوت، تمسح الضوضاء والصداع ، تصاوب محتوى، وتوليد عينات متنوعة. من طبيعة الحال هاد الاختراع ثوري ويقدر ينفع الطالب والمحترف و اي واحد مهتم يحسن التواصل ديالو او يخلي واحد تايتكلم لغة اجنبية يفهمو بالصوت الاصلي ديالو.

قبل Voicebox، كانت أنظمة توليد الكلام كتحتاج لتدريب محدد لكل مهمة. أما Voicebox، فيقدر يتعلم من البيانات الصوتية الخام والمطابقات الخطية المقابلة لها،لي كتيخليه يصنع الهضرة ويتكيف مع السياق والأساليب المختلفة.

لحد الساعة Meta باقي ماحطاتش النمودج للعموم، بسبب مخاطر الاستعمال ديالو خصوصا فالنصب والاحتيال و زيد بزاف ديال الاستعمالات لي يقدر يتستغل فيها.

للحد من هاد الاستعمالات، meta صنعو واحد المصنف “classifieur” كايخليه يفرق بين الكلام الأصيل والكلام الذي تم الإنشاء ديالو من عند .Meta

أضف تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Translate »