قبل Voicebox، كانت أنظمة توليد الكلام كتحتاج لتدريب محدد لكل مهمة. أما Voicebox، فيقدر يتعلم من البيانات الصوتية الخام والمطابقات الخطية المقابلة لها،لي كتيخليه يصنع الهضرة ويتكيف مع السياق والأساليب المختلفة.
لحد الساعة Meta باقي ماحطاتش النمودج للعموم، بسبب مخاطر الاستعمال ديالو خصوصا فالنصب والاحتيال و زيد بزاف ديال الاستعمالات لي يقدر يتستغل فيها.
للحد من هاد الاستعمالات، meta صنعو واحد المصنف “classifieur” كايخليه يفرق بين الكلام الأصيل والكلام الذي تم الإنشاء ديالو من عند .Meta