لماذا أنشأنا نظاماً لتحريك الفم لكل صوت عربي

لماذا أنشأنا نظام تحريك الفم لكل صوت عربي

يستخدم Amal تحريكاً للفم بالاعتماد على Rive لإظهار كيفية تشكيل كل صوت عربي — يتحرك فم الشخصية بمزامنة مع نطق الصوت. يساعد هذا النهج البصري-الفونتيكي الأطفال على تعلم النطق بشكل بديهي، خاصةً للأصوات التي لا توجد في الإنجليزية (مثل ع، خ، غ، ح).

المشكلة: تتضمن العربية أصواتاً ليست في الإنجليزية

تشمل الفونتيك العربي:

الحروف الحلقية (ع، ح): تُنتج من عمق الحلق، ولا توجد لها معادلات في الإنجليزية
الحروف اللهوية (ق، خ، غ): تُنتج من الجزء الخلفي من الفم
الحروف المطبقة (ص، ض، ط، ظ): تُنطق بتراجع اللسان

لا يمكن للأطفال تعلم هذه الأصوات من النص فقط — يحتاجون إلى رؤية وضعية الفم. الطريقة التقليدية: يُظهر المعلم ذلك بشكل شخصي. طريقتنا: شخصية AI تُظهر ذلك على الشاشة، بصبر غير محدود ومتاحة دائماً.

كيف يعمل نظام تحريك الفم

محرك الرسوم Rive
Rive (المعروف سابقاً باسم Flare) هو نظام رسوم متحركة ثنائي الأبعاد يحوي دعم للآلات الحركية. نستخدمه لأن:

الآلات الحركية تتيح انتقالات سلسلة بين الوضعيات المختلفة
التحكم في الوقت الحقيقي: نغيّر وضعية الفم برمجياً، بدلاً من تشغيل تسلسلات مُعالجَة مسبقاً
الملف `.riv` الواحد يحتوي جميع حالات التحريك (مقابل مئات من إطارات السبريتات)
معالجة GPU، 60 إطار في الثانية على الأجهزة متوسطة الأداء

خط أنابيب علامات النطق
1. يقوم تحويل النص إلى كلام بإنتاج صوت لـ"أَنَا" (أنا)
2. يعيد TTS "علامات النطق" — طوابع زمنية دقيقة لكل فونيم
3. يتم تعيين الفونيمات في `lip_sync_avatar.json` إلى حالات الفم في Rive
4. يقود `LipSyncController` انتقالات الآلة الحركية بالتزامن مع التشغيل
5. يشاهد الطفل موضع الفم الصحيح في الشخصية بينما يسمع الصوت

TTS Audio + Speech Marks
    ↓
[Extract Phoneme Timing]
    ↓
[Map to Rive States]
    ↓
[Animate Character Mouth]
    ↓
[Child Sees Mouth Position]

تنويعات الشخصيات المتعددة

الشخصية الرئيسية Amal مع تنويعات للجسم الكامل والوجه فقط
الشخصيات الودية التابعة للتنوع وزيادة التفاعل
الأفاتار المخصص: يختار الأطفال شكل الرأس، الملابس، الألوان، الإكسسوارات
الحالات العاطفية: هدوء، حديث، خطأ (تشجيع), احتفال (مديح)

عندما يخصص الأطفال شخصيتهم، يُعلّمهم هذا الأفاتار الشخصي طوال التطبيق — مما يخلق استثمار عاطفي.

لماذا اخترنا Rive (وليس Lottie أو سبريت شيتس)

النهج	الآلات الحركية	التحكم في الوقت الحقيقي	حجم الملف	الأداء	التكلفة
Rive	✓	✓	1.2 MB	60fps	وقت الهندسة
Lottie	✗	جزئي	2-3 MB	30fps	وقت التحريك
سبريتات	✗	يدوي	50+ MB	60fps	تخزين الأصول
فيديو	N/A	✗	100+ MB	متغير	تكلفة الاستضافة

Rive يفوز لأننا نحتاج إلى التحكم البرمجي، انتقالات الآلات، وحجم ملفات مضغوط لتطبيق جوال يخدم أكثر من 95,000 طفل.

التأثير التعليمي

تُظهر الأبحاث أن التعلم البصري-الفونتيكي (مشاهدة وضعية الفم بينما يسمع الصوت) يسرع اكتساب النطق. بياناتنا الداخلية:

الأطفال الذين يشاهدون تحريك الفم يتعلمون النطق أسرع بنسبة 40%
تحسن دقة النطق بثلاثة أضعاف مع التغذية الراجعة البصرية
فعليّة خاصة لأطفال الشتات الذين يفتقرون للمتحدثين بالعربية في المنزل

لماذا لا يستطيع المنافسون مطابقة ذلك

تحتاج لإعادة إنتاج هذا إلى:

خبرة في الفونتيك (معرفة أي وضعيات الفم تناسب أي أصوات)
مهارات في تحريك Rive (ليست بديهية — تصميم الآلة الحركية معقد)
تكامل علامات النطق من TTS (ليس كل مقدمي TTS يقدمون هذا)
تحسين للجوال (رندر Rive عند 60fps عبر الأجهزة)
نظام تخصيص الشخصيات (هندسة الأفاتار القائمة على المكونات)

الأسئلة الشائعة

س: هل يمكن لطفلي ضبط سرعة التحريك؟
ج: نعم. السرعات البطيئة تساعد مع الأصوات الصعبة؛ السرعات العالية تناسب المتعلمين المتقدمين. يتكيف التطبيق بناءً على الأداء.

س: هل تحتوي كل التمارين على تحريك الفم؟
ج: تمارين النطق النصي والصوتي تحتوي على تحريك فمٍ كامل. فوائد واستخدامات أخرى لتمارين أخرى (ألعاب، ألغاز) يخص استخدام الشخصية في التشجيع ورسوم المكافأة.

س: لماذا تُظهر الشخصية أحيانًا تحريك خطأ؟
ج: عندما يكتشف التعرف على الكلام أخطاء في النطق، تُظهر الشخصية تعبير "لنحاول مرة أخرى". هذا مشجع وليس عقابياً — يتعلم الأطفال من خلال المحاولات التكرارية.