تصميم خاصية استخراج الصوت باستخدام تردد ميل Cepstral الهجين و معامل (MFC)، والإدراك الحسي التنبؤ الخطي (PLP) للتحقق من المتكلم
|
باعتبارها واحدة من اهم الموضوعات في القياسات الحيوية , التعرف على صوت المتكلم يعني بتحديد المتكلم باستخدام صوت الشخص كمقياس البيومترية لتحديد صوت فريد. ميزة الاستخراج كمرحلة أولى في سلسلة مكون النظام تلعب مهمة حاسمة نظرا لأن المعلومات التي تعتمد على اللغة من إشارة المخطابة تستخرج في هذه المرحلة. إن نوعية هذه المرحلة تؤثر بشدة على جودة المكونات التالية في السلسلة. عدد من الأساليب والتقنيات تم اقترحها ومعظمها تم اشتقاقهامن تقنيات التعرف على الكلام مثل الخطي التنبؤي الترميز (LPC) ، إدراكي التنبؤ الخطي (PLP) ، وسجل نسبة المساحة LAR)) ، ميل التردد Cepstral معامل (MFCC) الخ. وعلى الرغم من وجود العديد من التحسينات على تلك التقنيات لتناسب الغرض في التعرف على الاصوات ، فإنه لا يزال حتى الآن أن تكون ناجحة 100 ٪ يرجع ذلك إلى حقيقة أن الكلام هو السلوكية البيومترية التي تتغير مع مرور الوقت وعرضة للبيئة. مع وجود الدافع لدراسة أكثر عمقا حول استخراج المزايا، ومن هذه الفرضية البحثية التي تستخدم تقنيات مختلطة في الحصول على معلومات من شأنها تحسين خطاب التفرد ونوعية المعلومات المتكلم.
|