جامعة الأمة العربية
جامعة الأمة المقاومة

×

الصفحة الرئيسية المجلس الثقافي

تعرّف الكلام | بقلم: أميمة الدكاك
تعرّف الكلام



بقلم: أميمة الدكاك  
استعرض مقالات الكاتب | تعرف على الكاتب
18-11-2022 - 2992

أثار موضوع الواجهات التخاطبية الكلامية بين الإنسان والآلة، منذ قرابة خمسة عقود، اهتمام المهندسين وعلماء الكلام معاً. ذلك لأن الكلام هو طريقة التواصل الأسهل والأكثر طبيعية بين البشر منذ عشرات القرون. وتسمح مثل هذه الواجهات للسواد من الناس، بالتواصل مع الشبكات الحاسوبية والحصول على المعلومات دون الحاجة إلى أن يكونوا معلوماتيين. وتتطلب هذه الواجهات تقنيات إنتاج الكلام من الحواسيب (تركيب الكلام)، وفهم الآلة الكلام أو تعرف الكلام speech recognition.

ولتعرّف الكلام تطبيقات كثيرة مثل:

1- إعطاء أوامر صوتية وتحكمية كطلب هتف رقم صوتياً، إدخال معطيات صوتية مثل رقم بطاقة الائتمان،

2- إعداد وثائق بنيوية كالوثائق الطبية...وغيرها الكثير.
يُعد تعرّف الكلام إجرائية تُحوِّل الإشارة الصوتية، الملتَقَطة من هاتف أو ميكرفون إلى مجموعة كلمات؛ قد تكون هذه الكلمات هي النتيجة المرجوة النهائية، كما في التطبيقات المذكورة سابقاً، وقد تخدم كدخل إلى نظم معالجة لغوية لاحقة للحصول على فهم الكلام لإعطاء تفسير لهذا الكلام والتصرف على أساسه. وقد صار لدينا خوارزميات ونظم تعرف كلام عالية الأداء.
موسطات عملية تعرف الكلام
ثمة كثير من الموسطات parameters التي تميز نظم التعرف المختلفة:
1ـ طريقة لفظ الكلام: نميز بين نظم تعرف الكلمات المعزولة (مجموعة مفردات) حيث يتوقف المتكلم عن الكلام برهة بين كلمة وأخرى، ونظم تعرف الكلمات المتصلة (مثل أرقام الهواتف) التي لا تتطلب مثل هذا التوقف، ونظم تعرف الكلام العفوي والارتجالي الذي يتضمن مفردات واسعة وانقطاعات في السلاسة، وهو أصعب من النظم السابقة.
2ـ حجم المفردات المختلفة التي يمكن أن يتعرفها النظام: صغير (حتى مئة مفردة)، متوسط (يصل إلى 1000 مفردة)، واسع (يزيد على 1000 مفردة).
3ـ علاقة النظام بالمتحدثين: يمكن أن نميز ثلاثة أنواع من نظم التعرف: نظم مرتبطة بالمتحدث، وهي تتطلب إدخال عينات من كلام كل مستخدم جديد، نظم مستقلة عن المتحدث speaker independent لا تتطلب العملية السابقة، ونظم متكيفة مع المتحدث قادرة على تحسين أدائها بالنسبة لكل متحدث على حدة في أثناء استخدامه للنظام، مع مرور الزمن.
4ـ مقدار المعرفة الصوتية والمعجمية في نظم التعرف: تراوح من نظم بسيطة لا تتضمن أي معلومات لغوية إلى نظم معقدة تكامل المعرفة الصوتية واللغوية النحوية والدلالية والسياقية.
نحتاج لتعرف الكلام المستمر، إلى نماذج لغوية وقواعد صنعية لتقييد تراكب الكلمات. يمكن أن يكون النموذج اللغوي بسيطاً، مثل شبكة حالات منتهية، بحيث نصرح عن الكلمات التي يمكن أن تتلو كلمة معينة. أو أن يكون أكثر عمومية، بحيث نقترب من اللغة الطبيعية باستعمال قواعد حساسة للسياق. يمكن قياس صعوبة هذه المهمة بموسط يسمى الإرباك perplexity، ويعرف على أنه المتوسط الهندسي لعدد الكلمات التي يمكن أن تلي كلمة معينة، بعد تحديد النموذج اللغوي.
صعوبات تعرّف الكلام وحلولها
تكمن صعوبة مسألة تعرف الكلام في تنوع شكل الإشارة الكلامية الموافقة للكلمة نفسها، ويمكن تصنيف هذه التغيرات كما يأتي:
1ـ تغيرات تتعلق بالمتحدث نفسه: إذ يمكن أن تنشأ تغيرات صوتية بحسب تغيرات الحالة الفيزيولوجية والنفسية للشخص (هل هو مريض أو صحيح، حزين أو فرح أو غاضب...)، وبحسب معدل كلامه (سريع أو بطيء)، وبحسب جودة صوته (يقصد الإفهام أو يتكلم على نحو عارض).
2ـ تغيرات بين المتحدثين: تتبع الخلفية الاجتماعية ـ اللغوية لهم مثل، اللهجة وأبعاد وشكل جهازهم الصوتي الفيزيولوجي vocal tract.
3ـ التحقيق الصوتي للصوتيمات phonemes: وهي أصغر الوحدات الصوتية التي يمكن أن تتركب منها الكلمات، ويعتمد هذا التحقيق اعتماداً كبيراً على السياق الذي تُلفَظ فيه. على سبيل المثال، يختلف لفظ الصوت /ب/ من الكلمة «باب» إلى الكلمة «سبت»، فهو في الأولى /b/ وفي الثانية /p/.
4ـ اختلاف محيط المتحدث: وهذا ناتج عن وجود إشارات صوتية غير مرغوب فيها (متحدثين آخرين، ضجيج، إغلاق باب...)، أو عن تنوع الميكرفونات المستخدمة ومكان توضعها.
توجد عدة نماذج لنظم تعرف الكلام منها النموذج الأكثر استخداماً تجارياً وصناعياً؛ وذلك لأنه يصلح مهما تغيرت المفردات أو تبدل المتحدثون أو مجموعة موسطات التمثيل أو خوارزمية البحث، وكذلك لسهولة برمجته وأدائه الجيد. ويستخدم هذا النموذج للتعرف على الكلمات المعزولة والمتصلة. يبين الشكل الآتي المكونات النموذجية لمثل هذا النظام:

وهذا يسمى نظام ترّف كلام نموذجي : 
معطيات التجريب:
الاشارات الكلامية التي تتفرع عنها التمثيل والتي يتفرع عن التمثيل النمذجة والتصنيف ومن ثم
البحث ويتضمن :
1- نماذج لغوية والنماذج الصوتية والنماذج الصوتية
يُعمد في البدء إلى تحليل الإشارة الكلامية بهدف تحويلها إلى تمثيل مضغوط قادر على تمييز الخصائص properties المتغيرة مع الزمن للكلام (موسطات ترددية أو معاملات ترميز التنبؤ الخطي أو غيرها، تحسب على نوافذ زمنية 10-30 ms بسبب الطبيعة المتغيرة للكلام)، أو إلى توصيف إحصائي لتسلسل الأصوات المختلفة ضمن الكلمات (نموذج ماركوف المخفي Hidden Markov Model (HMM).
يتطلب هذا النموذج عملية تدريب تسبق عملية التعرف يجري ضمنها استخلاص سمات مرجعية للمفرادت التي نرغب في تعرفها. من أجل التعرف على مفردة ما نعمد إلى موازنة سماتها مع السمات المرجعية لجميع المفردات المرجعية للبحث على المفردة الأقرب إليها. وللحصول على تعرف أمثل يمكن الإفادة من التقييدات الصوتية والمعجمية والنماذج اللغوية للغة المستعملة.
من الجدير بالذكر أن هناك طرق أخرى للتعرف تعتمد على تحديد القطع الصوتية وتصنيفها ثم استعمالها للتعرف على الكلمات، وذلك بالاستفادة من تقانات الذكاء الصنعي التي تحاول تقليد عملية تعرّف الكلام عند البشر. كما يمكن استعمال تقانة الشبكات العصبونية في التعرف مع نموذج ماركوف المخفي المشار إليه سابقاً.
تحاول نظم تعرف الكلام، نمذجة مصادر التغييرات المذكورة سابقاً، على عدة مستويات. فعلى مستوى تمثيل الإشارة، طور الباحثون طرق تمثيل تؤكد السمات الحسية الهامة للإشارة الكلامية، المستقلة عن المتحدث، وتخفف من أثر الصفات المعتمدة على المتحدث. وعلى المستوى الصوتي، جرت نمذجة تغييرات المتحدث باستعمال تقنيات إحصائية مطبَّقة على كم هائل من المعطيات. وكذلك، جرى تطوير خوارزميات مواءمة المتحدث، تناسب النماذج الصوتية المستقلة عن المتحدث لتوائم النماذج الصوتية للمتحدث الحالي أثناء استعماله للنظام. كما جرى تدريب النظم على نماذج مختلفة لمقاطع الأصوات في سياقات مختلفة لأخذ تغيّراتها بالحسبان. أما على مستوى الكلمات، فيجري تدريب النظم على مختلف ألفاظ الكلمات وحسب لهجات متعددة، وجرى استعمال نماذج لغوية إحصائية تعتمد على تقدير تردد ورود سلاسل الكلمات لقيادة البحث عن الكلمات الأكثر احتمالاً.
الحالة الراهنة: 
يمكن قياس أداء نظم التعرف بمعدل الخطأ الذي يُعرَّف بالعلاقة: E=(S+I+D)*100/N حيث N هو العدد الكلي لمفردات التعرف، S عدد الاستبدالات (تعرف كلمة مكان أخرى)، I عدد الإدراجات (تعرف كلمات غير ملفوظة أصلاً)، D عدد المحذوفات (عدم تعرف كلمة ملفوظة). وقد تطورت تقانات تعرف الكلام كثيراً في الفترة الأخيرة، وأدى هذا إلى خفض معدل الخطأ السابق بنسبة 50٪ (إلى النصف) كل عامين تقريباً. ويعود هذا التطور إلى عدة عوامل منها:
1ـ تطور تقنيات نموذج ماركوف المخفي HMM التي تساعد على الحصول على أداء أفضل بعد معالجة معطيات التدريب آلياً.
2ـ الجهود المبذولة عالمياً لبناء مدونات قياسية ضخمة، لتطبيقات الكلام، ولعدد من اللغات العالمية.
3ـ تقييس تقويم أداء مختلف نظم التعرف، وهذا ما زاد في وثوقية مراقبة تطور هذه النظم.
4ـ أثر التطور الحاصل في مجال التقانات الحاسوبية تأثيراً غير مباشر في تطور هذا العلم. فحواسيب اليوم أسرع من سابقاتها، وأرخص ثمناً وأكثر سعة.
يزداد الاهتمام، اليوم، بنظم التعرف عبر الشبكات الهاتفية والخلوية، حيث يزيد معدل تعرف الكلمات عبر المحادثات الهاتفية على 50٪.
فيما يأتي بعض أسماء نظم تعرف الكلام:
ـ تحت نظام ماكنتوش:
Dragon Dictation Products
ـ تحت نظام وندوز (ومنها وندوز 95 وNT و3.1(:
AT&T Watson Speech Recognition
Cambridge Voice for Windows
* DragonDictate for Windows
ـ تحت نظام دوس
DATAVOX - French
Dragon Developer Tools
ـ تحت النظام Unix
AbbotDemo * BBN Hark Telephony Recognizer * EARS: Single Word Recognition Package*Hidden Markov Model Toolkit (HTK) from Entropic
يختلف أداء نظم التعرف بحسب التطبيق والتقانات المستعملة، وفيما يأتي مثالان عن أداء هذه النظم:
ـ نظام تعرف الأرقام باللغة الإنكليزية:مستقل عن المتحدث، الأرقام ملفوظة على نحو مستمر وبعرض حزمة هاتفية، معامل الإرباك 11. معدل الخطأ 0.3٪ حين يكون عدد الأرقام في السلسلة معروفاً.
- نظام تعرف لأغراض الإملاء: حجم المفردات يتجاوز 20000، معامل الإرباك نحو 200، لكلام مستمر، مستقل عن المتحدث، كان معدل الخطأ في عام 1994 نحو 7.2٪.
التوجهات المستقبلية ومجالات البحث
إن محاور البحث الآتية يمكن أن تزيد من أداء نظم تعرف الكلام:
1ـ المتانة والمناعة: عدم تأثر أداء النظام كثيراً حين تتغير حالات استثماره عن حالات تدريبه.
2ـ الحَمُولة: عدم الحاجة إلى إعادة تدريب النظم مع اختلاف التطبيقات، لأن الأمر مكلف مادياً وزمانياً.
3ـ نمذجة اللغة: وضع قيود على النماذج اللغوية، مثل القيود النحوية syntactic والدلالية semantic التي لا يمكن نمذجتها بنماذج إحصائية بحتة.
4ـ كلمات من خارج المفردات: تمكين النظام من اكتشاف الكلمات الجديدة من خارج المفردات، بحيث لا تسبب الكلمة الجديدة الخطأ.
5ـ الكلام العفوي: القدرة على التعامل مع مختلف ظواهر الكلام العفوي مثل، إضافة توقفات، أخطاء، بنى غير قواعدية، تردد وإحجام.
6ـ نمذجة الحركة الديناميكية للعضلات الكلامية: كيف ننمذجها ونكاملها ضمن نظام التعرف.


تابعنا على مواقع التواصل الاجتماعي
Facebook
youtube

جميع الحقوق محفوظة
لموقع جامعة الأمة العربية
© 2013 - 2022
By N.Soft

حمل تطبيق الجامعة لأجهزة آندرويد
Back to Top

       كنعاني: أمريكا شريك أساسي في جرائم الكيان الصهيوني في غزة//الخارجية الإيرلندية: العالم في صدمة من مستوى اللاإنسانية داخل غزة//المالكي أمام العدل الدولية: الاحتلال الإسرائيلي يجب أن ينتهي والوقت حان لوضع حد لازدواجية المعايير//       أعرب خبراء في الأمم المتحدة عن قلقهم بشأن انتهاكات الاحتلال الإسرائيلي الجسيمة لحقوق الإنسان التي لا تزال تتعرض لها النساء والفتيات الفلسطينيات في قطاع غزة والضفة الغربية.//بعد تأمين شحنات الأسلحة اللازمة من إدارة بايدن.. “إسرائيل” تحضر لمجازر جديدة في رفح//الأونروا: المنظومة الإنسانية في غزة على وشك الانهيار//       طوفان الأقصى:وزارة الصحة الفلسطينية تطالب بضغط دولي على الاحتلال لإدخال الوقود والمساعدات لمستشفيات قطاع غزة//ملتقى تضامني بدمشق دعماً للشعب الفلسطيني بمواجهة عدوان وجرائم الاحتلال الصهيوني//107 شهداء و145 جريحاً جراء مجازر الاحتلال في قطاع غزة خلال الساعات الـ 24 الماضية//       أخبار محلية:وزارة الدفاع في بيان اليوم: “تمكنت وحدات من قوات حرس الحدود في الجيش العربي السوري من مصادرة 445 كفاً من مادة الحشيش المخدر، إضافة إلى 120 ألف حبة كبتاغون في البادية السورية بالقرب من الحدود الأردنية”.//الأمانة السورية للتنمية تنظم جلسة بعنوان “دمج التراث الثقافي غير المادي في التعليم.. تجارب وآفاق جديدة” بمؤتمر اليونيسكو في الإمارات//       سماحة السيدنصر الله يبحث مع النخالة الأوضاع في غزة والضفة الغربية//       الصحة العالمية تعرب عن قلقها إزاء الاعتداءات الإسرائيلية على رفح وتدعو لوقف إطلاق النار//164 شهيداً جراء مجازر الاحتلال في قطاع غزة خلال الساعات الـ 24 الماضية//الرئاسة الفلسطينية تطالب المجتمع الدولي وخاصة الإدارة الأمريكية بمنع الاحتلال من اجتياح رفح//المقاومة الفلسطينية: مجازر الاحتلال في رفح إمعان في حرب الإبادة الجماعية ومحاولات التهجير القسري//استشهاد أكثر من 100 فلسطيني بقصف طيران الاحتلال مدينة رفح//مظاهرات في مدن عدة حول العالم تنديداً بالعدوان الإسرائيلي على قطاع غزة//برنامج الأغذية العالمي يحذر من عدم توفر طعام ومأوى لمعظم سكان غزة//الصيادون في غزة: الاحتلال دمر الميناء والمراكب وحرمنا رزقنا//       للشهر الرابع… استمرار معاناة أهالي الحسكة بتوقف محطة مياه علوك جراء اعتداءات الاحتلال التركي// طوفان الأقصى:لمقاومة الفلسطينية تستهدف بقذائف الهاون موقع قيادة لجيش العدو الصهيوني وسط مدينة خان يونس جنوب قطاع غزة//       وزير الخارجية والمغتربين الدكتور فيصل المقداد يلتقي نظيره الإيراني حسين أمير عبد اللهيان والوفد المرافق في دمشق//جريح الوطن: تدريب دفعة جديدة من الجرحى على برامج قيادة الحاسب//       أخبار محلية:الرئيس الأسد يستقبل وزير الخارجية الإيراني ويبحث معه العلاقات الثنائية بين البلدين والتطورات في المنطقة//السيدة أسماء الأسد خلال زيارتها هيئة التميز والإبداع: الوصول لمنظومة كاملة للتعليم الإبداعي يكون عبر ترسيخ ثنائية العلم والمعرفة مع الهوية والانتماء//المقداد يلتقي وفداً برلمانياً ليبياً برئاسة يوسف إبراهيم العقوري//       دعا مندوب فلسطين الدائم لدى الأمم المتحدة رياض منصور مجلس الأمن إلى تحمل مسؤولياته الكاملة، لوقف العدوان الإسرائيلي المتواصل على قطاع غزة.//عبد اللهيان: استمرار دعم واشنطن لكيان الاحتلال لن يجلب لها إلا الفشل//       الأونروا: الوضع الإنساني في رفح ميئوس منه//اشتية يدعو لتدخل دولي عاجل لمنع امتداد رقعة العدوان الإسرائيلي وجرائم الإبادة إلى مدينة رفح//دان مسؤول السياسة الخارجية بالاتحاد الأوروبي جوزيب بوريل تصريحات رئيس حكومة الاحتلال الإسرائيلي بنيامين نتنياهو حول مخطط التوغل البري في مدينة رفح جنوب قطاع غزة وتهجير الأهالي منها قسرياً.//المقاومة اللبنانية تستهدف تجمعات ومواقع العدو الإسرائيلي التجسسية على الحدود مع فلسطين المحتلة//