نوع مقاله : مقاله کامل پژوهشی
نویسندگان
1 دانشآموختة کارشناسی ارشد، گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران
2 دانشیار، گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)
چکیده
در این مقاله، یک سیستم بازشناسی کلمات جداگانه بررسی شده است. هدف این تحقیق، افزایش کارایی سیستم بازشناسی گفتار کودکان با استفاده از روش هنجارسازی طول مسیر صوتی است. این سیستم بازشناسی، برای استفاده در طراحی نرمافزار گفتاردرمانی ایجاد شده است به طوری که این نرمافزار با استفاده از سیستم بازشناسی، درست یا نادرست بودن تلفظ کودک را تشخیص میدهد و تلاش میکند تا با استفاده از بازخوردها گفتار کودک را بهبود بخشد. دادگان گفتاری -که در فاز بازشناسی این سیستم استفاده شده است- مربوط به 47 کلمه و اختلالات تولیدی رایج در آنها است. در این مطالعه، 4 مدل پایه شامل مدل کودکان، مدل ترکیبی کودکان و زنان و دو مدل بزرگسالان (با استفاده از دادههای فارسدات) آموزش داده شده است. دادههایی که برای آموزش و آزمون مدل کودکان استفاده شده، مربوط به 38 کودک در بازه سنی 5 تا 8 است. همه مراحل آموزش و آزمون سیستم بازشناسی با استفاده از ابزار HTKانجام شده است. نتایج این پژوهش نشان میدهد که کارایی کم سیستم بازشناسی با استفاده از روش تطبیق هنجارسازی طول مسیر صوتی افزایش مییابد و بهبود مدل بزرگسالان چشمگیرتر از مدل کودکان است.
کلیدواژهها
- بازشناسی گفتار کودکان
- هنجارسازی طول مسیر صوتی
- تطبیق گوینده
- نرمافزار گفتاردرمانی کودکان
- مدلهای مارکوف پنهان
موضوعات
عنوان مقاله [English]
Study of VTLN Method to Recognize Common Speech Disorders in Speech-Therapy of Persian Children
نویسندگان [English]
- Shahla Azizi 1
- Farzad Towhidkhah 2
- Farshad Almasganj 2
1 M. Sc, Bioelectric Department, Faculty of Biomedical Engineering, Amirkabir University of Technology
2 Associate Professor, Bioelectric Department, Faculty of Biomedical Engineering, Amirkabir University of Technology
چکیده [English]
In present work, recognition of isolated word has been studied. The purpose of this research is to increase the performance of children’s speech recognizer using Vocal Tract Length Normalization. This recognition system has been created to design a speech therapy software. Recognition of correct and wrong pronunciation and help children to improve it using some feedbacks are the goals of this software. In test phase, some speech data that are related to correct and incorrect pronunciation of 47 words have been utilized. Four Baseline models have been Trained, one for children, one combined model (females and children) and two for Adults (by exploiting one Persian database). Children’s model was trained and tested with data that have been collected from 38 children (5 to 8 years old). These experiments were implemented in HTK toolkit. Poor performance was improved using VTLN. Improvement of adult’s model was more than children’s model.
کلیدواژهها [English]
- Children speech recognition
- Vocal Tract Length Normalization
- Speaker adaptation
- Children speech therapy software
- Hidden Markov Models