بررسی اثر استفاده از روش تطبیق هنجارسازی طول مسیر صوتی به منظور تشخیص اختلالات گفتاری رایج و گفتاردرمانی کودکان فارسی زبان

عزیزی, شهلا; توحیدخواه, فرزاد; الماس‌گنج, فرشاد

doi:10.22041/ijbme.2013.13121

بررسی اثر استفاده از روش تطبیق هنجارسازی طول مسیر صوتی به منظور تشخیص اختلالات گفتاری رایج و گفتاردرمانی کودکان فارسی زبان

نوع مقاله : مقاله کامل پژوهشی

نویسندگان

شهلا عزیزی ¹

فرزاد توحیدخواه ²

فرشاد الماس‌گنج ²

¹ دانش‌آموختة کارشناسی ارشد، گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران

² دانشیار، گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)

https://doi.org/10.22041/ijbme.2013.13121

چکیده

در این مقاله، یک سیستم بازشناسی کلمات جداگانه بررسی شده است. هدف این تحقیق، افزایش کارایی سیستم بازشناسی گفتار کودکان با استفاده از روش هنجارسازی طول مسیر صوتی است. این سیستم بازشناسی، برای استفاده در طراحی نرم‌افزار گفتاردرمانی ایجاد شده است به طوری که این نرم‌افزار با استفاده از سیستم بازشناسی، درست یا نادرست بودن تلفظ کودک را تشخیص می‌دهد و تلاش می‌کند تا با استفاده از بازخوردها گفتار کودک را بهبود بخشد. دادگان گفتاری -که در فاز بازشناسی این سیستم استفاده شده است- مربوط به 47 کلمه و اختلالات تولیدی رایج در آنها است. در این مطالعه، 4 مدل پایه شامل مدل کودکان، مدل ترکیبی کودکان و زنان و دو مدل بزرگسالان (با استفاده از داده‌های فارس‌دات) آموزش داده شده است. داده‌هایی که برای آموزش و آزمون مدل کودکان استفاده شده، مربوط به 38 کودک در بازه سنی 5 تا 8 است. همه مراحل آموزش و آزمون سیستم بازشناسی با استفاده از ابزار HTKانجام شده است. نتایج این پژوهش نشان می‌دهد که کارایی کم سیستم بازشناسی با استفاده از روش تطبیق هنجارسازی طول مسیر صوتی افزایش می‌یابد و بهبود مدل بزرگسالان چشمگیرتر از مدل کودکان است.

کلیدواژه‌ها

بازشناسی گفتار کودکان

هنجارسازی طول مسیر صوتی

تطبیق گوینده

نرم‌افزار گفتاردرمانی کودکان

مدل‌های مارکوف پنهان

موضوعات

پردازش گفتار

عنوان مقاله English

Study of VTLN Method to Recognize Common Speech Disorders in Speech-Therapy of Persian ‍Children

نویسندگان English

Shahla Azizi ¹

Farzad Towhidkhah ²

Farshad Almasganj ²

¹ M. Sc, Bioelectric Department, Faculty of Biomedical Engineering, Amirkabir University of Technology

² Associate Professor, Bioelectric Department, Faculty of Biomedical Engineering, Amirkabir University of Technology

چکیده English

In present work, recognition of isolated word has been studied. The purpose of this research is to increase the performance of children’s speech recognizer using Vocal Tract Length Normalization. This recognition system has been created to design a speech therapy software. Recognition of correct and wrong pronunciation and help children to improve it using some feedbacks are the goals of this software. In test phase, some speech data that are related to correct and incorrect pronunciation of 47 words have been utilized. Four Baseline models have been Trained, one for children, one combined model (females and children) and two for Adults (by exploiting one Persian database). Children’s model was trained and tested with data that have been collected from 38 children (5 to 8 years old). These experiments were implemented in HTK toolkit. Poor performance was improved using VTLN. Improvement of adult’s model was more than children’s model.

کلیدواژه‌ها English

Children speech recognition

Vocal Tract Length Normalization

Speaker adaptation

Children speech therapy software

Hidden Markov Models

[1] Potamianos A., Robust Recognition of Children’s Speech; IEEE transactions on speech and audio processing, 2003; 11(6).

[2] Giuliani D., Gerosa M., investigating recognition of children’s speech; ITC-irst, Center ob Scientific and Technological Research, Trento, Italy, 2003.

[3] Potamianos A., Narayanan S., Acoustics of children’s speech:Developmental changes of temporal and spectral parameters; Journal of Acoust. Soc. Amer, 1999; 105: 1455–1468.

[4] Tadayon Tabrizi Gh., HMM-Based Recognition and Adaptation of Persian Children's Speech; Department of Computer, Science and Research Branch, Islamic Azad University, Tehran, Iran, Contemporary Engineering Sciences, 2011; 4(5): 221 – 228.

[5] تدین تبریزی ق.، ستایشی س.، ارائه روشی مبتنی بر نرمالسازی اکوستیکی و خوشه بندی برای بهبود بازشناسی گفتار کودکان فارسی زبان؛ مجله فنی مهندسی دانشگاه آزاد اسلامی مشهد، دوره سوم، شماره اول، زمستان 88.

[6] باباعلی ب.، صامتی ح.، ویسی ه.، بکارگیری نرمالسازی اثر طول مسیر صوتی گویندهها در سیستم بازشناسی گفتار پیوسته فارسی مبتنی بر مدل مخفی مارکوف؛ سیزدهمین کنفرانس ملی انجمن کامپیوتر ایران، 1386.

[7] Elenius D., Blomberg M., Adaptation and Normalization Experiments in Speech Recognition for 4 to 8 Year old Children; Department of Speech Music and Hearing KTH, Stockholm, Sweden, INTERSPEECH, 2005.

[5] Sanand D.R., Kurimo M., A Study on Combining VTLN and SAT to Improve the Performance of Automatic Speech Recognition; Adaptive Informatics Research Center, Aalto University, Finland, Interspeech, 2011.

[9] Elenius D., Adaptation techniques for children’s speech recognition; KTH/TMH, 2004.

[10] Young S., Evermann G., et al., “The HTK book”, Cambridge University Engineering Department, 2006.

[11]Evandro B., Gouvêa, Acoustic-feature-based Frequency Warping for Speaker Normalization; Department of Electrical and Computer Engineering Carnegie Mellon University, Pittsburgh, Pennsylvania December, 1998.

[12] Feng H., Yuan C., Li Y., Speaker Normalization Method Based On the Piece-Wise Linear Frequency Warping; dept. computer and information engineering, 2009 International Conference on E-Learning, E-Business, Enterprise Information Systems, and E-Government.

دوره 6، شماره 4 - شماره پیاپی 4
زمستان 1391
صفحه 257-265

XML

اصل مقاله 1.63 M

تاریخ دریافت 23 خرداد 1394

تعداد مشاهده مقاله	2,109
تعداد دریافت فایل اصل مقاله	1,111

جستجوی پیشرفته

نشریه علمی مهندسی پزشکی زیستی

بررسی اثر استفاده از روش تطبیق هنجارسازی طول مسیر صوتی به منظور تشخیص اختلالات گفتاری رایج و گفتاردرمانی کودکان فارسی زبان

Study of VTLN Method to Recognize Common Speech Disorders in Speech-Therapy of Persian ‍Children

دوره 6، شماره 4 - شماره پیاپی 4
زمستان 1391
صفحه 257-265

صفحه اصلی

تماس با ما

نشریه علمی مهندسی پزشکی زیستی

بررسی اثر استفاده از روش تطبیق هنجارسازی طول مسیر صوتی به منظور تشخیص اختلالات گفتاری رایج و گفتاردرمانی کودکان فارسی زبان

Study of VTLN Method to Recognize Common Speech Disorders in Speech-Therapy of Persian ‍Children

دوره 6، شماره 4 - شماره پیاپی 4زمستان 1391صفحه 257-265

فایل ها

سابقه مقاله

هم رسانی

ارجاع به این مقاله

آمار

صفحه اصلی

مرور (جست‌وجو)

اطلاعات نشریه

برای نویسندگان

تماس با ما

دوره 6، شماره 4 - شماره پیاپی 4
زمستان 1391
صفحه 257-265