نوع مقاله : مقاله کامل پژوهشی
نویسندگان
1 دانشجوی کارشناسی ارشد برق الکترونیک دیجیتال/ دانشکده برق دانشگاه علم و صنعت ایران
2 استاد/گروه الکترونیک ، دانشگاه علم و صنعت ایران
چکیده
بررسی صدای اندامهای بدن یکی از روشهای تشخیص بیماریهای مختلف است که توسط پزشکان برای تحلیل صداهای عارضهای بکار گرفته میشود، از آنجایی که بیشتر مرگ و میر ناشی از بیماری، در کشورهای فقیری رخ میدهد که کمبود تجهیزات و متخصص دارند، ایجاد روشهای تشخیصی مبتنی بر یادگیری ماشین و پردازش صوت که علاوه بر دردسترس بودن ، غیرتهاجمی و ارزان نیز میباشند با تشخیص زودهنگام میتوانند باعث نجات میلیونها انسان شوند. در مطالعات پیشین غالبا ورودیهای بازتابکنندهی ویژگیهای فرکانسی صوت مورد استفاده قرار گرفته است، دراین مقاله علاوه بر آن از یک نمایش بازگشتی استفاده میکنیم که ویژگیهای زمانی صوت را بازتاب میکند و به عنوان ورودی به شبکههای کانولوشنی داده میشود تا از مزیتهای یادگیری انتقالی آن بهرهمند شویم، با اضافه کردن مکانیزم توجه زمانی و شبکه گیتهای بازگشتی دوطرفه، توالی دادههای صوتی که یک سری زمانی است مورد بررسی قرار میگیرد و هر یک از دادهها با توجه به ارزشی که دارند وزندهی میشوند. دادههای استفاده شده در این مقاله از پایگاه داده صدای ریه ICBHI است که در مقالههای بسیاری استفاده شده است. روش ارائه شده توانست در طبقه بندی صدای ریه به سه دستهی سالم، بیماری انسداد مزمن ریوی(COPD) و سایر بیماری ها به دقت 97 درصد برسد که نتیجه بهتری نسبت به سایر روش های بکار رفته برای این پایگاه داده میباشد.
کلیدواژهها
- تشخیص بیماری
- بیماری ریوی
- پردازش صوت
- نمایش بازگشتی
- توجه زمانی
- شبکه بازگشتی
- یادگیری انتقالی
- یادگیری ماشین
موضوعات
عنوان مقاله [English]
Diagnosing COPD disease through lung sound analysis with focus on temporal features and using a network based on temporal attention and bidirectional recurrent gates
نویسندگان [English]
- davoud saadati 1
- Sattar Mirzakuchaki 2
1 M.Sc, Student, Department of Electrical Engineering, Iran University of Science and Technology
2 Professor/Department of Electrical Engineering, Iran University of Science and Technology,
چکیده [English]
Analysis and examination of sound of organs can be utilized in order to diagnose various diseases and abnormal conditions. Diagnostic methods based on audio signal processing are non-invasive and inexpensive and can be especially useful in under-developed countries, where inadequate medical specialists and equipment has led to high fatality rates. Development of accessible methods based on machine learning can aid with early diagnosis. we used a convolutional network to attain the advantages of transfer learning. In previous studies, models have been proposed that feed spectrograms with frequency characteristics as inputs to the convolutional network. In this article, we propose a model which additionally employs a recurrent representation (Recurrence plot) that reflects the temporal characteristics of the sound. The audio data sequence is investigated by adding the temporal attention mechanism and the bi-directional recurrent gates for weighting data according to its informational value. Data used in this article is from the ICBHI lung sound database. The presented model was able to classify lung sounds into three categories: healthy, chronic obstructive pulmonary disease (COPD), and other diseases with an accuracy of 97%, which shows the superiority of the proposed method compared to results obtained from previous methods on the same database.
کلیدواژهها [English]
- Diagnosis
- Lung disease
- Sound processing
- Recurrence Plot
- Temporal attention
- Recurrent network
- Transfer learning
- machine learning