نوع مقاله : مقاله کامل پژوهشی

نویسندگان

1 دانشجوی کارشناسی ارشد برق الکترونیک دیجیتال/ دانشکده برق دانشگاه علم و صنعت ایران

2 استاد/گروه الکترونیک ، دانشگاه علم و صنعت ایران

10.22041/ijbme.2023.562783.1805

چکیده

بررسی صدای اندام‌های بدن یکی از روش‌های تشخیص بیماری‌های مختلف است که توسط پزشکان برای تحلیل صداهای عارضه‌ای بکار گرفته میشود، از آنجایی که بیشتر مرگ و میر ناشی از بیماری،‌ در کشورهای فقیری رخ میدهد که کمبود تجهیزات و متخصص دارند، ایجاد روش‌های تشخیصی مبتنی بر یادگیری ماشین و پردازش صوت که علاوه بر دردسترس بودن ، غیرتهاجمی و ارزان نیز میباشند با تشخیص زودهنگام میتوانند باعث نجات میلیون‌ها انسان شوند. در مطالعات پیشین غالبا ورودی‌های بازتاب‌کننده‌ی ویژگی‌های فرکانسی صوت مورد استفاده قرار گرفته است، دراین مقاله علاوه بر آن از یک نمایش بازگشتی استفاده میکنیم که ویژگی‌های زمانی صوت را بازتاب میکند و به عنوان ورودی به شبکه‌های کانولوشنی داده میشود تا از مزیت‌های یادگیری انتقالی آن بهره‌مند شویم، با اضافه کردن مکانیزم توجه زمانی و شبکه گیت‌های بازگشتی دوطرفه، توالی داده‌های صوتی که یک سری زمانی است مورد بررسی قرار میگیرد و هر یک از داده‌ها با توجه به ارزشی که دارند وزن‌دهی میشوند. داده‌های استفاده شده در این مقاله از پایگاه داده صدای ریه ICBHI است که در مقاله‌های بسیاری استفاده شده است. روش ارائه شده توانست در طبقه بندی صدای ریه به سه دسته‌ی سالم، بیماری انسداد مزمن ریوی(COPD) و سایر بیماری ها به دقت 97 درصد برسد که نتیجه بهتری نسبت به سایر روش های بکار رفته برای این پایگاه داده میباشد.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Diagnosing COPD disease through lung sound analysis with focus on temporal features and using a network based on temporal attention and bidirectional recurrent gates

نویسندگان [English]

  • davoud saadati 1
  • Sattar Mirzakuchaki 2

1 M.Sc, Student, Department of Electrical Engineering, Iran University of Science and Technology

2 Professor/Department of Electrical Engineering, Iran University of Science and Technology,

چکیده [English]

Analysis and examination of sound of organs can be utilized in order to diagnose various diseases and abnormal conditions. Diagnostic methods based on audio signal processing are non-invasive and inexpensive and can be especially useful in under-developed countries, where inadequate medical specialists and equipment has led to high fatality rates. Development of accessible methods based on machine learning can aid with early diagnosis. we used a convolutional network to attain the advantages of transfer learning. In previous studies, models have been proposed that feed spectrograms with frequency characteristics as inputs to the convolutional network. In this article, we propose a model which additionally employs a recurrent representation (Recurrence plot) that reflects the temporal characteristics of the sound. The audio data sequence is investigated by adding the temporal attention mechanism and the bi-directional recurrent gates for weighting data according to its informational value. Data used in this article is from the ICBHI lung sound database. The presented model was able to classify lung sounds into three categories: healthy, chronic obstructive pulmonary disease (COPD), and other diseases with an accuracy of 97%, which shows the superiority of the proposed method compared to results obtained from previous methods on the same database.

کلیدواژه‌ها [English]

  • Diagnosis
  • Lung disease
  • Sound processing
  • Recurrence Plot
  • Temporal attention
  • Recurrent network
  • Transfer learning
  • machine learning