نوع مقاله : مقاله کامل پژوهشی
نویسندگان
1 دکتری مهندسی پزشکی، پژوهشکده مهندسی برق و فناوری اطلاعات، سازمان پژوهش های علمی و صنعتی ایران، تهران
2 همکار طرح، گروه بیوالکتریک، پژوهشکده مهندسی برق و فناوری اطلاعات، سازمان پژوهش های علمی و صنعتی ایران، تهران
3 استادیار، گروه بیوالکتریک، پژوهشکده مهندسی برق و فناوری اطلاعات، سازمان پژوهش های علمی و صنعتی ایران، تهران
چکیده
سرطان پستان رایجترین نوع سرطان در بین زنان است. مطالعات پاتولوژیک نشان داداند که بیش از80% ناهنجاری های پستان در مراحل اولیه خوشخیم هستند، بنابراین مهمترین مسأله در درمان آن تشخیص زودهنگام است. ترموگرافی مادون قرمز پستان یک روش تصویرگیری مبتنی بر ثبت الگوهای توزیع دمایی بافت پستان است و در مقایسه با ماموگرافی پستان به دلیل غیرتهاجمی، غیرتماسی، غیرفعال بودن و عدم استفاده از تابش یونیزان روشی بسیار مناسب درتشخیص زودهنگام سلول های سرطانی است. در این مقاله روشی به منظور آشکارسازی خودکار نواحی مشکوک در تصاویر ترموگرام پستان با هدف کمک رساندن به پزشکان در تشخیص زودهنگام این سرطان ارائه شده است، به نحوی که دقت و صحت را افزایش داده و درصد پذیرش اشتباه را کاهش می دهد. این الگوریتم شامل 4 بخش اصلی پردازش تصویر، استخراج ویژگی، انتخاب ویژگی و طبقهبندی است. در مرحلهی پردازش، ابتدا براساس عملیاتی تمام خودکار، ناحیهی مطلوب تعیین شده، کیفیت تصاویر ارتقاء یافته و سپس پستان راست و چپ از یکدیگر جدا میشوند. سپس درایههای ماتریس تصویر، نرمالسازی شده و نواحی نسبی مشکوک تعیین می شوند. پس از آن و در مرحلهی استخراج ویژگی، ویژگیهای آماری، ویژگیهایی مبتنی بر هیستوگرام، ویژگیهایی مبتنی بر ماتریس هموقوعی (GLCM)، ویژگیهایی بر اساس مورفولوژی نواحی مشکوک و ویژگی هایی در حوزهی فرکانس از هر یک از نواحی بخشبندی شدهی پستان راست و چپ استخراج میشوند. در ادامه برای دستیابی به بهترین ویژگیها، روشهای انتخاب ویژگی نظیر کمترین افزونگی و بیشترین ارتباط (mRMR)، انتخاب متوالی روبه جلو (SFS)، انتخاب متوالی روبه عقب (SBS)، انتخاب متوالی سیال روبه جلو (SFFS)، انتخاب متوالی سیال روبه عقب (SFBS) و الگوریتم ژنتیک (GA) بهکار گرفته میشود. در پایان برای طبقهبندی و تعیین معیار استاندارد برای تحلیل دمای عروقی پستانها (TH)، روشهای مختلف طبقهبندی مانند AdaBoost، ماشینهای بردار پشتیبان (SVM)، نزدیکترین همسایه (KNN)، بیزین ساده (NB) و شبکهی عصبی احتمالی (PNN) مورد ارزیابی قرار گرفتند، تا از مناسب ترین آنها به منظور طبقهبندی ویژگیها استفاده شود. نتایج بهدست آمده روی پایگاه دادهی بومی، بیانگر کارایی قابلتوجه روش پیشنهادی است. با توجه به نتایج، ترکیب mRMR با AdaBoost با بیشینه صحت 92% و ترکیب SFFS با AdaBoost با بیشینه صحت 88%، بهترتیب بهترین ترکیبات بهدست آمده روی تصاویر پستان راست و چپ ارزیابی شدند.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Full Automatic Classification of Suspicious Areas in Breast Thermo Images for Early Cancer Detection
نویسندگان [English]
- Amir Ehsan Lashkari 1
- Fatemeh Pak 2
- Mohammad Firouzmand 3
1 Ph.D, Department of Bio-Medical Engineering, Institute of Electrical Engineering & Information Technology, Iranian Research Organization for Science and Technology (IROST), Tehran, Iran
2 Colleague, Department of Bio-Medical Engineering, Institute of Electrical Engineering & Information Technology, Iranian Research Organization for Science and Technology (IROST), Tehran, Iran
3 Assistant Professor, Department of Bio-Medical Engineering, Institute of Electrical Engineering & Information Technology, Iranian Research Organization for Science and Technology (IROST), Tehran, Iran
چکیده [English]
Breast cancer is the most common type of cancer among women. The important key to treat the breast cancer is early detection of it because according to many pathological studies more 80% of all abnormalities are still benign at primary stages; so in recent years, many studies and extensive research done to early detection of breast cancer with higher precision and accuracy. Infra-red breast thermography is an imaging technique based on recording temperature distribution patterns of breast tissue. Compared with breast mammography technique, thermography is more suitable technique because it is noninvasive, non-contact, passive and free ionizing radiation. In this paper, a full automatic high accuracy technique for classification of suspicious areas in thermogram images with the aim of assisting physicians in early detection of breast cancer has been presented. Proposed algorithm consists of four main steps: pre-processing & segmentation, feature extraction, feature selection and classification. At the first step, using full automatic operation, region of interest (ROI) determined and the quality of image improved. Using thresholding and edge detection techniques, both right and left breasts separated from each other. Then relative suspected areas become segmented and image matrix normalized due to the uniqueness of each person's body temperature. At feature extraction stage, 23 features, including statistical, morphological, frequency domain, histogram and Gray Level Co-occurrence Matrix (GLCM) based features are extracted from segmented right and left breast obtained from step 1. To achieve the best features, feature selection methods such as mRMR, SFS, SBS, SFFS, SFBS and GA have been used at step 3. Finally to classify and TH labeling procedures, different classifiers such as AdaBoost, SVM, kNN, NB and PNN are assessed to find the best suitable one. The results obtained on native database showed the best and significant performance of the proposed algorithm in comprise to the similar studies. According to experimental results, mRMR combined with AdaBoost with the maximum accuracy of 92%, and SFFS combined with AdaBoost with a maximum accuracy of 88%, are the best combination of feature selection and classifier for evaluation of the right and left breast images respectively.
کلیدواژهها [English]
- Breast cancer
- Breast Thermography
- Thermogram
- feature selection
- Classification
- TH