نوع مقاله : مقاله کامل پژوهشی
نویسندگان
1 دانشجوی دکتری مهندسی برق، گروه الکترونیک، دانشکدهی مهندسی برق و کامپیوتر، دانشگاه صنعتی نوشیروانی بابل، بابل، ایران
2 استادیار، گروه الکترونیک، دانشکدهی مهندسی برق و کامپیوتر، دانشگاه صنعتی نوشیروانی بابل، بابل، ایران
3 استاد، دانشکدهی مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجائی، تهران، ایران
چکیده
یکی از اصلیترین تواناییهای شناختی انسان و جانوران، بازشناسی اشیا است. سامانهی بینایی انسان به عنوان یک سامانهی سریع و دقیق میتواند منبع الهام مناسبی برای ارائهی مدلهای محاسباتی بازشناسی اشیا باشد. پژوهشهای پیشین که به بررسی رفتار سامانهی بینایی انسان در بازشناسی اشیا پرداختهاند، بر پردازش طی گامهای زمانی در این سامانه تاکید کردهاند، در حالی که در مدلهای محاسباتی موجود برای بازشناسی اشیا، چنین چیزی مورد توجه قرار نمیگیرد. در این مقاله سعی شده است تا یک مدل چندلایهی مبتنی بر زمان برای بازشناسی اشیا ارائه شود. در لایهی نخست مدل، اطلاعات تصویر ورودی در یک بازنمایی زمانی به لایههای بعدی ارسال میشود. در لایهی میانی مدل، از یک شبکهی عصبی عمیق به عنوان استخراج کنندهی ویژگی استفاده شده است. در پایان، برخلاف مدلهای محاسباتی موجود برای بازشناسی اشیا، پیشنهاد شده است که برای طبقهبندی ویژگیهای استخراج شده از مدلهای تصمیمگیری مبتنی بر سازوکار نورونی تصمیمگیری در مغز مانند مدل رانشی-انتشار استفاده شود. به بیان دیگر، در هر یک از این سه لایه تلاش شده است تا تطبیق مناسبی با سازوکار سامانهی بینایی انسان ایجاد شود. برای ارزیابی کارایی مدل محاسباتی پیشنهادی در بازشناسی اشیا، آزمونهای متعددی انجام شده است. نتایج به دست آمده از بررسی مدل پیشنهادی نشان میدهد که با دشوارتر شدن تصاویر، افزودن نویز یا بروز انسداد، کارایی مدل در بازشناسی اشیا کاهش یافته و زمان پاسخدهی آن افزایش مییابد که این روند با شواهد رفتاری انسانی مطابقت دارد. همچنین عملکرد مدل برای تشخیص شی و طبقهبندی سطح پایه در دو حالت تصاویر اصلی و تصاویر وارونه بررسی شده است. نتایج به دست آمده گویای تفاوت بین پردازش تشخیص شی با طبقهبندی سطح پایه است که این نتایج با آزمایشهای رفتاری گزارش شده در مقالههای مرجع همخوانی دارد.
کلیدواژهها
موضوعات
عنوان مقاله [English]
A Temporal Computational Model for Object Recognition inspired by Human Visual System
نویسندگان [English]
- Naser Sadeghnejad 1
- Mehdi Ezoji 2
- Reza Ebrahimpour 3
1 Ph.D. Student, Electronic Department, Faculty of Electrical and Computer Engineering, Babol Noshirvani University of Technology, Babol, Iran
2 Assistant Professor, Electronic Department, Faculty of Electrical and Computer Engineering, Babol Noshirvani University of Technology, Babol, Iran
3 Professor, Computer Department, Faculty of Computer Engineering, Shahid Rajaee Teacher Training University, Tehran, Iran
چکیده [English]
Object recognition is one of the main cognitive abilities of human and animals. Human visual system, as a fast and accurate system can be a source of inspiration for the computational models of object recognition. Studies on the human visual system have emphasized its processing over time, whereas it is not considered in the conventional computational models of object recognition. In this paper, we attempt to present a time-based multilevel model for object recognition. In the first layer of the model, the input image information is sent to the next layer in a temporal representation. In the middle layer of the model, a deep neural network is used as a feature extractor. Finally, in contrast to the popular computational models for object recognition, a decision-making model such as drift-diffusion model is proposed based on the neuronal decision-making mechanisms in the brain. In other words, adaption to the human visual system has been considered in all of three layers. Several experiments have been conducted to evaluate the performance of the proposed computational model in object recognition. The experimental results show that as the input image becomes more complicated, noise increases, or occlusion occurs, the performance/reaction time of the model decreases/increases, which is consistent with the behavior of human visual system. The performance of the model for object recognition and base-level categorization is also investigated for application of the original images and the inverted images. The results show the difference between the processes of the object recognition and base-level categorization, which is consistent with the behavior of human visual system reported in the referenced papers.
کلیدواژهها [English]
- Object Recognition
- Computational Model
- Deep Neural Network
- Decision Making Model
- Basic Level Categorization