نوع مقاله: مقاله کامل پژوهشی

نویسندگان

1 گروه الکترونیک، دانشکده مهندسی برق و کامپیوتر، دانشگاه نوشیروانی بابل. بابل، ایران.

2 گروه الکترونیک، دانشکده مهندسی برق و کامپیوتر

3 دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی، تهران، ایران.

10.22041/ijbme.2020.119227.1548

چکیده

یکی از اصلی‌ترین توانایی‌های شناختی انسان‌ و جانوران بازشناسی اشیا است. سامانه بینایی انسان به عنوان سامانه‌ای سریع و دقیق می‌تواند منبع الهام برای ارائه مدل‌های محاسباتی بازشناسی اشیا باشد. پژوهش‌های پیشین که به بررسی رفتار سامانه‌ی بینایی انسان در بازشناسی اشیا پرداخته‌اند، بر پردازش طی گام‌های زمانی در این سامانه تاکید کرده‌اند، در حالی که در مدل‌های محاسباتی موجود برای بازشناسی اشیا ، چنین چیزی مورد توجه قرار نمی‌گیرد. در این مقاله، تلاش می‌شود تا مدلی چندلایه مبتنی بر زمان برای بازشناسی اشیا ارائه شود. در لایه‌ی نخست مدل، اطلاعات تصویر ورودی در یک بازنمایی زمانی به لایه‌های بعدی ارسال می‌شود. در لایه میانی مدل، از یک شبکه عصبی عمیق به عنوان استخراج‌کننده ویژگی استفاده می‌شود. در پایان، برخلاف مدل‌های محاسباتی موجود بازشناسی اشیا، پیشنهاد می‌شود که برای طبقه‌بندی ویژگی‌های استخراجی از مدل‌های تصمیم‌گیری مبتنی بر سازوکار نرونی تصمیم‌گیری در مغز مانند مدل رانشی-انتشار استفاده شود. به بیان دیگر، در هر یک از این سه لایه، تلاش شده تا تطبیق مناسبی با سازوکار سامانه بینایی انسان اندیشه شود. برای ارزیابی کارایی مدل‌ محاسباتی پیشنهادی در بازشناسی اشیا، آزمون‌های متعددی انجام شده است. نتایج بدست آمده از بررسی مدل پیشنهادی نشان می‌دهد که با دشوارتر شدن تصاویر، افزودن نویز یا بروز انسداد، کارایی مدل در بازشناسی اشیا کاهش می‌یابد و زمان پاسخ‌دهی آن افزایش می‌یابد که این روند با شواهد رفتاری انسانی مطابقت دارد. همچنین عملکرد مدل برای تشخیص شی و طبقه بندی سطح پایه در دو حالت تصاویر اصلی و تصاویر وارونه بررسی شده است. نتایج بدست آمده گویای تفاوت بین پردازش تشخیص شی با طبقه‌بندی سطح پایه است که این نتایج با آزمایش‌های رفتاری گزارش شده در مقاله‌های مرجع هم‌خوانی دارد.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Temporal Computational Model for Object Recognition Inspired by Human Visual System

نویسندگان [English]

  • Naser Sadeghnejad 1
  • Mehdi Ezoji 2
  • Reza Ebrahimpour 3

1 Electronic Department, Faculty of Electrical and Computer Engineering, Babol Noshirvani University of Technology, Babol, Iran

2 Electronic Department, Electrical and Computer Engineering Faculty, Babol Noshirvani University of Technology, Babol, Iran

3 Faculty of Computer Engineering, Shahid Rajaei Teacher Training University, Tehran, Iran

چکیده [English]

Object recognition is one of the main cognitive abilities of human and animals. Human visual system, as a fast and accurate system can be a source of inspiration for the computational models of object recognition. Studies on the human visual system have emphasized its processing over time, whereas it is not considered in the conventional computational models of object recognition. In this paper, we attempt to present a time-based multilevel model for object recognition. In the first layer of the model, the input image information is sent to the next layer in a temporal representation. In the middle layer of the model, a deep neural network is used as a feature extractor. Finally, in contrast to the popular computational models for object recognition, a decision-making models such as drift-diffusion model is proposed based on the neuronal decision-making mechanisms in the brain. In other words, adaption to the human visual system has been considered in all of three layers. Several experiments have been conducted to evaluate the performance of the proposed computational model in object recognition. The experimental results show that as the input image becomes more complicated, noise increases, or occlusion occurs, the performance/reaction time of the model decreases/increases, which is consistent with the behavior of human visual system. The performance of the model for object recognition and base-level categorization is also investigated for application of the original images and the inverted images. The results show the difference between the processes of the object recognition and base-level categorization, which is consistent with the behavior of human visual system reported in the referenced papers.

کلیدواژه‌ها [English]

  • Object Recognition
  • Computational Models
  • Deep Neural networks
  • Decision Making Models
  • Basic Level Categorization