درک بصری تصویر  

    1. مقدمه
    2. تضاد یا کنتراست
    3. دقت یا تیزبینی  Acuity
    4. برخی توهمات بصری
    5. گروه بندی ادراکی
    6. منابع 

       

      درک بصری تصویر

  1. 1. مقدمه

هرکسی که الگوریتم‌ها یا دستگاه‌هایی را برای پردازش تصویر دیجیتال ایجاد می‌کند یا از آن استفاده می‌کند، باید از اصول درک بصری تصویر کاملا شناخت داشته باشد.
اگر قرار است یک تصویر توسط یک انسان تجزیه و تحلیل شود، اطلاعات باید با استفاده از متغیرهایی بیان شود که به راحتی قابل درک هستند.
این متغیر ها پارامترهای روانی-فیزیکی مانند کنتراست، حاشیه، شکل، بافت، رنگ و غیره هستند.    
انسان ها فقط در صورتی اشیاء را در تصاویر پیدا می کنند که بدون زحمت از پس زمینه متمایز شوند.
درک انسان از تصاویر یا همان درک بصری تصویر، توهمات بسیاری را برمی انگیزد که درک آنها سرنخ های ارزشمندی در مورد مکانیسم های بصری ارائه می دهد.
برخی از توهمات شناخته شده تر را در ادامه ذکر خواهیم کرد. این موضوع به طور کامل از نقطه نظر بینایی ماشین در [فریسبی، 1979] پوشش داده شده است.
اگر چشم انسان یا سیتیم بینایی پاسخی خطی به محرک های ورودی مرکب داشته باشد، یعنی مجموع ساده ای از محرک های فردی در این صورت وضعیت نسبتاً آسان خواهد بود.
البته باید بیان کرد که کاهش برخی از محرک ها، به عنوان مثال، ناحیه شی در تصویر، می تواند با شدت، کنتراست یا مدت زمان آن جبران شود.
در واقع، حساسیت حواس انسان تقریباً از نظر لگاریتمی با شدت سیگنال ورودی متناسب است. در این حالت، پس از یک تبدیل لگاریتمی اولیه، پاسخ به محرک های مرکب را می توان خطی در نظر گرفت.

2. تضاد یا کنتراست

کنتراست تغییر موضعی در روشنایی است و به عنوان نسبت بین میانگین روشنایی یک شی و پس‌زمینه تعریف می‌شود.
به بیان دقیق، اگر هدف ما دقیق بودن از نظر فیزیکی است، باید به جای روشنایی از درخشندگی صحبت کنیم.
چشم انسان از نظر لگاریتمی به روشنایی حساس است، به این معنی که برای همان درک، روشنایی بالاتر به کنتراست بالاتری نیاز دارد.
روشنایی ظاهری به شدت به روشنایی محیط اطراف بستگی دارد. این اثر کنتراست شرطی نامیده می شود. شکل زیر این مورد را با پنج دایره هم اندازه که توسط مربع هایی با روشنایی متفاوت احاطه شده اند، نشان می دهد. چشم انسان روشنایی دایره های کوچک را در این شکل غالبا متفاوت می بیند.

درک بصری تصویر
اثر کنتراست شرطی دایره های داخل مربع دارای روشنایی یکسان هستند و به عنوان دارای مقادیر روشنایی متفاوت تلقی می شوند

 

3. دقت یا تیزبینی  Acuity

دقت یاAcuity  توانایی تشخیص جزئیات در یک تصویر است.
چشم انسان نسبت به تغییرات آهسته و سریع روشنایی در صفحه تصویر حساسیت کمتری دارد اما به تغییرات میانی حساسیت بیشتری دارد. همچنین با افزایش فاصله از محور نوری، دقت تیزبینی کاهش می یابد.
وضوح در یک تصویر کاملاً با توانایی وضوح چشم انسان محدود می شود. نمایش اطلاعات بصری با وضوح بالاتر از بیننده معنایی ندارد.
وضوح در اپتیک به عنوان مقدار معکوس حداکثر زاویه دید بین بیننده و دو نقطه نزدیک تا جایی که چشم انسان نتواند آنها را تشخیص دهد تعریف می شود.
بینایی انسان بهترین وضوح را برای اجسامی دارد که در فاصله حدود 250 میلی متری از چشم تحت نور حدود 500 لوکس قرار دارند.
این روشنایی توسط یک لامپ 60 وات از فاصله 400 میلی متری تامین می شود. در این شرایط فاصله بین دو نقطه قابل تشخیص تقریباً 0.16 میلی متر است.

4. برخی توهمات بصری

درک انسان از تصاویر مستعد بسیاری از توهمات است. برای درمان جامع موضوع، [پالمر، 1999] را ببینید. مرزهای اشیا حاوی اطلاعات زیادی برای انسان هستند. مرزهای اشیاء و الگوهای ساده مانند حباب ها یا خطوط، جلوه های سازگاری مشابه کنتراست شرطی را که در بالا ذکر شد، امکان پذیر می کند.
توهم ابینگهاوس یک مثال شناخته شده است – در شکل زیر به نظر می رسد دو دایره با قطر یکسان در مرکز تصاویر دارای قطرهای متفاوت هستند.
درک بصری تصویر
ادراک یک شکل غالب را می توان با اشکال نزدیک فریب داد. شکل زیر سمت چپ بخش های خط مورب موازی را نشان می دهد که به عنوان موازی درک نمی شوند. شکل زیر سمت راست شامل ردیف هایی از مربع های سیاه و سفید است که همگی موازی هستند. با این حال، مربع های زیگزاگ عمودی ادراک افقی ما را مختل می کند.
درک بصری تصویر

« مطالب پیشنهادی:

ساختارهای مرسوم برای داده های تصویر

نرم افزار 3D Slicer

5. گروه بندی ادراکی

گروه‌بندی ادراکی [پالمر، 1999] یک اصل است که در بینایی کامپیوتری برای جمع‌آوری عناصر ارائه‌شده توسط عملیات سطح پایین مانند لبه‌ها، که حباب‌های کوچک تا تکه‌های بزرگ‌تر هستند، استفاده می‌شود. ریشه های آن در روانشناسی گشتالت است که برای اولین بار توسط آن فرض شد.
ورتایمر در سال 1912 [برت کینگ و ورتایمر، 2005]. روانشناسی گشتالت پیشنهاد می کند که اصل عملیاتی ذهن و مغز، کل نگر، موازی و با تمایلات خودسازماندهی است.
نظريه گشتالت به اين معنا بود كه كاربرد كلي داشته باشد. با این حال، اصول اصلی آن تقریباً منحصراً از مشاهدات بر روی ادراک بصری ناشی شده است. موضوع اصلی این نظریه این است که تحریک به صورت سازمان یافته یا پیکربندی درک می شود.
گشتالت در آلمانی به معنای پیکربندی، ساختار یا الگوی پدیده‌های فیزیکی، بیولوژیکی یا روان‌شناختی است که به‌گونه‌ای یکپارچه شده‌اند تا یک واحد عملکردی را با ویژگی‌هایی تشکیل دهند که از مجموع اجزای آن قابل استخراج نیستند. الگوها بر عناصر ارجحیت دارند و خصوصیاتی دارند که خصوصیات ذاتی خود عناصر نیستند.
درک بصری تصویر
توانایی انسان برای گروه بندی اقلام بر اساس ویژگی های مختلف در شکل 2.21 نشان داده شده است. ویژگی‌های درک شده به افراد کمک می‌کند تا عناصر را بر اساس ویژگی‌هایی که به‌شدت درک می‌شوند به‌عنوان موازی، تقارن، پیوستگی و بسته‌بودن که در شکل 2.22 نشان داده شده است، به یکدیگر متصل کنند.

نشان داده شده است که تقلید گروه بندی ادراکی در سیستم بینایی ماشین یک تکنیک قابل قبول است. این امکان ایجاد تکه های معنی دار تری از اطلاعات را از نتایج بی معنی عملیات سطح پایین مانند تشخیص لبه فراهم می کند.
چنین گروه بندی در درک تصویر مفید است. این اصل در این کتاب عمدتاً برای تقسیم بندی تصویر استفاده خواهد شد.

6. منابع:

Bruce V., Green P. Il., and Georgeson IVI. A. Visual Perception: Physiology, Psychology, and Ecology. Psychology Press, Boston, 3rd edition, 1996.
Palmer, Stephen E. Vision science: Photons to phenomenology. MIT Press, 1999.

اشتراک گذاری

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *