-
- مقدمه
- تضاد یا کنتراست
- دقت یا تیزبینی Acuity
- برخی توهمات بصری
- گروه بندی ادراکی
- منابع
-
1. مقدمه
هرکسی که الگوریتمها یا دستگاههایی را برای پردازش تصویر دیجیتال ایجاد میکند یا از آن استفاده میکند، باید از اصول درک بصری تصویر کاملا شناخت داشته باشد.
اگر قرار است یک تصویر توسط یک انسان تجزیه و تحلیل شود، اطلاعات باید با استفاده از متغیرهایی بیان شود که به راحتی قابل درک هستند.
این متغیر ها پارامترهای روانی-فیزیکی مانند کنتراست، حاشیه، شکل، بافت، رنگ و غیره هستند.
انسان ها فقط در صورتی اشیاء را در تصاویر پیدا می کنند که بدون زحمت از پس زمینه متمایز شوند.
درک انسان از تصاویر یا همان درک بصری تصویر، توهمات بسیاری را برمی انگیزد که درک آنها سرنخ های ارزشمندی در مورد مکانیسم های بصری ارائه می دهد.
برخی از توهمات شناخته شده تر را در ادامه ذکر خواهیم کرد. این موضوع به طور کامل از نقطه نظر بینایی ماشین در [فریسبی، 1979] پوشش داده شده است.
اگر چشم انسان یا سیتیم بینایی پاسخی خطی به محرک های ورودی مرکب داشته باشد، یعنی مجموع ساده ای از محرک های فردی در این صورت وضعیت نسبتاً آسان خواهد بود.
البته باید بیان کرد که کاهش برخی از محرک ها، به عنوان مثال، ناحیه شی در تصویر، می تواند با شدت، کنتراست یا مدت زمان آن جبران شود.
در واقع، حساسیت حواس انسان تقریباً از نظر لگاریتمی با شدت سیگنال ورودی متناسب است. در این حالت، پس از یک تبدیل لگاریتمی اولیه، پاسخ به محرک های مرکب را می توان خطی در نظر گرفت.
2. تضاد یا کنتراست
کنتراست تغییر موضعی در روشنایی است و به عنوان نسبت بین میانگین روشنایی یک شی و پسزمینه تعریف میشود.
به بیان دقیق، اگر هدف ما دقیق بودن از نظر فیزیکی است، باید به جای روشنایی از درخشندگی صحبت کنیم.
چشم انسان از نظر لگاریتمی به روشنایی حساس است، به این معنی که برای همان درک، روشنایی بالاتر به کنتراست بالاتری نیاز دارد.
روشنایی ظاهری به شدت به روشنایی محیط اطراف بستگی دارد. این اثر کنتراست شرطی نامیده می شود. شکل زیر این مورد را با پنج دایره هم اندازه که توسط مربع هایی با روشنایی متفاوت احاطه شده اند، نشان می دهد. چشم انسان روشنایی دایره های کوچک را در این شکل غالبا متفاوت می بیند.
3. دقت یا تیزبینی Acuity
دقت یاAcuity توانایی تشخیص جزئیات در یک تصویر است.
چشم انسان نسبت به تغییرات آهسته و سریع روشنایی در صفحه تصویر حساسیت کمتری دارد اما به تغییرات میانی حساسیت بیشتری دارد. همچنین با افزایش فاصله از محور نوری، دقت تیزبینی کاهش می یابد.
وضوح در یک تصویر کاملاً با توانایی وضوح چشم انسان محدود می شود. نمایش اطلاعات بصری با وضوح بالاتر از بیننده معنایی ندارد.
وضوح در اپتیک به عنوان مقدار معکوس حداکثر زاویه دید بین بیننده و دو نقطه نزدیک تا جایی که چشم انسان نتواند آنها را تشخیص دهد تعریف می شود.
بینایی انسان بهترین وضوح را برای اجسامی دارد که در فاصله حدود 250 میلی متری از چشم تحت نور حدود 500 لوکس قرار دارند.
این روشنایی توسط یک لامپ 60 وات از فاصله 400 میلی متری تامین می شود. در این شرایط فاصله بین دو نقطه قابل تشخیص تقریباً 0.16 میلی متر است.
4. برخی توهمات بصری
درک انسان از تصاویر مستعد بسیاری از توهمات است. برای درمان جامع موضوع، [پالمر، 1999] را ببینید. مرزهای اشیا حاوی اطلاعات زیادی برای انسان هستند. مرزهای اشیاء و الگوهای ساده مانند حباب ها یا خطوط، جلوه های سازگاری مشابه کنتراست شرطی را که در بالا ذکر شد، امکان پذیر می کند.
توهم ابینگهاوس یک مثال شناخته شده است – در شکل زیر به نظر می رسد دو دایره با قطر یکسان در مرکز تصاویر دارای قطرهای متفاوت هستند.
ادراک یک شکل غالب را می توان با اشکال نزدیک فریب داد. شکل زیر سمت چپ بخش های خط مورب موازی را نشان می دهد که به عنوان موازی درک نمی شوند. شکل زیر سمت راست شامل ردیف هایی از مربع های سیاه و سفید است که همگی موازی هستند. با این حال، مربع های زیگزاگ عمودی ادراک افقی ما را مختل می کند.
« مطالب پیشنهادی:
• ساختارهای مرسوم برای داده های تصویر
5. گروه بندی ادراکی
گروهبندی ادراکی [پالمر، 1999] یک اصل است که در بینایی کامپیوتری برای جمعآوری عناصر ارائهشده توسط عملیات سطح پایین مانند لبهها، که حبابهای کوچک تا تکههای بزرگتر هستند، استفاده میشود. ریشه های آن در روانشناسی گشتالت است که برای اولین بار توسط آن فرض شد.
ورتایمر در سال 1912 [برت کینگ و ورتایمر، 2005]. روانشناسی گشتالت پیشنهاد می کند که اصل عملیاتی ذهن و مغز، کل نگر، موازی و با تمایلات خودسازماندهی است.
نظريه گشتالت به اين معنا بود كه كاربرد كلي داشته باشد. با این حال، اصول اصلی آن تقریباً منحصراً از مشاهدات بر روی ادراک بصری ناشی شده است. موضوع اصلی این نظریه این است که تحریک به صورت سازمان یافته یا پیکربندی درک می شود.
گشتالت در آلمانی به معنای پیکربندی، ساختار یا الگوی پدیدههای فیزیکی، بیولوژیکی یا روانشناختی است که بهگونهای یکپارچه شدهاند تا یک واحد عملکردی را با ویژگیهایی تشکیل دهند که از مجموع اجزای آن قابل استخراج نیستند. الگوها بر عناصر ارجحیت دارند و خصوصیاتی دارند که خصوصیات ذاتی خود عناصر نیستند.
توانایی انسان برای گروه بندی اقلام بر اساس ویژگی های مختلف در شکل 2.21 نشان داده شده است. ویژگیهای درک شده به افراد کمک میکند تا عناصر را بر اساس ویژگیهایی که بهشدت درک میشوند بهعنوان موازی، تقارن، پیوستگی و بستهبودن که در شکل 2.22 نشان داده شده است، به یکدیگر متصل کنند.
نشان داده شده است که تقلید گروه بندی ادراکی در سیستم بینایی ماشین یک تکنیک قابل قبول است. این امکان ایجاد تکه های معنی دار تری از اطلاعات را از نتایج بی معنی عملیات سطح پایین مانند تشخیص لبه فراهم می کند.
چنین گروه بندی در درک تصویر مفید است. این اصل در این کتاب عمدتاً برای تقسیم بندی تصویر استفاده خواهد شد.
6. منابع:
Bruce V., Green P. Il., and Georgeson IVI. A. Visual Perception: Physiology, Psychology, and Ecology. Psychology Press, Boston, 3rd edition, 1996.
Palmer, Stephen E. Vision science: Photons to phenomenology. MIT Press, 1999.