研究人員如今通過一個單一的模糊影像搞清了大腦如何準確地評估聚焦誤差
這是我們一直認為理所當然的事情:看一個或近或遠的物體,,并在瞬間形成注視焦點的能力,。人類和許多動物的眼睛幾乎能在很短的時間里、以驚人的準確性完成這一過程,。如今研究人員表示,,他們向著搞清大腦如何完成這一壯舉又邁進了一步。
美國得克薩斯大學奧斯汀分校感知系統中心的心理學家Wilson Geisler和Johannes Burge如今研制出了一種簡單的算法,,能夠快速而準確地評估從一個單一模糊的影像產生的聚焦誤差,,他們說這是理解生物視覺系統如何避免采用同數碼相機類似的重復推測和檢查方法的關鍵所在,。研究人員表示,,這一發(fā)現有望推進我們對于人類如何患上近視眼的理解,或者幫助工程師改進數碼相機,。
為了清晰地觀看事物,,對模糊的影像進行準確的評估是至關重要的,。Geisler解釋說,,人類和動物能夠本能地提取模糊影像的關鍵特征,,利用這些信息確定它們與物體的距離,隨后立即將眼睛精確調節(jié)到想要的焦距,。
然而科學家并不知道生物視覺系統是如何很好地評估模糊影像的,。許多研究人員曾認為,,大腦使用了一套推測再檢查的系統來找到答案——就像一部照相機的自動對焦系統。Burge說,,基本上,照相機會改變焦距,,測量影像的對比度,,并重復這一過程直至擁有最大的對比度,。
Burge表示:“這一探索過程是緩慢的,,往往研究一開始便選錯了方向,,并依賴于最大對比度等于最佳焦距的假設——而這從嚴格意義上來說是不正確的。”
在這項研究中,,Geisler和Burge利用眾所周知的數學方程式形成了對人類視覺系統的計算機模擬,。他們向計算機提供了類似于人眼看到的自然場景的數字圖像,,例如面孔,、花或風景,,并觀察到,,盡管這些圖像的內容千變萬化,,但是其中的許多特征——銳度和模糊強度,,以及細節(jié)的相對量——卻是保持不變的,。
兩位科學家隨后通過向模型中添加一套濾光片來嘗試模擬人類視覺系統如何處理這些影像,。研究人員在計算機模擬中通過系統地改變焦距誤差來模糊這些影像,并測試濾光片的響應,。他們發(fā)現,,他們能夠通過在特征檢測器中觀察到的響應模式來預測聚焦誤差的準確數量。研究人員表示,,這為人類和動物的大腦如何能夠快速而準確地確定聚焦誤差而不用推測和檢查提供了一個潛在的解釋。研究人員在日前的美國《國家科學院院刊》網絡版上報告了這一研究成果,。(生物谷 Bioon.com)
doi:10.1073/pnas.1108491108
PMC:
PMID:
Optimal defocus estimation in individual natural images
Johannes Burge1 and Wilson S. Geisler
Defocus blur is nearly always present in natural images: Objects at only one distance can be perfectly focused. Images of objects at other distances are blurred by an amount depending on pupil diameter and lens properties. Despite the fact that defocus is of great behavioral, perceptual, and biological importance, it is unknown how biological systems estimate defocus. Given a set of natural scenes and the properties of the vision system, we show from first principles how to optimally estimate defocus at each location in any individual image. We show for the human visual system that high-precision, unbiased estimates are obtainable under natural viewing conditions for patches with detectable contrast. The high quality of the estimates is surprising given the heterogeneity of natural images. Additionally, we quantify the degree to which the sign ambiguity often attributed to defocus is resolved by monochromatic aberrations (other than defocus) and chromatic aberrations; chromatic aberrations fully resolve the sign ambiguity. Finally, we show that simple spatial and spatio-chromatic receptive fields extract the information optimally. The approach can be tailored to any environment–vision system pairing: natural or man-made, animal or machine. Thus, it provides a principled general framework for analyzing the psychophysics and neurophysiology of defocus estimation in species across the animal kingdom and for developing optimal image-based defocus and depth estimation algorithms for computational vision systems.