來自加州大學洛杉磯分校(UCLA)的兩位生物工程師和一名前博士后學者,共同開發了一類新的仿生三維攝像系統,可以模仿蒼蠅的多視角視覺和蝙蝠的自然聲納感應,實現深度可掃描盲點的多維成像。
在計算圖像處理技術的支持下,該相機可以識別隱藏在角落里或其他遮擋物后面的物體的大小和形狀。這項技術的傳感能力遠超當今前沿技術水平,有望應用于汽車自動駕駛或醫療成像領域,相關研究已經發表在《自然?通訊》上。
在黑暗中,蝙蝠可以通過使用回聲定位(聲納)的形式將周圍的生動畫面可視化。它們不斷發出高頻叫聲,被周圍的環境反射后會被耳朵接收到。通過接收回聲所需的時間和聲音強度的微小差異,蝙蝠可以實時確定行動路徑上物體的位置,以及與潛在獵物的距離。
許多昆蟲都有幾何形狀的復眼,其中每只“眼睛”由數百到數萬個獨立的視覺單位組成,這使得它們能夠從多個視角看到同一物體。例如,蒼蠅的球狀復眼盡管焦距固定,使它們很難看到遠處的物體 —— 比如高舉的蒼蠅拍 —— 但也讓它們擁有近 360 度的視野。
受到這兩種動物的啟發,加州大學洛杉磯分校(UCLA)領導的團隊開始設計一種具有先進功能的高性能 3D 攝像系統。研究負責人、UCLA 薩穆埃里工程學院(Samueli School of Engineering)的生物工程副教授高亮表示:“這個想法雖然之前已經嘗試過,但主要障礙則一直是長距離和圍繞遮擋物的識別。為了解決這個問題,我們開發了一個新的計算成像框架,它首次利用簡單的光學設備和一個小的傳感器陣列,獲得兼具寬度和深度的全景圖像。”
這一框架被稱為“緊湊光場成像”,或稱 CLIP(Compact Light-field Photography),允許相機系統在更大的深度范圍或環繞周圍觀察物體。在實驗中,研究人員證明他們的系統可以“看到”傳統 3D 相機無法發現的隱藏物體。
研究人員還使用了一種“光探測和測距” (Light Detection And Ranging, LiDAR)技術,使用激光掃描周圍環境以創建該區域的三維地圖。如果沒有 CLIP,傳統的激光雷達會對場景進行高分辨率的快照,然而會像人類的眼睛一樣,忽視隱藏的物體。
研究人員使用七臺帶有 CLIP 的 LiDAR 相機陣列拍攝一個場景的低分辨率圖像,處理各個相機的拍攝結果,然后在高分辨率三維成像中重建綜合該場景。結果顯示,該相機系統可以對包含多個不同距離物體的復雜三維場景進行成像。
“如果你遮住一只眼睛,看向你的筆記本電腦,有一個咖啡杯只是稍微藏在電腦后面,你可能就看不到它,因為筆記本電腦擋住了視線。”同樣是加州納米系統研究所成員的高亮解釋說,“但如果你同時用兩只眼睛看,你會得到一個更好的物體視圖。這有點像這里發生的事情,但現在想象一下用昆蟲的復眼看杯子。現在,對物體的多視角觀察是有可能實現的。”
根據高亮的說法,CLIP 能夠幫助相機陣列以類似的方式對隱藏的物體進行觀察。與 LiDAR 相結合,該系統能夠實現蝙蝠回聲定位的效果,因此人們可以通過光反射到相機所需的時間來發現隱藏的物體。