本文由「Light科普坊」出品
撰稿:范旭浩
審核:左超
導(dǎo)讀
當(dāng)我們拿起手機(jī)對(duì)準(zhǔn)面部,屏幕瞬間解鎖。你或許未曾察覺(jué),就在這短短一瞬,手機(jī)前方正悄然上演一場(chǎng)“光的演出”——數(shù)萬(wàn)個(gè)無(wú)形的紅外光點(diǎn)被精準(zhǔn)投射到面部,完成高安全性身份識(shí)別。而在工業(yè)車間內(nèi),工程師手持掃描設(shè)備滑過(guò)機(jī)械零件表面,明暗條紋掠過(guò),零件的三維數(shù)字模型便同步呈現(xiàn)在屏幕上。這些場(chǎng)景的實(shí)現(xiàn),都離不開(kāi)一項(xiàng)核心技術(shù):結(jié)構(gòu)光投影。它用不可見(jiàn)的光束完成了從現(xiàn)實(shí)到數(shù)字的轉(zhuǎn)換,構(gòu)建出物理世界的精確復(fù)制。
與依賴環(huán)境光和物體紋理的傳統(tǒng)視覺(jué)系統(tǒng)不同,結(jié)構(gòu)光技術(shù)憑借其雙主動(dòng)特性(主動(dòng)投射光源、主動(dòng)探測(cè)反饋),能在光照不均或紋理匱乏的環(huán)境中穩(wěn)定工作,展現(xiàn)出優(yōu)異的魯棒性和測(cè)量精度。如今,從消費(fèi)電子到智能制造,結(jié)構(gòu)光正逐步成為機(jī)器“看懂”三維世界的關(guān)鍵工具,重塑我們與數(shù)字世界的交互方式。
圖1:基于結(jié)構(gòu)光的人臉識(shí)別和機(jī)械零件三維重建
圖源:Light科普坊/作者創(chuàng)作
小百科1:什么是結(jié)構(gòu)光?
結(jié)構(gòu)光是一種主動(dòng)式三維成像技術(shù),它通過(guò)向物體表面投射預(yù)設(shè)的光學(xué)圖案(如條紋或點(diǎn)陣),并通過(guò)觀察圖案的變形來(lái)“推測(cè)”物體的三維形狀。結(jié)合高分辨率攝像與幾何計(jì)算,結(jié)構(gòu)光系統(tǒng)能夠在短時(shí)間內(nèi)重建物體表面的空間結(jié)構(gòu)。
圖2:結(jié)構(gòu)光投影及采集過(guò)程示意圖
圖源:南京理工大學(xué)智能計(jì)算成像實(shí)驗(yàn)室
無(wú)形光陣:手機(jī)面部識(shí)別的結(jié)構(gòu)光技術(shù)解密
以iPhone為例[1],TrueDepth相機(jī)系統(tǒng)會(huì)在面部投射出超過(guò)三萬(wàn)個(gè)肉眼不可見(jiàn)的紅外光點(diǎn),如同一張無(wú)形光網(wǎng)覆蓋整張臉。這些光點(diǎn)在遇到不同的面部結(jié)構(gòu),如鼻梁、眼眶、面頰時(shí),會(huì)因起伏而產(chǎn)生細(xì)微的位移,這些變形正是系統(tǒng)感知三維形貌的關(guān)鍵。首先,紅外投影器將點(diǎn)陣圖案均勻打在面部表面;隨后,專用攝像頭捕捉變形后的圖案影像。系統(tǒng)通過(guò)幾何計(jì)算反推出每一個(gè)光點(diǎn)的空間位置,進(jìn)而構(gòu)建出一張專屬用戶的三維深度圖。這張圖不僅包含臉部的輪廓線條,更記錄了面部微小凹凸細(xì)節(jié),如眉骨高度、顴骨弧度等,形成每個(gè)人獨(dú)一無(wú)二的“空間簽名”[2]。
圖3:三維結(jié)構(gòu)光人臉識(shí)別流程
圖源:Light科普坊/作者創(chuàng)作
二維識(shí)別只依賴圖像紋理,容易被照片或仿真模型欺騙;而結(jié)構(gòu)光基于真實(shí)立體結(jié)構(gòu),只有在空間坐標(biāo)完全匹配的前提下才能通過(guò)驗(yàn)證。因此,即使面對(duì)高分辨率的偽裝圖像或立體面具,系統(tǒng)依然能夠有效拒絕“冒充者”。結(jié)構(gòu)光讓機(jī)器真正“看見(jiàn)”了人臉的立體形態(tài)。也正因?yàn)檫@種精準(zhǔn)而可靠的感知能力,人臉識(shí)別不只是解鎖屏幕的工具,它已成為手機(jī)支付、賬戶認(rèn)證等高安全場(chǎng)景中的核心技術(shù)。借由這張無(wú)形光陣,三維信息感知技術(shù)讓“刷臉”真正變得安全而可信。
從點(diǎn)陣解析到三維重建:結(jié)構(gòu)光的數(shù)學(xué)魔法
在結(jié)構(gòu)光系統(tǒng)中,光不僅僅是用來(lái)照明的,而是主動(dòng)參與到三維世界的解析過(guò)程中。系統(tǒng)會(huì)將特定的光學(xué)圖案投射到物體表面,這些圖案在遇到不同的表面曲率時(shí)會(huì)發(fā)生精細(xì)的形變(如圖4所示)。系統(tǒng)通過(guò)計(jì)算這些形變中的幾何關(guān)系,推算出物體的空間深度結(jié)構(gòu)。這是一種將“光的變形”翻譯為“空間形狀”的技術(shù),其原理基于三角測(cè)量、投影幾何和圖像重建等數(shù)學(xué)方法。
圖4:基于三角測(cè)量的深度識(shí)別
圖源:Light科普坊/作者創(chuàng)作
根據(jù)投射圖案的形態(tài)特征,結(jié)構(gòu)光系統(tǒng)主要分為點(diǎn)陣式和條紋式兩大類。點(diǎn)陣式結(jié)構(gòu)光通過(guò)VCSEL(垂直腔面發(fā)射激光器)或EEL(邊緣發(fā)射激光器)配合DOE(衍射光學(xué)元件)實(shí)現(xiàn),投射離散的光點(diǎn)陣列,強(qiáng)調(diào)對(duì)坐標(biāo)點(diǎn)的精準(zhǔn)控制。如圖5所示,不同類型的結(jié)構(gòu)光圖案可以通過(guò)DOE等衍射光學(xué)元件靈活實(shí)現(xiàn)。以iPhone手機(jī)的Face ID為代表,這種方式特別適合用于復(fù)雜表面或細(xì)節(jié)區(qū)域的快速建模與三維重建。條紋式結(jié)構(gòu)光則通過(guò)DLP(數(shù)字光處理器)、MEMS掃描器或物理光柵來(lái)投影連續(xù)的光柵圖案,可對(duì)大面積目標(biāo)進(jìn)行高密度掃描,因此廣泛應(yīng)用于工業(yè)檢測(cè)和自動(dòng)化測(cè)量中。為了提高測(cè)量精度和抗干擾能力,這兩類結(jié)構(gòu)光系統(tǒng)都可以采用編碼技術(shù),其中彩色編碼通過(guò)引入多種波長(zhǎng)或顏色信息,利用光譜維度進(jìn)行空間編碼,特別適合在復(fù)雜光照或動(dòng)態(tài)環(huán)境中進(jìn)行穩(wěn)定識(shí)別。
圖5:基于衍射光學(xué)元件的結(jié)構(gòu)光生成
圖源:Light科普坊/作者創(chuàng)作
近年來(lái),微納光學(xué)的發(fā)展為結(jié)構(gòu)光投影帶來(lái)了更多新可能。例如,研究人員利用超構(gòu)表面(metasurface)技術(shù),在微米尺度上精確控制光的相位、振幅和偏振,從而實(shí)現(xiàn)結(jié)構(gòu)光圖案的靈活生成與快速切換。相比傳統(tǒng)的投影方式,超構(gòu)表面具有體積小、無(wú)需電源驅(qū)動(dòng)、可適應(yīng)多種波長(zhǎng)等優(yōu)勢(shì)。得益于像素尺寸的縮小,這類器件甚至可以實(shí)現(xiàn)接近360°視場(chǎng)角的結(jié)構(gòu)光投影[3],如圖6所示?;诔砻娴墓鈭?chǎng)調(diào)控器件為結(jié)構(gòu)光系統(tǒng)的小型化和集成化提供了全新路徑。
圖6:基于超表面的結(jié)構(gòu)光生成[4,5]
圖源:
Nano Letters2020, 20(9), 6719–6724,
Nature Communications2022, 13(1), 1–10
在三維重建中,圖像只是中間產(chǎn)物,最終構(gòu)建的是承載深度與結(jié)構(gòu)信息的空間點(diǎn)云,是從圖像走向模型的關(guān)鍵橋梁。結(jié)構(gòu)光系統(tǒng)通過(guò)幾何解算,將投影圖案在圖像中的二維像素還原為三維坐標(biāo),生成可計(jì)算、可建模的空間數(shù)據(jù)集,如圖7所示。高質(zhì)量點(diǎn)云的生成依賴于精準(zhǔn)的投影控制、高速圖像采集與魯棒的重建算法。點(diǎn)云生成后,可進(jìn)一步擬合為連續(xù)表面、體素模型或數(shù)字孿生結(jié)構(gòu),開(kāi)啟空間數(shù)字化進(jìn)程。如果說(shuō)圖像是二維世界的快照,那么點(diǎn)云就是三維空間的原始語(yǔ)言,而結(jié)構(gòu)光正是讓機(jī)器“理解幾何”的起點(diǎn)。從一束光到一個(gè)模型,從圖案到坐標(biāo),這場(chǎng)光與算法的協(xié)作,構(gòu)成了三維重建的數(shù)學(xué)魔法。
圖7:結(jié)構(gòu)光投影及三維重建
圖源:南京理工大學(xué)智能計(jì)算成像實(shí)驗(yàn)室[6]
小百科2:什么是點(diǎn)云數(shù)據(jù)?
點(diǎn)云是一種用于表達(dá)三維形狀的數(shù)據(jù)集合,由大量帶有空間坐標(biāo)(X, Y, Z)的離散點(diǎn)組成,常由結(jié)構(gòu)光、激光雷達(dá)等三維掃描技術(shù)生成。它記錄了物體或場(chǎng)景表面的幾何特征,是三維重建、數(shù)字建模和機(jī)器人感知等應(yīng)用的核心數(shù)據(jù)形式。
圖8:三維點(diǎn)云圖
圖源:Wiki
數(shù)字孿生:物理世界的虛擬鏡像
獲取高精度的三維點(diǎn)云數(shù)據(jù),是構(gòu)建數(shù)字世界的第一步。當(dāng)這些數(shù)據(jù)不斷更新,并接入傳感器、計(jì)算系統(tǒng)和控制平臺(tái)后,一個(gè)與現(xiàn)實(shí)對(duì)象實(shí)時(shí)聯(lián)動(dòng)的“數(shù)字鏡像”便逐漸成形。這個(gè)虛擬模型不僅復(fù)刻了物理結(jié)構(gòu),還具備實(shí)時(shí)感知環(huán)境、反饋狀態(tài)變化,甚至預(yù)測(cè)未來(lái)趨勢(shì)的能力,這就是近年來(lái)備受關(guān)注的數(shù)字孿生。
不同于傳統(tǒng)的“一次性建?!?,數(shù)字孿生強(qiáng)調(diào)持續(xù)更新與長(zhǎng)周期在線運(yùn)行,因此在智能制造、智慧城市、遠(yuǎn)程醫(yī)療、數(shù)字文保等領(lǐng)域展現(xiàn)出廣泛應(yīng)用前景。例如,在制造工廠中,數(shù)字孿生可以實(shí)時(shí)監(jiān)測(cè)設(shè)備運(yùn)行狀態(tài),預(yù)測(cè)潛在故障并提前干預(yù);在城市管理中,它可構(gòu)建出“虛擬城市沙盤”,幫助管理者直觀掌握交通、能源、水利等系統(tǒng)的動(dòng)態(tài)狀態(tài)。在這一過(guò)程中,結(jié)構(gòu)光技術(shù)扮演著關(guān)鍵角色。作為一種非接觸、高精度、響應(yīng)快的三維感知方式,它能迅速獲取物體或場(chǎng)景的空間形狀,廣泛應(yīng)用于工業(yè)質(zhì)檢、城市感知、醫(yī)療建模等場(chǎng)景,是實(shí)現(xiàn)“物理–數(shù)字映射”的基礎(chǔ)工具。
更重要的是,數(shù)字孿生已不再是單一技術(shù)的產(chǎn)物,而是正在與人工智能大模型、物聯(lián)網(wǎng)平臺(tái)、具身智能系統(tǒng),乃至元宇宙環(huán)境深度融合。在這一融合體系中,結(jié)構(gòu)光提供真實(shí)世界的幾何“底座”,AI大模型賦予系統(tǒng)強(qiáng)大的認(rèn)知與推理能力,而具身智能系統(tǒng)進(jìn)一步讓“虛擬體”能夠主動(dòng)感知、行動(dòng)與決策。這些新興技術(shù)的協(xié)同發(fā)展,正在推動(dòng)數(shù)字孿生從“靜態(tài)映射”邁向“智能決策”,不僅映射現(xiàn)實(shí),更助力預(yù)測(cè)未來(lái)、優(yōu)化管理,成為構(gòu)建未來(lái)智慧社會(huì)的關(guān)鍵引擎。
圖9:飛機(jī)制造中的數(shù)字孿生應(yīng)用
圖源:Light科普坊/Veer
小百科3:數(shù)字孿生與虛擬現(xiàn)實(shí)的區(qū)別?
虛擬現(xiàn)實(shí)(VR)是一種以人為中心的沉浸式技術(shù),用戶借助頭顯設(shè)備進(jìn)入一個(gè)完全由計(jì)算機(jī)生成的三維環(huán)境,強(qiáng)調(diào)的是視覺(jué)、聽(tīng)覺(jué)甚至觸覺(jué)的交互體驗(yàn)。數(shù)字孿生則是一種以現(xiàn)實(shí)系統(tǒng)為核心的功能性建模技術(shù),它在虛擬空間中構(gòu)建一個(gè)與真實(shí)物理對(duì)象或過(guò)程保持實(shí)時(shí)同步的數(shù)字模型。其重點(diǎn)不在沉浸感,而在于“同步感”,能夠感知現(xiàn)實(shí)狀態(tài)、反饋?zhàn)兓Y(jié)果、預(yù)測(cè)未來(lái)行為。前者是虛構(gòu)的沉浸空間,后者是現(xiàn)實(shí)世界的功能鏡像。
展望未來(lái):技術(shù)迭代與應(yīng)用創(chuàng)新
結(jié)構(gòu)光的原理源于對(duì)光與幾何關(guān)系的精準(zhǔn)控制,乍看之下只是“打光”與“成像”的組合,實(shí)則承載著人類理解空間、重構(gòu)現(xiàn)實(shí)的技術(shù)雄心。從人臉識(shí)別到工業(yè)建模,它以一束看不見(jiàn)的光,不斷拓展機(jī)器認(rèn)知世界的邊界。未來(lái),隨著數(shù)字孿生技術(shù)的普及,我們或?qū)碛忻恳粋€(gè)物理對(duì)象的數(shù)字映像,實(shí)時(shí)運(yùn)行、不斷演化,而結(jié)構(gòu)光正是推動(dòng)這一空間數(shù)字化進(jìn)程的關(guān)鍵起點(diǎn)。結(jié)構(gòu)光的演進(jìn),正如它照亮的對(duì)象,始于邊界,也將穿越邊界;未來(lái),它不僅幫助我們“看清”世界,更將成為重新定義“現(xiàn)實(shí)”的重要工具。
相關(guān)文獻(xiàn)
[1] About Face ID advanced technology, https://support.apple.com/en-us/102381
[2] 左超, 等. 3D真的來(lái)了嗎?—三維結(jié)構(gòu)光傳感器漫談. 紅外與激光工程 2020, 49(3): 0303001
[3] Eunsue Choi, et. al. 360° structured light with learned metasurfaces.
Nature Photonics2024, 18(8), 848-855. DOI: 10.1038/s41566-024-01450-x
[4] Yibo Ni, et. al. Metasurface for structured light projection over 120° field of view.
Nano Letters2020, 20(9), 6719–6724
[5] Gyeongtae Kim, et. al. Metasurface-driven full-space structured light for three-dimensional imaging.
Nature Communications2022, 13(1), 1–10. DOI: 10.1038/s41467-022-32117-2
[6] 《iPhone 15 Pro“空間視頻”+“3D結(jié)構(gòu)光”技術(shù)淺析:為影像添加一個(gè)新維度》,https://mp.weixin.qq.com/s/p2NNBMvN56Nx8_P95F3G_A
來(lái)源:中國(guó)光學(xué)
編輯:亦山
轉(zhuǎn)載內(nèi)容僅代表作者觀點(diǎn)
不代表中科院物理所立場(chǎng)
如需轉(zhuǎn)載請(qǐng)聯(lián)系原公眾號(hào)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.