網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

結(jié)構(gòu)光：從手機(jī)人臉解鎖到數(shù)字孿生

2025-08-28 14:15:09　來(lái)源: 中科院物理所

北京舉報(bào)

分享至

本文由「Light科普坊」出品

撰稿：范旭浩

審核：左超

導(dǎo)讀

當(dāng)我們拿起手機(jī)對(duì)準(zhǔn)面部，屏幕瞬間解鎖。你或許未曾察覺(jué)，就在這短短一瞬，手機(jī)前方正悄然上演一場(chǎng)“光的演出”——數(shù)萬(wàn)個(gè)無(wú)形的紅外光點(diǎn)被精準(zhǔn)投射到面部，完成高安全性身份識(shí)別。而在工業(yè)車間內(nèi)，工程師手持掃描設(shè)備滑過(guò)機(jī)械零件表面，明暗條紋掠過(guò)，零件的三維數(shù)字模型便同步呈現(xiàn)在屏幕上。這些場(chǎng)景的實(shí)現(xiàn)，都離不開(kāi)一項(xiàng)核心技術(shù)：結(jié)構(gòu)光投影。它用不可見(jiàn)的光束完成了從現(xiàn)實(shí)到數(shù)字的轉(zhuǎn)換，構(gòu)建出物理世界的精確復(fù)制。

與依賴環(huán)境光和物體紋理的傳統(tǒng)視覺(jué)系統(tǒng)不同，結(jié)構(gòu)光技術(shù)憑借其雙主動(dòng)特性（主動(dòng)投射光源、主動(dòng)探測(cè)反饋），能在光照不均或紋理匱乏的環(huán)境中穩(wěn)定工作，展現(xiàn)出優(yōu)異的魯棒性和測(cè)量精度。如今，從消費(fèi)電子到智能制造，結(jié)構(gòu)光正逐步成為機(jī)器“看懂”三維世界的關(guān)鍵工具，重塑我們與數(shù)字世界的交互方式。

圖1：基于結(jié)構(gòu)光的人臉識(shí)別和機(jī)械零件三維重建

圖源：Light科普坊/作者創(chuàng)作

小百科1：什么是結(jié)構(gòu)光？

結(jié)構(gòu)光是一種主動(dòng)式三維成像技術(shù)，它通過(guò)向物體表面投射預(yù)設(shè)的光學(xué)圖案（如條紋或點(diǎn)陣），并通過(guò)觀察圖案的變形來(lái)“推測(cè)”物體的三維形狀。結(jié)合高分辨率攝像與幾何計(jì)算，結(jié)構(gòu)光系統(tǒng)能夠在短時(shí)間內(nèi)重建物體表面的空間結(jié)構(gòu)。

圖2：結(jié)構(gòu)光投影及采集過(guò)程示意圖

圖源：南京理工大學(xué)智能計(jì)算成像實(shí)驗(yàn)室

無(wú)形光陣：手機(jī)面部識(shí)別的結(jié)構(gòu)光技術(shù)解密

以iPhone為例[1]，TrueDepth相機(jī)系統(tǒng)會(huì)在面部投射出超過(guò)三萬(wàn)個(gè)肉眼不可見(jiàn)的紅外光點(diǎn)，如同一張無(wú)形光網(wǎng)覆蓋整張臉。這些光點(diǎn)在遇到不同的面部結(jié)構(gòu)，如鼻梁、眼眶、面頰時(shí)，會(huì)因起伏而產(chǎn)生細(xì)微的位移，這些變形正是系統(tǒng)感知三維形貌的關(guān)鍵。首先，紅外投影器將點(diǎn)陣圖案均勻打在面部表面；隨后，專用攝像頭捕捉變形后的圖案影像。系統(tǒng)通過(guò)幾何計(jì)算反推出每一個(gè)光點(diǎn)的空間位置，進(jìn)而構(gòu)建出一張專屬用戶的三維深度圖。這張圖不僅包含臉部的輪廓線條，更記錄了面部微小凹凸細(xì)節(jié)，如眉骨高度、顴骨弧度等，形成每個(gè)人獨(dú)一無(wú)二的“空間簽名”[2]。

圖3：三維結(jié)構(gòu)光人臉識(shí)別流程

圖源：Light科普坊/作者創(chuàng)作

二維識(shí)別只依賴圖像紋理，容易被照片或仿真模型欺騙；而結(jié)構(gòu)光基于真實(shí)立體結(jié)構(gòu)，只有在空間坐標(biāo)完全匹配的前提下才能通過(guò)驗(yàn)證。因此，即使面對(duì)高分辨率的偽裝圖像或立體面具，系統(tǒng)依然能夠有效拒絕“冒充者”。結(jié)構(gòu)光讓機(jī)器真正“看見(jiàn)”了人臉的立體形態(tài)。也正因?yàn)檫@種精準(zhǔn)而可靠的感知能力，人臉識(shí)別不只是解鎖屏幕的工具，它已成為手機(jī)支付、賬戶認(rèn)證等高安全場(chǎng)景中的核心技術(shù)。借由這張無(wú)形光陣，三維信息感知技術(shù)讓“刷臉”真正變得安全而可信。

從點(diǎn)陣解析到三維重建：結(jié)構(gòu)光的數(shù)學(xué)魔法

在結(jié)構(gòu)光系統(tǒng)中，光不僅僅是用來(lái)照明的，而是主動(dòng)參與到三維世界的解析過(guò)程中。系統(tǒng)會(huì)將特定的光學(xué)圖案投射到物體表面，這些圖案在遇到不同的表面曲率時(shí)會(huì)發(fā)生精細(xì)的形變（如圖4所示）。系統(tǒng)通過(guò)計(jì)算這些形變中的幾何關(guān)系，推算出物體的空間深度結(jié)構(gòu)。這是一種將“光的變形”翻譯為“空間形狀”的技術(shù)，其原理基于三角測(cè)量、投影幾何和圖像重建等數(shù)學(xué)方法。

圖4：基于三角測(cè)量的深度識(shí)別

圖源：Light科普坊/作者創(chuàng)作

根據(jù)投射圖案的形態(tài)特征，結(jié)構(gòu)光系統(tǒng)主要分為點(diǎn)陣式和條紋式兩大類。點(diǎn)陣式結(jié)構(gòu)光通過(guò)VCSEL（垂直腔面發(fā)射激光器）或EEL（邊緣發(fā)射激光器）配合DOE（衍射光學(xué)元件）實(shí)現(xiàn)，投射離散的光點(diǎn)陣列，強(qiáng)調(diào)對(duì)坐標(biāo)點(diǎn)的精準(zhǔn)控制。如圖5所示，不同類型的結(jié)構(gòu)光圖案可以通過(guò)DOE等衍射光學(xué)元件靈活實(shí)現(xiàn)。以iPhone手機(jī)的Face ID為代表，這種方式特別適合用于復(fù)雜表面或細(xì)節(jié)區(qū)域的快速建模與三維重建。條紋式結(jié)構(gòu)光則通過(guò)DLP（數(shù)字光處理器）、MEMS掃描器或物理光柵來(lái)投影連續(xù)的光柵圖案，可對(duì)大面積目標(biāo)進(jìn)行高密度掃描，因此廣泛應(yīng)用于工業(yè)檢測(cè)和自動(dòng)化測(cè)量中。為了提高測(cè)量精度和抗干擾能力，這兩類結(jié)構(gòu)光系統(tǒng)都可以采用編碼技術(shù)，其中彩色編碼通過(guò)引入多種波長(zhǎng)或顏色信息，利用光譜維度進(jìn)行空間編碼，特別適合在復(fù)雜光照或動(dòng)態(tài)環(huán)境中進(jìn)行穩(wěn)定識(shí)別。

圖5：基于衍射光學(xué)元件的結(jié)構(gòu)光生成

圖源：Light科普坊/作者創(chuàng)作

近年來(lái)，微納光學(xué)的發(fā)展為結(jié)構(gòu)光投影帶來(lái)了更多新可能。例如，研究人員利用超構(gòu)表面（metasurface）技術(shù)，在微米尺度上精確控制光的相位、振幅和偏振，從而實(shí)現(xiàn)結(jié)構(gòu)光圖案的靈活生成與快速切換。相比傳統(tǒng)的投影方式，超構(gòu)表面具有體積小、無(wú)需電源驅(qū)動(dòng)、可適應(yīng)多種波長(zhǎng)等優(yōu)勢(shì)。得益于像素尺寸的縮小，這類器件甚至可以實(shí)現(xiàn)接近360°視場(chǎng)角的結(jié)構(gòu)光投影[3]，如圖6所示?；诔砻娴墓鈭?chǎng)調(diào)控器件為結(jié)構(gòu)光系統(tǒng)的小型化和集成化提供了全新路徑。

圖6：基于超表面的結(jié)構(gòu)光生成[4,5]

圖源：

Nano Letters

2020, 20(9), 6719–6724,

Nature Communications

2022, 13(1), 1–10

在三維重建中，圖像只是中間產(chǎn)物，最終構(gòu)建的是承載深度與結(jié)構(gòu)信息的空間點(diǎn)云，是從圖像走向模型的關(guān)鍵橋梁。結(jié)構(gòu)光系統(tǒng)通過(guò)幾何解算，將投影圖案在圖像中的二維像素還原為三維坐標(biāo)，生成可計(jì)算、可建模的空間數(shù)據(jù)集，如圖7所示。高質(zhì)量點(diǎn)云的生成依賴于精準(zhǔn)的投影控制、高速圖像采集與魯棒的重建算法。點(diǎn)云生成后，可進(jìn)一步擬合為連續(xù)表面、體素模型或數(shù)字孿生結(jié)構(gòu)，開(kāi)啟空間數(shù)字化進(jìn)程。如果說(shuō)圖像是二維世界的快照，那么點(diǎn)云就是三維空間的原始語(yǔ)言，而結(jié)構(gòu)光正是讓機(jī)器“理解幾何”的起點(diǎn)。從一束光到一個(gè)模型，從圖案到坐標(biāo)，這場(chǎng)光與算法的協(xié)作，構(gòu)成了三維重建的數(shù)學(xué)魔法。

圖7：結(jié)構(gòu)光投影及三維重建

圖源：南京理工大學(xué)智能計(jì)算成像實(shí)驗(yàn)室[6]

小百科2：什么是點(diǎn)云數(shù)據(jù)？

點(diǎn)云是一種用于表達(dá)三維形狀的數(shù)據(jù)集合，由大量帶有空間坐標(biāo)（X, Y, Z）的離散點(diǎn)組成，常由結(jié)構(gòu)光、激光雷達(dá)等三維掃描技術(shù)生成。它記錄了物體或場(chǎng)景表面的幾何特征，是三維重建、數(shù)字建模和機(jī)器人感知等應(yīng)用的核心數(shù)據(jù)形式。

圖8：三維點(diǎn)云圖

圖源：Wiki

數(shù)字孿生：物理世界的虛擬鏡像

獲取高精度的三維點(diǎn)云數(shù)據(jù)，是構(gòu)建數(shù)字世界的第一步。當(dāng)這些數(shù)據(jù)不斷更新，并接入傳感器、計(jì)算系統(tǒng)和控制平臺(tái)后，一個(gè)與現(xiàn)實(shí)對(duì)象實(shí)時(shí)聯(lián)動(dòng)的“數(shù)字鏡像”便逐漸成形。這個(gè)虛擬模型不僅復(fù)刻了物理結(jié)構(gòu)，還具備實(shí)時(shí)感知環(huán)境、反饋狀態(tài)變化，甚至預(yù)測(cè)未來(lái)趨勢(shì)的能力，這就是近年來(lái)備受關(guān)注的數(shù)字孿生。

不同于傳統(tǒng)的“一次性建?！?，數(shù)字孿生強(qiáng)調(diào)持續(xù)更新與長(zhǎng)周期在線運(yùn)行，因此在智能制造、智慧城市、遠(yuǎn)程醫(yī)療、數(shù)字文保等領(lǐng)域展現(xiàn)出廣泛應(yīng)用前景。例如，在制造工廠中，數(shù)字孿生可以實(shí)時(shí)監(jiān)測(cè)設(shè)備運(yùn)行狀態(tài)，預(yù)測(cè)潛在故障并提前干預(yù)；在城市管理中，它可構(gòu)建出“虛擬城市沙盤”，幫助管理者直觀掌握交通、能源、水利等系統(tǒng)的動(dòng)態(tài)狀態(tài)。在這一過(guò)程中，結(jié)構(gòu)光技術(shù)扮演著關(guān)鍵角色。作為一種非接觸、高精度、響應(yīng)快的三維感知方式，它能迅速獲取物體或場(chǎng)景的空間形狀，廣泛應(yīng)用于工業(yè)質(zhì)檢、城市感知、醫(yī)療建模等場(chǎng)景，是實(shí)現(xiàn)“物理–數(shù)字映射”的基礎(chǔ)工具。

更重要的是，數(shù)字孿生已不再是單一技術(shù)的產(chǎn)物，而是正在與人工智能大模型、物聯(lián)網(wǎng)平臺(tái)、具身智能系統(tǒng)，乃至元宇宙環(huán)境深度融合。在這一融合體系中，結(jié)構(gòu)光提供真實(shí)世界的幾何“底座”，AI大模型賦予系統(tǒng)強(qiáng)大的認(rèn)知與推理能力，而具身智能系統(tǒng)進(jìn)一步讓“虛擬體”能夠主動(dòng)感知、行動(dòng)與決策。這些新興技術(shù)的協(xié)同發(fā)展，正在推動(dòng)數(shù)字孿生從“靜態(tài)映射”邁向“智能決策”，不僅映射現(xiàn)實(shí)，更助力預(yù)測(cè)未來(lái)、優(yōu)化管理，成為構(gòu)建未來(lái)智慧社會(huì)的關(guān)鍵引擎。

圖9：飛機(jī)制造中的數(shù)字孿生應(yīng)用

圖源：Light科普坊/Veer

小百科3：數(shù)字孿生與虛擬現(xiàn)實(shí)的區(qū)別？

虛擬現(xiàn)實(shí)（VR）是一種以人為中心的沉浸式技術(shù)，用戶借助頭顯設(shè)備進(jìn)入一個(gè)完全由計(jì)算機(jī)生成的三維環(huán)境，強(qiáng)調(diào)的是視覺(jué)、聽(tīng)覺(jué)甚至觸覺(jué)的交互體驗(yàn)。數(shù)字孿生則是一種以現(xiàn)實(shí)系統(tǒng)為核心的功能性建模技術(shù)，它在虛擬空間中構(gòu)建一個(gè)與真實(shí)物理對(duì)象或過(guò)程保持實(shí)時(shí)同步的數(shù)字模型。其重點(diǎn)不在沉浸感，而在于“同步感”，能夠感知現(xiàn)實(shí)狀態(tài)、反饋?zhàn)兓Y(jié)果、預(yù)測(cè)未來(lái)行為。前者是虛構(gòu)的沉浸空間，后者是現(xiàn)實(shí)世界的功能鏡像。

展望未來(lái)：技術(shù)迭代與應(yīng)用創(chuàng)新

結(jié)構(gòu)光的原理源于對(duì)光與幾何關(guān)系的精準(zhǔn)控制，乍看之下只是“打光”與“成像”的組合，實(shí)則承載著人類理解空間、重構(gòu)現(xiàn)實(shí)的技術(shù)雄心。從人臉識(shí)別到工業(yè)建模，它以一束看不見(jiàn)的光，不斷拓展機(jī)器認(rèn)知世界的邊界。未來(lái)，隨著數(shù)字孿生技術(shù)的普及，我們或?qū)碛忻恳粋€(gè)物理對(duì)象的數(shù)字映像，實(shí)時(shí)運(yùn)行、不斷演化，而結(jié)構(gòu)光正是推動(dòng)這一空間數(shù)字化進(jìn)程的關(guān)鍵起點(diǎn)。結(jié)構(gòu)光的演進(jìn)，正如它照亮的對(duì)象，始于邊界，也將穿越邊界；未來(lái)，它不僅幫助我們“看清”世界，更將成為重新定義“現(xiàn)實(shí)”的重要工具。

相關(guān)文獻(xiàn)

[1] About Face ID advanced technology, https://support.apple.com/en-us/102381

[2] 左超, 等. 3D真的來(lái)了嗎?—三維結(jié)構(gòu)光傳感器漫談. 紅外與激光工程 2020, 49(3): 0303001

[3] Eunsue Choi, et. al. 360° structured light with learned metasurfaces.

Nature Photonics

2024, 18(8), 848-855. DOI: 10.1038/s41566-024-01450-x

[4] Yibo Ni, et. al. Metasurface for structured light projection over 120° field of view.

Nano Letters

2020, 20(9), 6719–6724

[5] Gyeongtae Kim, et. al. Metasurface-driven full-space structured light for three-dimensional imaging.

Nature Communications

2022, 13(1), 1–10. DOI: 10.1038/s41467-022-32117-2

[6] 《iPhone 15 Pro“空間視頻”+“3D結(jié)構(gòu)光”技術(shù)淺析：為影像添加一個(gè)新維度》，https://mp.weixin.qq.com/s/p2NNBMvN56Nx8_P95F3G_A

來(lái)源：中國(guó)光學(xué)

編輯：亦山

轉(zhuǎn)載內(nèi)容僅代表作者觀點(diǎn)

不代表中科院物理所立場(chǎng)

如需轉(zhuǎn)載請(qǐng)聯(lián)系原公眾號(hào)

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.