當?shù)貢r間 8 月 14 日,美國斯坦福大學團隊在Cell期刊發(fā)表腦機接口里程碑新成果,首次實現(xiàn)“讀心術”級腦機接口突破。研究人員通過運動皮層微電極陣列,成功解碼了人類內(nèi)心言語的神經(jīng)密碼,為完全閉鎖患者打造了“意念說話”系統(tǒng)。這項開創(chuàng)性工作不僅構建出全球首個 12.5 萬詞匯量的實時內(nèi)心言語解碼器,更發(fā)現(xiàn)了“嘗試性言語”與“內(nèi)心獨白”共享神經(jīng)表征的奧秘。
(來源:資料圖)
與此同時,本次研究還攻克了以下兩大難題:研究人員不僅實現(xiàn)了通過“神經(jīng)指紋”來區(qū)分主動表達與私密思維,還設計了關鍵詞鎖定機制來守護用戶思維隱私??梢哉f,這一成果標志著腦機接口邁入了從“運動解碼”邁向“思維解碼”的新階段。
(來源:Cell)
證實內(nèi)心言語具有穩(wěn)定的神經(jīng)表征模式,構建含有 12.5 萬詞語的腦機接口系統(tǒng)
語音腦機接口在為癱瘓患者恢復溝通能力方面展現(xiàn)出潛力,但也引發(fā)了關于其可能解碼私人內(nèi)心言語的相關討論。而內(nèi)心言語或許能成為一種替代方案,以便規(guī)避當前言語腦機接口要求用戶進行物理性言語嘗試的方式。要知道,要求用戶進行物理性言語嘗試不僅令人疲勞,還會減慢溝通速度。
本次研究通過對四名參與者的多單位記錄研究發(fā)現(xiàn),內(nèi)心言語在運動皮層中存在穩(wěn)定表征,并且用戶想象中的語句能夠被實時解碼。內(nèi)心言語的表征與嘗試性言語高度相關,不過研究人員也識別出了一個能區(qū)分二者的神經(jīng)“運動意圖”維度。通過此,研究人員探究了解碼私人內(nèi)心言語的可能性,發(fā)現(xiàn)在序列回憶和計數(shù)等認知任務中,自由形式內(nèi)心言語的某些方面可以被解碼。與此同時,研究人員還研發(fā)了一項高保真策略,以便防止言語腦機接口在無意中解碼私人內(nèi)心言語,從而避免給用戶帶來不必要的麻煩。
眾所周知,對于那些因為損傷或疾病導致癱瘓的人群來說,腦機接口能夠為其恢復運動能力或溝通能力提供極具前景的解決方案。此前,已有成功案例表明,四肢癱瘓患者能夠利用神經(jīng)信號控制電腦光標、操縱機械臂,甚至控制自己的手臂。
最近,腦機接口更是能夠通過對于書寫和言語的精準解碼實現(xiàn)用戶的快速溝通,其速度甚至超過其他替代設備比如眼動追蹤設備所能達到的水平。也有最新研究成果顯示,一名肌萎縮側索硬化癥(ALS,Amyotrophic Lateral Sclerosis)患者已能成功將言語神經(jīng)假體用于日常開放式溝通。
鑒于語音腦機接口的進展如此迅速,探明從言語運動皮層中所能解碼出的信息的局限性具有重要意義。本次研究中,研究人員以及他們所接觸的潛在用戶的一大顧慮是:該技術可能會解碼出用戶并不打算大聲說出的私人內(nèi)心言語。
盡管并非所有人都會將內(nèi)在認知與語言聯(lián)系起來,但許多人表示自己存在“內(nèi)心獨白”的體驗。內(nèi)心言語,也稱為想象言語、隱蔽言語、無聲言語、自我對話、言語表象、內(nèi)部獨白或言語思維。它在理論上被認為可以支持多種復雜的認知過程,包括支持工作記憶、言語復述、邏輯推理、執(zhí)行功能、行為控制和動機激發(fā)。這種現(xiàn)象同樣存在于默讀過程中,比如很多人都會在閱讀時激發(fā)聽覺或運動言語意象。
(來源:Cell)
研究人員指出,語音腦機接口在實際應用轉化中仍然面臨一定的挑戰(zhàn)。當前大多數(shù)腦機接口系統(tǒng)要求用戶必須盡力嘗試發(fā)聲(即“主動發(fā)聲”),這種模式容易導致用戶疲勞,并且對于癱瘓患者來說可能存在固有的速度限制。而假如一種腦機接口能夠解碼內(nèi)心言語,用戶僅需想象說話而無需實際發(fā)聲,那么則將有望解決上述問題。
神經(jīng)影像學和電生理學領域的研究均表明,內(nèi)心言語與實際發(fā)聲言語所激活的皮層網(wǎng)絡相似但并不完全相同,這意味著為解碼嘗試性言語而植入的電極或許也能夠實現(xiàn)對于內(nèi)心言語的解碼。對于內(nèi)心言語與實際發(fā)聲言語之間精確的神經(jīng)差異,目前人們?nèi)圆幻鞔_。而采用皮層腦電圖(ECoG,electrocorticography)的神經(jīng)假體研究顯示,內(nèi)心言語可以從皮層的特定區(qū)域解碼得出。但是,對于具體哪些區(qū)域起作用,領域內(nèi)在相關結論上仍然存在一定分歧。
在近期一項研究中,另一支研究團隊通過記錄緣上回(SMG,supramarginal gyrus)內(nèi)皮層微電極陣列的信號實現(xiàn)了內(nèi)心言語解碼,借此揭示出內(nèi)心言語、實際發(fā)聲言語和感知言語在該區(qū)域存在著共同的神經(jīng)表征。
近年來,由多個學術機構比如美國布朗大學、美國斯坦福大學和美國麻省總醫(yī)院等合作推進的研究項目 BrainGate2,旨在開發(fā)能夠解碼大腦運動意圖的技術,以幫助嚴重癱瘓的患者恢復交流或運動能力
而本次來自斯坦福大學的研究人員通過分析四位植入運動皮層微電極陣列的 BrainGate2 臨床試驗參與者的神經(jīng)信號,首次系統(tǒng)揭示了內(nèi)心言語的神經(jīng)表征機制。這一研究不僅證實內(nèi)心言語具有穩(wěn)定的神經(jīng)表征模式,更構建出首個含有 12.5 萬詞語的實時內(nèi)心言語腦機接口系統(tǒng),該系統(tǒng)可以解碼自定節(jié)奏的想象語句。值得注意的是,即使在未明確要求使用內(nèi)心言語的任務中,系統(tǒng)仍能解碼自由形式內(nèi)心言語的特定特征。
通過神經(jīng)幾何學分析,研究人員發(fā)現(xiàn)內(nèi)心言語可被視為是嘗試性言語的弱調(diào)制版本,但是借助此次新發(fā)現(xiàn)的神經(jīng)“運動意圖”維度則可以有效地區(qū)分內(nèi)心言語和嘗試性言語?;诖耍芯咳藛T開發(fā)出一款高精度的過濾算法,其能使傳統(tǒng)發(fā)聲腦機接口系統(tǒng)自動地屏蔽內(nèi)心言語信號。為了防止內(nèi)心言語腦機接口的誤輸出,研究人員還設計了一種基于關鍵詞識別的安全系統(tǒng),用戶可以通過默念特定關鍵詞來實現(xiàn)系統(tǒng)的鎖定與解鎖,同時其檢測準確率顯著優(yōu)于已有方法。
(來源:Cell)
首次為三名嚴重構音障礙患者打造實時內(nèi)心語言腦機接口系統(tǒng)
研究人員指出,就運動皮層中的內(nèi)心言語表征來說,言語畢竟是一種復雜的行為,因此會激活“言語網(wǎng)絡”中的多個皮層區(qū)域。傳統(tǒng)觀點認為言語感知區(qū)域和言語產(chǎn)生區(qū)域是相互獨立的,但是近期有研究表明即使在運動區(qū)域,言語產(chǎn)生和言語感知的神經(jīng)機制也是相互關聯(lián)且存在重疊的。領域內(nèi)關于內(nèi)心言語的研究也表明,嘗試性言語產(chǎn)生與內(nèi)心言語產(chǎn)生之間存在機制上的重疊。然而,目前在這些研究之中,不同研究團隊在重疊程度以及言語運動皮層的作用方面尚未達成共識。
(來源:Cell)
本次研究發(fā)現(xiàn),運動皮層中存在特定的功能分區(qū),這些功能分區(qū)分別是中央前回中部(mid-precentral gyrus)與最腹側(most ventral)。中央前回中部是指位于大腦初級運動皮層中間區(qū)域的功能分區(qū),最腹側指的是運動皮層中靠近腹側下方的區(qū)域,這些區(qū)域對于內(nèi)心言語、默讀及被動聽覺的神經(jīng)表征具有顯著相關性,并且其激活模式可被視為是嘗試性言語的按比例縮減版本。這一發(fā)現(xiàn)與既往語音腦機接口研究是互相吻合的,即中央前回中部及最腹側區(qū)域對言語解碼的信號貢獻度最大。
就皮層內(nèi)言語腦機接口的意義來說,研究人員指出近期語音神經(jīng)假體研究的進展,引發(fā)了人們關于運動皮層語言相關區(qū)域神經(jīng)信號在多大程度上可能會泄露個體內(nèi)心私密語言的討論。
如前所述,該團隊和潛在用戶都提出了對于“思維隱私”的擔憂。具體而言,當系統(tǒng)試圖解碼運動性言語意圖時,語音腦機接口是否“能夠讀取用戶的內(nèi)部思想或內(nèi)心獨白”。而本次研究表明,通過借助運動意圖維度進行精細的腦機接口解碼訓練,能夠以高保真度防止內(nèi)心語言的泄露。
(來源:Cell)
研究人員表示,內(nèi)心語言或可成為改進語音腦機接口的新途徑。不過,當前本次系統(tǒng)僅能依賴外部嘗試性言語進行解碼。研究中,研究人員首次為三名嚴重構音障礙患者打造了實時內(nèi)心語言腦機接口系統(tǒng)。需要說明的是,構音障礙是一種因神經(jīng)系統(tǒng)損傷導致的運動性言語障礙。
研究人員指出,與嘗試性言語相比,這種內(nèi)心語言腦機接口具有三大優(yōu)勢:首先,所需要的表達努力更少;其次,用戶的舒適度更高;再次,能夠繞過癱瘓患者因生理限制(如呼吸控制)導致的言語遲緩問題,因此有望使語音腦機接口達到接近正常語速的水平。但是,這類系統(tǒng)需要額外設計防護機制,以避免用戶的內(nèi)心想法意外“泄露”并被變成輸出指令。研究中,研究人員通過關鍵詞激活機制實現(xiàn)了解鎖控制,確保僅在用戶主動意圖下才能啟動解碼,最終實現(xiàn)了較高精度的輸出。
值得注意的是,研究人員還在一位僅存眼外肌運動能力、完全喪失發(fā)音器官控制功能的失語癥患者身上對比評估了嘗試性言語與內(nèi)心語言。盡管兩種狀態(tài)下均未觀察到任何肢體動作,但是嘗試性言語仍然顯示出更強的神經(jīng)表征強度。這表明即使處于失語狀態(tài),運動皮層仍保持著發(fā)音意圖的神經(jīng)編碼。這一發(fā)現(xiàn)也說明,對于接近或完全閉鎖狀態(tài)的患者而言,嘗試性言語或可繼續(xù)作為驅動語音腦機接口的有效行為范式。
最后,研究人員證實即使在那些沒有明確指令的任務中,比如序列回憶、計數(shù)和引導性思考等,內(nèi)心語言的某些特征仍然可以被解碼。在成年人的認知活動中,內(nèi)心語言作為一種思維工具,涉及到任務切換、規(guī)劃、命題推理、他者心理推斷、空間定向、分類歸納、認知控制以及閱讀等多個維度。但是,目前研究人員還不清楚運動皮層在這些多樣化情境中能在多大程度上普遍性地解碼內(nèi)心語言,因此關于這一方向仍需開展進一步研究。
此外,關于言語和語言在思維活動中的參與程度領域內(nèi)仍然存在一定爭議。而潛在的解碼范圍可能僅限于具體化的心理策略,比如言語記憶、計數(shù)或顯性語言思維(例如回憶歌曲歌詞)。研究人員指出,個體間的私密內(nèi)心獨白可能存在一定差異,而且未必會以具象化的方式呈現(xiàn),這可能會導致其難以或無法從運動皮層信號中被解碼。
總的來說,這項成果既是腦科學領域的重大飛躍,也引發(fā)了關于思維隱私與技術倫理的深刻思考,但它必將給腦機接口的應用帶來更多的助力。
參考資料:
https://www.cell.com/cell/fulltext/S0092-8674(25)00681-6
https://www.linkedin.com/in/frank-willett-6b02b634a/
https://www.linkedin.com/in/erin-kunz-75123a72
排版:劉雅坤
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.