成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

洞察抑郁:計(jì)算機(jī)如何識(shí)別心理危機(jī)?

0
分享至


原文發(fā)表于《科技導(dǎo)報(bào)》2025 年第14 期 《 計(jì)算機(jī)輔助抑郁障礙識(shí)別研究進(jìn)展 》

抑郁癥是一種典型的精神障礙,目前篩查主要以抑郁診斷量表和醫(yī)生問診為主。計(jì)算機(jī)輔助抑郁障礙識(shí)別是基于人工智能技術(shù)的一種抑郁癥篩查的新興方式。本文針對(duì)傳統(tǒng)測(cè)量工具的現(xiàn)狀和不足,綜述了當(dāng)前計(jì)算機(jī)輔助抑郁識(shí)別方法,論述了抑郁識(shí)別數(shù)據(jù)集和基于面部圖片、語音、文本等多模態(tài)數(shù)據(jù)的抑郁識(shí)別方法的研究現(xiàn)狀,并對(duì)計(jì)算機(jī)輔助抑郁識(shí)別的優(yōu)勢(shì)與挑戰(zhàn)進(jìn)行了總結(jié)與展望。計(jì)算機(jī)輔助抑郁識(shí)別能夠提供一種相對(duì)簡便、規(guī)范化的篩查方式,但仍面臨模型參數(shù)和特征解釋不足、中文數(shù)據(jù)集有待擴(kuò)充、現(xiàn)有數(shù)據(jù)集樣本量較少的挑戰(zhàn)。未來研究人員需要進(jìn)一步提升抑郁識(shí)別數(shù)據(jù)集的樣本量及模型準(zhǔn)確率等指標(biāo),進(jìn)行特征提取及模型構(gòu)建的理論及實(shí)驗(yàn)分析,推進(jìn)計(jì)算機(jī)輔助抑郁識(shí)別的臨床應(yīng)用。

近年來,各國關(guān)于抑郁癥的報(bào)道層出不窮,抑郁患者自殺的新聞?lì)l出。根據(jù)美國精神病學(xué)會(huì)的《精神障礙診斷與統(tǒng)計(jì)手冊(cè)》(DSM?5)診斷標(biāo)準(zhǔn),抑郁癥是一種典型的精神障礙,臨床特征包括顯著而持久的心境低落、興趣喪失和精力缺乏。據(jù)世界衛(wèi)生組織發(fā)布的《抑郁癥及其他常見精神障礙》報(bào)告顯示,全球范圍內(nèi)抑郁癥患者超過3億人,預(yù)計(jì)在未來10年將會(huì)成為全球第一大疾病負(fù)擔(dān)源?!读~刀·精神病學(xué)》上發(fā)表的對(duì)中國全國性精神障礙流行病學(xué)調(diào)查研究顯示,抑郁癥的終生患病率為6.8%,12個(gè)月患病率為3.6%。抑郁癥的發(fā)病機(jī)制比較復(fù)雜,遺傳因素、心理?社會(huì)因素均可能導(dǎo)致抑郁癥的產(chǎn)生。社會(huì)對(duì)抑郁癥的認(rèn)知偏見,患者自身及家庭對(duì)心理問題、精神疾病的認(rèn)識(shí)不足,導(dǎo)致抑郁癥識(shí)別率和就診率仍處在較低水平。

目前,抑郁癥的篩查主要以患者自評(píng)量表和醫(yī)師臨床診斷為主,可能受到醫(yī)生主觀判斷和患者自我認(rèn)知的影響,篩查工具和診斷方式具有一定局限性。抑郁癥心理行為特征相關(guān)研究表明,患者在運(yùn)動(dòng)行為、語言表達(dá)、身體姿態(tài)和生理指標(biāo)等方面表現(xiàn)出不同于健康人群的特征。在抑郁癥的篩查和診斷中,對(duì)患者的心理和生理癥狀進(jìn)行準(zhǔn)確的識(shí)別至關(guān)重要。通過醫(yī)生的臨床經(jīng)驗(yàn)和大規(guī)模的研究分析,能夠提取出用于識(shí)別抑郁患者的特征標(biāo)志。基于這些抑郁癥狀標(biāo)志特征,計(jì)算機(jī)輔助抑郁識(shí)別技術(shù)能從行為、語言等維度提取有效區(qū)分抑郁患者與健康人群的特征標(biāo)志,構(gòu)建抑郁篩查模型,輔助醫(yī)生進(jìn)行抑郁癥狀的診斷和篩查。

計(jì)算機(jī)輔助識(shí)別算法能夠從大規(guī)模的數(shù)據(jù)集中提取特征進(jìn)行分類,輸入機(jī)器學(xué)習(xí)模型中進(jìn)行參數(shù)訓(xùn)練和模型調(diào)整,并基于訓(xùn)練的模型對(duì)新的數(shù)據(jù)樣本進(jìn)行預(yù)測(cè)。該方法的有效性依賴于特征提取的準(zhǔn)確性和可靠性,特征選擇容易對(duì)模型的性能和預(yù)測(cè)效果產(chǎn)生明顯影響。隨著深度學(xué)習(xí)等技術(shù)的發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的分類器能夠與深度特征提取器訓(xùn)練得到端到端的分類器,該方法相對(duì)手工提取特征的方法更加簡便,但這種方法存在模型特征的解釋性較弱、計(jì)算復(fù)雜度較高等問題。目前上述2類計(jì)算機(jī)輔助篩查算法均有相關(guān)學(xué)者進(jìn)行研究,相比于抑郁自評(píng)量表等測(cè)量工具,計(jì)算機(jī)輔助方法包含更加豐富的多模態(tài)信息,能夠進(jìn)一步提升篩查的客觀性,具有較高的應(yīng)用和研究價(jià)值。

1 傳統(tǒng)測(cè)量工具概述

目前,廣泛應(yīng)用的抑郁癥篩查主要通過患者自評(píng)量表、醫(yī)師臨床診斷等方式,根據(jù)情緒低落、睡眠障礙、能力減退等抑郁典型癥狀出現(xiàn)的頻次、嚴(yán)重程度及持續(xù)時(shí)長,評(píng)估是否有抑郁障礙及其程度。

抑郁障礙自評(píng)或他評(píng)量表等工具能夠較直觀地體現(xiàn)抑郁障礙的診斷標(biāo)準(zhǔn),幫助醫(yī)生和研究人員快速而準(zhǔn)確地評(píng)估患者的情況,是常用的評(píng)估方法之一。貝克抑郁自評(píng)量表(BDI)、PHQ?9抑郁癥篩查量表(PHQ?9)、漢密爾頓抑郁量表(HAMD)、抑郁自評(píng)問卷(SDS)等是目前主流的評(píng)估篩查量表,能夠用于評(píng)估測(cè)評(píng)者是否有抑郁癥狀及抑郁程度。臨床上對(duì)抑郁癥的識(shí)別診斷主要基于國際疾病分類(ICD?10)或DSM?V中抑郁癥診斷標(biāo)準(zhǔn),結(jié)合病人的訪談情況、篩查量表及醫(yī)生診療經(jīng)驗(yàn)進(jìn)行。

BDI是一份自我報(bào)告問卷,包括21項(xiàng),一般耗時(shí)5~10 min。BDI在應(yīng)用中發(fā)現(xiàn)部分抑郁癥患者完成21項(xiàng)測(cè)評(píng)時(shí)存在困難,因此該量表也有修訂編制的13項(xiàng)版本。評(píng)估者需要從認(rèn)知、情感和軀體癥狀等方面對(duì)自我進(jìn)行評(píng)估,用于診斷自我的抑郁癥狀程度。

PHQ?9是臨床上對(duì)抑郁進(jìn)行初步篩查的簡易量表。PHQ?9主要用于測(cè)評(píng)在過去2周內(nèi)是否表現(xiàn)出相應(yīng)的抑郁癥狀、嚴(yán)重程度及持續(xù)時(shí)間,根據(jù)測(cè)評(píng)者不同癥狀出現(xiàn)的頻次總分進(jìn)行評(píng)估。該篩查量表的測(cè)評(píng)時(shí)間往往在5 min內(nèi),臨床研究證明具有良好的信度和效度。

HAMD是抑郁癥標(biāo)準(zhǔn)的評(píng)估工具之一,主要用于診斷和研究目的。HAMD分為17項(xiàng)、21項(xiàng)和24項(xiàng)等多個(gè)版本,一般需要20~30 min完成。評(píng)估者采用交談和觀察的方式,從抑郁情緒、自殺傾向、睡眠情況等角度對(duì)測(cè)評(píng)者進(jìn)行評(píng)定,評(píng)定分?jǐn)?shù)能夠較好反映是否患有抑郁癥及抑郁癥的嚴(yán)重程度。

SDS是美國教育衛(wèi)生部推薦用于精神藥理學(xué)研究的量表之一,包含20個(gè)評(píng)分題,涵蓋精神性?情感癥狀、軀體性障礙、精神運(yùn)動(dòng)性障礙、抑郁性心理障礙相關(guān)問題,上述4個(gè)方面的問題占比為10%、40%、10%、40%。SDS的使用和分析較為簡單方便,不需要經(jīng)過專門訓(xùn)練的醫(yī)師指導(dǎo)評(píng)定,評(píng)定分?jǐn)?shù)能夠直觀反映出患者的主觀感受,目前已廣泛應(yīng)用于門診病人的粗篩和情緒狀態(tài)評(píng)定。

上述測(cè)評(píng)量表在臨床實(shí)踐中得到廣泛應(yīng)用,每個(gè)量表都具有其獨(dú)特的優(yōu)缺點(diǎn),研究人員或?qū)I(yè)醫(yī)師可根據(jù)具體情況進(jìn)行選擇。在計(jì)算機(jī)輔助抑郁障礙識(shí)別數(shù)據(jù)集的構(gòu)建中,抑郁測(cè)評(píng)量表也具有重要作用。由于有監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法依賴于準(zhǔn)確的標(biāo)簽數(shù)據(jù),目前廣泛使用的基于人工智能技術(shù)的抑郁識(shí)別數(shù)據(jù)集中,往往以一個(gè)或多個(gè)上述量表的測(cè)評(píng)結(jié)果或醫(yī)生診斷結(jié)果作為數(shù)據(jù)的真實(shí)標(biāo)簽。

2 計(jì)算機(jī)輔助抑郁障礙識(shí)別

傳統(tǒng)測(cè)量工具可能受到醫(yī)生主觀判斷和患者自我認(rèn)知的影響,而計(jì)算機(jī)輔助識(shí)別能夠通過患者圖像、語音和文本等獲取更加豐富的多模態(tài)信息,進(jìn)一步提升篩查的客觀性?;谌斯ぶ悄芗夹g(shù)的計(jì)算機(jī)輔助識(shí)別作為一種跨學(xué)科技術(shù),利用計(jì)算機(jī)視覺、自然語言處理等人工智能技術(shù),建立機(jī)器學(xué)習(xí)模型,基于輸入模型的數(shù)據(jù)訓(xùn)練調(diào)整模型參數(shù),再根據(jù)構(gòu)建模型計(jì)算新樣本的預(yù)測(cè)結(jié)果和類別概率,輔助疾病的診斷和篩查。根據(jù)抑郁患者在面部圖像、語音、文本、腦電等模態(tài)數(shù)據(jù)上的差異,國內(nèi)外的研究提取不同模態(tài)的特征,可以從多角度建立抑郁診斷評(píng)估工具(圖1)。


圖1 基于人工智能技術(shù)的計(jì)算機(jī)輔助抑郁診斷示意

2.1 計(jì)算機(jī)輔助抑郁識(shí)別數(shù)據(jù)集

計(jì)算機(jī)輔助篩查通過采集抑郁患者和健康對(duì)照者的視頻、語音等模態(tài)數(shù)據(jù),提取用于區(qū)分抑郁癥狀的特征,訓(xùn)練機(jī)器學(xué)習(xí)模型對(duì)新的潛在抑郁癥患者進(jìn)行預(yù)測(cè)。機(jī)器學(xué)習(xí)算法模型的訓(xùn)練依賴足夠的數(shù)據(jù)以減少模型過擬合、提高模型精度,標(biāo)準(zhǔn)的抑郁識(shí)別數(shù)據(jù)集的建立對(duì)于篩查算法的訓(xùn)練至關(guān)重要。近10年,該領(lǐng)域開放的外文數(shù)據(jù)集包括:AVEC2013、AVEC2014、DAIC?WOZ、Pittsburgh等,中文數(shù)據(jù)集包括:MODMA、EATD、CMDC、Wenzhou?Kangning等,數(shù)據(jù)集概述如表1所示。

表1 近10年抑郁識(shí)別領(lǐng)域開源數(shù)據(jù)集


開源數(shù)據(jù)集為機(jī)器學(xué)習(xí)模型的訓(xùn)練提供了基礎(chǔ),推動(dòng)了人工智能輔助篩查領(lǐng)域的發(fā)展,對(duì)抑郁識(shí)別領(lǐng)域的發(fā)展有明顯的推動(dòng)作用。數(shù)據(jù)集往往根據(jù)量表篩查或醫(yī)師診斷出的抑郁人群或健康對(duì)照者給定標(biāo)簽,通過患者參與朗讀、描述、訪談等實(shí)驗(yàn)采集視頻、語音、腦電等多種數(shù)據(jù)模態(tài)。

在抑郁識(shí)別領(lǐng)域,自行采集和標(biāo)注的數(shù)據(jù)集也具有一定的研究和應(yīng)用價(jià)值。雖然這些數(shù)據(jù)集通常并未公開獲取,但它們?yōu)檠芯坎煌幕尘皩?duì)抑郁癥狀表達(dá)的影響,以及基于不同數(shù)據(jù)模態(tài)的抑郁識(shí)別算法的構(gòu)建提供了理論基礎(chǔ)和實(shí)驗(yàn)支撐。為分析中國抑郁癥患者的面部特征,Wang等采集了山東省精神衛(wèi)生中心的26名抑郁癥住院患者和26名健康對(duì)照者在觀看不同情緒圖片時(shí)的面部視頻數(shù)據(jù),以分析抑郁癥患者眉毛、眼睛和嘴巴處的特征,進(jìn)一步擴(kuò)充了中國患者的抑郁篩查數(shù)據(jù)。根據(jù)抑郁癥患者肢體運(yùn)動(dòng)等模態(tài)上的特點(diǎn),Wang等通過Kinect采集了126名抑郁癥患者和121名健康者的步態(tài)數(shù)據(jù),分析抑郁癥患者肢體擺動(dòng)、步幅變化和頭部姿勢(shì)及運(yùn)動(dòng)的特征,進(jìn)一步擴(kuò)充了與肢體運(yùn)動(dòng)相關(guān)的抑郁篩查數(shù)據(jù)。

2.2 面部視覺模態(tài)模型構(gòu)建

抑郁人群的面部表達(dá)能力受損,且更易于表現(xiàn)出眼睛松弛皺眉等悲傷情緒特征。根據(jù)抑郁癥患者的面部表達(dá)特點(diǎn),目前抑郁識(shí)別算法通過提取人臉面部關(guān)鍵特征進(jìn)行篩查(圖2),包括人臉特征點(diǎn)坐標(biāo)、面部動(dòng)作單元(AU)等。美國心理學(xué)家Ekman提出了一套面部表情編碼系統(tǒng)(FACS)以描繪不同臉部肌肉動(dòng)作和表情之間的對(duì)應(yīng)關(guān)系。該系統(tǒng)根據(jù)人臉學(xué)特點(diǎn),將面部表情劃分得到若干相互獨(dú)立又相互聯(lián)系的運(yùn)動(dòng)單元,以準(zhǔn)確地識(shí)別面部情緒和情感表達(dá)。2009年,Cohn等對(duì)參與者在回答HAMD中涉及情緒低落、內(nèi)疚和自殺的3個(gè)問題時(shí)的面部行為進(jìn)行手動(dòng)FACS編碼,結(jié)果顯示根據(jù)所有AU進(jìn)行分類能夠得到79%的準(zhǔn)確率,其中涉及夾肌收縮的AU14分類的準(zhǔn)確率最高,得到的靈敏度和特異度分別為87%和89%。2013年,Meng等從連續(xù)的圖像序列中計(jì)算運(yùn)動(dòng)歷史直方圖,通過局部二值模式(LBP)描述時(shí)序空間的細(xì)節(jié),拼接得到的時(shí)空描述子通過偏最小二乘回歸,在AVEC2013數(shù)據(jù)集上達(dá)到平均絕對(duì)誤差(MAE)=7.08、均方根誤差(RMSE)=8.81。2015年,Pampouchidou等提出一種使用魯棒描述符動(dòng)態(tài)進(jìn)行面部表情分析的方法,結(jié)合Curvelet變化和LBP?TOP得到人臉特征,建立對(duì)抑郁癥無、輕度、中度和重度等嚴(yán)重程度的有效的分類系統(tǒng),混淆矩陣顯示各分級(jí)的識(shí)別準(zhǔn)確率分別為51.0%、63.4%、55.0%、55.5%。2018年,Wang等根據(jù)從山東省精神衛(wèi)生中心采集到的抑郁癥住院患者的臨床視頻樣本,從中提取眼睛、眉毛和嘴角的運(yùn)動(dòng)變化,手動(dòng)提取計(jì)算了左右瞳孔間距、眨眼頻率、雙側(cè)眉毛和眼角間距等特征并通過SVM算法進(jìn)行分類,達(dá)到了78.85%的準(zhǔn)確率。


圖2 抑郁識(shí)別視覺模態(tài)特征標(biāo)志

隨著深度學(xué)習(xí)技術(shù)的發(fā)展,目前的研究不再局限于手工提取特征——從原始圖像數(shù)據(jù)中提取特征后進(jìn)行分類、回歸,而是通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)等端到端學(xué)習(xí)的方法進(jìn)行特征提取和模型訓(xùn)練,該模型也表現(xiàn)出了較高的準(zhǔn)確性和魯棒性。CNN是一種在圖像識(shí)別領(lǐng)域表現(xiàn)優(yōu)異的深度學(xué)習(xí)模型。通過卷積層、池化層和全連接層等基本結(jié)構(gòu),能夠從原始圖像數(shù)據(jù)中自動(dòng)提取具有高層次語義的特征表示,以進(jìn)行分類、回歸等任務(wù)。在抑郁癥分類診斷方面,CNN模型通過訓(xùn)練較大規(guī)模的抑郁樣本數(shù)據(jù),自動(dòng)學(xué)習(xí)面部表情特征與抑郁癥之間的聯(lián)系并對(duì)新的面部圖像進(jìn)行準(zhǔn)確的分類預(yù)測(cè)。2017年,Zhu等通過深度卷積神經(jīng)網(wǎng)絡(luò)(DNN)分別提取視頻中人臉靜態(tài)外觀和跨幀動(dòng)態(tài)特征,構(gòu)建聯(lián)合調(diào)整層進(jìn)行最終微調(diào)。在AVEC2014數(shù)據(jù)集上跨幀動(dòng)態(tài)特征模型相較靜態(tài)外觀特征模型在RMSE、MAE上分別提升0.56、0.3,聯(lián)合微調(diào)模型達(dá)到RMSE=9.55、MAE=7.47。

2D CNN已被廣泛用于圖像分類等領(lǐng)域,但其在處理帶有時(shí)間信息的數(shù)據(jù),如時(shí)間序列和視頻數(shù)據(jù)方面存在局限性。為了解決這一問題,研究者提出了3D CNN,該模型利用卷積操作在時(shí)間維度上提取特征,從而能夠有效地處理帶有時(shí)間信息的數(shù)據(jù)。通過引入時(shí)間維度,3D CNN可以從時(shí)空域的角度分析數(shù)據(jù),并且能夠在時(shí)域上學(xué)習(xí)數(shù)據(jù)中的時(shí)間相關(guān)性,從而提高對(duì)時(shí)間序列和視頻數(shù)據(jù)的建模能力。相比于2D CNN,3D CNN在處理時(shí)間序列和視頻數(shù)據(jù)方面具有更好的表現(xiàn),能夠有效地應(yīng)用于抑郁識(shí)別模型的構(gòu)建。2019年,de Melo等從采集對(duì)象臉部全局和眼睛局部區(qū)域中提取時(shí)空特征,通過3D卷積網(wǎng)絡(luò)(C3D)融合來提高抑郁癥預(yù)測(cè)的準(zhǔn)確率,在AVEC2013和AVEC2014上的實(shí)驗(yàn)結(jié)果表明,結(jié)合全局和局部的C3D方法RMSE達(dá)到8.26、MAE達(dá)到6.40,在AVEC2014數(shù)據(jù)集上相對(duì)于全局C3D方法在RMSE和MAE指標(biāo)上分別有0.68和0.64的提升。

3D CNN能夠廣泛應(yīng)用于視頻分類、動(dòng)作識(shí)別等任務(wù),并取得了顯著的成果。然而,3D CNN在處理序列數(shù)據(jù)時(shí)存在局限性——它無法充分考慮序列中不同時(shí)間步之間的關(guān)系。為了解決這個(gè)問題,學(xué)者們引入了注意力機(jī)制,通過為不同時(shí)間步賦予不同的權(quán)重來強(qiáng)調(diào)序列中的關(guān)鍵部分,從而提高3D CNN的性能。這種方法能夠讓3D CNN更加關(guān)注序列中重要的部分,提高其對(duì)于序列數(shù)據(jù)的建模能力。注意力機(jī)制的引入可以使3D CNN能夠更好地處理時(shí)間序列數(shù)據(jù),并在視頻模態(tài)的抑郁識(shí)別任務(wù)上獲得了良好的表現(xiàn)。2021年,孫浩浩等提出通道層注意力機(jī)制的DNN,通過多支路卷積網(wǎng)絡(luò)分別提取眼睛區(qū)域、嘴巴區(qū)域和面部的特征向量進(jìn)行融合,在全連接層輸出最后分?jǐn)?shù)。該實(shí)驗(yàn)在AVEC2013和AVEC2014訓(xùn)練集上得到加入了注意力機(jī)制、融合了多特征的模型,在AVEC2013數(shù)據(jù)集上達(dá)到MAE=6.74、RMSE=8.70,AVEC2014數(shù)據(jù)集上達(dá)到MAE=6.56、RMSE=8.56,優(yōu)于基線模型和其他對(duì)比模型。2022年,Chen等通過神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索技術(shù)設(shè)計(jì)了一個(gè)針對(duì)多面部特征的優(yōu)化模型,通過CNN?GCN的端到端網(wǎng)絡(luò),在AVEC2016數(shù)據(jù)集上RMSE和MAE相較于SOTA提升了27%和30%。2023年,Liu等提出一種部分和關(guān)系注意力網(wǎng)絡(luò),通過2種注意力機(jī)制計(jì)算不同局部特征對(duì)抑郁識(shí)別的貢獻(xiàn),進(jìn)一步將所有特征聚合成更能提供抑郁癥信息的表示并用于抑郁識(shí)別,在AVEC2013和AVEC2014上實(shí)現(xiàn)了最優(yōu)性能,MAE和RMSE分別達(dá)到6.08和7.59。

在抑郁識(shí)別領(lǐng)域,識(shí)別模型的迭代與深度學(xué)習(xí)的技術(shù)演化發(fā)展緊密相關(guān)。最初,應(yīng)用2D CNN技術(shù)進(jìn)行面部靜態(tài)二維圖像的分類和識(shí)別,雖然簡單高效,但存在對(duì)時(shí)間序列信息處理不足的問題,對(duì)采集的視頻數(shù)據(jù)無法很好挖掘幀與幀間的信息。3D CNN技術(shù)的引入擴(kuò)展了模型對(duì)于動(dòng)態(tài)視頻數(shù)據(jù)的建模能力,更好地利用了時(shí)間維度的信息。隨著注意力機(jī)制的廣泛應(yīng)用,有注意力的3D CNN框架進(jìn)一步增強(qiáng)了模型對(duì)數(shù)據(jù)的理解和處理能力,為處理復(fù)雜數(shù)據(jù)的抑郁識(shí)別問題提供了更有效的工具和方法(圖3)。這種演化從簡單到復(fù)雜從二維到三維、從靜態(tài)到動(dòng)態(tài),提高了對(duì)于數(shù)據(jù)中關(guān)鍵特征的挖掘并進(jìn)一步提升了模型在準(zhǔn)確率等方面的表現(xiàn),對(duì)于抑郁識(shí)別問題的研究具有重要的意義和實(shí)際應(yīng)用價(jià)值。


圖3 抑郁識(shí)別視覺模態(tài)模型流程

2.3 語音模態(tài)模型構(gòu)建

音頻信號(hào)是抑郁癥篩查中重要模態(tài)之一,能夠有效反映人的心理狀態(tài)和病理學(xué)特征。目前針對(duì)音頻模態(tài)的抑郁識(shí)別研究以手動(dòng)提取特征為主,即針對(duì)抑郁患者語速慢、聲音低沉等言語表達(dá)中的標(biāo)志特點(diǎn),通過對(duì)采集的抑郁患者的聲音信號(hào)進(jìn)行分析處理,提取音頻的能量、響度、梅爾頻譜、過零率等方面的差異特征,建立算法模型進(jìn)行訓(xùn)練和預(yù)測(cè),從而實(shí)現(xiàn)較客觀有效的輔助篩查(圖4)。由于特征提取的有效性對(duì)模型的性能有重要影響,因此特征的設(shè)計(jì)一直是研究者關(guān)注的重點(diǎn)。手工特征的提取需要通過多個(gè)預(yù)處理步驟,例如根據(jù)短時(shí)傅里葉變換等方法,將原始音頻信號(hào)轉(zhuǎn)換為頻譜圖等表示形式。這些特征經(jīng)過降維、歸一化等處理后,輸入到分類模型進(jìn)行訓(xùn)練和預(yù)測(cè)。該過程需要專家的領(lǐng)域知識(shí)和經(jīng)驗(yàn),其設(shè)計(jì)能夠反映研究者對(duì)標(biāo)志特征的構(gòu)建和篩選,加強(qiáng)對(duì)特征的全面解釋,但往往也比較耗時(shí)和復(fù)雜。2013年,Joshi等計(jì)算了基頻f0、響度、強(qiáng)度和梅爾頻率倒譜系數(shù)(MFCC)等音頻特征的有效性,融合從視頻中提取的視覺特征在30名抑郁患者和30名健康對(duì)照者的臨床實(shí)驗(yàn)數(shù)據(jù)上進(jìn)行分析,得到不同特征組合在各分類算法上的最大靈敏度、特異度和準(zhǔn)確率,最高準(zhǔn)確率達(dá)到65.92%。2014年,Ooi等提出多通道加權(quán)語音分類方法,對(duì)韻律、聲門和頻譜特征獨(dú)立分類后進(jìn)行加權(quán),判斷一個(gè)人在未來2.5年內(nèi)出現(xiàn)抑郁癥狀的風(fēng)險(xiǎn),準(zhǔn)確率達(dá)到74%。2017年,Kiss等分別對(duì)閱讀和自發(fā)講話場(chǎng)景下的特征進(jìn)行提取,分析得到在自發(fā)講話任務(wù)場(chǎng)景下的差異體現(xiàn)在與速度(語速、停頓時(shí)長等)相關(guān)的特征,在朗讀任務(wù)場(chǎng)景下的差異體現(xiàn)在共振峰軌跡等語音特征,最終在朗讀語音樣本上達(dá)到83%的檢測(cè)準(zhǔn)確率,在自發(fā)語音樣本上達(dá)到86%的檢測(cè)準(zhǔn)確率。


圖4 抑郁識(shí)別語音模態(tài)模型流程

隨著深度學(xué)習(xí)技術(shù)的發(fā)展,越來越多的研究開始探索在音頻信號(hào)處理中使用端到端的深度網(wǎng)絡(luò)。端到端的音頻識(shí)別網(wǎng)絡(luò)能夠直接從原始音頻數(shù)據(jù)中學(xué)習(xí)特征,并進(jìn)行分類任務(wù)。這種方法使用CNN、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等深度學(xué)習(xí)模型,通過多個(gè)卷積層、池化層等對(duì)原始音頻數(shù)據(jù)進(jìn)行處理,提取出音頻的高層次特征,然后再將這些特征輸入到全連接層進(jìn)行分類預(yù)測(cè)。由于不需要額外的特征提取步驟,端到端的音頻識(shí)別網(wǎng)絡(luò)能夠有效減少特征工程的工作量和誤差,且在抑郁識(shí)別實(shí)驗(yàn)中表現(xiàn)良好。2018年,He等提出了一種手動(dòng)特征提取和深度學(xué)習(xí)特征提取相結(jié)合的方式,先通過DNN從頻譜圖和原始語音波形圖中學(xué)習(xí)特征,然后手工從頻譜圖中提取紋理描述符,并通過聯(lián)合微調(diào)層結(jié)合手工和網(wǎng)絡(luò)特征以提高抑郁癥識(shí)別性能,在AVEC2013和AVEC2014數(shù)據(jù)集上的RMSE和MAE指標(biāo)優(yōu)于對(duì)比算法。2021年,Zhang等提出了抑郁檢測(cè)的音頻嵌入方法DEPA,該方法訓(xùn)練了自監(jiān)督學(xué)習(xí)音頻嵌入模型,在抑郁癥和健康對(duì)照者數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練后應(yīng)用于下游任務(wù)的模型分類,F(xiàn)1值達(dá)到94%。2022年,Sardari等通過端到端卷積神經(jīng)網(wǎng)絡(luò)的自動(dòng)編碼器CNN AE自動(dòng)提取相關(guān)特征,并采用基于聚類的抽樣技術(shù),在DAIC?WOZ數(shù)據(jù)集上相較于對(duì)比方法在F1值上提升了7%。2023年,Du等提出一種結(jié)合線性預(yù)測(cè)編碼(LPC)和MFCC的語音鏈模型,分別描述語音生成和感知的過程,通過CNN和長短時(shí)記憶網(wǎng)絡(luò)(LSTM)依次捕獲段內(nèi)和段間的動(dòng)態(tài)抑郁特征進(jìn)行分類,在DAIC?WOZ和MODMA數(shù)據(jù)集上分別取得77%和86%的準(zhǔn)確率。2024年,Das等結(jié)合MFCC和通過CNN提取的高級(jí)頻譜特征,在DAIC?WOZ數(shù)據(jù)集和MODMA數(shù)據(jù)集上的檢測(cè)準(zhǔn)確率超過90%。

2.4 文本模態(tài)模型構(gòu)建

文本數(shù)據(jù)也是抑郁識(shí)別的重要模態(tài)之一,研究人員通常會(huì)收集社交媒體平臺(tái)如Twitter、Facebook等用戶發(fā)布的文本數(shù)據(jù),通過自然語言處理和文本挖掘等技術(shù)挖掘數(shù)據(jù)中有關(guān)個(gè)體的健康狀況、情緒狀態(tài)等方面的信息用于輔助評(píng)估抑郁的嚴(yán)重程度及潛在風(fēng)險(xiǎn)。然而,在許多國家和地區(qū)存在法律限制和隱私保密問題,諸多研究采用自行采集的文本數(shù)據(jù)集或從音頻數(shù)據(jù)中轉(zhuǎn)錄得到文本數(shù)據(jù)。

目前的研究根據(jù)抑郁癥語言使用模式特點(diǎn),通過詞頻計(jì)數(shù)、情感極性分析詞嵌入等方法提取文本中與抑郁癥狀標(biāo)志關(guān)聯(lián)的特征,從而進(jìn)行抑郁識(shí)別算法分類(圖5)。抑郁文本分析的相關(guān)研究主要包括基于規(guī)則的方法和基于機(jī)器學(xué)習(xí)的方法?;谝?guī)則的文本分析利用預(yù)定義的規(guī)則和模式來解析和提取文本中的有用信息。這種方法通常使用正則表達(dá)式和語法解析器來識(shí)別和提取文本中的關(guān)鍵信息?;跈C(jī)器學(xué)習(xí)的方法使用大規(guī)模文本數(shù)據(jù)進(jìn)行訓(xùn)練,可以在分類和識(shí)別等下游任務(wù)中應(yīng)用,具有高準(zhǔn)確、可擴(kuò)展等優(yōu)點(diǎn),通過改變模型參數(shù)和算法,適應(yīng)各種不同的文本數(shù)據(jù),還能夠通過增加訓(xùn)練數(shù)據(jù)和特征選擇等方法,進(jìn)一步提高模型的性能。但這種方法需要大量的訓(xùn)練數(shù)據(jù)和計(jì)算資源,對(duì)于文本特征的解釋性較弱,使得該方法在深入了解抑郁癥的機(jī)理和相關(guān)因素方面存在局限性。


圖5 抑郁識(shí)別語音模態(tài)模型流程圖

隨著深度學(xué)習(xí)等技術(shù)的發(fā)展,通過詞嵌入等方法將文本中的單詞或短語進(jìn)行向量表示的研究愈來愈普遍。目前應(yīng)用于文本分類模型的典型特征生成方法包括OneHot編碼、關(guān)鍵詞權(quán)重(TF?IDF、Text-Rank等)、主題模型(LSA、LDA、LDA2Vec等)、詞嵌入(BERT Embedding)等。2016年,Williamson等從DAIC?WOZ數(shù)據(jù)集的文本中分別提取了語義內(nèi)容特征和語義上下文特征。語義內(nèi)容特征由GloVe詞嵌入模型生成詞向量的平均向量表示對(duì)話語句,用主成分分析和零相位成分分析進(jìn)行稀疏編碼后,通過支持向量回歸算法對(duì)表示向量和PHQ?9分?jǐn)?shù)進(jìn)行回歸。語義上下文特征從文本中提取抑郁、感受、治療和自殺4個(gè)指標(biāo),計(jì)算4個(gè)指標(biāo)的總和。結(jié)果顯示,DAIC?WOZ數(shù)據(jù)集本文對(duì)話中提問部分的最大F1值達(dá)到75%,回答部分的最大F1值達(dá)到62%。2022年,Amanat等通過獨(dú)熱編碼和主成分分析從Twitter抑郁文本數(shù)據(jù)集中提取特征,進(jìn)一步使用RNN?LSTM模型進(jìn)行預(yù)測(cè),10折交叉驗(yàn)證的結(jié)果顯示模型達(dá)到99.44%的靈敏度和99.7%的特異度。2022年,Uddin等從醫(yī)學(xué)和心理學(xué)專家預(yù)定義的抑郁癥狀作為特征,采用LSTM算法進(jìn)行分類,在挪威公共在線頻道年輕用戶的文本數(shù)據(jù)集拆分的2個(gè)數(shù)據(jù)集上分別達(dá)到98%、99%的準(zhǔn)確率,并通過可解釋人工智能對(duì)機(jī)器學(xué)習(xí)模型的結(jié)果進(jìn)行了解釋。2023年,Yadav等提出一種基于患者訪談文本轉(zhuǎn)錄的抑郁識(shí)別方法,結(jié)合了用于處理語言信息的雙向門控循環(huán)單元和用于集成模型輸出的全耦合網(wǎng)絡(luò),該方法可以提高識(shí)別的準(zhǔn)確性和效率,F(xiàn)1值達(dá)到92%。

2.5 多模態(tài)融合及模型構(gòu)建

計(jì)算機(jī)輔助抑郁識(shí)別依賴視覺、語言和社會(huì)特征等多維指標(biāo)的綜合判斷,計(jì)算機(jī)視覺、自然語言處理、語音處理等領(lǐng)域的專家傾向于應(yīng)用自己對(duì)應(yīng)領(lǐng)域的算法模型,但單一模態(tài)數(shù)據(jù)不足以提供足夠的信息,需要綜合多個(gè)領(lǐng)域、多種模態(tài)的專家知識(shí),以實(shí)現(xiàn)抑郁相關(guān)多維指標(biāo)特征之間的有效信息融合。多模態(tài)技術(shù)運(yùn)用多種不同的信息以更好地捕捉和理解事物的復(fù)雜性,廣泛應(yīng)用于情感識(shí)別等領(lǐng)域。在這些領(lǐng)域中,多模態(tài)數(shù)據(jù)可提供關(guān)于事物的多方面信息,對(duì)于理解事物的復(fù)雜性和捕捉不同維度的特征提供有力支持,進(jìn)一步提高抑郁檢測(cè)識(shí)別模型的準(zhǔn)確性。

多模態(tài)特征融合抽取來自不同模態(tài)數(shù)據(jù)的信息,整合成更豐富的多模態(tài)特征表征,以提高模型的魯棒性。但是,特征的有效融合仍是目前的研究難點(diǎn)之一。目前比較常見的特征融合方法有特征拼接、跨模態(tài)注意力機(jī)制和條件批歸一化(CBN)等。其中,特征拼接是一種簡單直觀的特征拼接方式,將來自不同模態(tài)的特征向量進(jìn)行拼接或加權(quán),拼接后的融合特征向量輸入神經(jīng)網(wǎng)絡(luò)。跨模態(tài)注意力機(jī)制則通過計(jì)算模態(tài)間的注意力權(quán)重,對(duì)模態(tài)特征進(jìn)行加權(quán)融合。CBN則是通過在批歸一化中引入額外的條件信息,來增強(qiáng)模型對(duì)不同模態(tài)數(shù)據(jù)的適應(yīng)能力。

隨著人工智能和深度學(xué)習(xí)技術(shù)的進(jìn)步,尤其是跨模態(tài)的特征融合技術(shù)的不斷發(fā)展,近幾年利用多模態(tài)數(shù)據(jù)進(jìn)行抑郁識(shí)別的研究受到了越來越多研究者的關(guān)注。通過結(jié)合多模態(tài)的數(shù)據(jù),能夠更全面地了解患者的情況,提高抑郁識(shí)別模型的準(zhǔn)確性和有效性。2019年,Wang等融合了眼球運(yùn)動(dòng)、記憶特征、認(rèn)知風(fēng)格特征和網(wǎng)絡(luò)行為特征用于診斷抑郁傾向,通過模型堆疊的方式提取非線性特征,達(dá)到模型泛化效果。2021年,Schultebraucks等從非結(jié)構(gòu)化臨床訪談中提取面部、語音、語言和運(yùn)動(dòng)特征作為輸入對(duì)創(chuàng)傷后應(yīng)激障礙(PTSD)和抑郁癥狀態(tài)的分類,解釋了患者和健康人群在運(yùn)動(dòng)協(xié)調(diào)、處理速度、情緒偏差、持續(xù)注意力、控制注意力、認(rèn)知靈活性、認(rèn)知抑制和執(zhí)行能力等認(rèn)知功能上的差異,結(jié)果顯示基于視頻和音頻的標(biāo)記能準(zhǔn)確區(qū)分PTSD狀態(tài),F(xiàn)1值分別為0.83、0.8。2022年,Liu等通過采集參與者在自然行走、情景訪談、閱讀情感文本和觀看情感視頻等任務(wù)時(shí)的視頻和音頻,分別提取視頻幀和音頻特征,利用VGG-Face、ResNet50、VGG16和DenseNet網(wǎng)絡(luò)得到不同模態(tài)的特征向量,通過門控循環(huán)單元分別決策后進(jìn)行結(jié)果融合,在測(cè)試集上的負(fù)性樣本、中性樣本和正性樣本的RMSE分別為10.59、10.64和10.13。2023年,F(xiàn)ang等提出了一種具有多層次注意力機(jī)制的多模態(tài)融合模型,第一階段通過2個(gè)LSTM和一個(gè)雙向LSTM(Bi?LSTM)分別提取視覺、音頻和文本特征,第二階段通過注意力融合網(wǎng)絡(luò)利用模態(tài)之間的多樣性和互補(bǔ)性進(jìn)行抑郁識(shí)別,在DAIC?WOZ數(shù)據(jù)集上實(shí)現(xiàn)了RMSE最優(yōu)。

2.6 其他模態(tài)數(shù)據(jù)及模型構(gòu)建

肢體運(yùn)動(dòng)、腦部信號(hào)等生物標(biāo)志也能夠用于抑郁識(shí)別。根據(jù)抑郁患者步態(tài)和運(yùn)動(dòng)等方面表現(xiàn)出的癥狀,Wang等通過參與者的步態(tài)數(shù)據(jù)提取左右臂擺動(dòng)、頭部垂直運(yùn)動(dòng)、左右步幅和步行速度等時(shí)空特征進(jìn)行抑郁識(shí)別。特征包括Kinect采集的25個(gè)關(guān)鍵點(diǎn)在x,y,z軸上的均值、標(biāo)準(zhǔn)差、偏度和峰度等時(shí)域特征,以及離散傅里葉變換得到的頻域特征。模型融合所有特征進(jìn)行10折交叉驗(yàn)證,分類靈敏度、特異度和AUC分別達(dá)到0.94、0.91和0.93。針對(duì)抑郁患者的腦電信號(hào)差異,深度學(xué)習(xí)方法,尤其是CNN和LSTM,被廣泛應(yīng)用于特征提取、抑郁識(shí)別分類和評(píng)估任務(wù)。2020年,Zhang等提出了一種基于靜息態(tài)腦電的抑郁癥分類腦功能網(wǎng)絡(luò)架構(gòu),以考慮電極之間的相關(guān)性和大腦異常拓?fù)浣Y(jié)構(gòu)的變化。對(duì)不同腦電頻段和不同腦區(qū)進(jìn)行統(tǒng)計(jì)分析,結(jié)果表明大腦的改變主要在左腦的額葉、顳葉、頂枕區(qū)和右腦的顳葉區(qū),且theta頻帶左中央?yún)^(qū)域的平均最短路徑長度、聚類系數(shù)以及右頂枕區(qū)域的節(jié)點(diǎn)中介中心度與抑郁癥的PHQ?9評(píng)分顯著相關(guān),最高分類準(zhǔn)確率達(dá)到93.31%。2023年,Xu等針對(duì)靜息態(tài)腦電,提出一種多分辨率CNN結(jié)合LSTM以及殘差擠壓和激勵(lì)的深度學(xué)習(xí)模型,結(jié)果表明腦電頻段越高抑郁識(shí)別效果越好,在高頻8~30 Hz實(shí)現(xiàn)了(98.48±0.22)%的最高分類準(zhǔn)確率。

3 計(jì)算機(jī)輔助抑郁識(shí)別的優(yōu)勢(shì)與挑戰(zhàn)

現(xiàn)有研究根據(jù)抑郁患者在面部表情、語言表達(dá)和肢體動(dòng)作等特征上的差異,從圖像、音頻和文本多模態(tài)數(shù)據(jù)中提取特征,通過機(jī)器學(xué)習(xí)算法對(duì)抑郁癥狀進(jìn)行識(shí)別和分類,在準(zhǔn)確率、召回率、F1、RMSE和MAE等指標(biāo)上達(dá)到了良好的效果,說明心理學(xué)、臨床醫(yī)學(xué)等領(lǐng)域提取的標(biāo)識(shí)特征在抑郁識(shí)別領(lǐng)域的有效性。

計(jì)算機(jī)輔助識(shí)別方法能夠提供一種相對(duì)簡便、規(guī)范化的篩查方式,具備與目前廣泛使用的量表篩查、醫(yī)師診斷等方式協(xié)同增效的潛能,尤其針對(duì)傳統(tǒng)抑郁篩查量表中存在社會(huì)稱許性誤差、對(duì)主觀判斷依賴高等問題,計(jì)算機(jī)輔助篩查能夠提供更加客觀的篩查結(jié)果,具體表現(xiàn)為以下3方面。

1)現(xiàn)有診斷方式依賴于患者對(duì)自我的合理評(píng)估,但由于心理測(cè)量中普遍存在的社會(huì)稱許性等問題,患者對(duì)自己的評(píng)估往往傾向于偏離難以被社會(huì)接受的消極行為,偏向能夠被社會(huì)認(rèn)可的積極行為,導(dǎo)致心理測(cè)評(píng)的結(jié)果出現(xiàn)偏差。而計(jì)算機(jī)輔助篩查能夠根據(jù)患者的面部行為、語言表達(dá)等數(shù)據(jù),規(guī)范提取篩查指標(biāo)、構(gòu)建識(shí)別模型,結(jié)果相對(duì)客觀準(zhǔn)確,能夠輔助醫(yī)師進(jìn)行抑郁癥篩查。

2)抑郁的診斷篩查方法較為繁瑣,在社會(huì)醫(yī)療資源緊張的情況下難以廣泛大規(guī)模推廣使用。目前,抑郁診斷很大程度依賴行為癥狀學(xué)指標(biāo),在臨床實(shí)踐上具有可操作性,但依賴醫(yī)師對(duì)患者心理狀況的問詢和對(duì)臨床表現(xiàn)分析,對(duì)醫(yī)師的主觀判斷依賴程度較高,容易受到醫(yī)師臨床經(jīng)驗(yàn)、溝通技巧等因素影響,且診療的成本較高,容易給患者及其家庭帶來經(jīng)濟(jì)負(fù)擔(dān)。而計(jì)算機(jī)輔助篩查方式較容易廣泛地篩查,尤其是針對(duì)抑郁高風(fēng)險(xiǎn)的人群進(jìn)行便捷、快速的檢測(cè)。此外,人工智能模型的訓(xùn)練和評(píng)估過程可以在大規(guī)模樣本上進(jìn)行,從而構(gòu)建更具代表性和準(zhǔn)確性的模型。

3)由于對(duì)抑郁癥等心理精神疾病的病恥感與文化易感性,中國抑郁患者相較于國外患者更容易表達(dá)軀體癥狀的不適,包括失眠、體重減輕、食欲不振、頭痛、腸胃道或呼吸系統(tǒng)癥狀等,在問診過程中癥狀表述容易和其他綜合性疾病混淆,出現(xiàn)誤診和漏診。因此,采集適用于中國患者的抑郁識(shí)別數(shù)據(jù)、構(gòu)建相應(yīng)的模型算法和篩查系統(tǒng)對(duì)于篩查的準(zhǔn)確性至關(guān)重要。目前抑郁識(shí)別算法達(dá)到了良好的識(shí)別效果但仍面臨諸多挑戰(zhàn),包括中文數(shù)據(jù)集有待擴(kuò)充、現(xiàn)有數(shù)據(jù)集樣本量較少、模型參數(shù)和特征解釋不足等現(xiàn)象,有待進(jìn)一步研究。

首先,相關(guān)研究的開放數(shù)據(jù)集以英文居多中文數(shù)據(jù)集有待擴(kuò)充。由于國內(nèi)外抑郁患者在面部特點(diǎn)、語言使用特點(diǎn)等方面存在一定差異,國外數(shù)據(jù)集的研究結(jié)果在中國人群中的適用性不明確、相關(guān)研究理論不足,仍需要更多的理論及實(shí)驗(yàn)支撐。中國本土化的抑郁篩查工具的發(fā)展是近年來備受關(guān)注的研究方向之一。本土化的抑郁癥篩查工具的發(fā)展,在充分考慮中國人文化背景和心理特點(diǎn)、構(gòu)建更加精準(zhǔn)的指標(biāo)和方法的基礎(chǔ)上,對(duì)于提高應(yīng)用于中國患者的抑郁篩查工具的有效性和準(zhǔn)確性上具有重要的意義。

其次目前抑郁識(shí)別數(shù)據(jù)集樣本量較少,且部分?jǐn)?shù)據(jù)集有較明顯的樣本分布不平衡現(xiàn)象,即健康對(duì)照組的數(shù)據(jù)樣本量明顯多于抑郁患者的數(shù)量。非均衡樣本對(duì)于抑郁識(shí)別的分類算法的準(zhǔn)確性和有效性存在考驗(yàn)。

最后,目前研究對(duì)提取特征和模型參數(shù)的解釋性不足模型的輸入輸出和內(nèi)部的工作原理和運(yùn)行機(jī)制不透明,多模態(tài)抑郁識(shí)別算法在臨床上難以得到充分應(yīng)用。相關(guān)研究實(shí)驗(yàn)結(jié)果及分析中,不僅僅需要提升模型準(zhǔn)確率等指標(biāo),特征提取及模型構(gòu)建的理論及實(shí)驗(yàn)分析也尤為重要。

4 結(jié)論

抑郁量表作為目前抑郁癥狀主要篩查方式,主要根據(jù)典型癥狀出現(xiàn)的頻次、嚴(yán)重程度及持續(xù)時(shí)長,評(píng)估測(cè)評(píng)者是否有抑郁癥狀及抑郁程度,具有良好的信效度。但傳統(tǒng)測(cè)量工具可能受到醫(yī)生主觀判斷和患者自我認(rèn)知的影響,客觀性和便捷性不足。隨著機(jī)器學(xué)習(xí)等技術(shù)的發(fā)展,計(jì)算機(jī)輔助篩查方式為抑郁癥狀篩查提供了新的解決方案。基于視覺語音、文本等多模態(tài)特征,模型能夠有效對(duì)抑郁癥狀進(jìn)行分類分級(jí)提供了一種相對(duì)快速、準(zhǔn)確的識(shí)別方法。目前抑郁識(shí)別檢測(cè)算法在準(zhǔn)確率、召回率、F1值等指標(biāo)上已達(dá)到了較好的指標(biāo)效果,但開放數(shù)據(jù)集樣本量較少,且部分?jǐn)?shù)據(jù)集的樣本分布不均衡,為進(jìn)一步提升算法精度帶來了挑戰(zhàn)。在抑郁識(shí)別工具的應(yīng)用上,目前抑郁識(shí)別研究中模型特征和參數(shù)的可解釋性不足,相關(guān)理論及實(shí)驗(yàn)研究對(duì)抑郁識(shí)別算法未來在臨床上的落地應(yīng)用尤為重要。

本文作者:辜雅婷,張遲,馬飛,賈曉健,倪士光

作者簡介:辜雅婷,清華大學(xué)深圳國際研究生院,碩士研究生,研究方向?yàn)槿斯ぶ悄?,心理和行為大?shù)據(jù);馬飛(通信作者),人工智能與數(shù)字經(jīng)濟(jì)廣東省實(shí)驗(yàn)室(深圳),研究員,研究方向?yàn)槊襟w內(nèi)容理解與生成;倪士光(共同通信作者),清華大學(xué)深圳國際研究生院,教授,研究方向?yàn)榉e極和健康心理學(xué)及人工智能交叉創(chuàng)新。

文章來 源 : 辜雅婷, 張遲, 馬飛, 等. 計(jì)算機(jī)輔助抑郁障礙識(shí)別研究進(jìn)展[J]. 科技導(dǎo)報(bào), 2025, 43(14): 82?93 .


內(nèi)容為【科技導(dǎo)報(bào)】公眾號(hào)原創(chuàng),歡迎轉(zhuǎn)載
白名單回復(fù)后臺(tái)「轉(zhuǎn)載」

《科技導(dǎo)報(bào)》創(chuàng)刊于1980年,中國科協(xié)學(xué)術(shù)會(huì)刊,主要刊登科學(xué)前沿和技術(shù)熱點(diǎn)領(lǐng)域突破性的研究成果、權(quán)威性的科學(xué)評(píng)論、引領(lǐng)性的高端綜述,發(fā)表促進(jìn)經(jīng)濟(jì)社會(huì)發(fā)展、完善科技管理、優(yōu)化科研環(huán)境、培育科學(xué)文化、促進(jìn)科技創(chuàng)新和科技成果轉(zhuǎn)化的決策咨詢建議。常設(shè)欄目有院士卷首語、科技新聞、科技評(píng)論、專稿專題、綜述、論文、政策建議、科技人文等。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
男子炒股10年傾家蕩產(chǎn),如今妻子病重急需用錢,打開電腦后他傻眼

男子炒股10年傾家蕩產(chǎn),如今妻子病重急需用錢,打開電腦后他傻眼

罪案洞察者
2025-09-02 11:30:12
女兒墨爾本打工13年寄回家7800萬,母親前往探望,見到女兒卻愣了

女兒墨爾本打工13年寄回家7800萬,母親前往探望,見到女兒卻愣了

罪案洞察者
2025-09-02 11:41:42
我國九三閱兵剛結(jié)束,這五國表態(tài)來了,尤其是新加坡,非常不一般

我國九三閱兵剛結(jié)束,這五國表態(tài)來了,尤其是新加坡,非常不一般

DS北風(fēng)
2025-09-04 18:59:12
京圈大花給老公選妃的瓜

京圈大花給老公選妃的瓜

熱鬧吃瓜大姐
2025-09-02 20:53:53
大快人心!馬克龍悍然插手中國內(nèi)政,不到48小時(shí)法政府陷倒臺(tái)危機(jī)

大快人心!馬克龍悍然插手中國內(nèi)政,不到48小時(shí)法政府陷倒臺(tái)危機(jī)

小莜讀史
2025-09-05 17:44:46
U23國足VS北馬里亞納群島:王牌鐵腰缺陣 蒯紀(jì)聞?lì)I(lǐng)銜 朱鵬宇沖鋒

U23國足VS北馬里亞納群島:王牌鐵腰缺陣 蒯紀(jì)聞?lì)I(lǐng)銜 朱鵬宇沖鋒

零度眼看球
2025-09-06 06:55:27
確認(rèn)了,上海下周降溫!

確認(rèn)了,上海下周降溫!

魯中晨報(bào)
2025-09-05 20:23:09
金正恩為何帶12歲的女兒來大閱兵?

金正恩為何帶12歲的女兒來大閱兵?

天真無牙
2025-09-04 08:37:07
淚目!102歲抗戰(zhàn)老兵看完閱兵,當(dāng)晚安詳離世,這盛世沒讓您失望

淚目!102歲抗戰(zhàn)老兵看完閱兵,當(dāng)晚安詳離世,這盛世沒讓您失望

派大星紀(jì)錄片
2025-09-04 17:45:11
金正恩剛回朝鮮,不到24小時(shí),三國將在半島軍演,中方態(tài)度很明確

金正恩剛回朝鮮,不到24小時(shí),三國將在半島軍演,中方態(tài)度很明確

近史博覽
2025-09-06 05:53:07
小學(xué)生“畫下媽媽睡姿”走紅,畫面過于寫實(shí),老師不得不打滿分

小學(xué)生“畫下媽媽睡姿”走紅,畫面過于寫實(shí),老師不得不打滿分

熙熙說教
2025-08-24 21:20:14
隊(duì)友不愿?jìng)髑??身價(jià)8500萬歐元的前鋒在德國隊(duì)完全迷失

隊(duì)友不愿?jìng)髑颍可韮r(jià)8500萬歐元的前鋒在德國隊(duì)完全迷失

星耀國際足壇
2025-09-06 00:50:06
5-0大捷,加圖索是本世紀(jì)第三位首秀贏球的意大利隊(duì)主帥

5-0大捷,加圖索是本世紀(jì)第三位首秀贏球的意大利隊(duì)主帥

懂球帝
2025-09-06 05:10:18
42歲張杰官宣,網(wǎng)友炸鍋了

42歲張杰官宣,網(wǎng)友炸鍋了

FM93浙江交通之聲
2025-09-06 00:16:12
中國大閱兵后,第一個(gè)對(duì)手出現(xiàn)?中方這次真發(fā)火了,進(jìn)行強(qiáng)烈譴責(zé)

中國大閱兵后,第一個(gè)對(duì)手出現(xiàn)?中方這次真發(fā)火了,進(jìn)行強(qiáng)烈譴責(zé)

知鑒明史
2025-09-05 09:35:57
奧萊報(bào):世界還未準(zhǔn)備接受梅西退役,按此狀態(tài)明年世界杯必有他在

奧萊報(bào):世界還未準(zhǔn)備接受梅西退役,按此狀態(tài)明年世界杯必有他在

直播吧
2025-09-05 20:19:05
億萬身家莊華去世,年僅62歲,上午簽千萬大單,下午健身時(shí)倒下

億萬身家莊華去世,年僅62歲,上午簽千萬大單,下午健身時(shí)倒下

阿器談史
2025-09-06 06:31:10
沈逸解析部分中國精英心態(tài):若中國科技趕超,綠卡價(jià)值或受影響

沈逸解析部分中國精英心態(tài):若中國科技趕超,綠卡價(jià)值或受影響

春秋論娛
2025-09-06 07:59:28
隨著女排世錦賽四強(qiáng)的全部產(chǎn)生,竟然產(chǎn)生3個(gè)意想不到!

隨著女排世錦賽四強(qiáng)的全部產(chǎn)生,竟然產(chǎn)生3個(gè)意想不到!

田先生籃球
2025-09-05 06:53:15
到底誰在喜歡這種病態(tài)美?27歲宋祖兒現(xiàn)身南京,雙腿瘦成皮包骨

到底誰在喜歡這種病態(tài)美?27歲宋祖兒現(xiàn)身南京,雙腿瘦成皮包骨

娘娘不想上班
2025-08-25 18:17:23
2025-09-06 09:15:00
科技導(dǎo)報(bào) incentive-icons
科技導(dǎo)報(bào)
中國科協(xié)學(xué)術(shù)會(huì)刊
4887文章數(shù) 8309關(guān)注度
往期回顧 全部

健康要聞

內(nèi)分泌科專家破解身高八大謠言

頭條要聞

西方26國宣布已準(zhǔn)備好向?yàn)蹩颂m出兵 普京:敢來就打

頭條要聞

西方26國宣布已準(zhǔn)備好向?yàn)蹩颂m出兵 普京:敢來就打

體育要聞

西甲最窮的“草臺(tái)班子”,竟然打進(jìn)歐戰(zhàn)了

娛樂要聞

!被罵“戀愛腦”的董璇玩脫了?

財(cái)經(jīng)要聞

拖欠訂單 立訊精密被供應(yīng)商索賠3343萬

科技要聞

超1萬億參數(shù)!阿里史上最大最強(qiáng)模型免費(fèi)上線

汽車要聞

華為乾崑技術(shù)日 實(shí)測(cè)ADS4已無限接近人類司機(jī)

態(tài)度原創(chuàng)

家居
手機(jī)
旅游
數(shù)碼
公開課

家居要聞

親子空間 舒適家居氛圍

手機(jī)要聞

蘋果 iPhone 17 Pro 將迎史上最大相機(jī)升級(jí):4800 萬長焦等

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

數(shù)碼要聞

海信炸場(chǎng) IFA 2025,全球顯示進(jìn)入RGB-Mini LED時(shí)刻

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版