案例編寫人:
田涵
北京互聯(lián)網(wǎng)法院政治部副主任
《殷某楨訴北京某智能科技公司等人格權(quán)糾紛案(入庫編號(hào):2025-07-2-474-001)》解讀
當(dāng)前,人工智能技術(shù)快速發(fā)展,對(duì)經(jīng)濟(jì)社會(huì)發(fā)展和人類文明進(jìn)步產(chǎn)生深遠(yuǎn)影響,也帶來難以預(yù)知的各種風(fēng)險(xiǎn)和復(fù)雜挑戰(zhàn)。在日常生活中,利用人工智能技術(shù)處理自然人的聲音并進(jìn)行商業(yè)化應(yīng)用的情形較為常見,公眾通常難以區(qū)分哪些是“合成”的聲音,哪些是自然人的聲音。一些企業(yè)濫用人工智能技術(shù),未經(jīng)授權(quán)隨意“合成”足以以假亂真的聲音用于經(jīng)營性活動(dòng),引發(fā)公眾對(duì)發(fā)展人工智能技術(shù)的擔(dān)憂,應(yīng)當(dāng)依法予以規(guī)制。然而,對(duì)于“合成”聲音是否侵犯自然人合法權(quán)益、侵犯何種權(quán)益,法律上并無明確規(guī)定,實(shí)踐中亦存在一定認(rèn)識(shí)分歧,亟待通過確立裁判規(guī)則予以回應(yīng)。對(duì)此,人民法院案例庫入庫參考案例《殷某楨訴北京某智能科技公司等人格權(quán)糾紛案(入庫編號(hào):2025- 07- 2- 474- 001)》明確了經(jīng)人工智能技術(shù)處理的聲音受聲音權(quán)益保護(hù)的認(rèn)定標(biāo)準(zhǔn),即“對(duì)于人工智能技術(shù)處理后的聲音,一般社會(huì)公眾或者一定范圍內(nèi)的公眾根據(jù)音色、語調(diào)和發(fā)音風(fēng)格,能夠識(shí)別出特定自然人的,則該聲音屬于自然人聲音權(quán)益的保護(hù)范圍。未經(jīng)自然人許可使用經(jīng)人工智能技術(shù)處理的聲音,構(gòu)成對(duì)自然人聲音權(quán)益的侵權(quán)”,為類案裁判提供借鑒和參考?,F(xiàn)就有關(guān)問題解讀如下:
一、經(jīng)人工智能技術(shù)處理的聲音屬于自然人聲音權(quán)益保護(hù)范圍的認(rèn)定
聲音與肖像、姓名一樣,都是民事主體的外在表征。民法典第一千零二十三條規(guī)定“對(duì)自然人聲音的保護(hù),參照適用肖像權(quán)保護(hù)的有關(guān)規(guī)定”,明確將自然人聲音權(quán)益作為人格權(quán)予以保護(hù)。據(jù)此,民法典關(guān)于肖像的認(rèn)定、肖像權(quán)的權(quán)能及合理使用等規(guī)定,適用于對(duì)自然人聲音權(quán)益的保護(hù)。根據(jù)民法典第一千零一十八條第二款關(guān)于肖像的定義,肖像具有可以識(shí)別特定自然人的屬性。因而,自然人聲音受到人格權(quán)保護(hù)的前提,也應(yīng)當(dāng)是具有識(shí)別特定自然人的屬性。實(shí)踐中有爭議的問題在于,經(jīng)人工智能技術(shù)處理后的聲音是否落入自然人聲音權(quán)益的保護(hù)范圍。對(duì)此,應(yīng)當(dāng)從自然人聲音權(quán)益的認(rèn)定標(biāo)準(zhǔn)出發(fā),能識(shí)別出該特定自然人的,可以認(rèn)定為屬于該自然人聲音權(quán)益的保護(hù)范圍,反之則不能受自然人聲音權(quán)益的保護(hù)。
關(guān)于聲音的可識(shí)別性認(rèn)定標(biāo)準(zhǔn),可以從處理方式角度,結(jié)合主客觀因素綜合考量。根據(jù)聲音的處理方式具體分為兩類:一類是直接使用自然人聲音,如通過音頻、視頻等形式對(duì)自然人聲音錄制、公開、模仿、拼接、篡改等;另一類是利用人工智能技術(shù)合成新的聲音。本案例即為第二類合成聲音的情形。聲音領(lǐng)域的人工智能技術(shù)通常是指文本轉(zhuǎn)語音,即利用深度學(xué)習(xí)技術(shù)對(duì)自然人聲音數(shù)據(jù)進(jìn)行學(xué)習(xí),通過文本轉(zhuǎn)語音操作。
經(jīng)人工智能技術(shù)合成后的聲音是否具備可識(shí)別性,關(guān)鍵在于能否識(shí)別出自然人主體身份。對(duì)此,不能僅依靠聲紋辨認(rèn)、聲紋確認(rèn)的客觀標(biāo)準(zhǔn),還需結(jié)合使用方式,將新的聲音的音色、語音語調(diào)、發(fā)音風(fēng)格等與自然人聲音作對(duì)比,同時(shí)根據(jù)自然人的社會(huì)知名度,采取一般社會(huì)公眾、一定范圍內(nèi)公眾的主觀標(biāo)準(zhǔn)進(jìn)行綜合判斷。例如,對(duì)于知名人物,由于其聲音音色、語音語調(diào)、發(fā)音風(fēng)格等獨(dú)特性,通常為一般社會(huì)大眾所熟知,此時(shí)以一般社會(huì)公眾能否識(shí)別作為判斷標(biāo)準(zhǔn)進(jìn)行判定;而對(duì)于配音演員等從事與聲音密切的行業(yè)的人員,應(yīng)以在一定范圍內(nèi)(如配音領(lǐng)域內(nèi))公眾能否識(shí)別作為判斷標(biāo)準(zhǔn)。
本案例中,殷某楨是配音演員,經(jīng)當(dāng)庭勘驗(yàn),某軟件公司利用人工智能技術(shù)處理后形成的聲音與殷某楨的音色、語調(diào)、發(fā)音風(fēng)格等具有高度一致性,能夠引起一般人產(chǎn)生與殷某楨有關(guān)的思想或感情活動(dòng),能夠?qū)⒃撀曇袈?lián)系到殷某楨本人,進(jìn)而識(shí)別出殷某楨的主體身份。因此,案涉經(jīng)人工智能技術(shù)合成的聲音屬于殷某楨聲音權(quán)益的保護(hù)范圍。
二、人工智能技術(shù)處理聲音構(gòu)成侵權(quán)的認(rèn)定
民法典第九百九十五條規(guī)定:“人格權(quán)受到侵害的,受害人有權(quán)依照本法和其他法律的規(guī)定請(qǐng)求行為人承擔(dān)民事責(zé)任。受害人的停止侵害、排除妨礙、消除危險(xiǎn)、消除影響、恢復(fù)名譽(yù)、賠禮道歉請(qǐng)求權(quán),不適用訴訟時(shí)效的規(guī)定?!痹摋l規(guī)定為自然人的人格權(quán)益受到侵害時(shí)的救濟(jì)提供法律依據(jù),從而實(shí)現(xiàn)保護(hù)人格尊嚴(yán)的目的。本案例系人格權(quán)侵權(quán)案件,按照民法典關(guān)于侵權(quán)責(zé)任的有關(guān)規(guī)定,認(rèn)定被告的行為是否構(gòu)成對(duì)殷某楨聲音權(quán)益的侵害,應(yīng)從侵害行為、侵害后果、因果關(guān)系、主觀過錯(cuò)等方面綜合考量。關(guān)于侵害行為方面,本案例中被訴侵權(quán)行為有二:一是未經(jīng)自然人許可使用其聲音用于訓(xùn)練素材,二是未經(jīng)許可使用經(jīng)人工智能技術(shù)生成的聲音。具體而言:
第一個(gè)侵權(quán)行為涉及人工智能訓(xùn)練素材的“投喂”過程。通常而言,訓(xùn)練方將自然人的聲音片段進(jìn)行“投喂”,“投喂”的素材越多,生成的聲音準(zhǔn)確度、還原度就越高。在“投喂”聲音的過程中,還可以進(jìn)行微調(diào)訓(xùn)練,讓人工智能自主學(xué)習(xí)“投喂”的聲音數(shù)據(jù)的音色、音調(diào)等信息,而隨著訓(xùn)練次數(shù)的增加,生成的聲音就與該自然人的聲音越相似。由于“投喂”訓(xùn)練素材需要使用自然人原本的聲音,若未經(jīng)自然人許可就直接使用,則構(gòu)成對(duì)自然人聲音權(quán)益的侵害。根據(jù)查明事實(shí),殷某楨為某文化公司錄制錄音制品,某文化公司依照約定對(duì)錄音制品享有著作權(quán)等權(quán)利,但不享有授權(quán)他人處理并使用殷某楨聲音的權(quán)利。某文化公司將并非殷某楨本人簽署的《數(shù)據(jù)授權(quán)書》提供給某軟件公司,允許某軟件公司以商業(yè)或非商業(yè)的用途使用、復(fù)制、修改數(shù)據(jù)用于其產(chǎn)品及服務(wù)。某軟件公司僅以殷某楨錄制的一部錄音制品作為素材進(jìn)行人工智能處理,生成了案涉聲音,而殷某楨本人也未直接參與兩家公司的合作協(xié)商,且殷某楨并未授權(quán)某文化公司對(duì)外許可對(duì)其聲音進(jìn)行人工智能處理。因此,某軟件公司是在未經(jīng)殷某楨本人知情同意的情況下,利用人工智能處理并使用殷某楨聲音,該行為無合法權(quán)利來源,構(gòu)成對(duì)殷某楨聲音權(quán)益的侵犯。
第二個(gè)侵權(quán)行為是某軟件公司在經(jīng)營活動(dòng)中使用了經(jīng)人工智能技術(shù)生成的聲音。生成后的聲音是對(duì)殷某楨原始聲音的模仿,容易讓公眾誤認(rèn)為是殷某楨本人的聲音,可能會(huì)造成其人格尊嚴(yán)的貶損,而某軟件公司將未經(jīng)授權(quán)處理生成的聲音制作成文本轉(zhuǎn)語音產(chǎn)品,授權(quán)他人在網(wǎng)絡(luò)平臺(tái)上銷售,而北京某智能科技公司購買該文本轉(zhuǎn)語音產(chǎn)品后,直接在其平臺(tái)中使用,導(dǎo)致案涉聲音在網(wǎng)絡(luò)上被廣泛傳播,上述行為侵犯了殷某楨的聲音權(quán)益。
此外,關(guān)于侵害后果方面,聲音權(quán)益屬于法定的人格權(quán)益,適用人格權(quán)請(qǐng)求權(quán)有關(guān)規(guī)定。行使人格權(quán)請(qǐng)求權(quán)不以造成損害后果為要件,對(duì)于可能發(fā)生的妨害或者已經(jīng)存在的妨害,權(quán)利人可以通過停止妨害請(qǐng)求權(quán)尋求救濟(jì)。行使侵權(quán)請(qǐng)求權(quán)則需要以存在一定損害作為前提,以對(duì)權(quán)利人的損害進(jìn)行補(bǔ)償救濟(jì)。同時(shí),人工智能技術(shù)處理聲音的侵害行為與侵害后果發(fā)生之間應(yīng)當(dāng)存在因果關(guān)系,被告據(jù)此承擔(dān)相應(yīng)的責(zé)任。本案例中,某文化公司與某軟件公司的案涉侵權(quán)行為造成了殷某楨聲音權(quán)益受損的后果,應(yīng)當(dāng)承擔(dān)賠償損失的法律責(zé)任。其他被告對(duì)此不存在過錯(cuò),不承擔(dān)損害賠償責(zé)任,但應(yīng)當(dāng)承擔(dān)相應(yīng)賠禮道歉責(zé)任。
有必要提及的是,人工智能訓(xùn)練素材的合法性問題較為復(fù)雜,世界范圍內(nèi)尚無成熟解決方案。對(duì)此,本案例明確了使用自然人聲音作為訓(xùn)練素材的,使用人應(yīng)當(dāng)有較高的注意義務(wù),未取得自然人授權(quán)且不屬于合理使用的,構(gòu)成人格權(quán)的侵權(quán)。同時(shí)也應(yīng)看到,人工智能技術(shù)的快速發(fā)展,給人格權(quán)保護(hù)帶來前所未有的挑戰(zhàn)。在此背景下,如何發(fā)揮司法職能作用,推動(dòng)在法治軌道上加強(qiáng)和完善人工智能治理,不斷提升人工智能技術(shù)的安全性、可靠性、可控性、公平性,是人民法院工作面臨的時(shí)代課題,需要在實(shí)踐中不斷探索,并形成有益的裁判規(guī)則。
來源:京法網(wǎng)事
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.