網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

【普法課堂】AI“偷”走你的聲音怎么辦？——殷某楨訴北京某智能科技公司等人格權(quán)糾紛案解讀

2025-07-09 18:15:07　來源: 昌平女性

北京舉報(bào)

分享至

案例編寫人：

田涵

北京互聯(lián)網(wǎng)法院政治部副主任

《殷某楨訴北京某智能科技公司等人格權(quán)糾紛案（入庫編號(hào)：2025-07-2-474-001）》解讀

當(dāng)前，人工智能技術(shù)快速發(fā)展，對(duì)經(jīng)濟(jì)社會(huì)發(fā)展和人類文明進(jìn)步產(chǎn)生深遠(yuǎn)影響，也帶來難以預(yù)知的各種風(fēng)險(xiǎn)和復(fù)雜挑戰(zhàn)。在日常生活中，利用人工智能技術(shù)處理自然人的聲音并進(jìn)行商業(yè)化應(yīng)用的情形較為常見，公眾通常難以區(qū)分哪些是“合成”的聲音，哪些是自然人的聲音。一些企業(yè)濫用人工智能技術(shù)，未經(jīng)授權(quán)隨意“合成”足以以假亂真的聲音用于經(jīng)營性活動(dòng)，引發(fā)公眾對(duì)發(fā)展人工智能技術(shù)的擔(dān)憂，應(yīng)當(dāng)依法予以規(guī)制。然而，對(duì)于“合成”聲音是否侵犯自然人合法權(quán)益、侵犯何種權(quán)益，法律上并無明確規(guī)定，實(shí)踐中亦存在一定認(rèn)識(shí)分歧，亟待通過確立裁判規(guī)則予以回應(yīng)。對(duì)此，人民法院案例庫入庫參考案例《殷某楨訴北京某智能科技公司等人格權(quán)糾紛案（入庫編號(hào)：2025- 07- 2- 474- 001）》明確了經(jīng)人工智能技術(shù)處理的聲音受聲音權(quán)益保護(hù)的認(rèn)定標(biāo)準(zhǔn)，即“對(duì)于人工智能技術(shù)處理后的聲音，一般社會(huì)公眾或者一定范圍內(nèi)的公眾根據(jù)音色、語調(diào)和發(fā)音風(fēng)格，能夠識(shí)別出特定自然人的，則該聲音屬于自然人聲音權(quán)益的保護(hù)范圍。未經(jīng)自然人許可使用經(jīng)人工智能技術(shù)處理的聲音，構(gòu)成對(duì)自然人聲音權(quán)益的侵權(quán)”，為類案裁判提供借鑒和參考?，F(xiàn)就有關(guān)問題解讀如下：

一、經(jīng)人工智能技術(shù)處理的聲音屬于自然人聲音權(quán)益保護(hù)范圍的認(rèn)定

聲音與肖像、姓名一樣，都是民事主體的外在表征。民法典第一千零二十三條規(guī)定“對(duì)自然人聲音的保護(hù)，參照適用肖像權(quán)保護(hù)的有關(guān)規(guī)定”，明確將自然人聲音權(quán)益作為人格權(quán)予以保護(hù)。據(jù)此，民法典關(guān)于肖像的認(rèn)定、肖像權(quán)的權(quán)能及合理使用等規(guī)定，適用于對(duì)自然人聲音權(quán)益的保護(hù)。根據(jù)民法典第一千零一十八條第二款關(guān)于肖像的定義，肖像具有可以識(shí)別特定自然人的屬性。因而，自然人聲音受到人格權(quán)保護(hù)的前提，也應(yīng)當(dāng)是具有識(shí)別特定自然人的屬性。實(shí)踐中有爭議的問題在于，經(jīng)人工智能技術(shù)處理后的聲音是否落入自然人聲音權(quán)益的保護(hù)范圍。對(duì)此，應(yīng)當(dāng)從自然人聲音權(quán)益的認(rèn)定標(biāo)準(zhǔn)出發(fā)，能識(shí)別出該特定自然人的，可以認(rèn)定為屬于該自然人聲音權(quán)益的保護(hù)范圍，反之則不能受自然人聲音權(quán)益的保護(hù)。

關(guān)于聲音的可識(shí)別性認(rèn)定標(biāo)準(zhǔn)，可以從處理方式角度，結(jié)合主客觀因素綜合考量。根據(jù)聲音的處理方式具體分為兩類：一類是直接使用自然人聲音，如通過音頻、視頻等形式對(duì)自然人聲音錄制、公開、模仿、拼接、篡改等；另一類是利用人工智能技術(shù)合成新的聲音。本案例即為第二類合成聲音的情形。聲音領(lǐng)域的人工智能技術(shù)通常是指文本轉(zhuǎn)語音，即利用深度學(xué)習(xí)技術(shù)對(duì)自然人聲音數(shù)據(jù)進(jìn)行學(xué)習(xí)，通過文本轉(zhuǎn)語音操作。

經(jīng)人工智能技術(shù)合成后的聲音是否具備可識(shí)別性，關(guān)鍵在于能否識(shí)別出自然人主體身份。對(duì)此，不能僅依靠聲紋辨認(rèn)、聲紋確認(rèn)的客觀標(biāo)準(zhǔn)，還需結(jié)合使用方式，將新的聲音的音色、語音語調(diào)、發(fā)音風(fēng)格等與自然人聲音作對(duì)比，同時(shí)根據(jù)自然人的社會(huì)知名度，采取一般社會(huì)公眾、一定范圍內(nèi)公眾的主觀標(biāo)準(zhǔn)進(jìn)行綜合判斷。例如，對(duì)于知名人物，由于其聲音音色、語音語調(diào)、發(fā)音風(fēng)格等獨(dú)特性，通常為一般社會(huì)大眾所熟知，此時(shí)以一般社會(huì)公眾能否識(shí)別作為判斷標(biāo)準(zhǔn)進(jìn)行判定；而對(duì)于配音演員等從事與聲音密切的行業(yè)的人員，應(yīng)以在一定范圍內(nèi)（如配音領(lǐng)域內(nèi)）公眾能否識(shí)別作為判斷標(biāo)準(zhǔn)。

本案例中，殷某楨是配音演員，經(jīng)當(dāng)庭勘驗(yàn)，某軟件公司利用人工智能技術(shù)處理后形成的聲音與殷某楨的音色、語調(diào)、發(fā)音風(fēng)格等具有高度一致性，能夠引起一般人產(chǎn)生與殷某楨有關(guān)的思想或感情活動(dòng)，能夠?qū)⒃撀曇袈?lián)系到殷某楨本人，進(jìn)而識(shí)別出殷某楨的主體身份。因此，案涉經(jīng)人工智能技術(shù)合成的聲音屬于殷某楨聲音權(quán)益的保護(hù)范圍。

二、人工智能技術(shù)處理聲音構(gòu)成侵權(quán)的認(rèn)定

民法典第九百九十五條規(guī)定：“人格權(quán)受到侵害的，受害人有權(quán)依照本法和其他法律的規(guī)定請(qǐng)求行為人承擔(dān)民事責(zé)任。受害人的停止侵害、排除妨礙、消除危險(xiǎn)、消除影響、恢復(fù)名譽(yù)、賠禮道歉請(qǐng)求權(quán)，不適用訴訟時(shí)效的規(guī)定?！痹摋l規(guī)定為自然人的人格權(quán)益受到侵害時(shí)的救濟(jì)提供法律依據(jù)，從而實(shí)現(xiàn)保護(hù)人格尊嚴(yán)的目的。本案例系人格權(quán)侵權(quán)案件，按照民法典關(guān)于侵權(quán)責(zé)任的有關(guān)規(guī)定，認(rèn)定被告的行為是否構(gòu)成對(duì)殷某楨聲音權(quán)益的侵害，應(yīng)從侵害行為、侵害后果、因果關(guān)系、主觀過錯(cuò)等方面綜合考量。關(guān)于侵害行為方面，本案例中被訴侵權(quán)行為有二：一是未經(jīng)自然人許可使用其聲音用于訓(xùn)練素材，二是未經(jīng)許可使用經(jīng)人工智能技術(shù)生成的聲音。具體而言：

第一個(gè)侵權(quán)行為涉及人工智能訓(xùn)練素材的“投喂”過程。通常而言，訓(xùn)練方將自然人的聲音片段進(jìn)行“投喂”，“投喂”的素材越多，生成的聲音準(zhǔn)確度、還原度就越高。在“投喂”聲音的過程中，還可以進(jìn)行微調(diào)訓(xùn)練，讓人工智能自主學(xué)習(xí)“投喂”的聲音數(shù)據(jù)的音色、音調(diào)等信息，而隨著訓(xùn)練次數(shù)的增加，生成的聲音就與該自然人的聲音越相似。由于“投喂”訓(xùn)練素材需要使用自然人原本的聲音，若未經(jīng)自然人許可就直接使用，則構(gòu)成對(duì)自然人聲音權(quán)益的侵害。根據(jù)查明事實(shí)，殷某楨為某文化公司錄制錄音制品，某文化公司依照約定對(duì)錄音制品享有著作權(quán)等權(quán)利，但不享有授權(quán)他人處理并使用殷某楨聲音的權(quán)利。某文化公司將并非殷某楨本人簽署的《數(shù)據(jù)授權(quán)書》提供給某軟件公司，允許某軟件公司以商業(yè)或非商業(yè)的用途使用、復(fù)制、修改數(shù)據(jù)用于其產(chǎn)品及服務(wù)。某軟件公司僅以殷某楨錄制的一部錄音制品作為素材進(jìn)行人工智能處理，生成了案涉聲音，而殷某楨本人也未直接參與兩家公司的合作協(xié)商，且殷某楨并未授權(quán)某文化公司對(duì)外許可對(duì)其聲音進(jìn)行人工智能處理。因此，某軟件公司是在未經(jīng)殷某楨本人知情同意的情況下，利用人工智能處理并使用殷某楨聲音，該行為無合法權(quán)利來源，構(gòu)成對(duì)殷某楨聲音權(quán)益的侵犯。

第二個(gè)侵權(quán)行為是某軟件公司在經(jīng)營活動(dòng)中使用了經(jīng)人工智能技術(shù)生成的聲音。生成后的聲音是對(duì)殷某楨原始聲音的模仿，容易讓公眾誤認(rèn)為是殷某楨本人的聲音，可能會(huì)造成其人格尊嚴(yán)的貶損，而某軟件公司將未經(jīng)授權(quán)處理生成的聲音制作成文本轉(zhuǎn)語音產(chǎn)品，授權(quán)他人在網(wǎng)絡(luò)平臺(tái)上銷售，而北京某智能科技公司購買該文本轉(zhuǎn)語音產(chǎn)品后，直接在其平臺(tái)中使用，導(dǎo)致案涉聲音在網(wǎng)絡(luò)上被廣泛傳播，上述行為侵犯了殷某楨的聲音權(quán)益。

此外，關(guān)于侵害后果方面，聲音權(quán)益屬于法定的人格權(quán)益，適用人格權(quán)請(qǐng)求權(quán)有關(guān)規(guī)定。行使人格權(quán)請(qǐng)求權(quán)不以造成損害后果為要件，對(duì)于可能發(fā)生的妨害或者已經(jīng)存在的妨害，權(quán)利人可以通過停止妨害請(qǐng)求權(quán)尋求救濟(jì)。行使侵權(quán)請(qǐng)求權(quán)則需要以存在一定損害作為前提，以對(duì)權(quán)利人的損害進(jìn)行補(bǔ)償救濟(jì)。同時(shí)，人工智能技術(shù)處理聲音的侵害行為與侵害后果發(fā)生之間應(yīng)當(dāng)存在因果關(guān)系，被告據(jù)此承擔(dān)相應(yīng)的責(zé)任。本案例中，某文化公司與某軟件公司的案涉侵權(quán)行為造成了殷某楨聲音權(quán)益受損的后果，應(yīng)當(dāng)承擔(dān)賠償損失的法律責(zé)任。其他被告對(duì)此不存在過錯(cuò)，不承擔(dān)損害賠償責(zé)任，但應(yīng)當(dāng)承擔(dān)相應(yīng)賠禮道歉責(zé)任。

有必要提及的是，人工智能訓(xùn)練素材的合法性問題較為復(fù)雜，世界范圍內(nèi)尚無成熟解決方案。對(duì)此，本案例明確了使用自然人聲音作為訓(xùn)練素材的，使用人應(yīng)當(dāng)有較高的注意義務(wù)，未取得自然人授權(quán)且不屬于合理使用的，構(gòu)成人格權(quán)的侵權(quán)。同時(shí)也應(yīng)看到，人工智能技術(shù)的快速發(fā)展，給人格權(quán)保護(hù)帶來前所未有的挑戰(zhàn)。在此背景下，如何發(fā)揮司法職能作用，推動(dòng)在法治軌道上加強(qiáng)和完善人工智能治理，不斷提升人工智能技術(shù)的安全性、可靠性、可控性、公平性，是人民法院工作面臨的時(shí)代課題，需要在實(shí)踐中不斷探索，并形成有益的裁判規(guī)則。

來源：京法網(wǎng)事

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.