IT之家 8 月 30 日消息,科技媒體 Windows Latest 昨日(8 月 29 日)發(fā)布博文,報(bào)道稱微軟在 Copilot Labs 推出全新 AI 語(yǔ)音生成工具 Copilot Audio Expressions,可通過(guò) Emotive 和 Story 兩種模式生成更具情感的英文語(yǔ)音。
IT之家注:Copilot Audio Expressions 是一款 AI 語(yǔ)音生成工具,功能是讓輸出的音頻更接近真人,并可根據(jù)需求加入創(chuàng)意潤(rùn)色。用戶無(wú)需注冊(cè)即可直接體驗(yàn),并可下載 MP3 格式音頻,方便在任何設(shè)備播放。
該工具目前提供 Emotive(情感表達(dá))和 Story(故事創(chuàng)作)兩種模式。
該媒體在測(cè)試 Emotive 模式后,選用“Oak”音色和“narration”敘述風(fēng)格,將模擬火車站的腳本輸入系統(tǒng)。
生成的音頻不僅朗讀了文字,還自動(dòng)增添細(xì)節(jié)、調(diào)整措辭,讓表達(dá)更生動(dòng)。單段音頻最長(zhǎng) 59 秒,支持十余種聲音與風(fēng)格組合。
在 Story 模式下,系統(tǒng)自動(dòng)選擇音色和風(fēng)格,用戶僅需提供主題提示。
例如輸入“講一個(gè)貓?jiān)诎堤帩撔幸捠车墓适隆?,AI 就生成了一個(gè)長(zhǎng)達(dá) 90 秒的多角色敘述:旁白用美式口音,貓的對(duì)白則為英式口音,并巧妙穿插互動(dòng),形成自然流暢的對(duì)話效果。
測(cè)試結(jié)果表明,Story 模式在情節(jié)構(gòu)建、角色區(qū)分及聲音融合度方面表現(xiàn)出色,輸出的成品不像單調(diào)的機(jī)器朗讀,更像是一次配音合作,讓該工具不僅適用于簡(jiǎn)單朗誦,也可勝任有多角色的創(chuàng)意作品制作。
該工具目前僅支持英文,中文及其他語(yǔ)言用戶暫無(wú)法直接生成母語(yǔ)音頻,微軟尚未透露后續(xù)是否會(huì)增加多語(yǔ)言支持。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.