撰文丨潘己鶴
有“音樂圈DeepSeek”稱號的Mureka,又有大動作。
7月23日,昆侖萬維宣布,旗下AI音樂生成平臺Mureka,基座模型再次迭代,全新音樂模型Mureka V7正式上線。
Mureka的新版本,將AI音樂的效果,猛拉一個臺階,單曲時長延伸到5.5分鐘,且可以輸出更具吸引力的旋律與編曲。
昆侖萬維官方出品的《杜甫》歌曲
“不論人聲、混聲還是作曲旋律,都基本超越Suno,尤其人聲擬真度,新版本有大幅提升?!庇袆?chuàng)作者忍不住感嘆。
昆侖萬維埋頭修煉產(chǎn)品力和技術(shù)力,打造AI視頻SkyReels、AI社交Linky、AI Agent Skywork等在內(nèi)的多元應(yīng)用矩陣,提速商業(yè)化。
AI音樂領(lǐng)域,Mureka V6 3月底發(fā)布后,新增注冊用戶近300萬,充分證明其市場號召力。
這一“AI大殺器”再次更新,昆侖萬維毫不掩飾其在AI音樂賽道的野心:
它要改寫游戲規(guī)則,給那些被主流體系忽略的、表達欲望無法釋放的普通人,插上自由創(chuàng)作的翅膀。
Mureka V7 + TTS V1雙模型上線,AI音樂進入個性化時代
實測Mureka V7,創(chuàng)作者最大的感受是,Mureka干活細致,生成的內(nèi)容自然流暢,質(zhì)量穩(wěn)定。
這背后是V7升級技術(shù),讓音樂品質(zhì)產(chǎn)生質(zhì)變——增強音樂人聲與樂器真實度,大幅改善旋律動機與編曲質(zhì)量,令用戶制作出質(zhì)感細膩的個人獨家BGM。
先放一段官方Demo,大家體驗下。
官方對Mureka V7的介紹,耐人尋味,稱之為“一座24小時不打烊的私人錄音棚”。多項技術(shù),支撐聽感提升。
先看關(guān)鍵的良品率,從V6的43.4%到V7的57.7%,輸入提示詞后,獲得好聽歌曲的概率大幅提升。
人聲真實度和表達力,提升44%,這讓AI音樂不再生硬,有了“呼吸感”;整體音質(zhì)提升近一倍。
相較V6的單曲最長4.5分鐘,V7延長到5.5分鐘,同樣是2積分/每2首歌,可謂加量不加價。
和之前版本一樣的是,Mureka V7劃分為簡單、高級兩種模式。
簡單模式下,用戶輸入大白話描述自己對歌曲的需求,在對話框里填寫文字,適配各種場景的音樂作品,一鍵入耳。
高級模式下,輸入關(guān)鍵詞,讓AI生成歌詞后,可精準選擇風(fēng)格,對歌曲進行細致調(diào)整。
比如,在輸入框輸入“夏天,蟬鳴,畢業(yè)季”三個關(guān)鍵詞,一兩秒時間,Mureka自動生成幾段歌詞:
夏日蟬鳴畢業(yè)季/每一聲都藏著秘密/樹蔭下笑語輕起/青春回憶在風(fēng)里飄逸……
簡單的字句,遞進押韻,鋪開離別情緒,旋律層次豐富,且自動劃分主歌、副歌等段落。
用戶若對歌詞不滿意,可標記進行優(yōu)化,還能續(xù)寫,生成歌詞窗口的最大容量,能夠達到3000字符。
接下來,點擊“創(chuàng)作”,一首2分20秒的音樂作品,立等可聽。
Mureka還有個獨特的音樂參考功能。
用戶可上傳參考歌曲,提供相似曲風(fēng)、自定義歌手、描述想要的音樂風(fēng)格以及自行哼唱旋律,Mureka會識別音樂類型、節(jié)奏、配器和情緒等要素,由此確保作品風(fēng)格的一致性。
這可以衍生出更多玩法,比如用鄧麗君的溫柔嗓音,演繹周杰倫風(fēng)格的歌曲。
總而言之,Mureka竭盡全力幫用戶洞察需求,捕捉那微妙而難以言明的表達要點,精準戳中爽感。
Mureka還有很多亮點。比如,支持純音樂生成,支持10種語言的AI音樂創(chuàng)作,用戶還可以自定義歌手音色,甚至上傳自己的聲音。
自研MusiCoT思維鏈顛覆音樂創(chuàng)作,中國技術(shù)領(lǐng)跑新賽道
怎么干好“AI音樂生成”這件事,昆侖萬維想得很早、很深,走出迥然不同的一條技術(shù)路線。
過去主流AI音樂模型,采用自回歸(Autoregressive, AR)模型路線,其基于逐token預(yù)測的范式,連貫性與情感建構(gòu)帶有拼接感。
直白點說,就是能聽,但“差點意思”。
Mureka的特點是,其采用自研的MusiCoT技術(shù),可顯著提升模型生成結(jié)果的整體性與發(fā)聲表現(xiàn)。
其專為音樂生成而設(shè)計的鏈式思維(Chain-of-Thought, CoT)提示方法,打通了高保真AI音樂的技術(shù)堵點,音樂模型生成質(zhì)量更高,推動打破“AI音樂沒有靈魂”這一刻板印象。
2025年3月,公司正式推出 Mureka O1 模型及 Mureka V6 模型。作為全球首個音樂推理大模型的 Mureka O1,其性能全面超越 Suno,成功登頂 SOTA。
此次升級,在V6的基礎(chǔ)上,V7進一步優(yōu)化MusiCoT技術(shù)。
它重要的一個創(chuàng)新,是“先結(jié)構(gòu),后生成”的做法。在正式生成音頻token之前,引導(dǎo)模型生成一份全局音樂結(jié)構(gòu)規(guī)劃,明確整體的段落、情緒、編配等布局。
打個比方,新手繪畫時,常常缺乏規(guī)劃,想到哪畫到哪,成品會缺乏整體性,一些AI音樂生成模型,也有“顧局部不顧全局”的毛病。
MusiCoT先打“草稿”后創(chuàng)作,類似人類創(chuàng)作邏輯,AI不只是即興演奏者,還是思考嚴謹?shù)淖髑?,其生成的作品,樂章推進與情緒遞進非常自然。
基于CLAP模型,MusiCoT還有“音樂思維鏈”,具備明確的語義指向。
音樂創(chuàng)作的整體結(jié)構(gòu),可分析、可控制,允許輸入任意長度的參考音頻作為風(fēng)格提示,由此,提升模型在復(fù)刻、變奏等創(chuàng)作需求中的靈活性,規(guī)避直接復(fù)制的風(fēng)險。
昆侖萬維稱,基于大量實驗,主觀與客觀雙重指標下,MusiCoT技術(shù)均展現(xiàn)領(lǐng)先效果,在多項評測中的表現(xiàn),達到行業(yè)一流水準。
新版本中,在結(jié)構(gòu)層面,MusiCoT的思考邏輯,更像人類作曲家,還通過Mureka團隊數(shù)據(jù)的scale-up以及Embedding信息粒度的細化,完善可控性與可擴展性,努力化解文本和音頻之間,模態(tài)差異的那道鴻溝。
怎么把AI音樂玩出新花樣,Mureka團隊下了番功夫。此次推出的Mureka TTS V1,支持Voice Design能力,用戶可使用文本控制音色生成。
不論真實人物、虛擬人物還是配音角色,通通能用文字調(diào)度,“菜色”更豐富,不似過去只能在特定音色庫里挑選。
從技術(shù)指標來看,Mureka單是語音質(zhì)量,就達到4.6分,超過Elevenlabs(4.36),整體聽感遠超同行。
以MusiCoT為核心的一系列技術(shù)創(chuàng)新,拉動Mureka“人人可用、好用、易用”,具有開創(chuàng)性意義,推動AI音樂快速走向工業(yè)化。
音樂終究服務(wù)于人的耳朵。如果AI音樂生成,停留在模板化、套路化階段,劣質(zhì)內(nèi)容就無法打動聽眾,更別說產(chǎn)生情感共鳴。
只有AI音樂工具更好用,生成的音樂品質(zhì)更高,“AI造富人類”才不會淪為一句空話。
昆侖萬維AI矩陣厚積薄發(fā),加速跑通商業(yè)化
本質(zhì)上,Mureka的定位,仍是工具,未介入到渠道層面。
這意味著,昆侖萬維對所有音樂平臺敞開大門,持開放態(tài)度,用戶亦然——無論來自什么領(lǐng)域,只要愛好音樂或有創(chuàng)作需求,Mureka都提供一攬子工具包,人人觸手可及。
Mureka支持10種語言作曲
它承載著“文化平權(quán)”“AI平權(quán)”的命題,亦寄托著昆侖萬維“讓每個人更好地塑造和表達自我”的重大使命。
縱觀人類歷史,文化創(chuàng)作一直是高階層的特權(quán)。
尤其在音樂創(chuàng)作領(lǐng)域,復(fù)雜的樂理知識、昂貴的作曲設(shè)備、專業(yè)的制作軟件,讓創(chuàng)作音樂成為小部分人的閉門派對。
以編曲來說,有音樂基礎(chǔ)的人,也需要付出很多時間成本和資金投入。這種生產(chǎn)環(huán)節(jié),非常適合用AI來簡化和提效。
Mureka V7的意義,正在于此——AI音樂平臺不是“玩具”,而是一款可“創(chuàng)作”的專業(yè)級產(chǎn)品。
普通人的靈感火花和表達欲望,需要一個出口釋放;手頭不寬裕、愿意擁抱變化的音樂人,AI能成為他們的階梯。
不久的將來,我們將看到,AI音樂進入權(quán)威音樂排行榜,成為金曲。
屆時,創(chuàng)作壁壘瓦解,音樂產(chǎn)業(yè)迎接“個體化時代”,文化話語權(quán)實現(xiàn)再分配,點燃新的大眾文藝火花。
改變,已在悄然發(fā)生。比如,有博主靠一首2分多鐘的AI音樂,變現(xiàn)超5萬元,在網(wǎng)易云音樂上的日播放量,最高達到15萬。
昆侖萬維推動AI與人文藝術(shù)融合,使文化產(chǎn)業(yè)發(fā)展走向去中心化。反過來講,音樂創(chuàng)作這個30多億美元的市場,只要公司能吃下2%,規(guī)模已非??捎^。
從數(shù)據(jù)來看,Mureka推出的3月,月訪問量高達333萬,一舉成為全球AI音樂品類增速最高。截至3月底,AI音樂年化流水收入ARR達到約1200萬美金。
爆發(fā)的市場、亮眼的收入,都在證明賽道熱度和公司戰(zhàn)略前瞻性。
沿著“All in AGI與AIGC”的戰(zhàn)略方向,昆侖萬維堅定前進。
作為中國領(lǐng)先的人工智能科技公司,近年來昆侖萬維在AI大模型、AI搜索、AI短劇、AI音樂、AI游戲、AI社交等多個領(lǐng)域取得了顯著進展,構(gòu)建了全面的AI業(yè)務(wù)布局。2024年度財報顯示,昆侖萬維實現(xiàn)營業(yè)總收入56.6億元,同比增長15.2%,整體毛利率達73.6%。
大模型技術(shù),正加速從“技術(shù)驗證”向“商業(yè)閉環(huán)”跨越,在邁向全球AI巨頭的道路上,昆侖萬維悄然加速。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.