突發(fā)！微軟與OpenAI同日開火：語音之戰(zhàn)+通用大模型，AI霸權(quán)決戰(zhàn)打響

2025-08-29 13:04:41　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：艾倫 KingHZ

【新智元導(dǎo)讀】微軟緊跟OpenAI的節(jié)奏，在同一天也親自下場發(fā)布了微軟自研的兩個(gè)大模型：語音模型MAI-Voice-1和通用模型MAI-1-preview。對于這位老大哥，親自下場做的第一個(gè)AI大模型，效果究竟怎么樣？

就在OpenAI發(fā)布最新的語音大模型之際，微軟掏出了自研語音大模型！

微軟AI掌門人、DeepMind聯(lián)合創(chuàng)始人Mustafa Suleyman正式宣布：

微軟AI正式推出MAI-Voice-1以及MAI-1-預(yù)覽版！而且還有更多內(nèi)容即將推出。

MAI-Voice-1語音模型效率極高：單GPU秒出1分鐘音頻！使用Copilot即可體驗(yàn)。

在Mustafa Suleyman看來，這是他用過表現(xiàn)力最豐富、最自然的語音生成模型。

而MAI-1預(yù)覽版模型是微軟AI首個(gè)端到端內(nèi)部訓(xùn)練的自研基礎(chǔ)模型。

這標(biāo)志著在多年依賴OpenAI模型之后，微軟AI部門正式與OpenAI及整個(gè)行業(yè)正面競爭，也意味著微軟在AI競賽中，開始掌握更多主動(dòng)權(quán)。

在接受采訪時(shí)，Suleyman 表示：「微軟是世界上最大的公司之一。我們必須具備內(nèi)部能力，來打造世界最強(qiáng)的模型。」

MAI-Voice-1，究竟能力如何

在微軟官方給出的指標(biāo)中，最能引起我們注意的，是「單卡<1秒，生成1分鐘音頻」。

這使其成為當(dāng)前少見的極致低時(shí)延TTS/對話式語音生成系統(tǒng)之一。

除此之外，語音的自然和富有表現(xiàn)力也是重點(diǎn)，這覆蓋到了單人敘述與多說話人對話兩種常見內(nèi)容形態(tài)。

新聞播報(bào)、播客對談、故事講述、冥想/引導(dǎo)等，你能想到的，統(tǒng)統(tǒng)沒問題。

你可以選擇9種不同的語音：

也可以選擇多達(dá)31種不同的情緒和播報(bào)場景：

你還可以讓模型扮演一個(gè)激情四射的體育解說員，點(diǎn)燃你的情緒：

具體到落地上，我們可以通過Copilot Labs，在Copilot Daily中以AI主播播報(bào)要聞、在Copilot Podcasts生成播客式討論，Copilot Labs 提供可玩Demo（可以自定義內(nèi)容、敘述風(fēng)格等）。

下面是兩段該模型生成的語音Demo，你可以聽聽看，滿分5分想給幾分？是否還有AI味呢？歡迎在評論區(qū)留下您的測評意見。

微軟與OpenAI難舍難分

長期以來，微軟主要依靠OpenAI的人工智能模型，為核心產(chǎn)品提供AI功能。

OpenAI目前估值約5000億美元，微軟一家的投資就超過了130億美元，而OpenAI也依賴微軟的云基礎(chǔ)設(shè)施來運(yùn)行其模型。

但現(xiàn)在宣布：「未來幾周，我們將在Copilot的部分文本任務(wù)中逐步推出MAI-1-preview，以便從用戶反饋中學(xué)習(xí)和改進(jìn)。」

目前，微軟仍在Bing、Windows 11及其他產(chǎn)品中使用OpenAI的模型。

但雙方的關(guān)系日漸惡化。

去年，微軟在年度財(cái)報(bào)中正式將OpenAI列入競爭對手名單，之前多年來只包含亞馬遜、蘋果、谷歌和 Meta等科技巨頭。

近幾個(gè)月，OpenAI也轉(zhuǎn)向CoreWeave、谷歌和甲骨文等其他云服務(wù)商，以滿足激增的算力需求。

與OpenAI同期發(fā)布語音模型，意欲何為

就在昨天，OpenAI也發(fā)布了最新的語音生成大模型GPT-Realtime，整體嵌入在Realtime API中。

該模型在語音自然性、情感豐富度、低延遲響應(yīng)上顯著提升，能夠在一句話之內(nèi)實(shí)現(xiàn)語調(diào)、語言的無縫切換，還支持工具調(diào)用、指令跟隨能力。

為什么微軟選擇在此時(shí)發(fā)布新模型？

此次發(fā)布雖然只有語音模型和預(yù)覽版通用模型，但釋放出的信號(hào)不容忽視。

其一，語音將成為AI助手的重要戰(zhàn)場。

MAI?Voice?1的效率和表達(dá)力有望推動(dòng)語音助手晉級的「數(shù)字伙伴」。

而富有情感和個(gè)性的數(shù)字伙伴，是Grok等模型時(shí)下開始發(fā)力的一個(gè)新突破點(diǎn)，潛力頗大。

其二，OpenAI不再是唯一選擇。

大模型發(fā)展進(jìn)入「百模大戰(zhàn)」階段，各巨頭紛紛推出自研產(chǎn)品。

微軟此舉既是對OpenAI合作的補(bǔ)充，也為自己與OpenAI的重大商業(yè)談判中增加了可觀的籌碼。

其三，MoE架構(gòu)成大模型新趨勢。

MAI?1?preview采用MoE架構(gòu)，訓(xùn)練規(guī)模適中但更關(guān)注指令遵循和響應(yīng)效率，能兼顧性能與成本。

隨著LLM細(xì)分應(yīng)用增多，多專家模型將成為重要方向。

其四，生態(tài)開放值得期待。

微軟表示將在Copilot及第三方測試平臺(tái)開放模型，鼓勵(lì)開發(fā)者提供反饋。

在媒體采訪中，Mustafa Suleyman表示：

人工智能不僅是科技的未來，更是未來幾十年商業(yè)運(yùn)行和價(jià)值創(chuàng)造的核心。

因此，研發(fā)最強(qiáng)的模型，不僅是技術(shù)追求，更是微軟作為企業(yè)的戰(zhàn)略必然。

我們必須擁有自己的核心能力。

在14個(gè)月前，他和團(tuán)隊(duì)從Inflection加入微軟后，就一直全力推動(dòng)這件事。

如今，微軟終于發(fā)布了兩款自研模型。

Suleyman強(qiáng)調(diào)，微軟未來會(huì)繼續(xù)使用OpenAI的模型，也會(huì)用開源模型，但關(guān)鍵在于「編排器」（orchestrator）。

這是一種模型調(diào)度系統(tǒng)，能夠根據(jù)任務(wù)自動(dòng)選擇合適的模型來完成特定請求，類似「路由器」。

他認(rèn)為，這種編排能力將成為微軟的重要知識(shí)產(chǎn)權(quán)。

外界普遍猜測，微軟推出自研模型，是否意味著與OpenAI的關(guān)系在降溫？

對此，Suleyman回應(yīng)道：

我們的目標(biāo)是進(jìn)一步加深與OpenAI的合作，并保持長期良好的伙伴關(guān)系。

雙方的合作已經(jīng)非常成功，未來我相信仍會(huì)繼續(xù)下去。

微軟如何自研大模型

這次微軟AI透露：「MAI-1-preview是MoE模型，使用約1.5萬張NVIDIA H100 GPU進(jìn)行了預(yù)訓(xùn)練和后訓(xùn)練。」

在LMArena文本任務(wù)榜單上，MAI-1排名第13，落后于DeepSeek、谷歌、OpenAI和xAI等主要AI玩家的模型。

相比之下，xAI的Grok模型則動(dòng)用了超過10萬張同類芯片。

微軟AI只用相對小規(guī)模的集群，也能訓(xùn)練出非常強(qiáng)大的模型。

Suleyman認(rèn)為自研的新模型表現(xiàn)遠(yuǎn)超其硬件規(guī)模，完全可以和世界上最強(qiáng)的模型媲美，而且現(xiàn)在才剛剛開始調(diào)優(yōu)。

一旦模型投入實(shí)際應(yīng)用并開始收集反饋，隨著不斷迭代，性能還會(huì)顯著提升。

對微軟AI來說，這僅僅是個(gè)開始。

微軟AI算力充沛，已經(jīng)在使用全球最大的數(shù)據(jù)中心之一，并配備了Nvidia下一代GB-200芯片，研發(fā)下一版本模型。

而且，他們有一個(gè)龐大的五年規(guī)劃，并會(huì)持續(xù)投資算力。

規(guī)模很重要，但效率同樣關(guān)鍵。

這意味著要精挑細(xì)選高質(zhì)量的訓(xùn)練數(shù)據(jù)，確保每一次浮點(diǎn)運(yùn)算、每一次GPU迭代都發(fā)揮最大價(jià)值。

現(xiàn)在訓(xùn)練模型的核心能力，已經(jīng)越來越變成了一種「工藝」——選對數(shù)據(jù)，避免把算力浪費(fèi)在無效的token上。

Suleyman 表示，公司利用了一些源自開源社區(qū)的技術(shù)，使得有限資源發(fā)揮了更大作用。

這是微軟首次完整端到端訓(xùn)練的大模型。在研發(fā)過程中，團(tuán)隊(duì)也遇到了不少挑戰(zhàn)。

Suleyman坦言：「構(gòu)建這樣規(guī)模的集群、訓(xùn)練如此龐大的數(shù)據(jù)，需要不斷的調(diào)試、迭代和耐心。這是每一家實(shí)驗(yàn)室都會(huì)面臨的難題。」

他對團(tuán)隊(duì)的表現(xiàn)非常滿意：「我們從中學(xué)到了很多，也積累了足夠的經(jīng)驗(yàn)去打造更多優(yōu)秀的模型?！?/p>

他把這比喻成「轉(zhuǎn)動(dòng)飛輪」：一旦模型研發(fā)進(jìn)入正循環(huán)，每一代都會(huì)推動(dòng)下一代更快成長。

之前，Suleyman在Inflection，甚至DeepMind都有相關(guān)經(jīng)驗(yàn)，不過那時(shí)候算力規(guī)模較小，GPU還沒有動(dòng)輒十萬張。

這次的首個(gè)模型訓(xùn)練成功，他認(rèn)為關(guān)鍵在于文化：

優(yōu)秀的文化吸引了優(yōu)秀的人，是優(yōu)秀的團(tuán)隊(duì)才能構(gòu)建出優(yōu)秀的模型。

而最終，這個(gè)團(tuán)隊(duì)的價(jià)值觀，也會(huì)自然地被注入到模型和產(chǎn)品中。

Suleyman還透露他們已經(jīng)在開發(fā)下一個(gè)模型了：規(guī)模更大，訓(xùn)練架構(gòu)也做了一些新的調(diào)整。

現(xiàn)在一切都已經(jīng)啟動(dòng)了，接下來幾個(gè)月、幾年里都會(huì)有很多值得期待的東西。

參考資料：

https://copilot.microsoft.com/labs/audio-expression

https://microsoft.ai/news/two-new-in-house-models/

https://x.com/mustafasuleyman/status/1961111770422186452

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

馬斯克親口證實(shí)xAI代碼庫被盜！涉案前員工被起訴，已跳槽OpenAI

量子位 2025-08-31 12:38:09
17 跟貼 17
被低估的GPT-5！OpenAI給7億人解鎖最強(qiáng)AI，大眾智能一夜撕裂舊秩序

新智元 2025-08-30 19:40:33
2 跟貼 2

謝賽寧七年前OpenAI面試：白板編程、五小時(shí)會(huì)議，面完天都黑了

機(jī)器之心Pro 2025-08-29 17:36:58
0 跟貼 0

OpenAI頭號(hào)叛徒，竟然是自學(xué)的AI?

量子位 2025-08-22 16:06:15
0 跟貼 0
機(jī)器狗跳千手觀音，波士頓動(dòng)力達(dá)人秀炸場

量子位 2025-06-13 15:55:52
0 跟貼 0

從被群嘲到頂級玩家，阿里AI逆襲之路

華商韜略 2025-07-28 17:27:23
0 跟貼 0

宇樹機(jī)器人復(fù)雜環(huán)境穩(wěn)定起立，速度不亞于人類

量子位 2025-04-09 10:10:32
0 跟貼 0
生成3D手辦還能互動(dòng)！谷歌新模型太炸裂了：這是PS終局？

雷科技 2025-08-31 19:00:41
0 跟貼 0

1分鐘逛遍世界機(jī)器人大會(huì)，機(jī)器人已經(jīng)沒有不會(huì)干的活了！

量子位 2025-08-10 02:23:22
3 跟貼 3
機(jī)器人疊衣，靈巧手抓萬物，超實(shí)用機(jī)器人組合來了

量子位 2025-07-29 03:31:41
0 跟貼 0
DeepMind讓AI當(dāng)「上帝」，導(dǎo)演一場只有AI演員的「西部世界」

機(jī)器之心Pro 2025-07-16 13:55:45
0 跟貼 0
華裔女學(xué)霸揭秘Claude Code，一人帶六個(gè)AI開干！編程范式徹底被顛覆

新智元 2025-08-30 12:54:01
36 跟貼 36
聚焦世界人工智能大會(huì) 機(jī)器人大秀舞姿引人注目

財(cái)聯(lián)社 2025-07-28 11:43:19
0 跟貼 0
一句話生成智能體集群，開發(fā)Agent能有多簡單？

量子位 2025-07-30 02:58:47
0 跟貼 0
用AI找回面子，成功把大侄子看得目瞪口呆

量子位 2025-07-01 14:31:29
0 跟貼 0
格斗冠軍機(jī)器人突然發(fā)瘋！嚇呆研究人員

量子位 2025-07-25 09:10:58
0 跟貼 0
超算互聯(lián)網(wǎng)上線開源AI社區(qū)！模型+數(shù)據(jù)+算力，一站式解決

量子位 2025-06-23 20:07:47
0 跟貼 0
會(huì)打羽毛球的機(jī)器狗來了！最高揮拍速度到12米/秒

量子位 2025-06-03 17:50:29
0 跟貼 0
構(gòu)建更有溫度的智能社會(huì) | 經(jīng)觀社論

經(jīng)濟(jì)觀察報(bào) 2025-08-31 15:25:42
0 跟貼 0
人機(jī)編程大戰(zhàn)，人類苦戰(zhàn)三天險(xiǎn)勝OpenAI

機(jī)器之心Pro 2025-07-18 18:21:43
0 跟貼 0
ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動(dòng)執(zhí)行各種任務(wù)

量子位 2025-07-18 18:08:35
0 跟貼 0
純國產(chǎn)智能體產(chǎn)品MasterAgent 一句話生成智能體集群

量子位 2025-07-29 18:00:26
0 跟貼 0
研發(fā)自動(dòng)化的初衷是讓每一個(gè)研究員都有Agent助理

量子位 2025-04-23 08:05:00
0 跟貼 0
馬斯克入局AI編程！新模型限時(shí)免費(fèi)：256K上下文，主打一個(gè)速度快

量子位 2025-08-29 09:20:55
12 跟貼 12
宇樹科技VS云深處，誰是國產(chǎn)機(jī)器人之王

華商韜略 2025-03-17 13:06:16
0 跟貼 0
深圳南山，藏著中國機(jī)器人天團(tuán)

華商韜略 2025-03-11 11:00:31
0 跟貼 0
創(chuàng)智「小紅書」震撼上線(1)

機(jī)器之心Pro 2025-07-22 17:16:40
0 跟貼 0
OpenAI反挖四位特斯拉、xAI、Meta高級工程師

機(jī)器之心Pro 2025-07-09 17:14:35
0 跟貼 0
價(jià)格降至百元級、需求暴漲11倍，人形機(jī)器人帶動(dòng)傳感器“狂飆”｜聚焦

財(cái)聯(lián)社 2025-08-31 13:34:28
2 跟貼 2
Sakana AI華人學(xué)者打造“AI進(jìn)化算法”，讓模型從零開始進(jìn)化

DeepTech深科技 2025-08-30 23:39:20
0 跟貼 0
AI應(yīng)用：浮現(xiàn)中的AI經(jīng)濟(jì)

機(jī)器之心Pro 2025-08-31 14:26:07
0 跟貼 0
最低調(diào)的機(jī)器人天團(tuán)，在這里!

華商韜略 2025-05-31 12:25:23
0 跟貼 0
直擊WAIC丨具身大模型賦能！機(jī)器人秒變專業(yè)鼓手

每日經(jīng)濟(jì)新聞 2025-07-29 01:50:00
0 跟貼 0
失敗147次后，他三天寫出萬能提示詞模板，600萬網(wǎng)友吵翻了

量子位 2025-07-13 17:09:11
0 跟貼 0
機(jī)器人首次踢5v5足球賽，摔跤是戰(zhàn)術(shù)？我們和參賽隊(duì)員聊了聊

量子位 2025-08-21 10:48:04
0 跟貼 0
物流業(yè)deepseek時(shí)刻，中國無人車火爆全球

華商韜略 2025-06-17 10:58:23
0 跟貼 0
143億美金買來一場空！小扎向谷歌OpenAI低頭，史上最大AI賭注失速

新智元 2025-08-31 19:13:20
1 跟貼 1
員工爆料：游戲大廠暴力裁員200人，背后資本推動(dòng)AI取代員工

DataEye 2025-08-29 08:11:18
3 跟貼 3
隨時(shí)可玩！微軟向XGP用戶開放云游戲服務(wù)

3DM游戲 2025-08-29 10:06:38
0 跟貼 0
中國“鋼鐵巨龍”直插喜馬拉雅，新藏鐵路震撼印度，博弈將持續(xù)

矚望云霄 2025-08-30 20:15:44
1 跟貼 1

新智元

AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代

13359文章數(shù) 66140關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產(chǎn)

藝術(shù)

數(shù)碼

旅游

軍事航空

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

突發(fā)！微軟與OpenAI同日開火：語音之戰(zhàn)+通用大模型，AI霸權(quán)決戰(zhàn)打響

入手iPhone 16還是等17？兩款手機(jī)全面對比

夫妻自駕從安徽送兒子去新疆上大學(xué)：辛苦但快樂

夫妻自駕從安徽送兒子去新疆上大學(xué)：辛苦但快樂

破2億身家！莎拉波娃的"勝負(fù)腦"

胡歌是永遠(yuǎn)都不會(huì)離婚的，原因很簡單

罕見熱鬧的8月之后，A股將迎怎樣的9月

家庭泛越野 大狗PLUS預(yù)售煥新11.28萬起

態(tài)度原創(chuàng)

顛覆認(rèn)知！?？谡嬲暮勒髌?，終于出現(xiàn)了！

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

169 元機(jī)械革命 140W 私有協(xié)議電源適配器（充電頭）開售

熱聞|清明假期將至，熱門目的地有哪些?

哈馬斯證實(shí)其軍事領(lǐng)導(dǎo)人辛瓦爾已死亡

突發(fā)！微軟與OpenAI同日開火：語音之戰(zhàn)+通用大模型，AI霸權(quán)決戰(zhàn)打響

入手iPhone 16還是等17？兩款手機(jī)全面對比

破2億身家！莎拉波娃的"勝負(fù)腦"

胡歌是永遠(yuǎn)都不會(huì)離婚的，原因很簡單

罕見熱鬧的8月之后，A股將迎怎樣的9月

家庭泛越野大狗PLUS預(yù)售煥新11.28萬起

顛覆認(rèn)知！?？谡嬲暮勒髌?，終于出現(xiàn)了！

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法