成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

微軟AI首個(gè)自研模型來(lái)了,實(shí)測(cè)可玩性超強(qiáng),CEO回應(yīng)與OpenAI隔閡

0
分享至


智東西
編譯 陳駿達(dá)
編輯 李水青

微軟AI首批自研大模型來(lái)了!

智東西8月29日?qǐng)?bào)道,今天,微軟旗下的AI研究機(jī)構(gòu)微軟AI(Mircosoft AI,簡(jiǎn)稱MAI)推出了首批兩款全自研AI模型,分別為MAI首款端到端訓(xùn)練的基礎(chǔ)模型MAI-1-preview和首款語(yǔ)音生成模型MAI-Voice-1。

MAI-Voice-1的發(fā)布時(shí)機(jī)十分湊巧,OpenAI也在今天發(fā)布了一款語(yǔ)音模型。MAI-Voice-1可提供高保真、富有表現(xiàn)力的音頻,已經(jīng)在Copilot Daily和Podcasts上線,還可在Copilot Labs進(jìn)行體驗(yàn)。

在智東西進(jìn)行的實(shí)測(cè)中,這一模型展現(xiàn)出超高的定制化程度:用戶不僅可以選擇情緒模式、聲音模板,還至少有40種語(yǔ)體風(fēng)格可供選擇。除了常見(jiàn)的喜悅、憤怒、悲傷、惡心、恐懼等情緒模板,模型還可以扮演機(jī)器人、海盜、吸血鬼、新聞主播、貓頭鷹等不同角色,對(duì)同一段文本進(jìn)行自主改寫(xiě)和演繹,可玩性超強(qiáng)。

每一個(gè)角色都有各自獨(dú)特的說(shuō)話方式、口癖等。貓頭鷹會(huì)不停地“咕咕”叫,機(jī)器人有一種“活人微死”的感覺(jué),新聞主播則一本正經(jīng)。這些角色都是在統(tǒng)一聲音模板的基礎(chǔ)上呈現(xiàn)的,展現(xiàn)出很強(qiáng)的可塑性。

MAI-Voice-1生成速度也較快,微軟稱能在單款GPU上運(yùn)行,一秒鐘輸出一分鐘的音頻。不過(guò),這一語(yǔ)音模型暫時(shí)不支持中文輸出,輸入中文時(shí)會(huì)自動(dòng)轉(zhuǎn)為英文。


▲輸入中文文本后,也會(huì)自動(dòng)轉(zhuǎn)為英文

體驗(yàn)鏈接:

https://copilot.microsoft.com/labs/audio-expression

MAI-1-preview是一款混合專家模型,大約在1.5萬(wàn)個(gè)英偉達(dá)H100 GPU上完成了預(yù)訓(xùn)練和后訓(xùn)練,主打指令遵循和日常問(wèn)題解答等能力。

這一模型已經(jīng)在LMArena(大模型競(jìng)技場(chǎng))內(nèi)進(jìn)行盲測(cè),不過(guò),智東西進(jìn)行了多次“抽卡”,都沒(méi)能體驗(yàn)到這一模型。未來(lái)幾周內(nèi),MAI-1-preview將會(huì)應(yīng)用于Copilot的部分文本場(chǎng)景,以獲取反饋,優(yōu)化用戶體驗(yàn)。

新模型發(fā)布之際,微軟AI CEO Mustafa Suleyman還接受了媒體Semafor的深度專訪,向外媒揭秘了自研大模型背后的考量,并正面回應(yīng)了外界普遍存在的關(guān)于微軟與OpenAI關(guān)系漸行漸遠(yuǎn)的看法。


▲Mustafa Suleyman在微軟發(fā)布會(huì)上(圖源:微軟)

MAI成立于2024年3月,是微軟推進(jìn)Copilot和其他消費(fèi)者AI產(chǎn)品和研究的專門機(jī)構(gòu)。MAI的CEO Suleyman曾擔(dān)任DeepMind聯(lián)合創(chuàng)始人兼應(yīng)用AI部門負(fù)責(zé)人一職,隨著DeepMind被收購(gòu)而加入谷歌,并在2022年離職創(chuàng)辦大模型創(chuàng)企Inflection AI。

2024年初,Infection AI與微軟達(dá)成6.5億美元“人才收購(gòu)”的交易方案,Suleyman與大部分員工加入MAI,14個(gè)月后,他們交付了第一款自研模型。

Suleyman稱,AI對(duì)微軟的業(yè)務(wù)有根本性的意義,而自研模型計(jì)劃早在14個(gè)月前便已開(kāi)始。他們會(huì)繼續(xù)與OpenAI等企業(yè)合作,也會(huì)使用開(kāi)源模型,但重要的是確保始終有選擇權(quán)。

MAI-1-preview被Suleyman定義為“人格原材料”,也就是說(shuō),模型可以在融入產(chǎn)品的過(guò)程中,表現(xiàn)出各種不一樣的人格特點(diǎn)。通過(guò)后訓(xùn)練、提示詞工程等方法,未來(lái)的大模型可以涌現(xiàn)出“數(shù)百萬(wàn)種”不同的人格。

微軟擁有打造強(qiáng)大模型所需的資源,正在構(gòu)建世界上最大規(guī)模的GB200、GB300集群,也能順利地招募到人才。但Suleyman強(qiáng)調(diào),規(guī)模固然重要,但效率同樣關(guān)鍵。這意味著要精挑細(xì)選高質(zhì)量訓(xùn)練數(shù)據(jù),讓每一次浮點(diǎn)運(yùn)算、每一次GPU迭代都物盡其用。

Suleyman還在訪談中分享了對(duì)“可解釋性”研究的看法,他認(rèn)為模型本質(zhì)是空心的,可解釋性研究有意義,但并不會(huì)揭示所謂意識(shí)的本質(zhì)。

以下是對(duì)Suleyman最新訪談的完整編譯:

一、OpenAI不是唯一解,模型不是未來(lái)核心知識(shí)產(chǎn)權(quán)

主持人:我很好奇,為什么微軟需要擁有自己的端到端預(yù)訓(xùn)練基礎(chǔ)模型,而不是使用來(lái)自O(shè)penAI等公司的這些其他模型呢?

Mustafa Suleyman:這是一個(gè)很好的問(wèn)題。我們是世界上最大的公司之一,而AI是未來(lái),不僅是技術(shù)的未來(lái),也是我們?cè)谖磥?lái)幾十年中進(jìn)行交易、開(kāi)展業(yè)務(wù)和創(chuàng)造價(jià)值的方式。

因此,這對(duì)微軟的業(yè)務(wù)來(lái)說(shuō)具有根本性的意義,必須具備內(nèi)部的專業(yè)能力,去打造世界上最強(qiáng)大的模型。這就是我們?cè)诖蠹s14個(gè)月前加入微軟后不久,就開(kāi)始著手自研模型工作的原因。這是一段非常令人興奮的時(shí)期。

主持人:這次你們發(fā)布了兩款模型。一個(gè)是MAI-1-Preview,據(jù)我理解,這是一個(gè)大型語(yǔ)言模型(LLM)。然后還有一個(gè)語(yǔ)音模型,它們是兩個(gè)獨(dú)立的模型嗎?

Mustafa Suleyman:是的,它們是兩個(gè)獨(dú)立的模型。我們的語(yǔ)音模型表現(xiàn)非常出色,流暢、干凈,而且富有表現(xiàn)力。我們希望確保微軟始終有多種選擇:會(huì)繼續(xù)使用第三方開(kāi)發(fā)者的模型,當(dāng)然也會(huì)長(zhǎng)期使用OpenAI的模型。同時(shí)我們也在用開(kāi)源模型,并會(huì)堅(jiān)持這樣做。

我認(rèn)為未來(lái)的關(guān)鍵知識(shí)產(chǎn)權(quán)在于編排器——它將決定在處理某類查詢時(shí)該調(diào)用哪個(gè)模型。這就是我們12到15個(gè)月前確立的方法,也是我們現(xiàn)在所走的路線。

主持人:編排器,是不是意味著它會(huì)自動(dòng)幫用戶選擇最合適的模型?

Mustafa Suleyman:可以把編排器理解為一個(gè)路由器,負(fù)責(zé)決定在何時(shí)將哪個(gè)請(qǐng)求交給哪個(gè)模型。

主持人:外界可能會(huì)把你們發(fā)布新模型解讀為微軟和OpenAI的關(guān)系出現(xiàn)疏遠(yuǎn),或者說(shuō)兩者關(guān)系變冷。你怎么看?合作依然緊密嗎?

Mustafa Suleyman:我們的目標(biāo)是進(jìn)一步深化與OpenAI的合作,確保這種關(guān)系能持續(xù)很多年。到目前為止,這種合作是非常成功的——他們從中獲益很多,我們也是。我希望并且有信心我們會(huì)繼續(xù)合作,我對(duì)此沒(méi)有任何擔(dān)憂。

二、集群量級(jí)小于業(yè)界頂級(jí)規(guī)模,盡量避免在無(wú)意義token上浪費(fèi)算力

主持人:你們公開(kāi)披露模型是用15000張H100 GPU訓(xùn)練的,這很有意思,因?yàn)楹芏喙就ǔ?duì)此守口如瓶?,F(xiàn)在有些公司動(dòng)用的是10萬(wàn)張H100 GPU,而且我們已經(jīng)在邁向下一代GPU。你覺(jué)得是否可能用更少的GPU達(dá)到同樣的效果?

Mustafa Suleyman:我認(rèn)為我們已經(jīng)證明了這是可能的。如今一個(gè)15000張GPU的集群,相比其他動(dòng)輒使用數(shù)倍規(guī)模的來(lái)說(shuō),算是小的了。但即便如此,我們依然能獲得世界級(jí)的性能。

這是一個(gè)超越其重量級(jí)的模型,表現(xiàn)不亞于世界上最頂尖的模型。而且這只是開(kāi)始。一旦模型進(jìn)入生產(chǎn)環(huán)境,開(kāi)始收集反饋,迭代過(guò)程將顯著提升性能。我們的團(tuán)隊(duì)已經(jīng)做得非常好,這是一個(gè)重要的里程碑,但對(duì)我們來(lái)說(shuō)這只是起點(diǎn)。

主持人:那你們有沒(méi)有特別針對(duì)某些基準(zhǔn)測(cè)試?

Mustafa Suleyman:我們?cè)诟鞣N主流基準(zhǔn)測(cè)試上都進(jìn)行了訓(xùn)練。如今模型必須具備通用性,尤其是文本任務(wù)。同時(shí)我們也在逐漸擴(kuò)展到多模態(tài),因?yàn)槎嗄B(tài)能讓模型在更多數(shù)據(jù)上學(xué)習(xí),從而表現(xiàn)得更好。我們對(duì)未來(lái)的發(fā)展持開(kāi)放態(tài)度。

主持人:那MAI是否已經(jīng)具備你所需要的資源?是不是GPU越多越好?

Mustafa Suleyman:我們剛剛開(kāi)始在GB200上進(jìn)行訓(xùn)練和測(cè)試。微軟正在構(gòu)建世界上最大規(guī)模的GB200、GB300集群之一。它們會(huì)為OpenAI提供支持,也會(huì)服務(wù)于MAI以及我們的付費(fèi)推理合作伙伴。

我們有一個(gè)為期五年的宏大路線圖,每個(gè)季度都會(huì)持續(xù)投入。這種趨勢(shì)還會(huì)繼續(xù)下去。

規(guī)模固然重要,但效率同樣關(guān)鍵。這意味著要精挑細(xì)選高質(zhì)量訓(xùn)練數(shù)據(jù),讓每一次浮點(diǎn)運(yùn)算、每一次GPU迭代都物盡其用。

如今訓(xùn)練模型的關(guān)鍵在于數(shù)據(jù)選擇——避免在無(wú)意義的token上浪費(fèi)算力。我們的新模型證明了,在極高效率的前提下,也能取得一流的表現(xiàn)。

三、MAI-1-Preview是“原材料”,可打造出大量人格

主持人:那么,使用這些模型的體驗(yàn)如何?幾周前你寫(xiě)了一篇文章,討論了“近似有意識(shí)”的AI,你提醒我們要避免這種情況。但在Inflection和微軟,你們也強(qiáng)調(diào)過(guò)讓模型具備同理心、擁有讓人樂(lè)于交流的人格特質(zhì)。這篇文章是不是意味著方向要調(diào)整?

Mustafa Suleyman:不,并不是。首先要認(rèn)識(shí)到,人類所具備的很多能力——不論是智商(IQ)、情商(EQ)、行為能力,還是社交智能(SQ)——本質(zhì)上都是高度可訓(xùn)練的。模型也會(huì)逐漸獲得這些能力,這是它們的“默認(rèn)”發(fā)展方向。

模型通過(guò)模仿學(xué)習(xí),而它們擁有海量的模仿數(shù)據(jù)可用。作為“雕塑家”,我們正在塑造它們的知識(shí)、人格特質(zhì)、行為能力和社會(huì)智能。

關(guān)鍵問(wèn)題是:哪些能力是我們希望模型擁有的?哪些是我們不希望它們擁有的?我們?nèi)绾伟l(fā)現(xiàn)潛在的副作用,并以負(fù)責(zé)任的方式進(jìn)行迭代?

我寫(xiě)這篇文章的目的,就是提醒大家:盲目追求模型模仿人類的全部能力,存在實(shí)質(zhì)性的風(fēng)險(xiǎn)。我們必須從現(xiàn)在開(kāi)始認(rèn)真思考,而不是等到問(wèn)題真正出現(xiàn)才去補(bǔ)救。這也是我職業(yè)生涯的核心目標(biāo)之一——推動(dòng)大家去思考兩三年后可能會(huì)發(fā)生什么,而不是忽視它。

我們需要認(rèn)真面對(duì)AI進(jìn)入社會(huì)后會(huì)帶來(lái)的影響。

主持人:雖然你說(shuō)那一步還沒(méi)到,可能要幾年后,但最近新聞里出現(xiàn)了OpenAI和Character.AI遭遇的訴訟,指控聊天機(jī)器人導(dǎo)致自殺。你覺(jué)得這是不是你文章中提到的風(fēng)險(xiǎn)?這是你擔(dān)心的情況嗎?

Mustafa Suleyman:我認(rèn)為未來(lái)會(huì)出現(xiàn)各種難以預(yù)料的突發(fā)效應(yīng)。我們能做的,就是提前思考可能性,并在發(fā)現(xiàn)問(wèn)題時(shí)及時(shí)公開(kāi),認(rèn)真對(duì)待,并推動(dòng)社區(qū)開(kāi)發(fā)者迅速采取行動(dòng)。

回顧以往的技術(shù)發(fā)展,很多時(shí)候潛在風(fēng)險(xiǎn)都會(huì)被回避,導(dǎo)致反應(yīng)遲緩。我認(rèn)為這一次我們必須謹(jǐn)慎、主動(dòng),同時(shí)盡可能快速地推進(jìn)技術(shù)落地,并把好處惠及世界。

主持人:和MAI-1或語(yǔ)音模型交流時(shí),會(huì)有特定的感覺(jué)嗎?你們的目標(biāo)是什么?是讓人感覺(jué)像在和一個(gè)善良、有同理心的人對(duì)話,但又不至于假裝是人類嗎?你們?nèi)绾伪3诌@種平衡?

Mustafa Suleyman:MAI-1-Preview可以被看作是“人格原材料”。最終的產(chǎn)品——無(wú)論是Copilot還是其他應(yīng)用——都會(huì)被塑造出特定的人格和對(duì)話風(fēng)格。

我預(yù)計(jì)社區(qū)和開(kāi)源開(kāi)發(fā)者會(huì)非常積極地嘗試各種不同的人格。我相信未來(lái)會(huì)出現(xiàn)數(shù)以百萬(wàn)計(jì)的版本,就像現(xiàn)實(shí)中存在數(shù)以百萬(wàn)計(jì)的個(gè)人、品牌和組織一樣。

每當(dāng)人類發(fā)明或發(fā)現(xiàn)一種新的交流媒介,都會(huì)催生大量變體。這一次也不例外。過(guò)去兩三年,大模型大多只有一種或極少數(shù)幾種人格。有些開(kāi)發(fā)者嘗試過(guò)角色設(shè)定或花哨的個(gè)性化,但在大型企業(yè)產(chǎn)品中依然很少見(jiàn)。我預(yù)計(jì)未來(lái)幾年這種情況會(huì)發(fā)生根本變化,這正是我在博客中呼吁大家注意的。

主持人:聽(tīng)起來(lái)在預(yù)訓(xùn)練階段幾乎沒(méi)法做什么,這些工作只能在后訓(xùn)練里處理。

Mustafa Suleyman:是的。預(yù)訓(xùn)練階段基本無(wú)法干預(yù)。后訓(xùn)練,甚至提示工程,都是非常強(qiáng)大的方法,而且操作并不復(fù)雜,很多人都能做到。

因此,我們應(yīng)該預(yù)期未來(lái)會(huì)出現(xiàn)數(shù)百萬(wàn)種不同的人格,各自有不同的背景故事和能力。這會(huì)讓AI產(chǎn)品與以往的技術(shù)和產(chǎn)品截然不同。

四、大模型是空心的,追求可解釋性是在“擬人化”

主持人:當(dāng)你談到塑造時(shí),有些人稱訓(xùn)練大模型幾乎就像種地一樣,在培育一個(gè)模型。在模型變得更有能力,更大之后,為了實(shí)現(xiàn)你的上述目標(biāo),是否需要更深入地理解模型呢?比如解決黑箱問(wèn)題,深入到單個(gè)神經(jīng)元中,以實(shí)現(xiàn)這個(gè)目標(biāo)呢?

Mustafa Suleyman:我覺(jué)得是有可能需要的。但同時(shí),我有一種直覺(jué),認(rèn)為對(duì)“可解釋性”的執(zhí)著其實(shí)是一種擬人化的想法。

它假設(shè)在生成語(yǔ)言、模擬體驗(yàn)的過(guò)程中,語(yǔ)言背后必然有某種“實(shí)體”,但在我看來(lái)并沒(méi)有。事實(shí)很清楚:一個(gè)簡(jiǎn)單的預(yù)測(cè)引擎就能以極其深刻的方式模擬出體驗(yàn)和互動(dòng)。

但這并不意味著在大型語(yǔ)言模型內(nèi)部真的發(fā)生了某種根本性的“體驗(yàn)”。它只是幾乎完美地模仿了體驗(yàn)的特性。而這就是模仿和真實(shí)體驗(yàn)之間的根本區(qū)別。

我們?nèi)祟惡推渌麆?dòng)物的意識(shí),其實(shí)是基于對(duì)感官輸入的第一手、實(shí)時(shí)的體驗(yàn),對(duì)它們進(jìn)行存儲(chǔ)、處理、適應(yīng),然后再基于此生成預(yù)測(cè)。

在我看來(lái),大語(yǔ)言模型是“空心”的。試圖去探索它們的內(nèi)部運(yùn)作機(jī)制,某種程度上也是一種擬人化。

當(dāng)然,這是一個(gè)有趣的科學(xué)探索,應(yīng)該繼續(xù)做下去。但它不太可能揭示出某種根本性的“意識(shí)的本質(zhì)(Consious Truth)”。而這正是一些學(xué)者或開(kāi)發(fā)者開(kāi)始探討的東西。我認(rèn)為這種探索是錯(cuò)誤的,也是過(guò)早的。

主持人:但即使它們是“空心的”,它們?cè)谝?guī)模變大、技術(shù)改進(jìn)時(shí),確實(shí)會(huì)變得更強(qiáng)。所以當(dāng)它們更強(qiáng)大、更龐大、更難理解時(shí),你認(rèn)為它們會(huì)不會(huì)在某種程度上變得難以控制,甚至在后訓(xùn)練階段也無(wú)法掌控?

Mustafa Suleyman:我不這么認(rèn)為。就像我在博文中寫(xiě)的那樣,我看不出這些系統(tǒng)會(huì)出現(xiàn)某種“欲望”、“動(dòng)機(jī)”或“意志”的涌現(xiàn)屬性的理由。

我沒(méi)有理由相信這種情況會(huì)發(fā)生。從歷史上看,這些特質(zhì)的出現(xiàn)是因?yàn)槲覀冇小皯?zhàn)或逃”的本能,為了生存而對(duì)環(huán)境作出反應(yīng)。

后訓(xùn)練的好處就在于,它是一種經(jīng)過(guò)反復(fù)驗(yàn)證、非常可靠的方式,可以用來(lái)塑造特定的行為。因此,我認(rèn)為作為模型開(kāi)發(fā)者,我們的責(zé)任是仔細(xì)思考:哪些行為要通過(guò)后訓(xùn)練去抑制,哪些行為要去放大。

這不會(huì)自然而然、涌現(xiàn)式地發(fā)生。如果會(huì)發(fā)生,那一定是因?yàn)槿藗兛桃獾貙⑦@些特性工程化地植入系統(tǒng)。因?yàn)槟P筒](méi)有真正的體驗(yàn),它們只是高質(zhì)量地模擬對(duì)話而已。所以好消息是,我認(rèn)為我們?cè)谶@些事情上仍然有很大的控制力。我們可以在積極降低風(fēng)險(xiǎn)的同時(shí),盡可能發(fā)揮它們的優(yōu)勢(shì)。這就是目標(biāo)。

五、招募人才沒(méi)遇到瓶頸,MAI飛輪已經(jīng)開(kāi)始旋轉(zhuǎn)

主持人:你們?cè)谛侣劯謇锲鋵?shí)也提到過(guò)——“來(lái)和我們一起工作吧,我們正在做很酷的事”。招募人才一直是AI行業(yè)的一個(gè)大問(wèn)題。你們?cè)谶@方面情況如何?能不能以理想的薪資招到你們想要的人才?

Mustafa Suleyman:當(dāng)然可以。我們有一支非常出色的團(tuán)隊(duì)。從Inflection帶來(lái)了一個(gè)極其強(qiáng)大的團(tuán)隊(duì),此后也從各大實(shí)驗(yàn)室招聘到了一批優(yōu)秀的人才。

我認(rèn)為我們的招聘非常順利。而且我們一直很謹(jǐn)慎,不會(huì)增長(zhǎng)得過(guò)快或過(guò)大。其實(shí)在這里,你只需要相對(duì)較小的團(tuán)隊(duì),就能做出高質(zhì)量的工作。

與此同時(shí),我們的團(tuán)隊(duì)也正在成長(zhǎng)到數(shù)百人規(guī)模,所以在招聘上我們處在一個(gè)很好的狀態(tài)。

主持人:那你們?cè)谖贻p的博士生時(shí),通常是怎么說(shuō)服他們?為什么要選擇來(lái)這里,而不是去OpenAI或DeepMind?

Mustafa Suleyman:我認(rèn)為世界上最優(yōu)秀的人才,想要做的是那些真正有影響力的工作,能帶來(lái)改變、能做出優(yōu)秀產(chǎn)品,同時(shí)解決如何高效實(shí)現(xiàn)目標(biāo)的技術(shù)挑戰(zhàn)。

而我們已經(jīng)證明了:我們能夠挑選非常高質(zhì)量的訓(xùn)練數(shù)據(jù),用相對(duì)有限數(shù)量的GPU,打造出世界級(jí)的模型。

我覺(jué)得這就是一張很有吸引力的名片,能讓更多人愿意加入我們的團(tuán)隊(duì)。我相信這只是我們未來(lái)幾個(gè)季度將推出的眾多模型中的第一個(gè)。我很期待繼續(xù)打造一支優(yōu)秀的團(tuán)隊(duì)。

主持人:我很好奇,在這次發(fā)布之前有報(bào)道說(shuō)模型出現(xiàn)了延遲、遇到問(wèn)題,早期沒(méi)能達(dá)到預(yù)期的能力。你們從中學(xué)到了什么?

畢竟這是微軟首個(gè)完整的端到端基礎(chǔ)模型。是不是很大的挑戰(zhàn)?有沒(méi)有收獲很多?

Mustafa Suleyman:是的,毫無(wú)疑問(wèn)。構(gòu)建如此規(guī)模的集群、在如此龐大的數(shù)據(jù)上進(jìn)行訓(xùn)練,總是很大的挑戰(zhàn)。

它需要大量的調(diào)試和迭代,需要來(lái)回折騰,需要耐心,還需要謙遜。每一家實(shí)驗(yàn)室都經(jīng)歷過(guò)這種過(guò)程,通過(guò)多次迭代才推出新版本。

但我認(rèn)為我們擁有一支非常優(yōu)秀的團(tuán)隊(duì),會(huì)繼續(xù)不斷迭代,把新的優(yōu)秀模型推向世界。我對(duì)未來(lái)充滿期待,因?yàn)槲覀儸F(xiàn)在已經(jīng)讓自己的“飛輪”轉(zhuǎn)了起來(lái),接下來(lái)會(huì)有很多非常有趣的事情發(fā)生。

六、核心模型仍需繼續(xù)迭代,不排除開(kāi)源可能

主持人:你之前在Inflection做過(guò)類似的事,再之前你在DeepMind,但那時(shí)還沒(méi)有大家都在搞十萬(wàn)級(jí)GPU集群的規(guī)模。所以那些經(jīng)驗(yàn)?zāi)苤苯舆w移過(guò)來(lái)嗎?還是說(shuō)每家公司都有自己的一套風(fēng)格或挑戰(zhàn),需要重新學(xué)習(xí)?

Mustafa Suleyman:這是個(gè)好問(wèn)題。歸根結(jié)底,這一切都是在于建立一種偉大的文化。文化吸引團(tuán)隊(duì),團(tuán)隊(duì)打造模型,而團(tuán)隊(duì)的價(jià)值觀最終會(huì)體現(xiàn)在我們做出的模型和產(chǎn)品中。

所以我們正在努力建設(shè)一種友善、支持性強(qiáng)、可持續(xù)的文化,同時(shí)專注于技術(shù)卓越,盡可能做到最好。

很多人會(huì)覺(jué)得這非常令人滿足,尤其是當(dāng)我們的產(chǎn)品能夠觸達(dá)數(shù)十億消費(fèi)者、數(shù)十萬(wàn)大小企業(yè)的時(shí)候。能讓技術(shù)惠及這么多人,本身就是很令人滿足的事。

主持人:說(shuō)到這里,你們預(yù)計(jì)什么時(shí)候能把這些模型真正應(yīng)用到微軟龐大的產(chǎn)品網(wǎng)絡(luò)里?

Mustafa Suleyman:很快。我們還需要在核心模型上繼續(xù)一些迭代,然后當(dāng)然要做大量的后訓(xùn)練,把它們應(yīng)用到不同的產(chǎn)品領(lǐng)域,并讓它有可能通過(guò)Foundry API提供給外部開(kāi)發(fā)者使用。這一切都在推進(jìn)中,很快就會(huì)發(fā)生。

主持人:你提到過(guò)你們從開(kāi)源世界學(xué)到了很多,但這個(gè)模型本身不是開(kāi)源的。未來(lái)會(huì)不會(huì)開(kāi)源?還是說(shuō)這并不是你們的方向?

Mustafa Suleyman:有可能。我們保持開(kāi)放的態(tài)度,畢竟現(xiàn)在也有很多優(yōu)秀的開(kāi)源模型。我認(rèn)為第一步是看看它在我們產(chǎn)品中的表現(xiàn),收集反饋,進(jìn)行迭代,然后可能會(huì)提供給其他客戶使用。我們現(xiàn)在正在考慮所有這些事情。

主持人:剛才還提到了GB200集群。那么MAI-2已經(jīng)在路上了嗎?是不是一年內(nèi)就能看到?接下來(lái)是什么?

Mustafa Suleyman:是的,我們已經(jīng)在做下一個(gè)模型了,規(guī)??隙ǜ?,訓(xùn)練方案上也會(huì)有一些新的調(diào)整。一切都在進(jìn)行中,未來(lái)幾個(gè)月、幾年會(huì)有很多新東西。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我在非洲當(dāng)保鏢:見(jiàn)證了海外華人的邪惡,非洲黑妹非要嫁給我

我在非洲當(dāng)保鏢:見(jiàn)證了海外華人的邪惡,非洲黑妹非要嫁給我

吳學(xué)華看天下
2023-12-20 12:32:08
79歲克林頓久違露面,帶除顫器引發(fā)健康擔(dān)憂,77歲希拉里卻很精神

79歲克林頓久違露面,帶除顫器引發(fā)健康擔(dān)憂,77歲希拉里卻很精神

譯言
2025-08-30 20:30:50
孟村女子葬禮后續(xù):弟弟曬照緬懷,曝姐姐隱忍原因,設(shè)計(jì)師發(fā)聲!

孟村女子葬禮后續(xù):弟弟曬照緬懷,曝姐姐隱忍原因,設(shè)計(jì)師發(fā)聲!

古希臘掌管松餅的神
2025-08-29 21:52:46
36歲楊穎上海商場(chǎng)現(xiàn)身,穿3年前高定禮服,失勢(shì)藝人辛酸盡顯?

36歲楊穎上海商場(chǎng)現(xiàn)身,穿3年前高定禮服,失勢(shì)藝人辛酸盡顯?

智凌縱橫
2025-08-30 10:36:55
楊蘭蘭保鏢身份疑曝光:姓胡、江西人,曾服役武警特勤,身手不凡

楊蘭蘭保鏢身份疑曝光:姓胡、江西人,曾服役武警特勤,身手不凡

公子麥少
2025-08-10 17:04:40
莫迪最新涉華表態(tài):印中保持緊密關(guān)系,對(duì)構(gòu)建多極化亞洲和世界至關(guān)重要

莫迪最新涉華表態(tài):印中保持緊密關(guān)系,對(duì)構(gòu)建多極化亞洲和世界至關(guān)重要

環(huán)球網(wǎng)資訊
2025-08-30 10:09:51
澳門賭場(chǎng)公關(guān)爆猛料:明星導(dǎo)演常來(lái),某天王玩半年,專走秘密通道

澳門賭場(chǎng)公關(guān)爆猛料:明星導(dǎo)演常來(lái),某天王玩半年,專走秘密通道

深析古今
2025-08-25 10:41:34
2進(jìn)武漢決賽,肖國(guó)棟秀恩愛(ài):感謝我老婆,這是送她的七夕禮物!

2進(jìn)武漢決賽,肖國(guó)棟秀恩愛(ài):感謝我老婆,這是送她的七夕禮物!

老媹古裝影視解說(shuō)
2025-08-29 21:07:49
iPhone17ProMax,突然提前上架

iPhone17ProMax,突然提前上架

搞機(jī)小帝
2025-08-30 13:57:02
董璇給張維伊家所有親屬買黃金,董璇媽媽感慨:他家親戚可多了!

董璇給張維伊家所有親屬買黃金,董璇媽媽感慨:他家親戚可多了!

陳意小可愛(ài)
2025-08-30 21:40:31
“我不想死!”長(zhǎng)沙女教師癌癥晚期,直言:全家必須為我犧牲!

“我不想死!”長(zhǎng)沙女教師癌癥晚期,直言:全家必須為我犧牲!

詩(shī)詞中國(guó)
2025-08-26 15:46:48
人民網(wǎng)發(fā)聲!兇手爸媽醫(yī)院工作,劉某父親哽咽發(fā)聲:一命抵一命

人民網(wǎng)發(fā)聲!兇手爸媽醫(yī)院工作,劉某父親哽咽發(fā)聲:一命抵一命

熱點(diǎn)菌本君
2025-08-27 15:45:34
【市長(zhǎng)】潮州市迎來(lái)新任副市長(zhǎng)鄧鋼:從紀(jì)委骨干到援藏先鋒,實(shí)干擔(dān)當(dāng)助力潮州騰飛

【市長(zhǎng)】潮州市迎來(lái)新任副市長(zhǎng)鄧鋼:從紀(jì)委骨干到援藏先鋒,實(shí)干擔(dān)當(dāng)助力潮州騰飛

潮州玩家
2025-08-30 22:26:13
韓國(guó)女運(yùn)動(dòng)員網(wǎng)上曬腹肌竟被舉報(bào)!稱她是只穿內(nèi)衣太暴露?

韓國(guó)女運(yùn)動(dòng)員網(wǎng)上曬腹肌竟被舉報(bào)!稱她是只穿內(nèi)衣太暴露?

奮斗在韓國(guó)
2025-08-30 14:06:44
打入一球,迪亞斯當(dāng)選奧格斯堡vs拜仁全場(chǎng)最佳球員

打入一球,迪亞斯當(dāng)選奧格斯堡vs拜仁全場(chǎng)最佳球員

懂球帝
2025-08-31 03:11:31
街頭捕獲高個(gè)長(zhǎng)發(fā)姐姐,她瑜伽褲勾勒的線條感絕了

街頭捕獲高個(gè)長(zhǎng)發(fā)姐姐,她瑜伽褲勾勒的線條感絕了

半生情感
2025-08-15 10:10:50
杭州男子暴打情夫后續(xù):扇臉猛踹,妻子跪地求饒,猛料被扒是慣犯

杭州男子暴打情夫后續(xù):扇臉猛踹,妻子跪地求饒,猛料被扒是慣犯

天天熱點(diǎn)見(jiàn)聞
2025-08-29 14:11:55
這是黃圣依?差點(diǎn)沒(méi)認(rèn)出來(lái),氣質(zhì)完全不一樣了呀,像是變了一個(gè)人

這是黃圣依?差點(diǎn)沒(méi)認(rèn)出來(lái),氣質(zhì)完全不一樣了呀,像是變了一個(gè)人

鄉(xiāng)野小珥
2025-08-24 13:16:57
貴州女老師趙慶梅執(zhí)行死刑,22名男生遭毒手,全班僅兩人幸免

貴州女老師趙慶梅執(zhí)行死刑,22名男生遭毒手,全班僅兩人幸免

第四思維
2025-08-26 09:14:41
重磅的房地產(chǎn)政策來(lái)了,國(guó)家要對(duì)老舊住房改造下重手。

重磅的房地產(chǎn)政策來(lái)了,國(guó)家要對(duì)老舊住房改造下重手。

流蘇晚晴
2025-08-30 18:06:15
2025-08-31 03:48:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
10390文章數(shù) 116838關(guān)注度
往期回顧 全部

科技要聞

李斌內(nèi)部講話:蔚來(lái)四季度必須盈利

頭條要聞

媒體:日本忍不了了 最后一刻取消訪美

頭條要聞

媒體:日本忍不了了 最后一刻取消訪美

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂(lè)要聞

吳京風(fēng)波拉出多位明星

財(cái)經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

汽車要聞

全國(guó)靜態(tài)品鑒開(kāi)啟 方程豹鈦7成都車展首秀

態(tài)度原創(chuàng)

手機(jī)
游戲
旅游
數(shù)碼
健康

手機(jī)要聞

vivo X300系列超前瞻預(yù)熱開(kāi)啟:兩億像素+長(zhǎng)焦微距,實(shí)力不容小覷

UP主挑戰(zhàn)念“游戲科學(xué)”100萬(wàn)次:最后竟然成功了!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

數(shù)碼要聞

英特爾 Arc Pro B50 首個(gè) Geekbench 跑分出爐,低于銳炫 B570

精神科專家解答學(xué)習(xí)困難七大問(wèn)題

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版