多些基于彼此「聽(tīng)懂」的相互理解,是重建以善為經(jīng)緯的巴別塔的應(yīng)有之義。
文 | 佘宗明
假如人類(lèi)語(yǔ)言相通,世界將會(huì)怎樣?
《圣經(jīng)》中就講了個(gè)故事:說(shuō)著相同語(yǔ)言的人類(lèi)想建造通天塔,借此直通天堂,此舉激起God不滿(mǎn),視此為挑釁的他,變亂人們口音,增加溝通障礙。因語(yǔ)言不再相通,人類(lèi)隔閡叢生,無(wú)力再造巴別塔。
盡管人類(lèi)的語(yǔ)言并不相通,但通過(guò)翻譯消除隔閡的嘗試卻未曾斷絕。
78年前,也就是在世界第一臺(tái)現(xiàn)代電子計(jì)算機(jī)ENIAC問(wèn)世的第二年,「信息論先驅(qū)」韋弗就提出了用計(jì)算機(jī)進(jìn)行語(yǔ)言翻譯的設(shè)想。兩年后,他在《翻譯備忘錄》中正式提出機(jī)器翻譯的概念。
只不過(guò),在有生之年,他并未看到機(jī)器翻譯迎來(lái)歷史性突破。
機(jī)器翻譯迎來(lái)奇點(diǎn)時(shí)刻,是在十多年前。點(diǎn)燃引線的,是當(dāng)今AI界的重量級(jí)人物——人稱(chēng)「AI教父」的杰弗里·辛頓。2006年,辛頓改善了神經(jīng)網(wǎng)絡(luò)優(yōu)化過(guò)于緩慢的致命缺點(diǎn),使得基于神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的機(jī)器翻譯成為可能。
可即便是辛頓本人都未必能料到,他能在大洋彼岸親自見(jiàn)證機(jī)器翻譯迎來(lái)的節(jié)點(diǎn)性時(shí)刻。
7月26日,辛頓現(xiàn)身2025世界人工智能大會(huì)(WAIC)發(fā)表了主題演講。演講完后,中國(guó)外交部原副部長(zhǎng)傅瑩與辛頓在會(huì)場(chǎng)外偶遇。二人的對(duì)話雖是主論壇外的插曲,卻也為這場(chǎng)技術(shù)盛宴增添了耐人尋味的注腳。
傅瑩說(shuō):「杰弗里,今天你的演講我聽(tīng)得非常清楚,屏幕上有實(shí)時(shí)中文翻譯字幕,AI一直在翻譯你的話?!?/p>
辛頓略顯意外:「我看不到屏幕,但我耳機(jī)里聽(tīng)到的是人工翻譯?!?/p>
傅瑩回應(yīng):「所以,AI在聆聽(tīng)你。(AI is listening to you!)」
AI站在身為諾貝爾獎(jiǎng)與圖靈獎(jiǎng)雙料得主的辛頓身后,傾聽(tīng)并轉(zhuǎn)譯他那些深邃洞見(jiàn),這本就是AI對(duì)AI世界「推門(mén)人」的友善回應(yīng)。
而幾乎秒反應(yīng)式「聽(tīng)懂」辛頓的中國(guó)AI,也在定義另一種可能。
01
AI正讓機(jī)器同傳從「可用」到「好用」
消除人類(lèi)因語(yǔ)言不通而來(lái)的隔閡,在故事里是宏大設(shè)定,在現(xiàn)實(shí)中卻對(duì)應(yīng)著頗顯急切的剛需:在出境游、跨國(guó)會(huì)議、跨境貿(mào)易、商務(wù)談判等已成「地球村」日常的當(dāng)下,跨語(yǔ)言溝通變成了高頻需求。
可多年來(lái),機(jī)器同傳在高端國(guó)際會(huì)議上卻只能扮演「打輔助」的角色:延遲久、術(shù)語(yǔ)錯(cuò)譯率高、專(zhuān)業(yè)語(yǔ)境斷句混亂,使得主辦方通常只敢把AI字幕當(dāng)輔助參考。
但AI使得機(jī)器翻譯駛?cè)肓丝燔?chē)道。近些年,無(wú)論是國(guó)內(nèi)的科大訊飛、阿里、百度,還是國(guó)外的OpenAI、谷歌、Meta等,都在發(fā)力跨語(yǔ)種翻譯技術(shù)。
原因不復(fù)雜:更符合人類(lèi)表達(dá)習(xí)慣的語(yǔ)音交互被認(rèn)為是下一代人機(jī)交互形態(tài),構(gòu)筑「語(yǔ)音到語(yǔ)音」的閉環(huán)體驗(yàn)成了許多大模型打造多模態(tài)能力的重要落點(diǎn)。
而語(yǔ)音同傳是其中特別考驗(yàn)技術(shù)和拉練能力的應(yīng)用場(chǎng)景,補(bǔ)足即時(shí)傳譯能讓大模型實(shí)現(xiàn)能力躍升——比起語(yǔ)音來(lái)語(yǔ)音去,不同語(yǔ)言間的「實(shí)時(shí)語(yǔ)音+實(shí)時(shí)翻譯+實(shí)時(shí)輸出」要難多了。
這其中,作為「AI語(yǔ)音之王」的科大訊飛,就將機(jī)器翻譯從傳統(tǒng)模式下的「語(yǔ)音→文字→翻譯→文字→語(yǔ)音」五段跳,帶到了「邊聽(tīng)邊說(shuō)的語(yǔ)音到語(yǔ)音同傳」階段,帶動(dòng)了實(shí)時(shí)語(yǔ)音同傳技術(shù)的成熟化。
成為本屆WAIC唯一的「翻譯合作伙伴」,將語(yǔ)音同傳技術(shù)應(yīng)用于開(kāi)幕式及多場(chǎng)論壇(包括辛頓的主旨演講環(huán)節(jié)),就是對(duì)科大訊飛技術(shù)實(shí)力的「蓋章」。
沒(méi)什么理所應(yīng)當(dāng),所謂理所應(yīng)當(dāng)都是種瓜得瓜:正是科大訊飛把中英同傳首字響應(yīng)壓縮到2秒以?xún)?nèi),達(dá)到了人類(lèi)頂尖同傳譯員的反應(yīng)速度,將機(jī)器同傳從「可用」推向了「好用」。
快是壁壘,超強(qiáng)理解力是絕技。辛頓的演講內(nèi)容橫跨AI發(fā)展史、認(rèn)知科學(xué)、科技倫理、人類(lèi)未來(lái)、量子計(jì)算隱喻等復(fù)雜領(lǐng)域,但本次辛頓演講的中文字幕體驗(yàn)卻極為流暢,幾乎達(dá)到了「無(wú)感」的程度,翻譯呈現(xiàn)效果可謂質(zhì)的飛躍。
這離不開(kāi)訊飛星火語(yǔ)音同傳大模型的支撐。就在大會(huì)前一天,科大訊飛發(fā)布了深度推理大模型星火X1的最新版本。端到端架構(gòu),130+語(yǔ)種的交互問(wèn)答、數(shù)學(xué)解題、文本生成、語(yǔ)言翻譯等任務(wù),覆蓋超8萬(wàn)個(gè)垂直領(lǐng)域的專(zhuān)業(yè)詞匯,使得其可以勝任高難度的「傾聽(tīng)」任務(wù),并徹底消除翻譯時(shí)的卡頓體驗(yàn)。
到頭來(lái),星火X1帶來(lái)的無(wú)障礙溝通效果,在參會(huì)者對(duì)大會(huì)字幕「幾乎忘了是AI完成的」評(píng)價(jià)中可見(jiàn)一斑。
02
15年前,科大訊飛就是辛頓的「知音」
如果說(shuō)現(xiàn)場(chǎng)效果顯示了「能做到怎樣」,那技術(shù)沉淀則回答了「為什么能做到這樣」。
辛頓那番備受矚目的演講被科大訊飛實(shí)時(shí)傾聽(tīng)轉(zhuǎn)譯,本就裹著些許歷史回響的意味:一個(gè)鮮為人知的故事,將辛頓與這家中國(guó)公司十幾年前就連接在了一起。
2008年,當(dāng)辛頓與華人科學(xué)家鄧力合作嘗試用「深度學(xué)習(xí)」這個(gè)全新方法解決語(yǔ)音問(wèn)題時(shí),應(yīng)者一時(shí)寥寥,鄧力在微軟的直屬上司就認(rèn)為這「非?;闹嚒埂?/p>
但,思想火種總會(huì)找到愿意接納它的創(chuàng)新土壤,最終帶來(lái)燎原效果。
2010年,鄧力受邀回到母校中國(guó)科學(xué)技術(shù)大學(xué),舉辦了一場(chǎng)關(guān)于「深度學(xué)習(xí)」的學(xué)術(shù)報(bào)告,這啟發(fā)了臺(tái)下一群年輕人——他們來(lái)自科大訊飛研究院。這批年輕人隨后成為微軟總部以外全球最早系統(tǒng)了解、發(fā)力跟進(jìn)這項(xiàng)研究的團(tuán)隊(duì)之一。
鄧力后來(lái)就回憶,在那個(gè)時(shí)代,全球真正相信「深度學(xué)習(xí)」并付諸實(shí)踐的公司,只有兩家:谷歌和科大訊飛。
這段歷史淵源,大致解釋了科大訊飛為何能在智能語(yǔ)音領(lǐng)域長(zhǎng)期領(lǐng)跑。
《最佳可能的世界:數(shù)學(xué)與命運(yùn)》作者??死试f(shuō)過(guò):每起事件就像樹(shù)干,把網(wǎng)狀的根伸向過(guò)去,把樹(shù)冠托向未來(lái)。如果說(shuō)偶然之機(jī)是栽下種子的觸點(diǎn),那持久之力就是讓樹(shù)冠長(zhǎng)得更高的澆灌。
從一個(gè)技術(shù)追隨者,到如今能夠?yàn)橹屏巳駻I發(fā)展的「教父」提供服務(wù),背后就是科大訊飛長(zhǎng)達(dá)二十余年在多語(yǔ)言技術(shù)上的「久久為功」。深耕厚積,蓄積了其躋身人工智能?chē)?guó)家隊(duì)的底氣。
拿語(yǔ)音同傳來(lái)說(shuō),科大訊飛首創(chuàng)的基于文本自適應(yīng)調(diào)度的「流式語(yǔ)音合成技術(shù)」,就讓AI 翻譯出來(lái)的聲音自然度和擬人感媲美真人。在醫(yī)療、制造業(yè)、金融這些 「術(shù)語(yǔ)重災(zāi)區(qū)」,覆蓋了8萬(wàn)+專(zhuān)業(yè)詞匯的星火語(yǔ)音同傳大模型,專(zhuān)業(yè)內(nèi)容翻譯得分破 90 分,在專(zhuān)業(yè)度和完整性上已超越一般同傳譯員。
這屆WAIC是自創(chuàng)辦以來(lái)國(guó)際化程度最高的一屆全球AI盛會(huì),也成了AI企業(yè)的炫肌肉時(shí)刻。星火X1加持和多語(yǔ)言能力賦能下的科大訊飛同傳會(huì)議服務(wù)、SaaS產(chǎn)品和翻譯機(jī)、錄音筆等智能設(shè)備密集亮相,就成了中國(guó)智能語(yǔ)音領(lǐng)域的全明星卡司陣容。
頗堪尋味的一幕是:在WAIC科大訊飛展臺(tái)前,泰國(guó)AI公司Omniscien的首席技術(shù)官Dion Wiggins就對(duì)多語(yǔ)種AI透明屏發(fā)出了「This is exciting!」的感嘆。
03
世界需要可靠的「第二選擇」
需要看到的是,在演講中,辛頓著重警告了AI伴生的風(fēng)險(xiǎn)。風(fēng)險(xiǎn)核心在于,AI可能發(fā)展出人類(lèi)無(wú)法預(yù)料和控制的目標(biāo)。
而大模型作為當(dāng)前AI技術(shù)的核心,其價(jià)值觀和知識(shí)邊界很大程度上由其訓(xùn)練數(shù)據(jù)和開(kāi)發(fā)理念所決定。
一個(gè)由單一文化背景、單一技術(shù)路徑主導(dǎo)的全球AI格局,本身就蘊(yùn)含著巨大的「系統(tǒng)性風(fēng)險(xiǎn)」。它可能會(huì)在無(wú)形中強(qiáng)化某種文化霸權(quán),或是在算法層面忽視特定區(qū)域的需求與價(jià)值觀。
在此背景下,全球需要更多的解決方案來(lái)避免這類(lèi)風(fēng)險(xiǎn),畢竟,若AI大模型成了通往哪里由某個(gè)鋪設(shè)者說(shuō)了算的單軌鐵路,那車(chē)上的人注定要承受很多的未卜未知。
而科大訊飛的底座大模型走的就是全棧自研路線:星火X1完全是基于「飛星一號(hào)」全國(guó)產(chǎn)算力平臺(tái)訓(xùn)練,從底層的AI芯片和算力集群,到中間的AI框架,再到上層的算法與模型,「全棧自主可控」的技術(shù)路徑早已成形。
在當(dāng)前全球地緣政治與科技博弈加劇的當(dāng)下,這不僅關(guān)乎技術(shù)實(shí)力,更關(guān)乎戰(zhàn)略安全。當(dāng)先進(jìn)制程芯片的獲取受限成為常態(tài),全球AI產(chǎn)業(yè)高度依賴(lài)少數(shù)幾家美國(guó)公司的技術(shù)棧時(shí),這意味著,將技術(shù)迭代的命脈都掌握在自己手中。
鑒于訊飛星火大模型整體效果可對(duì)標(biāo)OpenAI o3等國(guó)內(nèi)外一流大模型,其「既能自主,又能領(lǐng)先」的狀態(tài)構(gòu)成了它的優(yōu)勢(shì)點(diǎn),也讓AI多了些安全可控的著力點(diǎn)。
將目光投向更廣闊的國(guó)際市場(chǎng)時(shí)也能看到,科大訊飛作為「第二選擇」的價(jià)值愈發(fā)清晰。
從服務(wù)北京冬奧會(huì),到成為進(jìn)博會(huì)和聯(lián)合國(guó)會(huì)議的???,到在2025年日本大阪世博會(huì)上推出「AI孫悟空」,再到成為WAIC的唯一翻譯合作伙伴,科大訊飛的語(yǔ)音同傳技術(shù)日益成為中國(guó)與世界對(duì)話的「標(biāo)準(zhǔn)配置」。
對(duì)不少非英語(yǔ)國(guó)家特別是「一帶一路」沿線國(guó)家而言,有一個(gè)來(lái)自中國(guó)的技術(shù)水平領(lǐng)先且愿意進(jìn)行更靈活本地化合作的伙伴作為「第二選擇」,顯然要優(yōu)于只有一個(gè)會(huì)帶來(lái)數(shù)據(jù)主權(quán)與文化安全顧慮的「唯一選項(xiàng)」要好。
就此看,WAIC上那塊精準(zhǔn)翻譯著辛頓灼見(jiàn)的屏幕,不僅是一次技術(shù)實(shí)力的展示,更是一次無(wú)聲的宣言:在關(guān)乎人類(lèi)共同命運(yùn)的AI命題上,一個(gè)擁有包容、多元、可靠的「第二選擇」的未來(lái),不僅是必要的,而且是可能的。而中國(guó)AI就在為此提供自己的解決方案。
而今,升級(jí)后的星火X1已支持超過(guò)130個(gè)語(yǔ)種,為全球跨語(yǔ)言溝通提供了實(shí)打?qū)嵉谋憷?。由此可?jiàn),其多語(yǔ)言能力不僅僅是商業(yè)布局,更是致力于服務(wù)全球多元需求的AI力量支撐,有助于制衡單極化的AI格局,構(gòu)建更多元更平衡的全球AI生態(tài)。
04
結(jié)語(yǔ)
辛頓在WAIC演講中直言,「人類(lèi)面臨最重要的事」——加強(qiáng)讓AI向善的全球合作,防止讓AI「統(tǒng)治」世界。
無(wú)論是AI向善還是全球合作,都需要打破語(yǔ)言不相通帶來(lái)的隔膜,增加跨語(yǔ)言溝通的順暢性。
詩(shī)人斯蒂芬·格奧爾曾寫(xiě)道:「詞語(yǔ)破碎處,無(wú)物可存在」。順暢的跨語(yǔ)言溝通,正是為了縫合那些「破碎處」。
在《巴別塔之后》里,著名學(xué)者喬治·斯坦納說(shuō):理解即翻譯。這話反過(guò)來(lái)說(shuō),很多時(shí)候也成立:翻譯即理解?;蛘哒f(shuō),翻譯是增進(jìn)理解的方式。
多些基于彼此「聽(tīng)懂」的相互理解,是重建以善為經(jīng)緯的巴別塔的應(yīng)有之義。
科大訊飛提供「第二選擇」,用技術(shù)搭建全球跨語(yǔ)言溝通橋梁,讓更多跨國(guó)交流變得無(wú)障礙,就是在助力塔基下的人們沖破溝通障礙,更好地聚在一起。
最起碼,辛頓演講被中國(guó)AI精準(zhǔn)實(shí)時(shí)「聽(tīng)懂」,就讓這幅圖景變得愈發(fā)可期。
?作者 | 佘宗明
?運(yùn)營(yíng) | 李玩
轉(zhuǎn)載須經(jīng)許可
廣告合作請(qǐng)聯(lián)系微信號(hào):rabgogo88
或手機(jī)號(hào):18810070968
敬請(qǐng)關(guān)注
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.