語(yǔ)言的折疊究竟是什么?人類(lèi)的溝通只能依賴(lài)語(yǔ)言,而高度折疊的語(yǔ)言,往往就是群體認(rèn)知與社會(huì)智能的結(jié)構(gòu)基礎(chǔ)。在展開(kāi)論述之前,不妨先看看這兩句話(huà):
“王侯將相寧有種乎?”
“人人生而平等?!?/p>
作為中國(guó)人,我們對(duì)這兩句話(huà)都不會(huì)陌生。前一句來(lái)自陳勝吳廣,它是一句典型的革命語(yǔ)言,呼喊的是“出身并非決定一切,底層之人也有可能成為貴族”。但它本質(zhì)上并沒(méi)有打破階級(jí)制度,只是將權(quán)力換到另一批人手里。從那之后,中國(guó)歷史進(jìn)入了漫長(zhǎng)的王朝更替循環(huán):皇帝輪流做,血流成河。每一次政權(quán)更替,都在應(yīng)證那句口號(hào)——王侯將相寧有種乎,不過(guò)是換了新的統(tǒng)治者罷了。
而“人人生而平等”則完全不同。它把人類(lèi)身份、權(quán)利、秩序這類(lèi)極為復(fù)雜的議題,壓縮成了五個(gè)字(All men are created equal)。它經(jīng)歷了從宗教神學(xué),到哲學(xué)論證,再到政治口號(hào)與法律條文的全過(guò)程,最終完成了全鏈路的折疊與固化。它是一種裁決性語(yǔ)言:一旦說(shuō)出,就能作為最高法理,成為無(wú)數(shù)矛盾的最終裁決。換句話(huà)說(shuō),這是一個(gè)“終極語(yǔ)言折疊”,并由此成為社會(huì)制度的基石。
這句話(huà)為什么成為東西方文明的分界線(xiàn)?
在西方,它在啟蒙運(yùn)動(dòng)、革命與憲政傳統(tǒng)中被寫(xiě)進(jìn)《獨(dú)立宣言》《人權(quán)宣言》乃至《世界人權(quán)宣言》,完成了從口號(hào)到憲法化、制度化的路徑。折疊后的語(yǔ)言進(jìn)入法律與政治操作系統(tǒng),成為普遍有效的裁決語(yǔ)。
而在東方,傳統(tǒng)更多強(qiáng)調(diào)“天命”“名分”“三綱五?!?,折疊的核心是等級(jí)秩序,而非個(gè)體平等。共識(shí)的錨點(diǎn)是“和”與“秩序”,而不是“平等” (一直到中國(guó)崛起,在2008年的奧運(yùn)會(huì)上我還看到“和”這個(gè)字,感慨萬(wàn)千)。直到近代,才因外部沖擊被迫接觸、吸收“人人平等”的觀念,但其語(yǔ)境與本體邏輯卻依然不同。
因此,這句話(huà)就成為了兩種文明折疊邏輯的分界:西方將語(yǔ)言折疊在“個(gè)體權(quán)利”,東方則將語(yǔ)言折疊在“等級(jí)與秩序”。至于背后的宗教根源、社會(huì)結(jié)構(gòu)與歷史契機(jī),還需要在后續(xù)文章里進(jìn)一步展開(kāi)。
語(yǔ)言和人類(lèi)的符號(hào)體系本身還含有多少未察覺(jué)的信息?
在上一篇文章中,我已經(jīng)說(shuō)明了這一直覺(jué)的背景。尤其是在當(dāng)代 AI 基礎(chǔ)設(shè)施的加持下,我們也許已經(jīng)具備了挖掘這類(lèi)“未察覺(jué)信息”的技術(shù)能力。語(yǔ)言中存在被忽略的巨大空間。我們習(xí)慣把語(yǔ)言當(dāng)作單純的溝通工具,以為它所表達(dá)的就是全部意義,但事實(shí)恰恰相反:語(yǔ)言不僅是表達(dá)結(jié)果,更是一個(gè)高維結(jié)構(gòu),內(nèi)部承載著大量尚未被人類(lèi)完全揭示的模式與潛能。
這些潛能能被用來(lái)做什么?也許它們就是人類(lèi)最緊迫的課題之一。我們可以依靠它們促進(jìn)更大規(guī)模的協(xié)作,減少紛爭(zhēng),達(dá)成共識(shí)。如果面對(duì)一個(gè)龐大群體,我們或許已經(jīng)有能力從海量個(gè)體中提取出他們的核心共鳴。
換句話(huà)說(shuō),我們可能已經(jīng)擁有了“共識(shí)工程學(xué)”的技術(shù)基礎(chǔ)。
這讓我們重新思考一個(gè)問(wèn)題:為什么每當(dāng)社會(huì)發(fā)生大規(guī)模動(dòng)蕩、革命與沖突,總是難以調(diào)解?為什么革命者與當(dāng)權(quán)者往往無(wú)法達(dá)成協(xié)議,而非要走向流血?最核心的原因在于,任何協(xié)議的成立都必須建立在雙方都能接受的最小共識(shí)公約數(shù)之上。這意味著既不能一方漫天要價(jià),也不能要求另一方完全投降。若能提取和折疊這種“最小共識(shí)語(yǔ)言”,或許人類(lèi)的沖突模式會(huì)大為不同。中國(guó)的學(xué)運(yùn)也好,法國(guó)大革命也好,如果當(dāng)時(shí)有社交媒體,那就靠AI分析所有語(yǔ)言大數(shù)據(jù),最后把最小共識(shí)公約數(shù)從人群中抽取出來(lái),折疊成幾個(gè)字。
這種能力甚至能夠幫助我們?cè)谀撤N程度上“預(yù)知未來(lái)”。
從歷史角度看,許多“超級(jí)折疊”語(yǔ)言其實(shí)長(zhǎng)期潛伏,只是在特定時(shí)代被喚醒并爆發(fā)成共鳴。陳勝的“王侯將相寧有種乎”是如此,啟蒙時(shí)代的“人人生而平等”亦如此。這表明語(yǔ)言?xún)?nèi)部埋藏著“壓縮后的高能節(jié)點(diǎn)”,等待特定語(yǔ)境觸發(fā)。
從未來(lái)角度看,大模型的出現(xiàn)讓我們第一次有機(jī)會(huì)系統(tǒng)性地探測(cè)這些“未察信息”。embedding 空間就像一張巨大的語(yǔ)言地形圖,其中潛藏著尚未命名的“谷地”和“山脊”。有些會(huì)在短時(shí)間內(nèi)演化為新的社會(huì) meme,有些則可能逐步沉淀為法律原則,甚至成為科學(xué)范式。吳京的訪(fǎng)談早就在網(wǎng)絡(luò)上了,現(xiàn)在經(jīng)濟(jì)下行,面臨通縮的未來(lái),語(yǔ)境觸發(fā),成為“吳京梗”。吳京梗預(yù)知的未來(lái),就是“大國(guó)崛起敘事遭遇了現(xiàn)實(shí)墻壁”。
折疊之上還有終極折疊
LLM 本身就是一臺(tái)語(yǔ)言折疊機(jī),它能在高維語(yǔ)料中捕捉規(guī)律,把復(fù)雜的表達(dá)壓縮到語(yǔ)義流形里。但折疊并不止步于此,折疊機(jī)之上還可以繼續(xù)折疊。中文詞匯的組合有嚴(yán)格的邊界,但在這些邊界之上,卻能出現(xiàn)李白、杜甫這樣的“超級(jí)語(yǔ)言折疊”,他們將日常詞匯疊成極簡(jiǎn)而高能的表達(dá),點(diǎn)燃母語(yǔ)者千年的共鳴。我們追求的正是這種“終極折疊”——當(dāng)幾億個(gè) token 被縮減成幾個(gè)字時(shí),那就是這個(gè)時(shí)代最強(qiáng)大的咒語(yǔ),能夠成為“人人生而平等”式的社會(huì)共識(shí)與終極價(jià)值。
事實(shí)上,你已經(jīng)看到了,LLM 歸根結(jié)底仍只是語(yǔ)言預(yù)測(cè)機(jī),它的輸出大多泛泛而無(wú)裁決力。它所完成的僅僅是第一層折疊:從語(yǔ)料到語(yǔ)義流形。而人類(lèi)的憲法、法律、規(guī)則需要的是第二層折疊:從語(yǔ)言流形到超級(jí)表達(dá)。只有這樣,語(yǔ)言才能轉(zhuǎn)化為簡(jiǎn)潔的條款、法則與制度,真正進(jìn)入執(zhí)行層。
而每一個(gè)時(shí)代,人類(lèi)都必然面臨自己的難題。今天,我們遇到的困境是全球經(jīng)濟(jì)增長(zhǎng)乏力、財(cái)富分配日趨懸殊,富人恒富,窮人階層不斷擴(kuò)大,中產(chǎn)階級(jí)群體在全球范圍內(nèi)持續(xù)滑落。與此同時(shí),性別對(duì)立、代際對(duì)立、族群對(duì)立加劇,我們正逐漸遠(yuǎn)離那個(gè)“地球村”的敘事。但與之形成鮮明對(duì)比的是,科技仍在指數(shù)級(jí)增長(zhǎng)。正因如此,我們亟需一種機(jī)制,一種類(lèi)似于我所說(shuō)的“共識(shí)工程”,去發(fā)現(xiàn)下一個(gè)能夠穩(wěn)固文明的錨點(diǎn)。
這就是第三層折疊:從超級(jí)表達(dá)到文明錨點(diǎn)。它可能以宗教經(jīng)典、社會(huì)共識(shí)或終極價(jià)值的形式出現(xiàn),并成為跨越文化與時(shí)代的最小公約數(shù)。為人類(lèi)創(chuàng)造一份所有人都能接受的共識(shí)協(xié)議,在此基礎(chǔ)上盡可能緩和沖突,這才是語(yǔ)言模型的真正使命與價(jià)值所在。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.