深度思考不是天才專(zhuān)利,而是可復(fù)制的系統(tǒng)方法。
3月24日晚,比亞迪交出歷史最強(qiáng)成績(jī)單,2024年?duì)I收7771億元,同比增長(zhǎng)29%;歸母凈利潤(rùn)402.5億元,同比增長(zhǎng)34%。營(yíng)收首次突破千億美元,超越特斯拉,成為全球第一大新能源車(chē)企。
這家曾被人嘲笑“土味造車(chē)”的企業(yè),在2019年的至暗時(shí)刻,利潤(rùn)同比下降40%,扣非凈利潤(rùn)僅2.3億元,汽車(chē)、光伏、儲(chǔ)能等產(chǎn)業(yè)均陷入困境,月銷(xiāo)量長(zhǎng)期徘徊在3萬(wàn)至4萬(wàn)輛,被戲稱(chēng)為“比三萬(wàn)”,但現(xiàn)在應(yīng)該稱(chēng)呼其為“迪王”了。
其實(shí)在發(fā)布會(huì)之后,我就通過(guò) DeepSeek用巴菲特“護(hù)城河理論”梳理了比亞迪和特斯拉,那哪個(gè)公司的護(hù)城河更深,更有投資價(jià)值呢?
DeepSeek按照我的護(hù)城河四個(gè)問(wèn)題的框架回答得非常好,不亞于一個(gè)商業(yè)分析師。但是,前提條件是你要理解巴菲特護(hù)城河理論。那么,AI(人工智能)可以模仿人類(lèi)思考,人類(lèi)是不是也可以反向?qū)W習(xí) AI?就像2016年阿爾法狗在圍棋戰(zhàn)勝人類(lèi)之后,人類(lèi)通過(guò)向 AI學(xué)習(xí),圍棋水平提升到一個(gè)新的高度。
所以,今天和大家分享我最近在和 AI協(xié)作投資、研究的過(guò)程中,如何將投資研究的工作效率提升了4倍以及如何向 DeepSeek學(xué)習(xí)深度思考。
什么是深度思考?
特斯拉創(chuàng)始人兼首席執(zhí)行官馬斯克說(shuō),深度思考對(duì)于解決問(wèn)題和創(chuàng)造新事物非常重要,你需要深入研究一個(gè)問(wèn)題,理解其本質(zhì)和根源,然后提出創(chuàng)新解決方案。
心理學(xué)家、諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼說(shuō),深度思考是一種對(duì)信息進(jìn)行批判性分析的能力,它涉及對(duì)信息的綜合、評(píng)估和推理。這種思考方式可以幫助我們避免被表象所迷惑,作出更明智的決策。
在 AI身上,就是體現(xiàn)在 DeepSeek讓人驚嘆的思維鏈,它通過(guò)分步推理、動(dòng)態(tài)修正、多模態(tài)整合模擬人類(lèi)的思考過(guò)程,將復(fù)雜問(wèn)題分解為多個(gè)中間步驟,并逐步推導(dǎo)得出結(jié)論,從而提升模型在邏輯推理、數(shù)學(xué)計(jì)算、代碼生成等任務(wù)中的準(zhǔn)確性與透明度。
也就是把 Open AI等 AI大模型的“黑箱決策”轉(zhuǎn)化為可追溯、可驗(yàn)證的邏輯鏈條,也給了我們向 AI學(xué)習(xí)的機(jī)會(huì)。
這樣的訓(xùn)練和技術(shù)分為三個(gè)階段,也可以遷移到企業(yè)和投資中。
第一,預(yù)訓(xùn)練(Pre-training)。
構(gòu)建知識(shí)的底層操作系統(tǒng),也是構(gòu)建思維鏈里面的底層邏輯基礎(chǔ)。它的核心邏輯是讓 AI像人類(lèi)幼童般“博覽群書(shū)”。通過(guò)海量文本數(shù)據(jù)(書(shū)籍、網(wǎng)頁(yè)、代碼、對(duì)話(huà)記錄等)來(lái)訓(xùn)練模型,使其掌握語(yǔ)言規(guī)律和基礎(chǔ)知識(shí)。
這個(gè)過(guò)程如同給 AI裝了一套“底層操作系統(tǒng)”,決定了它的知識(shí)廣度和基礎(chǔ)能力。預(yù)訓(xùn)練階段特點(diǎn)是無(wú)須監(jiān)督學(xué)習(xí),無(wú)須人工標(biāo)注,模型通過(guò)預(yù)測(cè)“下一個(gè)詞”來(lái)自我進(jìn)化。這個(gè)過(guò)程中要特別注意數(shù)據(jù)庫(kù)的偏向性。
我在看到比亞迪的年報(bào)之后,讓 DeepSeek幫我統(tǒng)計(jì)比亞迪和特斯拉兩家公司從2020年到2024年的營(yíng)收、研發(fā)費(fèi)用/研發(fā)費(fèi)用率、銷(xiāo)售費(fèi)用/銷(xiāo)售費(fèi)用率。結(jié)果,出現(xiàn)了兩個(gè)問(wèn)題:
1. DeepSeek沒(méi)有使用剛剛發(fā)布的比亞迪2024年年報(bào)的營(yíng)收數(shù)據(jù),只是用比亞迪2024年前三季度的數(shù)據(jù)來(lái)推算,特斯拉也是這樣的情況,導(dǎo)致計(jì)算結(jié)果錯(cuò)誤。然后,我就給它投喂了比亞迪和特斯拉最新的年報(bào),數(shù)據(jù)才會(huì)修改。
2.在看到2024年數(shù)據(jù)錯(cuò)誤后,我在想其他數(shù)據(jù)是不是也會(huì)出現(xiàn)錯(cuò)誤?我馬上就用專(zhuān)業(yè)股票軟件數(shù)據(jù)核對(duì),結(jié)果營(yíng)收數(shù)據(jù)對(duì)了,但是中間的研發(fā)費(fèi)用、銷(xiāo)售費(fèi)用出現(xiàn)了錯(cuò)誤。由于數(shù)據(jù)更新速度和語(yǔ)料庫(kù)的原因,會(huì)導(dǎo)致大模型出來(lái)的結(jié)果出現(xiàn)重大失誤,行業(yè)簡(jiǎn)稱(chēng)為數(shù)據(jù)幻覺(jué)。
這里我給大家一個(gè)警示,再好的大模型,進(jìn)去的是精華,出來(lái)的就是精華,進(jìn)去的是垃圾,出來(lái)的就是垃圾。
這也是為什么這么多中國(guó)企業(yè)寧肯自己耗資幾十萬(wàn)元,買(mǎi)英偉達(dá)50、90GPU(中央處理器),本地部署 DeepSeek,用自己的公司和行業(yè)數(shù)據(jù)投喂,問(wèn)答就更有確定性和專(zhuān)業(yè)性,同時(shí)能夠保證數(shù)據(jù)的隱私安全。
像比亞迪電池實(shí)驗(yàn)室就是類(lèi)似的思維,將2000份專(zhuān)利濃縮成“技術(shù)要素矩陣表”,形成研發(fā)人員理解和運(yùn)用的結(jié)構(gòu)化知識(shí)體系。
華為海思芯片團(tuán)隊(duì)要求工程師閱讀全球3000多篇頂級(jí)論文建立知識(shí)圖譜,美的集團(tuán)在工業(yè)互聯(lián)網(wǎng)平臺(tái)預(yù)訓(xùn)練階段,就投喂了亞馬遜、西門(mén)子等50家企業(yè)數(shù)字化轉(zhuǎn)型案例,構(gòu)建出制造業(yè)知識(shí)庫(kù)。
第二,監(jiān)督微調(diào)(SFT, Supervised Fine-tuning)。
打造專(zhuān)業(yè)領(lǐng)域的行為規(guī)范,定向訓(xùn)練思維鏈生成規(guī)則。
核心邏輯:像培訓(xùn)新員工一樣“手把手教學(xué)”,用高質(zhì)量經(jīng)過(guò)標(biāo)注的數(shù)據(jù)(問(wèn)答對(duì)、操作指南等)調(diào)整模型行為,使其輸出符合人類(lèi)需求。
這個(gè)過(guò)程如同給 AI編寫(xiě)“崗位說(shuō)明書(shū)”,規(guī)范專(zhuān)業(yè)技能。像寧德時(shí)代質(zhì)檢系統(tǒng)用5萬(wàn)張電池缺陷圖片做監(jiān)督微調(diào)訓(xùn)練,將誤檢率從12%降至0.7%。大疆農(nóng)業(yè)無(wú)人機(jī)監(jiān)督學(xué)習(xí)3000種農(nóng)田作業(yè)軌跡,實(shí)現(xiàn)果樹(shù)環(huán)繞噴灑等高難度動(dòng)作。
第三,強(qiáng)化學(xué)習(xí)(RL, Reinforcement Learning)。
在實(shí)戰(zhàn)中修煉頂級(jí)高手,精細(xì)化調(diào)整思維鏈質(zhì)量。
就像奧運(yùn)會(huì)選手模擬的“以賽代練”,通過(guò)實(shí)時(shí)反饋機(jī)制(用戶(hù)點(diǎn)擊、評(píng)分、對(duì)比選擇等),讓 AI自主優(yōu)化決策路徑。這個(gè)過(guò)程如同給 AI安裝“進(jìn)化引擎”,使它在復(fù)雜環(huán)境中持續(xù)突破極限。強(qiáng)化學(xué)習(xí)階段的精髓,就是設(shè)計(jì)獎(jiǎng)勵(lì)機(jī)制,定義清晰的評(píng)估標(biāo)準(zhǔn),如對(duì)話(huà)質(zhì)量評(píng)分,類(lèi)似我們給團(tuán)隊(duì)發(fā)獎(jiǎng)勵(lì)和獎(jiǎng)狀一樣。
更高級(jí)的是采用多維度博弈:讓多個(gè) AI智能體相互競(jìng)爭(zhēng)、協(xié)作,像 Alpha Go 1.0是投喂了人類(lèi)歷史的百萬(wàn)圍棋棋譜,到了 Alpha Go 2.0階段,就是自我對(duì)弈模式,不需要棋譜。
那我們?nèi)绾尾拍芟?AI一樣深度思考和學(xué)習(xí)?記住三個(gè)要點(diǎn):
第一,建立“行動(dòng)—反饋—調(diào)整”的正循環(huán),就像打游戲升級(jí)一樣,每完成學(xué)習(xí)任務(wù)立刻檢驗(yàn)效果,用他人評(píng)價(jià)修正自我認(rèn)知。
第二,深度拆解頂尖案例,看書(shū)的時(shí)候,邊讀邊畫(huà)知識(shí)圖譜,把復(fù)雜信息提煉成可復(fù)用的思維模型。
這也是我2024年做得最多的研究,將過(guò)去騰訊、美的、華為、小米等公司做了深度分析,梳理成長(zhǎng)模型,同時(shí)對(duì)過(guò)去20年,5次牛市進(jìn)行了深度復(fù)盤(pán)。
第三,用頭腦風(fēng)暴對(duì)抗思維慣性。
遇到問(wèn)題同時(shí)想出3種解決方案,就像下棋推演一樣比較優(yōu)劣,日??梢园才?5%的陌生領(lǐng)域挑戰(zhàn),睡前花10分鐘回顧當(dāng)天所學(xué),這樣大腦會(huì)像 AI訓(xùn)練神經(jīng)網(wǎng)絡(luò)一樣,在不知不覺(jué)中提升舉一反三的能力。
深度思考不是天才專(zhuān)利,而是可復(fù)制的系統(tǒng)方法。
當(dāng)我們拆解 AI和中國(guó)企業(yè)的進(jìn)化密碼時(shí),就會(huì)發(fā)現(xiàn)“預(yù)訓(xùn)練—監(jiān)督學(xué)習(xí)—強(qiáng)化學(xué)習(xí)”的思維鏈三階進(jìn)化,正在塑造中國(guó)制造的思維基因。
假如每個(gè)崗位都能像 AI模型那樣持續(xù)學(xué)習(xí)、規(guī)范輸出、快速進(jìn)化,組織的思維鏈就會(huì)成為企業(yè)堅(jiān)固的護(hù)城河。畢竟,連機(jī)器都知道深耕勝過(guò)亂撞,人類(lèi)又怎么總做思維上的“機(jī)會(huì)主義者”?
責(zé)任編輯:楊曉 | 責(zé)任校對(duì):趙艷麗 | 審核:張旭 | 美編:丁然
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.