你可能見過這樣一類人:
他們穩(wěn)定細致,把流程背得滾瓜爛熟,那套方法也曾為他們帶來過成效與成就感。但當環(huán)境改變,規(guī)則重構,新變量不斷涌入時,他們下意識拿起的還是那套舊解法。相比于停下腳步重新審視框架的適用性,他們總是更用力地去打磨熟悉的流程;
家庭教育中也存在類似場景:父母憑借舊時代的學習方式實現(xiàn)了上升路徑,便將其視為黃金標準,希望原封不動地復制給下一代,按圖施工,卻忽略了新環(huán)境的競爭結構與選擇空間。
這些人往往是某類特定題型的優(yōu)等生。正因經驗曾帶來過回報,他們更容易形成路徑依賴,把曾經的正確答案背得爛熟??僧斢螒蛞?guī)則變化,不再奏效的經驗反而成了決策的干擾項。
這不僅是個體的困局:企業(yè)依賴舊商業(yè)模式難以轉型,管理者沿用過時激勵機制管理新世代,品牌用上一代的邏輯猜測新消費群體……
這正是一種認知上的過擬合:我們在熟悉問題上訓練得太“好” ,但精進的不是對底層規(guī)律的理解,而是特定的做法或流程。結果就是:當題型變了、系統(tǒng)重構、變量更迭,原有的框架不再適用,大腦仍在不假思索地套用舊答案。
成功經驗是如何演化為過擬合?
為什么越是過去做得出色的人,反而越容易在變化中失速?
機器學習中有個概念叫做:過擬合(Overfitting),描述的是一種學得太好反而失效的現(xiàn)象:模型在訓練集上表現(xiàn)完美,卻在新數(shù)據(jù)上一敗涂地。因為它不是學到了通用規(guī)律,而是記住了過去數(shù)據(jù)的細節(jié)與噪聲。
如圖中表示:
左圖是欠擬合:模型太簡單,淺嘗輒止,于是只抓到了皮毛沒抓到規(guī)律,錯過了關鍵結構。
中間是恰到好處:模型既理解了數(shù)據(jù)的整體趨勢,也不過度追逐每一個噪聲點,就像我們理性中的認知態(tài):能抽象出底層結構,同時保留對變化的彈性。
右圖就是過擬合:模型看似學得非常努力,把每一個點都照顧到了,但它其實把數(shù)據(jù)中的噪聲也當成規(guī)律來學習。就像在某一類問題上訓練得太精細,以至于一旦題型稍有變化,就無法應對。因為學到的不是原理,而是背熟了答案。
這也是我們每個人在成長中極容易陷入的陷阱。靠某一套方法一路披荊斬棘,建立起優(yōu)勢與自信,于是自然地把那套解法當作普遍適用的真理。
為什么我們會不自覺地陷入這種模式?
1. 對成功的錯誤歸因
當用某種方法獲得過成功,我們下意識把功勞歸給了方法本身,卻忽略了一個關鍵事實:是方法與場景之間的匹配,才讓它有效。即便當場景變了,我們也很少會立刻質疑方法是否過時,而傾向于懷疑自己是不是哪里沒做好,是不是執(zhí)行得還不夠徹底。
2. 認知的自我強化機制
我們的大腦其實遠沒有我們想象的那么開放。
認知科學中有一個叫預測編碼的理論,大致意思是:大腦并不是開放地理解現(xiàn)實,而是會基于經驗預判出一個世界的樣子,再用感官去驗證猜測。只要現(xiàn)實沒明顯違背,我們就會默認預判是對的,也就是說,我們看到的往往不是現(xiàn)實本身,而是被個人認知和經驗加工過的現(xiàn)實。時間久了,我們不僅會越來越相信自己的經驗,還會下意識屏蔽可能動搖它的證據(jù)。
容易過擬合而陷入停滯的人,都有幾個共同點:
1. 過度依賴即時反饋
他們缺乏長期意義的標尺,判斷一件事值不值得做,更多看的是現(xiàn)在有沒有反饋,當下能不能起效。只要今天的數(shù)據(jù)好看、領導點個頭,就覺得方向對了,哪怕這件事早已是邊際效益極低的重復動作。一旦短期內沒有明顯回報,就會開始懷疑焦慮,然后迅速放棄,很難撐過看不到即刻結果但值得長期投入的深水區(qū)。
2. 極度追求確定性
他們偏愛標準答案和清晰的流程,對模糊性和不確定性感到本能的不安。只有當任務清晰、路徑熟悉,才能感到掌控感。一旦邊界模糊就不敢邁步。這讓他們在面對復雜新問題時,更傾向于從過去找參考答案,而不是搭建新模型。
3. 缺乏遷移能力
這類人往往擅長記住“怎么做”,卻很難跳出具體案例,從中抽象出底層結構,再遷移到新情境中。
局部最優(yōu)陷阱:
每一步都極致優(yōu)化,最后卻走向死路?
局部最優(yōu) vs. 全局最優(yōu)
想象你站在一片山地中,目標是登上整片區(qū)域的最高峰。你選擇了一個看似聰明的策略:每一步都往上走。剛開始一切順利,視野漸漸開闊,你以為離目標越來越近。直到某一刻,四周全是下坡路——你站在了一座小山頭上。而真正的高峰藏在山谷的另一側。
回頭看每一步都沒錯,但向前也再無路可走。這就是典型的優(yōu)化策略爬山算法會掉入局部最優(yōu)陷阱的原因。在復雜、非線性的系統(tǒng)中,它的局限性就體現(xiàn)出來了:不考慮全局路徑結構,不允許暫時退步,也不具備探測遠方高峰的能力。所以最終它很可能會卡在局部最優(yōu)點上,無法跳出。
現(xiàn)實生活也是一樣:我們每一步都希望能在眼前的提升看到快速反饋,但回報的轉折,需要承受一段探索、混亂、下行的過程。
諾基亞:一步步贏得當下,最后輸?shù)粑磥?/strong>
諾基亞曾是功能機時代的王者,幾乎壟斷市場。2000年代中期,高管層已清楚意識到智能機將顛覆行業(yè),但他們的選擇卻是繼續(xù)優(yōu)化 Symbian 系統(tǒng),強化已有產品線,提升利潤效率。
在當下看起來每一步都做得對:節(jié)省成本、擴大市場、維持供應鏈效率;但這是正是一種典型的局部最優(yōu)困境:每次決策都以當下最優(yōu)為標準,卻一步步導致最終喪失了適應智能時代的彈性。對比同期的蘋果,路線幾乎是反向的:他們砍掉了當時最賺錢的 iPod mini,推翻 iPod 的操作邏輯,重構多點觸控交互,甚至放棄構建封閉系統(tǒng),轉向開放的 App Store 生態(tài)。每一步看起來都在拆掉優(yōu)勢,卻為未來十年埋下了新的增長曲線。
敢下坡,才可能換座山。
我們在決策中也經常無意識選擇了通向局部最優(yōu)的路徑:每一次索職業(yè)方向,都是優(yōu)先當前最容易轉成功的崗位,于是始終在熟悉領域打轉;每次學習新技能,都是挑上手最快、反饋最及時的。
每一個選擇節(jié)點上,只關心哪個回報最快最確定,卻回避發(fā)問:這一步能不能讓我的下一個選擇更寬、更自由。越是怕走彎路,就越容易卡在一座看起來還不錯的小山頭上。
為什么“局部最優(yōu)”難以跳出
路徑依賴帶來的結構性鎖定
很多人以為,做選擇的是自己。但到了某一階段你會發(fā)現(xiàn):你并不是完全自主選擇路徑,而是反過來被路徑塑形。當一個系統(tǒng)朝某方向積累得足夠多,就會產生自我強化效應:越往前走,越難調頭;越表現(xiàn)優(yōu)秀,越難逃脫原位。看似自主,實則早已被生態(tài)、反饋、身份綁定。
比如,一個操作系統(tǒng)一旦用戶量夠大、生態(tài)成型,開發(fā)者就只能為它開發(fā),而不再考慮更優(yōu)系統(tǒng);一個城市一旦選錯了交通模式,想基建轉型也需要巨大的代價;企業(yè)中越搭越復雜的數(shù)據(jù)架構,最后已不是為了效率存在,而是為了不徹底崩壞只好一直運轉下去。
結構鎖定可怕的地方在于,會讓你越來越無法忍受「短期無反饋」。你若曾經在某條路徑上收獲回報,建立起成就感,當站在潛在更優(yōu)但短期看不到成功的路上時,你會本能地覺得劃不來。哪怕是學習新技能、寫作、職業(yè)探索,也會本能地反問:“做這個能帶來什么?” 如果答案不是立刻可見的回報,你就很難產生行動的動力。
同樣,系統(tǒng)也會反過來強化你的身份。
你越在一個點往前走,系統(tǒng)對你的定義越強:“報表專家”,“XX高手”,…… 這些標簽一旦形成,你就會開始為他人的期望服務,而不是為真實的自我探索服務。
此外,我們對「潛在失去」的感知也遠遠大于對「可能獲得」的渴望。你可能已經在某個階段意識到當前路徑的局限,但腦海中會不斷預演:如果失敗,會不會連現(xiàn)有的都保不???
在正反饋的依賴、標簽強化、風險厭惡的作用下,你已經很難自主選擇跳出,而是整個系統(tǒng)強迫你持續(xù)選擇當下最優(yōu)。于是,你會一直選擇繼續(xù)做自己最擅長的事,即便在這條路上的投入已經正在逐步失去它們的邊際價值。
那么,我們該如何跳出路徑鎖死的局面?
跳出鎖死的方法:泛化能力
在機器學習中,與過擬合相對的是泛化能力。指的是一個優(yōu)秀的模型,不僅能在訓練集上表現(xiàn)良好,面對未知也依然穩(wěn)定有效。
關鍵在于不是死記套路,而是學到規(guī)律。人也是一樣。要跳出路徑鎖死、避免陷入局部最優(yōu),不能靠背熟答案,而是鍛煉泛化的能力,使得從舊經驗中抽象出的底層方法,遷移到全新的環(huán)境里依然奏效。
三種策略,從局部跳向全局:
1. 引入新變量打破慣性
在模擬退火算法中,為了跳出局部最優(yōu),系統(tǒng)會主動引入擾動,跳出原有軌跡。生活中,我們同樣需要主動打開新的可能性。
比如:
- 每月試做一件完全不在舒適區(qū)的事,比如和跨領域的人對話、新技能探索、嘗試副業(yè);
- 打破一些固定慣性,比如換一條上班路線、參加一場陌生聚會、在不同平臺表達自己。
2. 從終點反推,重新評估路徑
定期更新并審視當前的北極星目標,比如是財富、創(chuàng)造力、效率或是自由。 從終點反推,回看當前所在的位置。只有不斷對著整體地圖審視自己的路徑,才能識別是否正卡在一個看起來還不錯的小高地。
3. 培養(yǎng)抽象-遷移能力
跳出局部最優(yōu)的關鍵是提升經驗的可遷移性。比如:
- 做科研時訓練的邏輯思辨和論證能力,在商業(yè)環(huán)境中也能用于談判和決策;
- 學一門外語時,其中的記憶方式和語義理解系統(tǒng)也能用于學其他語言;
- 在健身過程中養(yǎng)成的“目標-分解-反饋”機制,也能遷移到備考、學習新技能等。
我們常被那些「看起來還不錯」的路徑困住,在老路上過擬合。因為它們已太容易帶來熟悉的滿足感,以至于我們慢慢失去了對更優(yōu)的追問。跳出局部最優(yōu)是學會不斷刷新自己對更好的定義,也能夠允許自己階段性掉線,在無反饋的道路中探索穿行。
有時,轉彎并非離開,而是為了更好地抵達。
end
參考資料:
[1] Predictive coding in the brain: Functional implicationsFriston, K.Nature Reviews Neuroscience (2005)
https://www.nature.com/articles/nrn1530
[2] Path dependence, lock-in, and history. David, P. A.
Journal of Economic Perspectives (1985)
https://www.jstor.org/stable/2138761https://bytehouse.cn/blog/tiktok-reinforcement-learning-recommendations/
[3] When good performance backfires: Success-induced rigidity in strategic decision making. Audia, G., Locke, E. & Smith, K.
https://www.sciencedirect.com/science/article/abs/pii/S0749597808000573
[4] The Optimization Paradox: Why better solutions often require worse decisions
Medium – Towards Data Science
https://medium.com/towards-data-science/the-optimization-paradox-6c158f40de10
來源:DataCafe
編輯:紫竹小筑
轉載內容僅代表作者觀點
不代表中科院物理所立場
如需轉載請聯(lián)系原公眾號
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.