進(jìn)入2025年8月后,A股市場保持強勢,多個指數(shù)盤中齊創(chuàng)多年新高。截至8月18日收盤,上證指數(shù)上漲0.85%報3728.03點,盤中最高觸及3745.94點,創(chuàng)下近十年新高;深證成指漲1.73%,盤中最高觸及11919.57點,創(chuàng)下近兩年來新高;創(chuàng)業(yè)板指漲2.84%;北證50漲6.79%,刷新歷史新高,科創(chuàng)50漲2.14%。A股全天成交2.81萬億元,較上一交易日大幅放量。
在市場一片沸騰的背后,一個問題也隨之浮現(xiàn):在AI飛速發(fā)展的今天,為什么沒有任何一個公開的大模型,能夠提前預(yù)測到這樣一場波瀾壯闊的行情?而且,既然牛市已經(jīng)到來,那么大模型能否預(yù)測這輪牛市會持續(xù)多久?
大模型可以分析過去幾十年的牛熊轉(zhuǎn)換,識別出一些典型的衰退信號,比如成交量異常放大、估值泡沫化、關(guān)鍵技術(shù)指標(biāo)背離等。然而大模型卻無法正確預(yù)測下一次牛市或者熊市。
網(wǎng)上經(jīng)常會有人售賣大模型炒股以及做量化交易的教程,但是即便是你一步一步地按照他的方式來,也依然賺不到錢,這又是為什么?
01
金融大模型的發(fā)展可以追溯到2023年,那一年也是大模型的“開元之年”。當(dāng)時最具標(biāo)志性的金融大模型是彭博社發(fā)布的BloombergGPT。
BloombergGPT是彭博社利用其數(shù)十年積累的、高質(zhì)量且完全專有的金融文本數(shù)據(jù)所開發(fā)的信息交流工具。這些數(shù)據(jù)包括了海量的金融新聞、上市公司的財務(wù)文件、專業(yè)的市場研究報告,甚至包含了彭博終端內(nèi)部用戶之間交流產(chǎn)生的匿名化數(shù)據(jù)。
這種數(shù)據(jù)既獨特,而且質(zhì)量高,使得BloombergGPT在誕生之初就具備了對金融語境的深刻理解能力。它能夠精準(zhǔn)識別金融術(shù)語、理解實體之間的復(fù)雜關(guān)系,并對市場情緒做出比通用模型更準(zhǔn)確的判斷。
其主要任務(wù)是執(zhí)行金融領(lǐng)域高度專有的任務(wù):進(jìn)行更細(xì)粒度的情緒分析、從海量公告中精準(zhǔn)識別關(guān)鍵的命名實體、對新聞進(jìn)行深度分類,以及實現(xiàn)對財務(wù)報表的智能問答。對于量化交易者而言,BloombergGPT的輸出的每一個交易建議,都具有極高的高價值。
它的出現(xiàn),成為了當(dāng)時的行業(yè)標(biāo)桿。
因此,BloombergGPT的缺點也同樣明顯。成本高昂、系統(tǒng)封閉,普通個人開發(fā)者和小型機構(gòu)完全無法觸及。其模型內(nèi)部的運作機制是一個黑箱,使用者只能接受其輸出結(jié)果,而無法對其進(jìn)行定制或深入研究,這對于追求策略透明度和自主性的量化研究者來說是一個限制。
進(jìn)入2024年,市場格局發(fā)生了顯著變化。隨著技術(shù)的快速迭代,大模型的上下文長度、生成內(nèi)容的一致性和邏輯推理能力都得到了顯著提高。同時,各大互聯(lián)網(wǎng)與科技巨頭紛紛開源或發(fā)布了自己強大的基礎(chǔ)模型,這極大地降低了技術(shù)門檻,使得金融大模型的開發(fā)進(jìn)入了一個百花齊放的階段。
市場上涌現(xiàn)出大量或開源或商業(yè)化的大模型,它們能生成代碼,能分析新聞,還能進(jìn)行市場預(yù)測。然而,一個普遍的現(xiàn)象是,盡管模型在處理文本、生成代碼等任務(wù)上的能力有所提高,但它們在最核心的金融預(yù)測性方面的提升,卻小得可憐。
這種技術(shù)進(jìn)步與金融實效之間的脫節(jié),源自于當(dāng)時大模型還并不能理解金融數(shù)據(jù)。金融市場數(shù)據(jù)的“低信噪比”特性。與語言或圖像數(shù)據(jù)不同,金融價格序列中包含了大量的隨機波動,即“噪聲”,而能夠真正預(yù)示未來方向的“信號”則極其微弱。大模型雖然擅長發(fā)現(xiàn)模式,但在這種環(huán)境下,它極易將噪聲誤認(rèn)為是信號,從而產(chǎn)生“過擬合”。換句話說,模型在歷史數(shù)據(jù)上看似找到了規(guī)律,但在真實的未來預(yù)測中卻即刻失效。
時間推進(jìn)到2025年,隨著具備高級推理和工具調(diào)用能力的“AI智能體”(Agent)技術(shù)走向成熟,金融預(yù)測的探索進(jìn)入了一個新的階段。開發(fā)者們不再執(zhí)著于訓(xùn)練一個單一的、端到端的預(yù)測模型,而是轉(zhuǎn)向構(gòu)建一個由智能體驅(qū)動的自動化分析工作流。人們更愿意相信這種模式,因為它看起來更像人類專家的工作方式:分解問題、搜集信息、分析推理、得出結(jié)論。
在這種新范式下,類似n8n這樣的無代碼工作流自動化平臺成為了核心工具。開發(fā)者可以設(shè)計一個復(fù)雜的金融分析流程,并讓一個AI智能體來執(zhí)行它。
這種基于智能體和工作流的方法,相比于早期的單一模型,開發(fā)者可以清晰地看到每一步的輸入和輸出,便于調(diào)試和優(yōu)化。然而,即便如此,它依然沒有解決金融預(yù)測的根本性難題,反而以新的形式暴露了這些問題。
由于需要經(jīng)過多步的調(diào)用,整個工作流的響應(yīng)時間要比大模型慢,即便完全自動化,執(zhí)行完畢也需要秒級甚至分鐘級的時間。在這個時間內(nèi),專業(yè)的量化對沖基金已經(jīng)利用更底層的技術(shù),完成了對初始新聞事件的納秒級反應(yīng)。智能體得出的結(jié)論,在誕生的那一刻就已經(jīng)過時了。而此時,這個智能體給出答案的正確與否,就不太重要了。
正是因為清醒地認(rèn)識到了這些根本性難題,到了2025年,業(yè)界的焦點已經(jīng)從不切實際的“市場預(yù)測”,全面轉(zhuǎn)向了更務(wù)實的“工作流增強”。大模型不再被視為能夠預(yù)測未來的“水晶球”,而是被定位為賦能專業(yè)人士的“超級工具”,即“插件”。這類工具不再嘗試給出買賣建議,而是深度集成到研究員的工作流程中,幫助他們更快地處理數(shù)據(jù)、生成代碼、驗證想法、撰寫報告,將人類從重復(fù)性勞動中解放出來,專注于更高層次的策略創(chuàng)新和邏輯思考。
02
2025年8月,清華大學(xué)研究團(tuán)隊在Gtihub上發(fā)布了一個叫做Kronos的開源項目,其目標(biāo)是利用時間序列大模型來預(yù)測金融市場的K線走勢。從項目介紹來看,這是一個典型的、試圖利用大模型在金融市場中直接尋找盈利機會的嘗試。
這個項目的邏輯簡單直接:既然大模型能夠在語言、圖像等領(lǐng)域通過學(xué)習(xí)海量數(shù)據(jù)發(fā)現(xiàn)復(fù)雜的模式,那么它也應(yīng)該有能力從充滿噪聲的歷史價格數(shù)據(jù)中,找到預(yù)示未來漲跌的規(guī)律。
Kronos所采用的時間序列模型,正是一種專門用于處理和分析按時間順序排列的數(shù)據(jù)點的架構(gòu),其設(shè)計目標(biāo)就是捕捉數(shù)據(jù)在時間維度上的依賴關(guān)系和潛在趨勢。具體到金融領(lǐng)域,就是將K線圖中的開盤價、收盤價、最高價、最低價以及成交量等一系列數(shù)據(jù)點輸入模型,期望模型能輸出對未來價格走勢的概率性預(yù)測。
進(jìn)一步探究該項目的issue區(qū)可以發(fā)現(xiàn),使用者普遍對其分析K線得出的結(jié)果表示不滿意。這就引出了一個更深層次的矛盾:Kronos模型明明是基于歷史K線數(shù)據(jù)進(jìn)行訓(xùn)練的,為何其預(yù)測結(jié)果卻無法讓使用者信服,甚至被認(rèn)為是無效的呢?
在github上,這種開源的大模型金融工具并不少,但實際上并沒有多少程序員能通過這些開源的大模型金融工具賺到了錢。
答案并非隱藏在技術(shù)細(xì)節(jié)中,而是根植于金融市場一個最基本、也是最殘酷的運行法則——策略的“Alpha衰減”。
要理解這個法則,首先需要明白什么是“Alpha”。在投資領(lǐng)域,Alpha是一個核心概念,它指的是投資組合相對于市場基準(zhǔn)(例如滬深300指數(shù))所獲得的超額回報。
如果一個投資策略在扣除所有風(fēng)險因素后,長期穩(wěn)定地跑贏了市場平均水平,那么我們就說這個策略擁有正的Alpha。尋找Alpha,是所有主動型投資管理者的終極目標(biāo)。而所謂的“Alpha因子”,就是那些被認(rèn)為能夠預(yù)測未來資產(chǎn)價格走勢,從而帶來超額收益的信號或變量。
這些因子可以是多種多樣的,比如一個公司的市盈率(價值因子),或者一只股票過去一段時間的漲幅(動量因子)。量化交易的本質(zhì),就是通過數(shù)據(jù)分析和統(tǒng)計建模,去發(fā)現(xiàn)并利用這些有效的Alpha因子來構(gòu)建交易策略。
一個有效的策略之所以能夠賺錢,是因為它發(fā)現(xiàn)并利用了一個暫時未被大多數(shù)市場參與者所察覺或利用的市場無效性或某種規(guī)律。然而,金融市場是一個復(fù)雜的適應(yīng)性系統(tǒng)。這意味著,任何能夠穩(wěn)定盈利的模式,一旦被發(fā)現(xiàn)和傳播,就會被迅速地套利,直到其盈利空間完全消失。這就是“Alpha衰減”的核心邏輯。
一個策略發(fā)現(xiàn)了一個規(guī)律,即每當(dāng)某個特定類型的公告發(fā)布后,相關(guān)公司的股價在接下來的一個小時內(nèi)大概率會上漲3%。最初,只有發(fā)現(xiàn)這個規(guī)律的交易者能夠利用它來獲利。他可以在公告發(fā)布后立刻買入,一小時后賣出,穩(wěn)定地賺取差價。
但是,這種交易行為本身會在市場上留下痕跡。其他敏銳的交易者會觀察到這種異動,并開始研究其背后的原因。很快,第二個、第三個、乃至成百上千個交易者都會發(fā)現(xiàn)這個規(guī)律。當(dāng)所有人都知道這個規(guī)律后,競爭就會變得異常激烈。人們不再等到公告發(fā)布后才行動,而是會試圖提前預(yù)測公告的內(nèi)容,或者在公告發(fā)布后的瞬間以更快的速度下單。
買盤的瞬間涌入會立刻推高股價,可能在幾秒鐘內(nèi)就將那3%的潛在漲幅完全抹平。最終,這個曾經(jīng)有效的規(guī)律,其預(yù)測能力會因為過度擁擠的交易而趨近于零。這個規(guī)律的Alpha,就徹底衰減了。
市場的這種“學(xué)習(xí)”能力,是所有公開策略的天敵。
像Kronos這樣的模型,它試圖從公開的K線數(shù)據(jù)中學(xué)習(xí)價格運動的模式。K線數(shù)據(jù)是市場上最公開、最容易獲取的數(shù)據(jù),全世界數(shù)以百萬計的交易者和研究員已經(jīng)用各種可能的方法對其進(jìn)行了長達(dá)一個世紀(jì)的分析。其中任何簡單、穩(wěn)定的線性或非線性模式,都早已被發(fā)現(xiàn)和利用,其對應(yīng)的Alpha也早已衰減殆盡。
大模型雖然擁有強大的非線性擬合能力,但它所學(xué)習(xí)的原材料,是已經(jīng)被過度挖掘的公開數(shù)據(jù)。因此,它很可能只是找到了數(shù)據(jù)中一些看似存在、實則由隨機性導(dǎo)致的虛假關(guān)聯(lián)(即過擬合),或者是一些極其微弱、生命周期極短的真實模式。
當(dāng)用戶試圖用這個模型去預(yù)測未來的市場時,這些虛假關(guān)聯(lián)自然會失效,而那些微弱的真實模式,也可能因為市場的學(xué)習(xí)效應(yīng)而在模型發(fā)布后的幾天甚至幾個小時內(nèi)就消失了。
基于大模型的策略,尤其是那些依賴于對某些特定數(shù)據(jù)(無論是K線、新聞還是財報)的解讀方式的策略,尤其容易受到Alpha衰減的影響。因為一旦其核心邏輯或模型結(jié)構(gòu)被公開,任何人都可以利用強大的算力和現(xiàn)成的AI框架,在極短的時間內(nèi)復(fù)制、驗證并執(zhí)行這個策略。這使得這類策略的生命周期被極大地縮短了。
這也就解釋了為什么BloombergGPT這類產(chǎn)品之所以曾經(jīng)能夠成功,是因為它們并不直接提供一個“必勝策略”,而是提供一種更高質(zhì)量、更及時的專有數(shù)據(jù)處理服務(wù)。機構(gòu)投資者利用這些經(jīng)過處理的數(shù)據(jù),結(jié)合自己獨有的、保密的策略邏輯,去尋找屬于自己的、尚未衰減的Alpha。
因此,程序員群體中很少有人能通過開源的金融大模型工具賺到錢,這并非是因為技術(shù)不夠先進(jìn),而是因為他們試圖解決的問題,觸及了金融市場最核心的規(guī)律。在一個高效的、信息快速流通的市場中,任何公開的、易于復(fù)制的工具或策略,都無法成為持續(xù)獲取超額收益的鑰匙。真正的Alpha,往往隱藏在獨有的數(shù)據(jù)、深刻的行業(yè)認(rèn)知、創(chuàng)新的策略邏輯以及對市場結(jié)構(gòu)的深刻理解之中,而這些,恰恰是無法通過一個開源模型直接獲得的。
所以說當(dāng)你在網(wǎng)上看到那些教你用大模型打造金融工具的視頻或者文章,一個也別信,他們就是靠賣課賺錢的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.