成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

清華崔鵬團(tuán)隊(duì)LimiX:首個(gè)結(jié)構(gòu)化數(shù)據(jù)通用大模型,性能超越SOTA

0
分享至



2025 年 8 月 29 日,由清華大學(xué)計(jì)算機(jī)系崔鵬教授團(tuán)隊(duì)聯(lián)合穩(wěn)準(zhǔn)智能共同研發(fā)的結(jié)構(gòu)化數(shù)據(jù)通用大模型「極數(shù)」(LimiX)正式宣布開源。

此次發(fā)布標(biāo)志著我國(guó)在結(jié)構(gòu)化數(shù)據(jù)智能處理領(lǐng)域的技術(shù)突破與生態(tài)開放邁出關(guān)鍵一步,將顯著降低千行百業(yè)應(yīng)用結(jié)構(gòu)化數(shù)據(jù) AI 技術(shù)的門檻,特別是在結(jié)構(gòu)化數(shù)據(jù)占主導(dǎo)的泛工業(yè)領(lǐng)域,「極數(shù)」大模型將助力 AI 深度融入工業(yè)生產(chǎn)全流程,破解工業(yè)數(shù)據(jù)價(jià)值挖掘難題,為實(shí)現(xiàn)智能制造與新型工業(yè)化提供關(guān)鍵支撐,推動(dòng)產(chǎn)業(yè)技術(shù)變革和優(yōu)化升級(jí)。

在泛工業(yè)領(lǐng)域,結(jié)構(gòu)化數(shù)據(jù)是核心資產(chǎn)——工業(yè)生產(chǎn)參數(shù)、設(shè)備運(yùn)行數(shù)據(jù)、質(zhì)量檢測(cè)數(shù)據(jù)、科研實(shí)驗(yàn)數(shù)據(jù)等均以結(jié)構(gòu)化數(shù)據(jù)形式呈現(xiàn),其智能處理能力直接影響產(chǎn)業(yè)效率與科研突破,也是 AI 賦能工業(yè)制造的關(guān)鍵突破口。

雖然通用大語言模型(LLM)憑借強(qiáng)大的文本理解與生成能力,已在內(nèi)容創(chuàng)作、對(duì)話交互等領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用,但 LLM 在面對(duì)表格、時(shí)序等結(jié)構(gòu)化數(shù)據(jù)時(shí)短板明顯:數(shù)值比較、計(jì)算等基礎(chǔ)任務(wù)易出偏差,更無法勝任數(shù)據(jù)分類、預(yù)測(cè)、歸因等復(fù)雜任務(wù),準(zhǔn)確率難以滿足真實(shí)行業(yè)需求。因此,目前工業(yè)結(jié)構(gòu)化數(shù)據(jù)處理依然依賴私有數(shù)據(jù) + 專用模型的傳統(tǒng)范式。

由于專用模型難泛化、不通用,面對(duì)不同場(chǎng)景需要訓(xùn)練多個(gè)專用模型,成本高、效果差,且難以發(fā)揮數(shù)據(jù)要素聚集的乘數(shù)效應(yīng),嚴(yán)重制約了 AI 在工業(yè)場(chǎng)景的落地路徑。

結(jié)構(gòu)化數(shù)據(jù)通用大模型(Large Data Model, LDM)則針對(duì)性解決這一痛點(diǎn):不同于 LLM 聚焦文本,LDM 融合結(jié)構(gòu)因果推斷與預(yù)訓(xùn)練大模型技術(shù),既能捕捉結(jié)構(gòu)化數(shù)據(jù)的內(nèi)在關(guān)聯(lián),又具備強(qiáng)泛化能力,可跨行業(yè)適配多類任務(wù)。

「極數(shù)」大模型可以支持分類、回歸、高維表征抽取、因果推斷等多達(dá) 10 類任務(wù),在工業(yè)時(shí)序預(yù)測(cè)、異常數(shù)據(jù)監(jiān)測(cè)、材料性能預(yù)測(cè)等場(chǎng)景中,性能達(dá)到甚至超越最優(yōu)專用模型,實(shí)現(xiàn)單一模型適配多場(chǎng)景、多任務(wù)的通用性突破,為人工智能賦能工業(yè)提供了 One-For-All 解決方案。

從技術(shù)性能到產(chǎn)業(yè)落地,「極數(shù)」大模型的核心優(yōu)勢(shì)已得到充分驗(yàn)證。

在超過 600 個(gè)數(shù)據(jù)集上的十余項(xiàng)測(cè)試結(jié)果表明,「極數(shù)」大模型無需進(jìn)行二次訓(xùn)練,已經(jīng)在準(zhǔn)確率、泛化性等關(guān)鍵指標(biāo)上均能達(dá)到或超過專有 SOTA 模型。

而在產(chǎn)業(yè)應(yīng)用層面,「極數(shù)」大模型已成功落地多個(gè)真實(shí)工業(yè)場(chǎng)景,無需訓(xùn)練、部署成本低、準(zhǔn)確率高、通用性強(qiáng)的特點(diǎn)獲得合作企業(yè)的高度認(rèn)可,成為推動(dòng)工業(yè)數(shù)據(jù)價(jià)值轉(zhuǎn)化的實(shí)用型技術(shù)方案,正加速形成面向泛工業(yè)垂直行業(yè)核心業(yè)務(wù)場(chǎng)景的真正智能底座。



研發(fā)團(tuán)隊(duì)

「極數(shù)」模型的研發(fā)核心力量,由清華大學(xué)計(jì)算機(jī)系崔鵬教授牽頭組建,團(tuán)隊(duì)匯聚了學(xué)術(shù)研究與產(chǎn)業(yè)落地的雙重優(yōu)勢(shì),其技術(shù)突破背后是深厚的科研積淀與前瞻性的方向布局。

作為團(tuán)隊(duì)核心,崔鵬教授是我國(guó)數(shù)據(jù)智能領(lǐng)域的頂尖學(xué)者:他不僅是國(guó)家杰出青年科學(xué)基金獲得者,更以突出成果兩度斬獲國(guó)家自然科學(xué)二等獎(jiǎng),同時(shí)獲評(píng)國(guó)際計(jì)算機(jī)協(xié)會(huì)(ACM)杰出科學(xué)家,其學(xué)術(shù)影響力獲國(guó)際學(xué)界廣泛認(rèn)可。在基礎(chǔ)研究領(lǐng)域,崔鵬教授開創(chuàng)性提出「因果啟發(fā)的穩(wěn)定學(xué)習(xí)」新范式,突破傳統(tǒng)機(jī)器學(xué)習(xí)在數(shù)據(jù)分布偏移場(chǎng)景下的性能局限,為 AI 模型的可靠性與泛化性研究奠定重要理論基礎(chǔ)。

2022 年 OpenAI 推出 ChatGPT 引發(fā)大模型技術(shù)浪潮后,崔鵬教授敏銳洞察到結(jié)構(gòu)化數(shù)據(jù)方向大模型技術(shù)的發(fā)展?jié)摿Γ杆賹⒀芯糠较驈囊蚬€(wěn)定學(xué)習(xí)拓展至結(jié)構(gòu)化數(shù)據(jù)通用大模型(LDM)領(lǐng)域。依托既有理論積累,團(tuán)隊(duì)攻克結(jié)構(gòu)因果數(shù)據(jù)合成、模型結(jié)構(gòu)設(shè)計(jì)、跨場(chǎng)景泛化等核心難題,最終實(shí)現(xiàn)「極數(shù)」模型在多領(lǐng)域任務(wù)中的性能突破,為此次開源奠定關(guān)鍵技術(shù)基礎(chǔ)。

極數(shù)大模型簡(jiǎn)介

「極數(shù)」大模型將多種能力集成到同一基礎(chǔ)模型中,包括:分類、回歸、缺失值插補(bǔ)、數(shù)據(jù)密度估計(jì)、高維表征抽取、數(shù)據(jù)生成、因果推斷、因果發(fā)現(xiàn)和分布外泛化預(yù)測(cè)等;在擁有優(yōu)秀結(jié)構(gòu)化數(shù)據(jù)建模性能的同時(shí),極大提高了模型的通用性。

在預(yù)訓(xùn)練階段,「極數(shù)」大模型基于海量因果合成數(shù)據(jù)學(xué)習(xí)數(shù)據(jù)中的因果關(guān)系,不同于專用模型在訓(xùn)練階段記憶住數(shù)據(jù)特征的模式,「極數(shù)」大模型可以直接在不同的上下文信息中捕捉因果變量,并通過條件掩碼建模的方式學(xué)習(xí)數(shù)據(jù)的聯(lián)合分布,以適應(yīng)包括分類、回歸、缺失值預(yù)測(cè)、數(shù)據(jù)生成、因果推斷等各種下游任務(wù)。

在推理階段,極數(shù)可直接基于提供的上下文信息進(jìn)行推理,無需訓(xùn)練即可直接適用于各種應(yīng)用場(chǎng)景。

模型技術(shù)架構(gòu)



「極數(shù)」大模型沿用了 transformer 架構(gòu),并針對(duì)結(jié)構(gòu)化數(shù)據(jù)建模和任務(wù)泛化進(jìn)行了相關(guān)的優(yōu)化。

「極數(shù)」大模型先對(duì)先驗(yàn)知識(shí)庫(kù)中的特征和目標(biāo)分別進(jìn)行 embedding;之后在主要模塊中,在樣本和特征維度上分別使用注意力機(jī)制,來聚焦關(guān)鍵樣本的關(guān)鍵特征。

最終,提取到的高維特征被分別傳入 regression head 和 classification head,實(shí)現(xiàn)對(duì)不同功能的支持。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
《731》預(yù)售票房慘淡,430萬人想看是假數(shù)據(jù)?四個(gè)原因很現(xiàn)實(shí)

《731》預(yù)售票房慘淡,430萬人想看是假數(shù)據(jù)?四個(gè)原因很現(xiàn)實(shí)

史書無明
2025-09-05 08:24:56
狗糧!楊瀚森洛杉磯特訓(xùn)漂亮女友一路同行,女友坐行李箱小楊推著走

狗糧!楊瀚森洛杉磯特訓(xùn)漂亮女友一路同行,女友坐行李箱小楊推著走

818體育
2025-09-05 22:57:38
大快人心!馬克龍悍然插手中國(guó)內(nèi)政,不到48小時(shí)法政府陷倒臺(tái)危機(jī)

大快人心!馬克龍悍然插手中國(guó)內(nèi)政,不到48小時(shí)法政府陷倒臺(tái)危機(jī)

小莜讀史
2025-09-05 17:44:46
莫言:如果一個(gè)男人,不吸煙,不喝酒,不賭博,性格內(nèi)向,不喜歡社交,從不參加同學(xué)聚會(huì)……

莫言:如果一個(gè)男人,不吸煙,不喝酒,不賭博,性格內(nèi)向,不喜歡社交,從不參加同學(xué)聚會(huì)……

深度知局
2025-04-14 17:50:31
九三之后,美國(guó)海軍被中國(guó)逼進(jìn)了死胡同

九三之后,美國(guó)海軍被中國(guó)逼進(jìn)了死胡同

華山穹劍
2025-09-05 21:21:41
王非王博同框!詹姆斯緊緊抱李夢(mèng)夸她小公主,李夢(mèng)四肢比王博還粗

王非王博同框!詹姆斯緊緊抱李夢(mèng)夸她小公主,李夢(mèng)四肢比王博還粗

老吳說體育
2025-09-06 00:42:30
重情義,講義氣的四個(gè)星座

重情義,講義氣的四個(gè)星座

星座葉大仙
2025-09-06 12:01:30
內(nèi)馬爾繼承8.46億英鎊遺產(chǎn)!神秘富豪從未謀面,原因太暖心

內(nèi)馬爾繼承8.46億英鎊遺產(chǎn)!神秘富豪從未謀面,原因太暖心

野薔薇觀察所
2025-09-05 12:10:04
我國(guó)九三閱兵剛結(jié)束,這五國(guó)表態(tài)來了,尤其是新加坡,非常不一般

我國(guó)九三閱兵剛結(jié)束,這五國(guó)表態(tài)來了,尤其是新加坡,非常不一般

DS北風(fēng)
2025-09-04 18:59:12
65歲英國(guó)富婆愛上小21歲非洲“翹屁嫩男”!為愛瘋狂砸錢勇闖貧民窟,結(jié)局太扯…

65歲英國(guó)富婆愛上小21歲非洲“翹屁嫩男”!為愛瘋狂砸錢勇闖貧民窟,結(jié)局太扯…

英國(guó)報(bào)姐
2025-09-04 21:58:10
新王統(tǒng)治?辛納近5個(gè)大滿貫均進(jìn)決賽,此前4戰(zhàn)3冠&法網(wǎng)遭讓二追三

新王統(tǒng)治?辛納近5個(gè)大滿貫均進(jìn)決賽,此前4戰(zhàn)3冠&法網(wǎng)遭讓二追三

直播吧
2025-09-06 11:11:09
歸化球員陳佳裕:在葡萄牙大家叫我中國(guó)人,在中國(guó)大家卻覺得我是外國(guó)人

歸化球員陳佳裕:在葡萄牙大家叫我中國(guó)人,在中國(guó)大家卻覺得我是外國(guó)人

懂球帝
2025-09-05 23:43:52
女領(lǐng)導(dǎo)天天蹭我車,我笑她這樣我娶不到媳婦,她卻偷笑道:娶我呀

女領(lǐng)導(dǎo)天天蹭我車,我笑她這樣我娶不到媳婦,她卻偷笑道:娶我呀

牛魔王與芭蕉扇
2025-09-03 16:50:44
毛飛廉曝新料:趙晴許凱戀愛后把他甩了,在一起9個(gè)月,打臉于正

毛飛廉曝新料:趙晴許凱戀愛后把他甩了,在一起9個(gè)月,打臉于正

農(nóng)村娛樂光哥
2025-09-05 13:32:06
西方國(guó)家為什么都討厭中國(guó)?英國(guó)專家:中國(guó)犯了一個(gè)“原罪”

西方國(guó)家為什么都討厭中國(guó)?英國(guó)專家:中國(guó)犯了一個(gè)“原罪”

叮當(dāng)當(dāng)科技
2025-09-03 09:26:33
京圈大花給老公選妃的瓜

京圈大花給老公選妃的瓜

熱鬧吃瓜大姐
2025-09-02 20:53:53
24小時(shí)內(nèi)連收兩大噩耗,普京一句不跟中國(guó)提及,準(zhǔn)備自己硬扛到底

24小時(shí)內(nèi)連收兩大噩耗,普京一句不跟中國(guó)提及,準(zhǔn)備自己硬扛到底

劉森森
2025-09-05 15:00:18
61歲章小蕙帶火了一種初秋新穿法:襯衫+半身裙+穆勒鞋,高級(jí)顯貴

61歲章小蕙帶火了一種初秋新穿法:襯衫+半身裙+穆勒鞋,高級(jí)顯貴

全球時(shí)尚
2025-09-02 20:49:41
日本為何多次索要辛追夫人頭發(fā)?多年后真相曝光,幸好我們沒給

日本為何多次索要辛追夫人頭發(fā)?多年后真相曝光,幸好我們沒給

大千世界觀
2025-09-02 19:32:08
臺(tái)灣省名嘴開撕周杰倫!這一次,沒人敢替“裝聾作啞”的他說話了

臺(tái)灣省名嘴開撕周杰倫!這一次,沒人敢替“裝聾作啞”的他說話了

丹妮觀
2025-09-04 12:13:08
2025-09-06 12:48:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11240文章數(shù) 142442關(guān)注度
往期回顧 全部

科技要聞

超1萬億參數(shù)!阿里最大最強(qiáng)模型免費(fèi)上線

頭條要聞

面館推"茅臺(tái)配板面"套餐:點(diǎn)板面加38元喝一杯飛天茅臺(tái)

頭條要聞

面館推"茅臺(tái)配板面"套餐:點(diǎn)板面加38元喝一杯飛天茅臺(tái)

體育要聞

英國(guó)籃球,為什么那么菜?

娛樂要聞

易烊千璽被資本市場(chǎng)教育了

財(cái)經(jīng)要聞

原證監(jiān)會(huì)主席易會(huì)滿,被查

汽車要聞

科技加持 BMW R 1300 GS Adv依舊標(biāo)桿實(shí)力

態(tài)度原創(chuàng)

手機(jī)
房產(chǎn)
數(shù)碼
健康
游戲

手機(jī)要聞

三星首款三折疊開合操作動(dòng)畫曝光,可調(diào)用后置攝像頭自拍

房產(chǎn)要聞

實(shí)景驚艷+名校護(hù)航!這個(gè)項(xiàng)目,正在重新定義白云改善新高度!

數(shù)碼要聞

集邦咨詢:預(yù)估9月面板價(jià)格全面持平 電視面板需求第三季開始回穩(wěn)增強(qiáng)

內(nèi)分泌科專家破解身高八大謠言

網(wǎng)易《光遇》手游打擊外掛:封禁34萬個(gè)違規(guī)賬號(hào)

無障礙瀏覽 進(jìn)入關(guān)懷版