鷺羽 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
太夸張!百度辦AI“培訓(xùn)班”,大佬都紛紛要來拜師學(xué)藝。
剛剛百度舉辦了首席AI架構(gòu)師培養(yǎng)計(jì)劃(AICA)的第九期開學(xué)典禮,一看嚇一跳,本期學(xué)員里可謂是臥虎藏龍。
除了有來自茅臺(tái)、奔馳、麥當(dāng)勞等明星企業(yè)的技術(shù)高管,還有國(guó)網(wǎng)、中石化、中石油等一眾國(guó)字號(hào)大佬云集于此。
所以讓大佬們擠破腦袋都想進(jìn)來學(xué)習(xí)的AICA到底是個(gè)啥?
依托百度自研的深度學(xué)習(xí)平臺(tái)飛槳和文心大模型,AICA目標(biāo)培養(yǎng)復(fù)合型AI架構(gòu)師,簡(jiǎn)單來說,就是既能參與技術(shù)開發(fā),又能確保項(xiàng)目落地。
而今年較之以往最不同的是,從導(dǎo)師到學(xué)員,聊得最火熱的話題莫過于——大模型。
相關(guān)課題占比51%,并首次出現(xiàn)多智能體協(xié)同等前沿技術(shù)應(yīng)用。
與會(huì)嘉賓也在開學(xué)典禮上重點(diǎn)強(qiáng)調(diào)大模型推動(dòng)產(chǎn)業(yè)變革的意義所在,從底層架構(gòu)再到軟硬件協(xié)同發(fā)展,以及為AI架構(gòu)師如何跟上大模型發(fā)展速度提出了寶貴意見。
以下是量子位從嘉賓演講中整理出的部分精彩內(nèi)容,在不改變?cè)x的基礎(chǔ)上進(jìn)行了適當(dāng)調(diào)整。
大模型正在逐步轉(zhuǎn)向產(chǎn)業(yè)落地
安暉:AI技術(shù)賦能產(chǎn)業(yè)發(fā)展
來自中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院的副總工安暉,首先就整個(gè)AI行業(yè)發(fā)展進(jìn)行了系統(tǒng)性分析。
他認(rèn)為,AI將會(huì)是繼蒸汽機(jī)、互聯(lián)網(wǎng)之后推動(dòng)整個(gè)社會(huì)經(jīng)濟(jì)發(fā)展的重要通用技術(shù),而當(dāng)前更是進(jìn)入了加速重視AI應(yīng)用工具的新階段。
尤其是從2025世界人工智能大會(huì)可以看出,AI競(jìng)爭(zhēng)正在逐步轉(zhuǎn)向場(chǎng)景落地,如制造、醫(yī)療、金融等領(lǐng)域。
以及全網(wǎng)關(guān)注的GPT-5也側(cè)面說明,當(dāng)前底層模型能力已足夠強(qiáng)大,大模型性能提升速度或?qū)⒎啪彛?strong>現(xiàn)在產(chǎn)業(yè)重心應(yīng)當(dāng)放在大模型的應(yīng)用落地。
AI技術(shù)未來將在企業(yè)發(fā)展中占據(jù)更為重要的作用,根據(jù)OpenAI發(fā)布的企業(yè)客戶研究報(bào)告,AI可以在提高工作效率、解放員工的重復(fù)性任務(wù)、推動(dòng)產(chǎn)品創(chuàng)新三個(gè)方面帶來顯著提升。
賽迪研究院也補(bǔ)充指出,AI還將重構(gòu)服務(wù)模式、實(shí)現(xiàn)資源均衡,共同促進(jìn)多行業(yè)變革。
而當(dāng)前我國(guó)AI發(fā)展呈現(xiàn)出三大趨勢(shì),分別是技術(shù)比拼、商業(yè)應(yīng)用、產(chǎn)業(yè)格局:
- 技術(shù)比拼:整體參數(shù)規(guī)模轉(zhuǎn)向智能水平,核心競(jìng)爭(zhēng)力在于技術(shù)護(hù)城河。
- 商業(yè)應(yīng)用:正在從概念驗(yàn)證轉(zhuǎn)向場(chǎng)景實(shí)踐,逐步建立特色AI生態(tài)。
- 產(chǎn)業(yè)格局:整體從分散行動(dòng)發(fā)展成頭部企業(yè)主導(dǎo)行業(yè)風(fēng)向,把握優(yōu)勢(shì)資源成為企業(yè)的重中之重。
但安暉也表示,相關(guān)產(chǎn)品效益還未完全顯現(xiàn),從人工智能大會(huì)也能看出,當(dāng)前新產(chǎn)品在功能、形態(tài)和應(yīng)用內(nèi)容上存在同質(zhì)化,缺乏創(chuàng)新閃光點(diǎn)。
其邁向?qū)嶋H應(yīng)用過程中,如何與實(shí)體企業(yè)核心業(yè)務(wù)掛鉤,當(dāng)前各大AI企業(yè)還未給出準(zhǔn)確的方案,如何能夠讓用戶認(rèn)同AI價(jià)值、對(duì)AI營(yíng)收效益持積極向好態(tài)勢(shì),都是進(jìn)一步推動(dòng)AI應(yīng)用必須解決的前提條件。
另外,行業(yè)缺乏AI經(jīng)驗(yàn)和數(shù)據(jù)支持,從而導(dǎo)致產(chǎn)用脫節(jié)、落地困難。
因此,安暉建議應(yīng)該以創(chuàng)造價(jià)值為導(dǎo)向發(fā)展AI,幫助企業(yè)增收降本,另一方面重視AI人才培養(yǎng),無(wú)論是校企培養(yǎng),還是AI企業(yè)和用戶企業(yè)協(xié)作培養(yǎng),寄希望于將技術(shù)深度融入業(yè)務(wù)體系。
馬艷軍:新技術(shù)重構(gòu)AI能力邊界
百度AI技術(shù)生態(tài)總經(jīng)理馬艷軍則主要介紹當(dāng)前大模型技術(shù)在產(chǎn)業(yè)融合中的能力狀態(tài)以及AI架構(gòu)師應(yīng)當(dāng)如何應(yīng)對(duì)這種變化。
首先整個(gè)大模型技術(shù)已經(jīng)得以完善增強(qiáng),擁有更好的多任務(wù)泛化能力,產(chǎn)品研發(fā)流程也變得更加標(biāo)準(zhǔn)化。
LLM已逐步具備專家級(jí)智能水平,現(xiàn)在只需要向大模型表達(dá)需求,就能立即獲得對(duì)應(yīng)任務(wù)結(jié)果。
例如百度基于文心大模型4.5 Turbo打造的羅永浩數(shù)字人技術(shù),可以專業(yè)且長(zhǎng)時(shí)間地保持高質(zhì)量直播輸出,體現(xiàn)出一個(gè)多功能LLM的深度思考和分析能力。
此外,LLM為整個(gè)行業(yè)帶來了翻天覆地的變化,尤其是編程領(lǐng)域。
在百度內(nèi)部,整個(gè)AI代碼生成的占比和采納率已經(jīng)從2022年的5%和15%增長(zhǎng)至50%和80%,大模型能夠完成復(fù)雜編程任務(wù),如刪除功能模塊或糾正編譯錯(cuò)誤。
這對(duì)團(tuán)隊(duì)的首席AI架構(gòu)師而言,將會(huì)是一個(gè)巨大的挑戰(zhàn)。
要想要跟上LLM發(fā)展趨勢(shì),將其能力最大化,AI架構(gòu)師就需要知道如何讓模型輸出、如何讓模型輸出更優(yōu)、如何讓模型輸出更快。
馬艷軍表示,需要從以下四個(gè)方面入手:
- 深入了解提示詞工程:相應(yīng)優(yōu)化技巧包括合理拆解復(fù)雜任務(wù)、組織輸出順序、補(bǔ)充合適信息以緩解幻覺、多文檔引用正確指令和使用可理解的文本格式。
- 學(xué)習(xí)模型調(diào)優(yōu)方式:包括增加預(yù)訓(xùn)練、對(duì)指令監(jiān)督微調(diào)、進(jìn)行獎(jiǎng)勵(lì)模型訓(xùn)練,以及偏好對(duì)齊。
- 掌握全棧系統(tǒng)設(shè)計(jì)能力:從模型開發(fā)、訓(xùn)練、精調(diào)、壓縮再到部署推理,可實(shí)現(xiàn)完整性標(biāo)準(zhǔn)流程。
- 深刻理解場(chǎng)景問題:洞察行業(yè)痛點(diǎn),能夠判斷什么場(chǎng)景需要什么模型,構(gòu)建針對(duì)性解決方案。
總之,首席AI架構(gòu)師需要學(xué)會(huì)將Agent融入日常工作流程,推動(dòng)產(chǎn)業(yè)范式升級(jí)。
于佃海:從深度學(xué)習(xí)到大模型
在本次開學(xué)典禮中,百度飛槳總架構(gòu)師于佃海,也帶來了有關(guān)深度學(xué)習(xí)到大模型發(fā)展變遷的第一堂課。
隨著LLM發(fā)展,現(xiàn)在來到了軟件3.0時(shí)代,1.0時(shí)代是傳統(tǒng)編碼實(shí)現(xiàn)功能,2.0時(shí)代基于深度學(xué)習(xí),通過訓(xùn)練模型實(shí)現(xiàn)功能,3.0時(shí)代直接一個(gè)大模型提示詞就能完成多種任務(wù)。
大模型的本質(zhì)不僅僅是參數(shù)量大,規(guī)模從百萬(wàn)級(jí)到現(xiàn)在的十億級(jí),更重要的是其模型結(jié)構(gòu)、學(xué)習(xí)機(jī)制以及推理能力的進(jìn)步。
當(dāng)前LLM模型架構(gòu)主要還是以Transformer為核心,基于神經(jīng)網(wǎng)絡(luò)的注意力機(jī)制,從序列的轉(zhuǎn)換發(fā)展而來。
而未來LLM架構(gòu)還會(huì)繼續(xù)基于Transformer持續(xù)優(yōu)化,與此同時(shí)更加重視專家MoE結(jié)構(gòu)。
學(xué)習(xí)機(jī)制上,深度學(xué)習(xí)在新一代的大模型訓(xùn)練流程中分別承擔(dān)不同功能角色,自監(jiān)督學(xué)習(xí)可以實(shí)現(xiàn)大規(guī)模預(yù)訓(xùn)練,監(jiān)督學(xué)習(xí)負(fù)責(zé)增強(qiáng)LLM指令遵循能力,強(qiáng)化學(xué)習(xí)通過人類反饋提升模型的偏好對(duì)齊。
高效推理部署是當(dāng)前大模型應(yīng)用推廣的關(guān)鍵,相當(dāng)考驗(yàn)基礎(chǔ)設(shè)施建設(shè),目前硬件(芯片、算力、存儲(chǔ))方面還有所落后,軟件(分布式訓(xùn)練框架、高效推理引擎、優(yōu)化工具)方面則已取得進(jìn)展。
未來還需要實(shí)現(xiàn)軟硬件協(xié)同發(fā)展,包括支持更多硬件高效適配接入、構(gòu)建大規(guī)模硬件集群達(dá)成多維混合并行、芯片層面深度協(xié)同優(yōu)化,最終搭建起大模型時(shí)代的深度學(xué)習(xí)平臺(tái)。
AICA:培養(yǎng)真正懂AI、做AI的架構(gòu)師
從2019年開始,這已經(jīng)是AICA舉辦的第九個(gè)學(xué)期,作為百度與深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心的聯(lián)合發(fā)起項(xiàng)目,吸納了來自各行各業(yè)的頂尖人才參與。
本期共招收學(xué)員96名,是通過長(zhǎng)達(dá)半年的預(yù)科學(xué)習(xí)、項(xiàng)目技術(shù)評(píng)審以及多輪考核,才從500多名報(bào)名者中脫穎而出的。
其中,61%的學(xué)員來自國(guó)央企、上市公司以及行業(yè)龍頭T1應(yīng)用服務(wù)商,80%有“管理+專業(yè)+技術(shù)”復(fù)合背景,均是各大公司的CTO或技術(shù)高管,行業(yè)覆蓋18個(gè)領(lǐng)域,包括能源、重工業(yè)、醫(yī)療康養(yǎng)、海關(guān)物流等,也有像貴州茅臺(tái)、奔馳這類頭部知名企業(yè)的加入。
課題內(nèi)容方面,AICA第九期新增文心開源、MCP前沿技術(shù)、多模態(tài)、數(shù)據(jù)等模塊,以及百度重點(diǎn)技術(shù)的實(shí)戰(zhàn)案例,當(dāng)前AI應(yīng)用的主流技術(shù)路線全覆蓋。
例如本次麥當(dāng)勞團(tuán)隊(duì)申報(bào)的課題《麥麥巡警數(shù)字員工》:
- 麥麥團(tuán)隊(duì)希望得到關(guān)于大模型優(yōu)化、任務(wù)調(diào)度與管理等方面的技術(shù)指導(dǎo)和建議,進(jìn)一步了解場(chǎng)景Agent落地的工程化設(shè)計(jì)思路,助力提升麥麥巡警數(shù)字員工的開發(fā)效果。
百度集團(tuán)副總裁吳甜也在會(huì)上表示,AICA將通過文心大模型與飛槳深度學(xué)習(xí)平臺(tái),為學(xué)員們提供產(chǎn)業(yè)級(jí)模型與工具鏈,另外保障豐富的實(shí)踐案例以供參考,并提供終身學(xué)習(xí)與交流平臺(tái)。
目前AICA已向業(yè)界輸送489名AI架構(gòu)師,遍布工業(yè)、能源、金融、交通、農(nóng)業(yè)、互聯(lián)網(wǎng)等數(shù)十個(gè)行業(yè),真正實(shí)現(xiàn)懂AI、做AI,讓AI落地真實(shí)場(chǎng)景。
參考鏈接:
[1]https://mp.weixin.qq.com/s/H5ctOM-zBNQaBwXdvkxZyQ
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.