8月26日下午,元戎啟行舉辦了“新物種”發(fā)布會,正式推出VLA模型。CEO周光在會上表示,VLA模型標(biāo)志著自動駕駛進(jìn)入大模型時代,是從端到端輔助駕駛邁向更高層次智能駕駛的關(guān)鍵一步。
相比傳統(tǒng)CNN模型,VLA基于GPT-Transformer架構(gòu),具備更強(qiáng)的語義理解和邏輯推理能力。公司自2023年以來經(jīng)歷了無圖方案和端到端輔助駕駛量產(chǎn)階段,目前量產(chǎn)車輛已接近10萬臺,合作車型超過10款,但CNN端到端模型已逐漸接近性能瓶頸,需要VLA來突破復(fù)雜場景理解。
VLA模型的技術(shù)亮點(diǎn)包括對盲區(qū)環(huán)境的語義理解、異形障礙物識別、臨時標(biāo)識及文字類路牌的解析,以及記憶語音指令的個性化控車能力。其內(nèi)置思維鏈能力支持長時序推理,同時結(jié)合大規(guī)模知識庫訓(xùn)練,提高模型在不同場景的泛化能力。通過DeepRoute IO 2.0平臺,VLA可以實現(xiàn)多模態(tài)、多芯片、多車型的適配,既支持激光雷達(dá),也可僅用視覺方案,強(qiáng)調(diào)防御性駕駛理念。
在實車演示中,系統(tǒng)能夠預(yù)測盲區(qū)中可能出現(xiàn)的移動物體,并主動采取減速或鳴笛等防御動作。語音交互設(shè)計以安全為優(yōu)先,再執(zhí)行用戶指令。商業(yè)化方面,2025年已有5款車型定點(diǎn)合作,適配價格主要集中在15萬元以上車型,同時可優(yōu)化用于10萬元級別。芯片算力是主要成本,但整體方案與端到端駕駛成本接近。
展望未來,元戎啟行計劃將技術(shù)向Robotaxi及通用移動智能擴(kuò)展,逐步形成RoadAGI策略。技術(shù)演進(jìn)路徑為規(guī)則算法到CNN端到端,再到GPT架構(gòu)端到端,強(qiáng)化學(xué)習(xí)作為后訓(xùn)練手段,資源消耗可控。出海策略重在合規(guī),模型泛化能力強(qiáng)。VLA模型在多芯片平臺上運(yùn)行穩(wěn)定,幀率滿足實時響應(yīng),未來可逐步向全無人駕駛能力發(fā)展,區(qū)別于其他廠商的優(yōu)勢在于防御性駕駛經(jīng)驗和思維鏈推理能力的積累。
總的來說,VLA模型通過視覺、語義和動作決策三大核心能力,實現(xiàn)了輔助駕駛的斷代式突破。DeepRoute IO 2.0平臺提供多模態(tài)、多芯片、多車型的適配方案,整個發(fā)布會強(qiáng)調(diào)的是安全、自然和人性化的智能駕駛體驗。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.