記者 何己派 編輯 鄢子為
誰來做Agent大規(guī)模落地的核心推手?
火山引擎說,我想。
這朵來自字節(jié)跳動的云,去年發(fā)起閃電降價,豆包主力模型,拿出比同行便宜99%的價格,直接引發(fā)全行業(yè)跟進。
6月11日,火山引擎舉辦Force原動力大會,這一次,它拿出一套工具包,要在技術、成本、服務等維度,繼續(xù)推動Agent的大規(guī)模普及。
區(qū)間定價
“如果說2024年是中國大模型應用的元年,那2025年將很可能是中國Agent落地的元年?!?/p>
在火山引擎總裁譚待看來,以PC、移動、AI三個時代來劃分,技術主體在發(fā)生變化,從PC時代的web,移動時代的APP,到AI時代,則是Agent。
Agent正逐步進入企業(yè)的各個業(yè)務流程。怎么讓Agent星星之火可燎原,打通其規(guī)?;涞氐亩曼c,火山引擎的一把火,燒向“區(qū)間定價”。
“Agent的Token消耗量是很大的?!睍蠼邮堋?1CBR》等媒體采訪時,譚待談到,讓Agent執(zhí)行一項任務,可能需要20萬tokens。因此,怎么把模型使用成本降下來,非常關鍵。
新發(fā)布的豆包大模型1.6,首創(chuàng)按“輸入長度”區(qū)間定價的模式,深度思考、多模態(tài)能力與基礎語言模型,統(tǒng)一價格。
譚待表示,對同結構、同參數(shù)的模型而言,真正影響成本的,是上下文長度,而不是是否開啟了思考和多模態(tài)功能。目前模型大部分的調(diào)用,輸入范圍都在32K以內(nèi)。
基于這一觀察,團隊意識到,如果在推理調(diào)度上,通過分桶調(diào)度做好優(yōu)化,就能夠讓占大頭比例的模型請求,享受到更低成本、更快速度。
在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間,豆包1.6的價格,為每百萬tokens輸入0.8元、輸出8元,綜合成本是豆包1.5深度思考模型、DeepSeek R1的三分之一。
對于企業(yè)而言,豆包1.6成本下降了63%,只需要原來三分之一左右的價格,用上這個新模型。
加碼多模態(tài)
會上,譚待提了模型進化的三個關鍵方向,深度思考、多模態(tài)理解和工具自主調(diào)用。
此次發(fā)布的豆包1.6,全系列原生支持多模態(tài)思考能力,并基于圖形界面操作能力,進一步具備“行動力”。
演示案例顯示,豆包1.6可自動操作瀏覽器完成酒店預訂,識別購物小票并整理成Excel表格等任務。
新亮相的豆包視頻生成模型Seedance 1.0 pro,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P視頻。
價格方面,Seedance 1.0 pro模型每千tokens僅0.015元,相當于每生成一條5秒的1080P視頻,只需3.67元。
拿著1萬塊錢的預算,使用Seedance 1.0 pro,可制作超過2700條5秒視頻。
數(shù)據(jù)顯示,豆包大模型日均tokens使用量超過16.4萬億,較去年5月首次發(fā)布時,增長137倍。
在行業(yè)應用上,豆包大模型服務著全球TOP10手機廠商中的9家、8成主流汽車品牌、70%的系統(tǒng)重要性銀行及超5成985高校。
譚待向《21CBR》等媒體表示,豆包大模型的迭代,希望保持一年至少出一個大版本的節(jié)奏。目前,火山的所有業(yè)務里,大模型的收入增速最快,遠超其他產(chǎn)品,毛利也位居前列。
對今年火山引擎的收入增長和客戶拓展預期,他以“目標很激進”來回應,“需求是明確、清晰且龐大的”。
搶跑Agent時代,豆包如何贏得行業(yè)認可,譚待認為,“訣竅是心誠”,不為了賺吆喝,而把不好的模型免費。
“要讓更多人運用AI創(chuàng)造價值,就是三件事,把模型做好,把成本做低,把應用落地的各種工具做好。這三個點,我們過去一直在說,未來也不會變?!?/p>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.