近日,Arm宣布推出面向汽車領域的標準化預集成計算平臺——Zena計算子系統(tǒng) (Compute Subsystems, CSS),在AI技術的驅(qū)動下,Zena CSS能夠顯著縮短汽車相關芯片的開發(fā)周期,將車廠新車推向市場的時間提前一年。
“Zena CSS的優(yōu)勢在于,在提供更豐富計算能力的同時,為合作伙伴保留足夠靈活性,助力其專注于加速器開發(fā)與差異化創(chuàng)新,從而在AI時代保持競爭力?!盇rm汽車事業(yè)部產(chǎn)品和解決方案副總裁Suraj Gajendra在接受集微網(wǎng)等媒體采訪時表示。
高靈活性助力客戶差異化設計
在AI時代,汽車廠商保持競爭力的關鍵因素之一,是在不影響安全性、能效和靈活性的前提之下,具備可擴展的計算能力。
相較于傳統(tǒng)基于IP進行芯片設計,Zena CSS可減少多達20%的芯片工程工作量,使團隊能夠?qū)W⒂陂_發(fā)針對 AI 定義汽車工作負載的差異化功能。此外,Zena CSS通過軟件標準化,可降低多達30%的跨平臺移植工作量,節(jié)省軟件開發(fā)時間與成本。
以上效益能降低整體車輛平臺開發(fā)總成本,而一致的Arm架構(gòu)則具備跨 ADAS、中央計算與 IVI 用例的擴展能力,可適用于基于單芯片和芯粒 (chiplet) 的芯片設計。
靈活性是Zena CSS平臺的重要特征之一。
比如,該平臺通過RTL而非GDS的形式交付。考慮到每款芯片的設計,包括架構(gòu)都有所不同,客戶對于架構(gòu)的需求也各有差異。如果直接通過GDS進行產(chǎn)品交付,本質(zhì)上會在布局規(guī)劃或物理實現(xiàn)層面限制客戶的設計——Arm不希望剝奪這種靈活性,而是希望客戶能夠自主決定不同模塊的放置位置,從而實現(xiàn)芯片的設計和優(yōu)化。
通過RTL的形式交付,還能進一步將芯片性能優(yōu)化的主動權(quán)交由客戶掌握,從而讓其可以根據(jù)目標市場的需求進行對應優(yōu)化設計。
“在GDS的形式下,如果Arm選定某個工藝節(jié)點并針對該節(jié)點進行優(yōu)化設計,客戶就不得不使用相同的工藝節(jié)點,失去了選擇的自由和靈活性。然而每個客戶都會根據(jù)成本、性能等不同考量因素,自主選擇特定的代工廠并針對性地優(yōu)化設計??偟膩碚f,我們希望把更多的自由度留給客戶,讓他們能夠根據(jù)自身需求進行差異化設計?!盨uraj Gajendra說。
據(jù)了解,Arm在設計Zena CSS之初還充分考慮到Chiplet對于先進芯片的助力。Zena CSS不僅支持芯粒 (Chiplet) 架構(gòu),還提供了該架構(gòu)所需的關鍵標準接口,能支持客戶和合作伙伴基于芯粒架構(gòu)進行設計——包括單個和多個的Zena CSS互聯(lián)。而對芯粒架構(gòu)的支持也將持續(xù)作為Arm未來計算子系統(tǒng)的產(chǎn)品路線圖中重要的設計組件。
“考慮到部分客戶的設計并不需要芯粒架構(gòu)的實現(xiàn)方案,因此Zena CSS本身并不包含UCIe接口,但具備了連接UCIe所需的標準接口。芯片廠商既可以通過添加UCIe接口,將Zena CSS 設計為獨立芯粒;也可以不使用UCIe接口,將其實現(xiàn)為單片式SoC (系統(tǒng)級芯片)。這就是我們?yōu)榭蛻糍x予的產(chǎn)品設計靈活性。”Suraj Gajendra說。
軟硬一體應對算力需求擴展
當前,大模型正在加速實現(xiàn)上車,圍繞大模型的創(chuàng)新應用部署也成為車廠打造駕乘體驗差異化,消費者選購汽車車型的重要因素。
這一“軟件定義汽車”的發(fā)展趨勢,也是Arm一直在推動的方向。而無論是軟件定義還是AI定義,算力仍然是重中之重。
如果說過去傳統(tǒng)的4核、 8核甚至12核的算力配置就足以滿足汽車的需求。那么隨著“AI 定義汽車”的演進——以及大語言模型應用的發(fā)展,汽車需要更加強大的核心來應對算力的大幅增長,現(xiàn)在16甚至32核的配置已經(jīng)成為普遍需求,而這也是Zena CSS可以發(fā)揮核心價值之處。
Zena CSS擁有16個基于Armv9架構(gòu)的Cortex-A720AE核心,且具備擴展能力,即通過兩個Zena CSS的組合,實現(xiàn)32核的配置。
“我們希望通過這種集成化的高算力方案支持合作伙伴,讓車廠能在越來越多的AI應用上車時,專注于AI加速以及其他軟件和應用的開發(fā)。Arm的核心任務就是打好計算底座?!盨uraj Gajendra說。
除了硬件底座之外,軟件、工具、庫、編譯器的能力也同樣重要。因此,近年來Arm也大力投入資源,確保計算子系統(tǒng)配備適配的AI工具、工作流和軟件庫,以支持運行最新的大語言模型及正在落地的新AI應用。
在汽車業(yè)務領域,今年3月,Arm將KleidiAI 軟件庫擴展到了汽車領域。KleidiAI 的核心作用是優(yōu)化Arm CPU上大語言模型的運行性能。目前這些軟件庫已完成部署,Arm的客戶能夠借此充分發(fā)揮16核的算力優(yōu)勢,在Arm CPU上運行更高效的AI工作負載。
標準化底座與差異化空間
Zena CSS在標準化平臺的基礎之上,為廠商進行留出了差異化設計區(qū)域。比如標準部分包括CPU 集群、安全島、安全飛地、調(diào)試模塊以及電源管理單元,可選部分包括圖像信號處理器ISP和圖形處理器GPU。而加速器,以及客戶與合作伙伴可能需要添加的其他定制邏輯等方面則可自行設計。
通過 Arm 計算子系統(tǒng),客戶可以復用核心計算組件,借由AI加速器子系統(tǒng)的升級、I/O 的增添或是其他功能的調(diào)整,就能進行產(chǎn)品的迭代更新。
“我們的目標絕非消除差異化,而是希望合作伙伴保留這種差異化的能力:無論是自主研發(fā)芯片的車廠,還是開發(fā) SoC 的傳統(tǒng)芯片合作伙伴,都能在加速器、定制邏輯,或是I/O及整體系統(tǒng)架構(gòu)的其他方面實現(xiàn)差異化的創(chuàng)新。”Suraj Gajendra說。
也就是說,Zena CSS構(gòu)建完成了底層標準化的工作,這個工作的重要性在于,當核心CPU功能以標準化方式實現(xiàn)時,能顯著提升軟件復用率。同樣,隨著安全島的集成,安全機制與主CPU之間的交互也能實現(xiàn)標準化。因此,Arm聚焦于標準化一小部分,但卻是關鍵的元素——計算核心組件,而讓客戶專注于差異化設計,這將有效提升開發(fā)效率。
“當合作伙伴進行代際迭代時,假設這一代產(chǎn)品只需400 TOPS(萬億次每秒)的AI性能,他們采用Zena CSS并搭配自主研發(fā)的加速器,即可實現(xiàn)這一性能目標。到了下一代,若希望 CPU基本保持不變,但將AI性能提升至800 TOPS,僅需升級加速器部分即可。如此一來,在核心計算部分保持不變的前提下,一方面實現(xiàn)了代際間的標準化,另一方面又達到大量軟件復用的成效,還能獲得所需的額外AI性能。這正是我們?yōu)榭蛻籼峁┑撵`活性與性能優(yōu)化價值。”Suraj Gajendra告訴集微網(wǎng)。
超10家合作伙伴合作接洽
過去幾年,Arm CSS成為手機、數(shù)據(jù)中心等業(yè)務主推的平臺,這一創(chuàng)新業(yè)務形式,以及所帶來的性能、靈活性、安全等優(yōu)勢,引發(fā)了市場廣泛關注。
Suraj Gajendra介紹,在過去幾個月,Arm一直在圍繞Zena CSS進行開發(fā)優(yōu)化,市場對Zena CSS的關注度和興趣也不斷提升。截至目前,全球已有包括車廠和芯片設計商在內(nèi)超過10家合作伙伴,一部分已取得了Zena CSS的技術授權(quán),另一部分則正與Arm進行深度合作接洽。
此前,行業(yè)中也一直存在一種聲音,即CSS推出后,Arm將對以前單獨處理器授權(quán)模式不再提供支持,但在此次采訪中,Suraj Gajendra否定了這樣的說法。
“以我們這次發(fā)布的 Zena CSS 為例,我們將IP產(chǎn)品整合為計算子系統(tǒng)的核心組成部分。這些IP產(chǎn)品同時納入我們的產(chǎn)品矩陣,供合作伙伴靈活選用。但我們堅信,依托計算子系統(tǒng)將產(chǎn)品推向市場是最優(yōu)路徑,可以實現(xiàn)完整的產(chǎn)品解決方案。我們在整個供應鏈中對 CSS 的資源投入與關注度將持續(xù)深化。同時,已發(fā)布的前幾代 IP 產(chǎn)品仍將保持供應,滿足客戶的多樣化需求?!?/p>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.