在2025年,企業(yè)數(shù)據(jù)平臺已成為企業(yè)在云端、本地和邊緣環(huán)境中運行和管理數(shù)據(jù)的基礎架構。它們?yōu)閺慕鹑诤凸湹娇蛻趔w驗和戰(zhàn)略規(guī)劃的各個領域提供支撐。隨著生成式AI日益融入日常工作流程以及合規(guī)要求不斷收緊,企業(yè)需要的是清潔、易于發(fā)現(xiàn)且隨時可用的數(shù)據(jù)。企業(yè)數(shù)據(jù)供應商正在快速適應這些需求以保持競爭力。
今年早些時候我發(fā)布了關于這個市場的概述,但這個領域變化如此迅速,值得我們重新審視當前正在發(fā)生的最大變化趨勢。其中之一是Apache Iceberg和Delta Lake等開放格式正在讓數(shù)據(jù)在不同系統(tǒng)間更容易遷移,而不會被困在供應商的孤島中。同時,基于檢索增強生成和向量搜索等技術的AI就緒工具也在興起,這些工具可以從實時數(shù)據(jù)中提取答案——這還不包括智能體AI在這些系統(tǒng)中令人驚嘆的快速普及。除此之外,越來越多的企業(yè)正在轉向統(tǒng)一平臺,將編排、治理和元數(shù)據(jù)整合到一個地方,而不是使用零散的解決方案。具有規(guī)模和功能集的供應商正在發(fā)揮平臺能力來改善其競爭地位。
在這種背景下,數(shù)據(jù)架構不再僅僅是IT技術關注點,而是保持快速、智能和競爭力的關鍵戰(zhàn)略考量。因此,讓我們深入了解這些新興變化趨勢如何在企業(yè)數(shù)據(jù)管理市場中發(fā)揮作用。
2025年企業(yè)數(shù)據(jù)平臺的關鍵要素
企業(yè)數(shù)據(jù)平臺正在演變?yōu)楦幽K化、標準驅動的系統(tǒng),而非單一供應商堆棧。首先,Apache Iceberg和Delta Lake等開放表格式現(xiàn)在得到廣泛支持,使得構建跨云工作且能夠隨時間適應的架構變得更容易;這也通過使數(shù)據(jù)更容易在不同平臺間移動和查詢來幫助減少供應商鎖定。數(shù)據(jù)平臺不再將攝取、轉換和治理作為獨立步驟處理,而是將它們視為連接的連續(xù)過程。Snowflake、IBM、Cloudera和Informatica支持Iceberg,而Databricks通過其Unity Catalog支持兩種格式,Delta Lake UniForm實現(xiàn)跨格式訪問。開放標準的使用讓組織對其數(shù)據(jù)有更多控制權,并且在不從頭開始的情況下更容易切換工具。
如今的數(shù)據(jù)平臺也是從基礎開始為AI構建的。智能體系統(tǒng)可以自主處理元數(shù)據(jù)標記和數(shù)據(jù)質量檢查等任務。檢索增強生成使AI基于可信的企業(yè)數(shù)據(jù),而向量搜索和嵌入管理等工具現(xiàn)在已成為標準。低代碼功能和策略自動化也正在成為標準——不僅用于提高效率,還用于實際需求,如及早識別數(shù)據(jù)質量問題、執(zhí)行合規(guī)規(guī)則和準備審計而無需大量手工工作。此時,AI已經(jīng)超越了試點項目;協(xié)作助手、智能體和特定領域的自動化已嵌入到日常任務中,從簡化供應鏈調整到標記欺詐交易。這使得技術和非技術團隊都能獲得更快、更一致的結果。
在基礎設施方面,混合和邊緣部署已成為常態(tài)。企業(yè)需要在數(shù)據(jù)生成的地方附近處理數(shù)據(jù),特別是在醫(yī)療保健、制造業(yè)和金融等速度、隱私和控制至關重要的行業(yè)。隨著傳統(tǒng)數(shù)據(jù)中心外數(shù)據(jù)生成的增加,無縫邊緣集成也變得必要。微軟、IBM和Cloudera等供應商現(xiàn)在提供支持這種轉變的邊緣就緒選項。
由于生成式AI工作負載成本的增加,財務運營(FinOps)功能變得越來越重要。供應商現(xiàn)在提供各種解決方案,在復雜環(huán)境中提供這些成本的可見性。AWS的成本優(yōu)化中心、微軟增強的Fabric控制以及IBM將FinOps工具集成到其數(shù)據(jù)堆棧中都是這些解決方案的例子。財務治理正在演變?yōu)槿芷谝?guī)劃,具有跟蹤使用情況、預測成本并幫助團隊就工作負載管理做出明智決策的工具。
同時,主權AI正在升溫,因為政府和企業(yè)通常希望其AI系統(tǒng)在國家或地區(qū)邊界內以滿足隱私法律和監(jiān)管期望。這種對控制的關注,特別是在國防、醫(yī)療保健和政府部門,信任和問責至關重要,正在推動新法規(guī)的發(fā)展,如美國司法部2025年數(shù)據(jù)安全計劃。真正的優(yōu)勢將來自能夠適應政策和地理的平臺??紤]模型審計、邊界感知部署以及對混合云、本地和邊緣環(huán)境的支持。你的平臺越適應性強,即使在復雜規(guī)則和不斷上升的期望的世界中,也越容易保持快速發(fā)展。
在數(shù)據(jù)方面,強有力的治理現(xiàn)在是默認要求。血緣跟蹤、策略執(zhí)行和元數(shù)據(jù)標記等功能不是可有可無的——它們是預期的。更多團隊也開始將數(shù)據(jù)視為產品:可重用、有良好文檔記錄且從一開始就受到治理的東西。
綜合來看,到目前為止,供應商不能再專注于其平臺的潛力。今天,重點是實際能力。買家正在尋求大規(guī)模的切實現(xiàn)實世界性能,以及強大的治理和可觀察性以及適應的靈活性。滿足這些期望的平臺有望塑造企業(yè)數(shù)據(jù)戰(zhàn)略的下一階段。
企業(yè)數(shù)據(jù)供應商比較
企業(yè)數(shù)據(jù)平臺供應商繼續(xù)采取不同的路徑,這些路徑由其背景和戰(zhàn)略優(yōu)先級塑造。Snowflake通過Cortex AI-SQL為其SQL原生平臺添加了AI,讓用戶直接在查詢中嵌入AI。它現(xiàn)在通過開源Polaris Catalog支持Apache Iceberg,最近推出了OpenFlow來處理實時管道并為事件驅動用例組合結構化和非結構化數(shù)據(jù)。Cittabase使用Cortex AI-SQL自動將非結構化視覺數(shù)據(jù)轉換為結構化文本摘要,使團隊能夠將圖像衍生的洞察與關系表連接,以獲得更豐富的分析。
Databricks專注于數(shù)據(jù)科學和AI優(yōu)先工作流。如上所述,它支持Delta Lake和Iceberg,其Unity Catalog現(xiàn)在提供跨多種格式和引擎的治理。Databricks正在加倍投注互操作性和智能體驅動的自動化;這得到其LakehouseIQ的支持,這是一個通過學習組織數(shù)據(jù)上下文來實現(xiàn)自然語言查詢的知識引擎,以及Mosaic AI,一個用于構建和治理AI模型和智能體的平臺——更不用說其對Tabular(Iceberg背后的團隊)的收購。DraftKings使用Databricks上的機器學習構建了實時欺詐檢測系統(tǒng)。Coinbase使用該平臺大規(guī)模監(jiān)控區(qū)塊鏈交易和標記可疑活動。這兩個例子都表明了該平臺在實時處理、向量搜索和機器學習工具方面的優(yōu)勢。
Informatica繼續(xù)以元數(shù)據(jù)驅動治理領先。其Claire AI引擎現(xiàn)在包括Claire智能體——用于管理超越聊天式交互的數(shù)據(jù)的自主工具。它支持Iceberg并提供混合部署靈活性,吸引需要強策略控制的企業(yè)。例如,Holiday Inn Club Vacations使用Claire整合來自斷開系統(tǒng)的客戶數(shù)據(jù),提高準確性。Paycor使用Informatica的云工具現(xiàn)代化其管道,加速分析和AI交付。
Cloudera發(fā)揮其在混合和邊緣部署方面的優(yōu)勢。它依賴于開源技術,如用于流處理的NiFi和用于處理的Spark,并支持具有ACID事務和時間旅行的Iceberg——查詢歷史版本數(shù)據(jù)表進行審計、恢復或時點分析的能力。最近的更新添加了GPU可觀察性、Nvidia H100支持和Hugging Face模型集成(包括Llama 3.2)用于AI啟用的湖倉用例。制造商在邊緣使用它進行預測性維護,而零售商和銀行使用它保護客戶數(shù)據(jù)并實時檢測欺詐——平衡本地處理與集中監(jiān)督。
Teradata仍然是金融和零售等行業(yè)大規(guī)模分析的首選。其VantageCloud Lake和ClearScape Analytics平臺現(xiàn)在支持生成式和基于智能體的AI,具有新的成本跟蹤和工作負載管理工具,旨在為技術和業(yè)務團隊提供便利。銀行和電信公司由于其強大的工作負載管理和可擴展性而將其用于合規(guī)、風險建模和審計,這些非常適合有大量數(shù)據(jù)需求的受監(jiān)管行業(yè)。
IBM一直在擴展watsonx以涵蓋更復雜和受監(jiān)管的AI工作負載。2025年6月的更新帶來了非結構化數(shù)據(jù)支持、通過DataStax的實時Cassandra集成以及通過Apache Gluon的Spark加速。今天,watsonx支持Iceberg、邊緣部署和增強的向量搜索,其中包括現(xiàn)代管道工具和FinOps功能。Vodafone使用watsonx模擬客戶交互,而保險公司通過從表格和文檔中提取關鍵信息來自動化理賠處理——表明watsonx在混合、以合規(guī)為重點的設置中的價值。
Salesforce正在通過擬議的80億美元收購Informatica來擴展其企業(yè)數(shù)據(jù)戰(zhàn)略,預計將在2026年秋季完成。這可能會將Informatica的治理和AI能力擴展到Salesforce的整個堆棧——與Data Cloud、Tableau和MuleSoft集成——同時使Salesforce更直接地與Snowflake和Databricks等競爭對手競爭。2025年8月,Salesforce還完成了對Waii的收購,這是一家使用元數(shù)據(jù)知識圖將自然語言查詢轉換為優(yōu)化SQL的初創(chuàng)公司。Waii的技術預計將增強Data Cloud、Agentforce和Tableau Next,使用戶和AI智能體能夠通過對話查詢與企業(yè)數(shù)據(jù)交互。
來自云服務提供商的企業(yè)數(shù)據(jù)管理產品
主要云提供商繼續(xù)采取不同的方法來提供自己的企業(yè)數(shù)據(jù)平臺,這些方法由他們在AI、基礎設施和開發(fā)工具方面的優(yōu)勢塑造。AWS提供廣泛的工具包,包括用于數(shù)據(jù)倉庫的Redshift、用于ETL的Glue、用于機器學習的SageMaker和用于臨時查詢的Athena。雖然功能強大,但這些服務通常需要拼接在一起。為了提供幫助,AWS推出了用于治理的DataZone和用于更好財務跟蹤的成本優(yōu)化中心。同時,Greengrass支持制造、零售和現(xiàn)場操作中的邊緣部署。
微軟Azure通過Microsoft Fabric專注于集成,該平臺將Synapse、Data Factory和Power BI合并到OneLake上的一個SaaS平臺中。Fabric現(xiàn)在擁有超過17,000個客戶,包括大部分財富500強企業(yè)。最近的更新添加了物化湖視圖、改進的鏡像和更緊密的OneLake集成。Azure Arc將Azure數(shù)據(jù)服務擴展到本地和主權環(huán)境,支持混合用例。現(xiàn)實世界的用例涵蓋許多行業(yè)。例如,墨爾本機場使用Microsoft Fabric進行統(tǒng)一分析以高效管理運營數(shù)據(jù)。香奈兒將Fabric集成到其分析工作流中,平衡決策支持與強治理。微軟本身在內部使用Fabric來管理復雜的大規(guī)模數(shù)據(jù)環(huán)境。
谷歌云強調AI和數(shù)據(jù)靈活性。其堆棧——BigQuery、Vertex AI和Looker——支持Iceberg和Delta Lake,允許開放、云無關的架構。Anthos實現(xiàn)混合和邊緣編排,谷歌更新的FinOps儀表板旨在提供更好的成本可見性。該平臺的開放AI工具吸引構建定制工作流的工程團隊。拜耳將AlloyDB與BigQuery一起使用,在開放Iceberg格式數(shù)據(jù)上部署實時分析,與其之前的架構相比,響應速度更快,吞吐量更高。
Oracle云基礎設施專注于事務和應用集成工作負載的性能。通過自治數(shù)據(jù)庫和AI向量搜索,OCI與Oracle的ERP和SaaS堆棧緊密結合。雖然其邊緣能力仍在成熟中,但OCI為已經(jīng)標準化Oracle的企業(yè)提供穩(wěn)定的定價和內置集成。作為客戶使用的一個例子,DeweyVision部署Oracle自治數(shù)據(jù)庫與AI向量搜索一起,在不同數(shù)據(jù)類型中提供快速、AI驅動的語義媒體搜索,改善可發(fā)現(xiàn)性和用戶體驗。
企業(yè)數(shù)據(jù)平臺的戰(zhàn)略展望
企業(yè)數(shù)據(jù)平臺市場預計在未來七年翻倍——從2025年的1113億美元增長到2032年的2435億美元,年復合增長率為11.8%。這種增長由數(shù)據(jù)復雜性上升、AI采用、更嚴格的法規(guī)和持續(xù)的云擴張推動。
今天的企業(yè)需要簡化操作、降低成本并使AI有用的平臺。目錄聯(lián)邦、基于智能體的編排和AI感知成本建模等功能開始滿足這些需求。新的"認知"平臺將AI智能體視為活躍的數(shù)據(jù)用戶——能夠在沒有持續(xù)人工監(jiān)督的情況下采取行動。
主權AI和邊緣計算也在塑造平臺設計。AI系統(tǒng)越來越需要保持在受監(jiān)管數(shù)據(jù)源附近,而邊緣能力支持快速的本地處理。大多數(shù)供應商正在適應以支持兩者??沙掷m(xù)性也開始變得更重要。企業(yè)在評估平臺時開始考慮數(shù)據(jù)基礎設施的環(huán)境影響。展望未來,平臺選擇將更少地取決于名聲,更多地取決于技術契合度。最強的競爭者將提供靈活的部署、開放標準、透明的成本控制和內置治理——幫助制造業(yè)、醫(yī)療保健、金融、零售等各個領域的企業(yè)更快地行動并做出更明智的決策。
Q&A
Q1:Apache Iceberg和Delta Lake等開放格式對企業(yè)數(shù)據(jù)平臺有什么好處?
A:開放表格式讓企業(yè)更容易在不同系統(tǒng)間移動數(shù)據(jù)而不被困在供應商孤島中,同時支持構建跨云工作且能夠隨時間適應的架構。Snowflake、IBM、Cloudera支持Iceberg,Databricks支持兩種格式,這給組織更多數(shù)據(jù)控制權,使得在不從頭開始的情況下更容易切換工具。
Q2:生成式AI如何改變企業(yè)數(shù)據(jù)平臺的功能?
A:生成式AI已經(jīng)從試點項目發(fā)展到嵌入日常任務中,智能體系統(tǒng)可以自主處理元數(shù)據(jù)標記和數(shù)據(jù)質量檢查。檢索增強生成使AI基于可信的企業(yè)數(shù)據(jù),向量搜索和嵌入管理成為標準功能。協(xié)作助手、智能體和特定領域自動化現(xiàn)在用于從供應鏈調整到欺詐檢測的各種任務。
Q3:企業(yè)數(shù)據(jù)平臺市場未來發(fā)展趨勢如何?
A:預計未來七年市場將翻倍,從2025年的1113億美元增長到2032年的2435億美元,年復合增長率11.8%。增長動力包括數(shù)據(jù)復雜性上升、AI采用、嚴格法規(guī)和云擴張。未來平臺選擇將更注重技術契合度而非名聲,最強競爭者將提供靈活部署、開放標準、透明成本控制和內置治理。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.