在日益不確定的全球經(jīng)濟(jì)環(huán)境中,AI創(chuàng)新競賽正在激烈進(jìn)行。但許多企業(yè)仍缺乏執(zhí)行工具:Gartner預(yù)測,到2027年,60%的組織將因數(shù)據(jù)治理問題而無法實現(xiàn)AI用例的價值。
在AI市場競爭的企業(yè)無法承受因安全和主權(quán)挑戰(zhàn)而停滯不前。它們需要一體化的主權(quán)數(shù)據(jù)和AI解決方案,能夠連接專有數(shù)據(jù)與智能體AI愿景之間的差距。那么,主權(quán)數(shù)據(jù)和AI平臺應(yīng)該是什么樣的?
首先是AI就緒數(shù)據(jù)
AI需要數(shù)據(jù)。但企業(yè)在將數(shù)據(jù)用于AI時面臨三大挑戰(zhàn):
以安全方式獲得數(shù)據(jù)資料的完整統(tǒng)一視圖
構(gòu)建可靠的AI就緒數(shù)據(jù)管道
在防止專有數(shù)據(jù)泄露的同時將AI投入生產(chǎn)
從第一個挑戰(zhàn)開始。當(dāng)今任何企業(yè)的數(shù)據(jù)都分散在不同系統(tǒng)中,由不同團(tuán)隊管理,在公有云、私有云和數(shù)據(jù)中心等不同環(huán)境中。沒有統(tǒng)一的數(shù)據(jù)策略,變革性AI計劃將失敗。
解決方案是對數(shù)據(jù)的完全可見性和控制。組織必須整合分散的系統(tǒng),選擇能夠支持所有數(shù)據(jù)模型的通用數(shù)據(jù)平臺,包括關(guān)系型、向量、文檔和時間序列數(shù)據(jù)。此外,它們需要與Apache Iceberg等開放表格式的無縫集成。這將通過跨孤島合并數(shù)據(jù)來確保數(shù)據(jù)訪問和集成,同時保持與所選查詢引擎的兼容性。
沒有可見性就沒有控制。企業(yè)需要一個統(tǒng)一控制臺來管理、監(jiān)控和擴(kuò)展混合基礎(chǔ)設(shè)施中的數(shù)據(jù)庫,包括自托管、本地部署和多云部署。最后,數(shù)據(jù)平臺必須通過加密、SQL保護(hù)、訪問管理、審計、性能(智能監(jiān)控和建議修復(fù))等功能以及通過集中管理的分布式集群實現(xiàn)近零停機(jī)時間來提供端到端安全。
讓數(shù)據(jù)流動起來
在統(tǒng)一數(shù)據(jù)平臺中整合企業(yè)資產(chǎn)是邁向AI領(lǐng)導(dǎo)地位的重要步驟。但正如許多失望的湖倉采用者所證實的,僅僅集中數(shù)據(jù)并不能單獨(dú)解決所有問題。企業(yè)需要可靠的AI就緒數(shù)據(jù)管道,按需為其構(gòu)建者提供數(shù)據(jù)。
問題在于,用于生成式AI的企業(yè)數(shù)據(jù)管道往往笨重且深奧,涉及九個或更多不同步驟。開發(fā)團(tuán)隊在如何存儲、索引和查詢向量嵌入及其相關(guān)對象方面存在困難。大多數(shù)組織通過將現(xiàn)有數(shù)據(jù)基礎(chǔ)設(shè)施與專用向量數(shù)據(jù)庫進(jìn)行改裝來加劇這個問題,創(chuàng)造出更多需要專業(yè)知識維護(hù)的分片系統(tǒng)。結(jié)果是:AI項目因數(shù)據(jù)管道混亂而陷入困境。
企業(yè)需要一個能夠標(biāo)準(zhǔn)化AI管道的AI工廠。在數(shù)據(jù)方面,這意味著集成嵌入生成、存儲和索引工作流,以提供從攝取到相似性搜索的自動化管道。換句話說,這是一條將原始數(shù)據(jù)轉(zhuǎn)換為安全、AI就緒資產(chǎn)的裝配線。
主權(quán)AI工廠還必須解決開發(fā)人員、數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家和其他使用AI就緒數(shù)據(jù)的用戶面臨的最后一公里挑戰(zhàn)。這意味著實施低代碼和無代碼開發(fā)工具,簡化AI應(yīng)用程序的開發(fā),包括生成式AI助手和智能體,并使用由企業(yè)向量引擎支持的安全AI知識庫。
EDB Postgres AI工廠大幅加速投產(chǎn)時間,在開發(fā)階段節(jié)省高達(dá)90%的步驟。但涉及主權(quán)AI時,考慮如何保持整個機(jī)器的端到端安全至關(guān)重要。
保持主權(quán)
摩根大通首席信息安全官Patrick Opet最近發(fā)布公開信,呼吁供應(yīng)商解決標(biāo)準(zhǔn)云模型的網(wǎng)絡(luò)安全弱點。Opet表示,雖然SaaS"提供效率和快速創(chuàng)新,但同時放大任何弱點、中斷或破壞的影響,創(chuàng)造具有潛在災(zāi)難性系統(tǒng)性后果的單點故障"。
這是當(dāng)今的普遍情緒:技術(shù)必須默認(rèn)安全和主權(quán)。不幸的是,當(dāng)今大多數(shù)生成式AI工具都需要將數(shù)據(jù)傳輸?shù)降谌皆?。這是合規(guī)噩夢。
要真正實現(xiàn)數(shù)據(jù)和AI主權(quán),平臺必須:
通過內(nèi)置治理保護(hù)敏感信息
精確控制向公共大語言模型發(fā)送的信息
消除第三方數(shù)據(jù)暴露風(fēng)險
提供靈活的部署選項,在企業(yè)自托管環(huán)境中實現(xiàn)端到端功能
幸運(yùn)的是,創(chuàng)新正在贏得主權(quán)戰(zhàn)爭。一個令人興奮的發(fā)展是所謂的"離提示"數(shù)據(jù)訪問管理,它防止專有信息暴露給公共托管的大語言模型。
離提示技術(shù)通過將敏感數(shù)據(jù)隔離在可配置的向量存儲中來工作,使其被引用但不嵌入發(fā)送給公共大語言模型的提示中。大語言模型無法看到或?qū)W習(xí)離提示數(shù)據(jù),因此無法存儲或共享專有數(shù)據(jù)。離提示控制防止數(shù)據(jù)泄露,還通過減少提示大小幫助控制成本。
通過數(shù)據(jù)和AI主權(quán)跨越智能體AI鴻溝
業(yè)務(wù)領(lǐng)導(dǎo)者面臨來自客戶和競爭對手實施AI的巨大壓力。但今天,這需要跨多個供應(yīng)商的多個專業(yè)產(chǎn)品,這帶來安全風(fēng)險并增加維護(hù)開銷。這種分片方法占用稀缺的AI人才,開發(fā)人員將50-80%的時間花在集成上。同時,敏感數(shù)據(jù)經(jīng)常流向外部供應(yīng)商,造成治理風(fēng)險并限制專有數(shù)據(jù)資產(chǎn)的戰(zhàn)略優(yōu)勢。
AI工廠與組織數(shù)據(jù)平臺無縫嵌入時,消除實施復(fù)雜性并加速智能體AI的價值實現(xiàn)時間。它通過將向量數(shù)據(jù)庫、嵌入管道、模型服務(wù)和智能體編排集成到單一、連貫的系統(tǒng)中來實現(xiàn)這一目標(biāo),使組織能夠在幾小時或幾天內(nèi)而不是幾個月到幾年內(nèi)部署生產(chǎn)就緒的應(yīng)用程序。它還應(yīng)為開發(fā)人員提供低代碼環(huán)境來構(gòu)建復(fù)雜的智能體AI,以及為公民開發(fā)者提供無代碼選項來串聯(lián)不同的推理和智能體能力以滿足特定業(yè)務(wù)需求。
這種綜合方法提供隨AI技術(shù)發(fā)展而適應(yīng)的靈活性。但為了靈活適應(yīng)不斷變化的合規(guī)和監(jiān)管關(guān)切,它還必須在可信環(huán)境中保持完整的數(shù)據(jù)主權(quán)和治理。根據(jù)獨(dú)立基準(zhǔn)研究,這樣的解決方案現(xiàn)在觸手可及,能夠?qū)崿F(xiàn)3倍更快的投產(chǎn)時間、8倍更高的應(yīng)用程序性能和6倍更好的成本效率,同時實現(xiàn)51%的總擁有成本降低。
Q&A
Q1:主權(quán)數(shù)據(jù)和AI平臺的核心優(yōu)勢是什么?
A:主權(quán)數(shù)據(jù)和AI平臺能夠在保持?jǐn)?shù)據(jù)安全和合規(guī)的前提下,將向量數(shù)據(jù)庫、嵌入管道、模型服務(wù)和智能體編排集成到單一系統(tǒng)中,實現(xiàn)3倍更快的投產(chǎn)時間、8倍更高的應(yīng)用程序性能和6倍更好的成本效率,同時降低51%的總擁有成本。
Q2:什么是"離提示"數(shù)據(jù)訪問管理技術(shù)?
A:"離提示"技術(shù)通過將敏感數(shù)據(jù)隔離在可配置的向量存儲中,使數(shù)據(jù)被引用但不嵌入發(fā)送給公共大語言模型的提示中。這樣大語言模型無法看到或?qū)W習(xí)離提示數(shù)據(jù),防止專有數(shù)據(jù)泄露,同時通過減少提示大小幫助控制成本。
Q3:企業(yè)在AI數(shù)據(jù)管道方面面臨哪些主要挑戰(zhàn)?
A:企業(yè)面臨三大挑戰(zhàn):獲得數(shù)據(jù)的完整統(tǒng)一安全視圖、構(gòu)建可靠的AI就緒數(shù)據(jù)管道、在防止專有數(shù)據(jù)泄露的同時將AI投入生產(chǎn)。傳統(tǒng)數(shù)據(jù)管道往往涉及九個或更多步驟,系統(tǒng)分散,需要專業(yè)知識維護(hù),導(dǎo)致AI項目陷入困境。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.