AI智能體正處在快速發(fā)展階段,變得更加復(fù)雜、自主和多功能,且應(yīng)用范圍在不斷擴大。在AI智能體進入“規(guī)模就業(yè)”階段前,安全——成為一個不容忽視的問題,企業(yè)需要解決信任、物理安全、網(wǎng)絡(luò)安全以及合規(guī)性等關(guān)鍵問題。
應(yīng)對這一系列問題,日前,英偉達發(fā)布了全新的 NVIDIA NIM AI Guardrail 微服務(wù)。作為NVIDIA NeMo Guardrails 軟件工具系列的一部分,該平臺用于 AI 的管理、定制和防護,可幫助開發(fā)者在大語言模型 (LLM) 應(yīng)用中集成和管理 AI 護欄。行業(yè)領(lǐng)導(dǎo)企業(yè) Amdocs、Cerence AI 以及勞氏公司 (Lowe’s) 等都在使用 NeMo Guardrails 保護 AI 應(yīng)用的安全。
直面AI智能體部署挑戰(zhàn),英偉達全新微服務(wù)護航
一項對于企業(yè)組織采用AI智能體的調(diào)研顯示,10%已經(jīng)在使用,52% 計劃在未來2-3年內(nèi)使用,30%計劃在明年內(nèi)使用AI代理,僅有7%沒有探索使用的計劃。這也表明,大多數(shù)組織對采用AI智能體持積極態(tài)度,預(yù)計在未來兩三年內(nèi)將有大量組織開始實施AI智能體。
企業(yè)部署AI智能體面臨哪些挑戰(zhàn)?英偉達方面指出,需要重點考慮四大因素:安全性(確保不會對企業(yè)系統(tǒng)造成安全威脅)、數(shù)據(jù)隱私(保護用戶數(shù)據(jù)不被未經(jīng)授權(quán)的訪問或泄露)、治理(建立有效的管理機制來監(jiān)督AI智能體的運行和決策過程)、性能(確保AI智能體能夠高效完成任務(wù),滿足企業(yè)需求)。
為了幫助企業(yè)在部署AI智能體的過程中,構(gòu)建起強大的安全性和控制能力,NVIDIA NeMo Guardrails提供了一套全面的解決方案,主要覆蓋以下三個環(huán)節(jié):
- 定義(Define):根據(jù)獨特的需求定制安全規(guī)則;
- 編排(Orchestrate):高效編排多個專業(yè)化的安全規(guī)則;
- 執(zhí)行(Enforce):維護AI智能體的性能,確保安全規(guī)則得到執(zhí)行。
NeMo Guardrails 引入了三項全新的NIM微服務(wù),可幫助AI智能體在大規(guī)模運行的同時保持受控行為:
- 內(nèi)容安全NIM微服務(wù):防止AI生成有偏見或有害的輸出結(jié)果,確保回答符合道德標準。
- 話題控制 NIM 微服務(wù):將對話聚焦在經(jīng)過審核的話題上,避免離題或不當內(nèi)容。
- 越獄檢測 NIM 微服務(wù):增加對越獄企圖的防護,幫助在對抗性場景中保持 AI 的完整性。
據(jù)英偉達方面解釋,由于“一刀切”的方法無法有效保護和控制復(fù)雜的代理式 AI 工作流,通過應(yīng)用多個輕量級專業(yè)模型作為護欄,開發(fā)者可以彌補在只采取較為通用的全局策略和保護措施時可能出現(xiàn)的漏洞。
同時,這也可以在不顯著影響性能的情況下,顯著提高AI智能體的安全性和合規(guī)性。為了在最小化延遲的情況下提高安全性,NeMo Guardrails系列中采用了延遲較低的小語言模型,即使是資源有限的場景或是分布式環(huán)境中也能高效運行。
相關(guān)測試顯示,在添加了AI安全護欄的情況下,響應(yīng)延遲也僅為半秒,同時合規(guī)性提高了1.5倍,表明NeMo Guardrails能夠在不明顯影響性能的情況下,顯著提高AI代理的安全性和合規(guī)性。
在這些全新微服務(wù)中,有一項專為審核內(nèi)容安全而構(gòu)建,并使用 Aegis 內(nèi)容安全數(shù)據(jù)集 (Aegis Content Safety Dataset) 進行訓(xùn)練,后者是同類中質(zhì)量較高的人工注釋數(shù)據(jù)源之一。該數(shù)據(jù)集由英偉達整理并擁有,已在 Hugging Face 網(wǎng)站上公開發(fā)布。該數(shù)據(jù)集包含超過 35000 個經(jīng)過人工標記的數(shù)據(jù)樣本,這些樣本針對 AI 安全和繞過系統(tǒng)限制的越獄企圖進行標記。
有了全新的 NVIDIA NIM AI Guardrail 微服務(wù),開發(fā)者可以構(gòu)建更加安全、可信的 AI 智能體。這些智能體能夠參考特定語境準則做出安全、適當?shù)幕卮?,并且加強了對越獄企圖的抵御力度。它們可被部署在汽車、金融、醫(yī)療、制造、零售等行業(yè)的客戶服務(wù)中,提高客戶的滿意度和信任度。
NeMo Guardrails保障AI安全,正在大范圍展開
AI 智能體有望成為能夠完成各種任務(wù)的“知識機器人”,提升全球數(shù)十億知識工作者的生產(chǎn)力。目前,多個行業(yè)已經(jīng)開始采用NVIDIA的NeMo Guardrails來增強AI應(yīng)用的安全性和可控性。作為一個開源工具,NeMo Guardrails允許開發(fā)者通過編排AI策略來提升大型語言模型(LLM)應(yīng)用的安全性。這個工具與NVIDIA的NIM微服務(wù),構(gòu)成了強大的AI系統(tǒng)構(gòu)建框架,支持大規(guī)模部署而不犧牲安全和性能。
全球傳媒軟件和服務(wù)提供商Amdocs、汽車AI解決方案提供商Cerence AI,以及家居裝飾零售商勞氏公司(Lowe’s)都在使用NeMo Guardrails來提高客戶交互的安全性和準確性。這些公司通過集成NeMo Guardrails,能夠提供更安全、更符合語境的AI回答,增強客戶服務(wù)體驗。
此外,NVIDIA在NRF展會上宣布了整合NeMo Guardrails微服務(wù)的AI Blueprint,旨在為零售購物助手創(chuàng)造更可靠的客戶交互。咨詢行業(yè)的領(lǐng)導(dǎo)者如Taskus、Tech Mahindra和Wipro也在將NeMo Guardrails集成到他們的解決方案中,以提供更安全、可靠的生成式AI應(yīng)用。
NeMo Guardrails的開放性和可擴展性使其能夠集成領(lǐng)先的AI安全模型和防護提供商的生態(tài)系統(tǒng),以及AI可觀察性和開發(fā)工具。它支持與ActiveFence的ActiveScore集成,以及與AI可觀測性平臺Fiddler和端到端AI開發(fā)者平臺Weights & Biases的集成,增強監(jiān)控和推理能力。