作為 NVIDIA NIM 微服務,開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何加速系統(tǒng)上為 AI 智能體提供強效助力。
人工智能正在進入一個全新的時代——代理式 AI。在這個時代,專業(yè)智能體團隊可以幫助人們解決復雜的問題并自動執(zhí)行重復任務。
借助定制 AI 智能體,各行各業(yè)的企業(yè)可以構建智能解決方案,從而獲得前所未有的生產(chǎn)力。這些先進的 AI 智能體需要一個多樣化生成式 AI 模型系統(tǒng),并且這些模型要針對代理式 AI 功能和能力進行優(yōu)化。這樣的復雜程度意味著企業(yè)對強大、高效的企業(yè)級模型產(chǎn)生了極大的需求。
為了給企業(yè)代理式 AI 奠定基礎,NVIDIA 宣布推出開放式大語言模型 (LLM) 的 Llama Nemotron 系列。該模型基于 Llama 構建,可以幫助開發(fā)者在一系列應用中創(chuàng)建和部署 AI 智能體,包括客戶支持、欺詐檢測、產(chǎn)品供應鏈和庫存管理優(yōu)化。
許多 AI 智能體不僅需要語言技能,還需要感知世界并采取適當行動的能力,以更有效地發(fā)揮其作用。
借助全新的 NVIDIA Cosmos Nemotron 視覺語言模型 (VLM) 以及面向視頻搜索和摘要的 NVIDIA NIM 微服務,開發(fā)者可以構建智能體,分析來自自主機器、醫(yī)院、商店和倉庫的圖像和視頻以及體育賽事、電影和新聞,并對其做出響應。針對希望為機器人和自動駕駛汽車領域生成物理感知視頻的開發(fā)者,NVIDIA 還宣布推出 NVIDIA Cosmos 世界基礎模型。
開放式 Llama Nemotron 模型優(yōu)化了 AI 智能體的計算效率和精度
NVIDIA Llama Nemotron 模型基于 Llama 基礎模型而構建,為 AI 智能體開發(fā)提供經(jīng)過優(yōu)化的基礎模組。Llama 基礎模型是最熱門的商用開源模型集合之一,下載次數(shù)超過 6.5 億次。這一成果建立在 NVIDIA 致力于開發(fā)前沿模型的基礎之上,例如 Llama 3.1 Nemotron 70B,現(xiàn)在可通過 NVIDIA API 目錄獲取。
Llama Nemotron 模型使用 NVIDIA 最新技術和高質(zhì)量數(shù)據(jù)集進行剪枝和訓練,可增強代理式 AI 功能。它們在指令遵循、聊天、函數(shù)調(diào)用、編碼和數(shù)學方面表現(xiàn)出色,同時經(jīng)過尺寸優(yōu)化,可在廣泛的 NVIDIA 加速計算資源上運行。
Meta 副總裁兼 GenAI 負責人 Ahmad Al-Dahle 表示:“代理式 AI 是 AI 開發(fā)的下一個前沿,為了抓住這次機會,需要在 LLM 系統(tǒng)中進行全棧優(yōu)化,以提供高效、準確的 AI 智能體。通過與 NVIDIA 的合作,以及我們對開放模型的共同承諾,基于 Llama 構建的 NVIDIA Llama Nemotron 系列可以助力企業(yè)快速構建自己的定制 AI 智能體?!?/p>
包括 SAP 和 ServiceNow 在內(nèi)的領先 AI 智能體平臺提供商,有望成為首批使用全新 Llama Nemotron 模型的企業(yè)。
SAP 首席人工智能官 Philipp Herzig 表示:“能夠跨多個業(yè)務線協(xié)作解決復雜任務的 AI 智能體將會超越當今的生成式 AI 場景,將企業(yè)生產(chǎn)力提升到一個全新的水平。借助 SAP 的 Joule,數(shù)億企業(yè)用戶能夠與這些智能體進行交互,以前所未有的速度實現(xiàn)他們的目標。NVIDIA 的全新開放式 Llama Nemotron 模型系列將推動多個專用 AI 智能體的開發(fā),助力業(yè)務流程轉(zhuǎn)型?!?/p>
ServiceNow 平臺 AI 副總裁 Jeremy Barnes 表示:“AI 智能體使企業(yè)組織能夠事半功倍,為業(yè)務轉(zhuǎn)型樹立了新的標準。NVIDIA 開放式 Llama Nemotron 模型性能和精度的提升有助于構建先進的 AI 智能體服務,以解決各行業(yè)中各種職能的復雜問題?!?/p>
NVIDIA Llama Nemotron 模型使用 NVIDIA NeMo 進行蒸餾、剪枝和對齊。使用這些技術可以將這些模型保持較小的規(guī)模,以便在各種計算平臺上運行,并在提供高精度的同時提高模型吞吐量。
Llama Nemotron 模型系列將以可下載模型和 NVIDIA NIM 微服務的形式提供,可輕松部署在云端、數(shù)據(jù)中心、PC 和工作站。它們可以為企業(yè)提供業(yè)界領先的性能,并且能夠可靠、安全且無縫地集成到其代理式 AI 應用工作流中。
使用 NVIDIA NeMo 定制并接入業(yè)務知識
Llama Nemotron 和 Cosmos Nemotron 模型系列將提供 Nano、Super 和 Ultra 三種規(guī)模,為部署各種規(guī)模的 AI 智能體提供廣泛選擇。
Nano:成本效益最高的模型,針對實時應用進行了優(yōu)化,延遲低,非常適合部署在 PC 和邊緣設備上。
Super:高精度模型,可在單個 GPU 上提供卓越的吞吐量。
Ultra:精度最高的模型,專為需要超高性能的數(shù)據(jù)中心級應用而設計。
企業(yè)還可以使用 NVIDIA NeMo 微服務為其特定用例和領域定制模型,以簡化數(shù)據(jù)管護、加速模型定制和評估,還可以應用護欄,以確保響應正常。
借助 NVIDIA NeMo Retriever,開發(fā)者還可以集成檢索增強生成功能,將模型與企業(yè)數(shù)據(jù)連接起來。
使用面向代理式 AI 的 NVIDIA Blueprint,企業(yè)可以利用 NVIDIA 先進的 AI 工具和端到端開發(fā)專長,快速構建自己的應用。事實上,NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 和 NeMo Retriever 將為今天發(fā)布的面向視頻搜索和摘要的全新 NVIDIA Blueprint 提供強效助力。
NeMo、NeMo Retriever 和 NVIDIA Blueprint 均可通過 NVIDIA AI Enterprise 軟件平臺使用。
可用性
Llama Nemotron 和 Cosmos Nemotron 模型將以托管應用編程接口的形式提供,可通過 NVIDIA 官網(wǎng)和 Hugging Face 下載:https://www.nvidia.cn/ai/
NVIDIA 開發(fā)者計劃的成員均可免費訪問開發(fā)、測試和研究資源:https://forums.developer.nvidia.com/t/nvidia-nim-faq/300317
在生產(chǎn)中,企業(yè)可以使用 NVIDIA AI Enterprise 軟件平臺在加速數(shù)據(jù)中心和云計算基礎設施上運行 Llama Nemotron 和 Cosmos Nemotron NIM 微服務。
查閱相關軟件產(chǎn)品信息說明:https://www.nvidia.cn/about-nvidia/terms-of-service/