• 正文
    • GR00T N1基礎(chǔ)模型,賦予人形機(jī)器人通用技能與推理技能
    • NVIDIA與GE醫(yī)療合作,引入物理AI推進(jìn)自主診斷成像開發(fā)
    • NVIDIA機(jī)器人布局:打通全鏈條能力
    • 有望重新定義機(jī)器人技術(shù)邊界
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

NVIDIA重新定義機(jī)器人技術(shù)邊界:人形機(jī)器人與醫(yī)療AI迎來(lái)雙線突破

原創(chuàng)
03/26 08:43
740
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

“全球超5000萬(wàn)的勞動(dòng)力缺口”與“三分之二人口無(wú)法獲得基礎(chǔ)醫(yī)療影像服務(wù)”的現(xiàn)實(shí),揭示了AI的發(fā)力方向。

近期,NVIDIA在GTC 2025的兩大發(fā)布——全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型Isaac GR00T N1,以及聯(lián)合GE醫(yī)療推出的醫(yī)療AI仿真平臺(tái)——給出了一個(gè)回應(yīng):物理AI(Physical AI)。通過將物理規(guī)律嵌入AI訓(xùn)練、用合成數(shù)據(jù)替代稀缺的人類經(jīng)驗(yàn),NVIDIA正在證明:機(jī)器人不僅能看得懂世界,更能理解世界如何運(yùn)轉(zhuǎn)。

GR00T N1基礎(chǔ)模型,賦予人形機(jī)器人通用技能與推理技能

NVIDIA Isaac GR00T N1是一個(gè)開源且可定制的基礎(chǔ)模型,可支持通用人形機(jī)器人實(shí)現(xiàn)推理及各項(xiàng)技能,有助于加速行業(yè)轉(zhuǎn)型。據(jù)了解,它是一系列可完全定制模型中的首個(gè)模型,NVIDIA將對(duì)該系列模型進(jìn)行預(yù)訓(xùn)練,并面向全球機(jī)器人開發(fā)者發(fā)布。同時(shí)推出的新技術(shù)還包括仿真框架和藍(lán)圖:如用于生成合成數(shù)據(jù)的NVIDIA Isaac GR00T Blueprint,以及和Google DeepMind及Disney Research共同開發(fā)的、專為機(jī)器人開發(fā)而構(gòu)建的開源物理引擎Newton。

黃仁勛指出,通用機(jī)器人的時(shí)代已經(jīng)到來(lái),借助NVIDIA Isaac GR00T N1以及新的數(shù)據(jù)生成和機(jī)器人學(xué)習(xí)框架,全球機(jī)器人開發(fā)者將開啟 AI 時(shí)代的全新篇章。

據(jù)介紹,GR00T N1 基礎(chǔ)模型采用雙系統(tǒng)架構(gòu),這是受到人類認(rèn)知原理的啟發(fā)?!跋到y(tǒng)1”是一個(gè)快速思考的動(dòng)作模型,反映人類的本能反應(yīng)或直覺?!跋到y(tǒng)2”是慢思考模型,用于進(jìn)行經(jīng)過深度思考的決策制定。

其中,系統(tǒng)2由視覺語(yǔ)言模型提供支持,它會(huì)對(duì)所處環(huán)境和接收到的指令進(jìn)行推理,從而規(guī)劃行動(dòng)。系統(tǒng)1隨后將這些規(guī)劃轉(zhuǎn)化為精確、連續(xù)的機(jī)器人運(yùn)動(dòng)。系統(tǒng)1基于人類演示數(shù)據(jù)和 NVIDIA Omniverse平臺(tái)生成的海量合成數(shù)據(jù)進(jìn)行訓(xùn)練。

根據(jù)演示來(lái)看,GR00T N1可輕松適應(yīng)并完成通用任務(wù),如單手或雙手抓取、移動(dòng)物體,將物體從一只手臂轉(zhuǎn)移到另一只手臂,或執(zhí)行需要長(zhǎng)語(yǔ)境和通用技能組合的多步驟任務(wù)。這些功能可應(yīng)用于物品搬運(yùn)、包裝和檢查等各種使用場(chǎng)景中。值得一提的是,開發(fā)者和研究人員可使用真實(shí)數(shù)據(jù)或合成數(shù)據(jù)針對(duì)特定人形機(jī)器人或任務(wù)對(duì)GR00T N1進(jìn)行后訓(xùn)練。

在GTC主題演講中,黃仁勛展示了1X的人形機(jī)器人自主執(zhí)行室內(nèi)清理任務(wù)的過程,該過程就是基于GR00T N1的后訓(xùn)練策略。

據(jù)了解,這款機(jī)器人自主能力是1X與NVIDIA AI協(xié)作訓(xùn)練的成果。1X Technologies首席執(zhí)行官Bernt B?rnich認(rèn)為,人形機(jī)器人未來(lái)的開發(fā)重點(diǎn)在于適應(yīng)能力和學(xué)習(xí)能力。由于GR00T N1模型在機(jī)器人推理和技能方面實(shí)現(xiàn)突破,因此僅需最少量的后訓(xùn)練數(shù)據(jù),就能在 NEO Gamma上全面部署。全球其他優(yōu)先使用 GR00T N1 的領(lǐng)先機(jī)器人公司還包括 Agility Robotics、波士頓動(dòng)力、Mentee Robotics 和 NEURA Robotics。

為了讓機(jī)器人學(xué)習(xí)如何以更高精度處理復(fù)雜任務(wù),NVIDIA 還與Google DeepMind、Disney Research展開合作,共同開發(fā)開源物理引擎Newton。

據(jù)介紹,Newton基于NVIDIA Warp框架而構(gòu)建,將針對(duì)機(jī)器人學(xué)習(xí)進(jìn)行優(yōu)化,并與Google DeepMind MuJoCo和NVIDIA Isaac Lab等仿真框架兼容。此外,三家公司還計(jì)劃讓Newton能夠利用迪士尼的物理引擎。

Disney Research將成為首批使用Newton以推動(dòng)其機(jī)器人角色平臺(tái)發(fā)展的公司之一,該平臺(tái)為下一代娛樂機(jī)器人提供支持,比如此次 GTC 主題演講中和黃仁勛一起登臺(tái)、以星球大戰(zhàn)為靈感設(shè)計(jì)的富有表現(xiàn)力的 BDX 機(jī)器人,就是該平臺(tái)的成果。

此外,應(yīng)對(duì)機(jī)器人后訓(xùn)練發(fā)展的數(shù)據(jù)問題,NVIDIA宣布了用于合成運(yùn)動(dòng)生成的 NVIDIA Isaac GR00T Blueprint。它基于Omniverse 和 NVIDIA Cosmos Transfer 世界基礎(chǔ)模型構(gòu)建,讓開發(fā)者可以通過少量的人工演示生成大量合成運(yùn)動(dòng)數(shù)據(jù),以用于操作任務(wù)。

利用為藍(lán)圖提供的首批組件,NVIDIA 能夠在11小時(shí)內(nèi)生成780,000個(gè)合成軌跡,相當(dāng)于 6,500 小時(shí)或連續(xù)九個(gè)月的人類演示數(shù)據(jù)。然后,通過將合成數(shù)據(jù)與真實(shí)數(shù)據(jù)相結(jié)合,與僅使用真實(shí)數(shù)據(jù)相比,NVIDIA將GR00T N1性能提高了40%。

據(jù)介紹,為進(jìn)一步為開發(fā)者社區(qū)提供有價(jià)值的訓(xùn)練數(shù)據(jù),NVIDIA 將發(fā)布 GR00T N1 數(shù)據(jù)集,作為更大的開源物理 AI 數(shù)據(jù)集的一部分,現(xiàn)在可通過 Hugging Face 下載。

此外,NVIDIA還宣布推出了個(gè)人AI超級(jí)計(jì)算機(jī)NVIDIA DGX Spark,為開發(fā)者提供一站式系統(tǒng),可將GR00T N1功能擴(kuò)展到新機(jī)器人、任務(wù)和環(huán)境中,而無(wú)需進(jìn)行大量自定義編程。

NVIDIA與GE醫(yī)療合作,引入物理AI推進(jìn)自主診斷成像開發(fā)

醫(yī)療AI方面,則傳來(lái)NVIDIA與GE醫(yī)療合作的消息,雙方將共同推進(jìn)自主成像技術(shù)創(chuàng)新,重點(diǎn)開發(fā)自主X射線技術(shù)與超聲應(yīng)用。GE醫(yī)療采用了全新的 NVIDIA Isaac for HealthCare 醫(yī)療設(shè)備仿真平臺(tái),該平臺(tái)包含預(yù)訓(xùn)練模型及基于物理的傳感器、解剖結(jié)構(gòu)與環(huán)境仿真,可加速研發(fā)流程,使GE醫(yī)療能夠在部署前通過虛擬環(huán)境訓(xùn)練、測(cè)試與驗(yàn)證自主成像系統(tǒng)能力。

醫(yī)療行業(yè)作為AI重要的應(yīng)用領(lǐng)域之一,其實(shí)當(dāng)前醫(yī)療服務(wù)需求遠(yuǎn)超供給。超聲與X射線作是最常見且廣泛使用的診斷成像系統(tǒng),然而全球仍有近三分之二人口無(wú)法獲得這類檢查服務(wù)。通過為成像系統(tǒng)增加機(jī)器人能力,有助于擴(kuò)大醫(yī)療服務(wù)覆蓋范圍。

NVIDIA將通過Isaac for Healthcare支持更多客戶構(gòu)建仿真環(huán)境用例。仿真環(huán)境使機(jī)器人系統(tǒng)能夠在物理精確的虛擬環(huán)境中安全學(xué)習(xí)技能,以應(yīng)對(duì)手術(shù)等現(xiàn)實(shí)場(chǎng)景,這些場(chǎng)景通常難以復(fù)現(xiàn)。

Isaac for Healthcare 是基于NVIDIA三大機(jī)器人計(jì)算平臺(tái)(NVIDIA DGX,NVIDIA Omniverse以及 NVIDIA Holoscan)構(gòu)建的物理 AI 平臺(tái),包含專為醫(yī)療機(jī)器人優(yōu)化的AI模型,可通過增強(qiáng)視覺與語(yǔ)言處理能力實(shí)現(xiàn)理解、行動(dòng)與觀察功能。平臺(tái)還提供仿真框架,供開發(fā)者精確仿真醫(yī)療環(huán)境,并通過邊緣AI計(jì)算平臺(tái)NVIDIA Holoscan實(shí)現(xiàn)實(shí)時(shí)機(jī)器人決策。

借助 Isaac for Healthcare,醫(yī)療傳感器仿真選項(xiàng)有限的問題有望得到解決。開發(fā)者可訪問基于物理的醫(yī)療環(huán)境數(shù)字孿生,導(dǎo)入定制傳感器、器械甚至解剖結(jié)構(gòu),訓(xùn)練機(jī)器人應(yīng)對(duì)多樣化場(chǎng)景。此類虛擬環(huán)境有助于縮小仿真與現(xiàn)實(shí)的差距,支持快速數(shù)字原型設(shè)計(jì)。

據(jù)介紹,該平臺(tái)支持從微觀結(jié)構(gòu)、手術(shù)室到完整醫(yī)院設(shè)施的多尺度仿真。通過仿真策略訓(xùn)練,機(jī)器人系統(tǒng)可學(xué)習(xí)如何在手術(shù)室的各種醫(yī)療場(chǎng)景中做出反應(yīng),以及如何以最佳方式輔助醫(yī)生做出決策和為患者提供護(hù)理服務(wù)。

Isaac for Healthcare 將會(huì)通過仿真復(fù)雜醫(yī)療場(chǎng)景、訓(xùn)練AI模型及優(yōu)化手術(shù)、內(nèi)窺鏡與心血管介入等機(jī)器人應(yīng)用,加速醫(yī)療機(jī)器人解決方案開發(fā)。目前,Moon Surgical、Neptune Medical 以及Xcath等機(jī)構(gòu)已經(jīng)提前開始使用這一平臺(tái)。這些合作伙伴可以將其仿真工具、傳感器、機(jī)器人系統(tǒng)與醫(yī)療探針無(wú)縫集成至專用仿真環(huán)境。Ansys、Franka、ImFusion、Kinova 與 Kuka 在內(nèi)的生態(tài)合作伙伴已經(jīng)提前開始部署這一功能。

NVIDIA機(jī)器人布局:打通全鏈條能力

NVIDIA在機(jī)器人領(lǐng)域的布局已經(jīng)展現(xiàn)了一條清晰的戰(zhàn)略路徑:通過底層技術(shù)堆棧的垂直整合,正在打通從數(shù)據(jù)生成到硬件落地的全鏈條能力,同時(shí)以開源協(xié)作加速生態(tài)建設(shè)。

用于合成數(shù)據(jù)生成的全新 Omniverse Blueprint和開源數(shù)據(jù)集,正在快速開啟物理AI的數(shù)據(jù)飛輪。通過將Omniverse與合成數(shù)據(jù)生成的深度結(jié)合,解決了機(jī)器人訓(xùn)練中數(shù)據(jù)稀缺與多樣性的核心痛點(diǎn)。特別是對(duì)于人形機(jī)器人這類需要高度動(dòng)態(tài)適應(yīng)的領(lǐng)域,為算法優(yōu)化提供了更大的試錯(cuò)空間。

并且,GR00T N1模型、Newton引擎等開源舉措,將有助于吸引開發(fā)者與合作伙伴共建生態(tài)。通過開放物理仿真核心能力,開發(fā)者可以低成本接入高精度仿真環(huán)境,同時(shí)社區(qū)貢獻(xiàn)的插件與擴(kuò)展,將反哺工具鏈的完善。這種開放協(xié)作的模式,不僅降低了中小企業(yè)的創(chuàng)新門檻,還有望催生跨行業(yè)應(yīng)用(如工業(yè)機(jī)器人與醫(yī)療機(jī)器人的技術(shù)遷移),形成良性循環(huán)的創(chuàng)新生態(tài)。

另一方面,NVIDIA面向醫(yī)療領(lǐng)域推出的Isaac for Healthcare 醫(yī)療設(shè)備仿真平臺(tái),作為基于NVIDIA三大機(jī)器人計(jì)算平臺(tái)(NVIDIA DGX,NVIDIA Omniverse以及 NVIDIA Holoscan)構(gòu)建的物理 AI 平臺(tái),通過引入物理AI推進(jìn)自主診斷成像開發(fā),體現(xiàn)了對(duì)行業(yè)需求的精準(zhǔn)洞察。這種“通用+垂直”的并行策略,既保證了技術(shù)底座的可擴(kuò)展性,又能在細(xì)分市場(chǎng)快速建立競(jìng)爭(zhēng)優(yōu)勢(shì)。

有望重新定義機(jī)器人技術(shù)邊界

NVIDIA正在通過AI與物理仿真為核心,重構(gòu)機(jī)器人開發(fā)范式。從數(shù)據(jù)生成、算法訓(xùn)練到硬件部署,其技術(shù)堆棧覆蓋了機(jī)器人開發(fā)全生命周期,而開源策略則打破了傳統(tǒng)封閉系統(tǒng)的局限性,推動(dòng)行業(yè)向協(xié)作式創(chuàng)新邁進(jìn)。

在AI與機(jī)器人深度融合的當(dāng)下,這一戰(zhàn)略不僅加速了從實(shí)驗(yàn)室到工廠、醫(yī)療場(chǎng)景的落地進(jìn)程,更預(yù)示著一個(gè)更廣闊的未來(lái):機(jī)器人將不再是被動(dòng)執(zhí)行指令的工具,而是具備自主感知、學(xué)習(xí)和適應(yīng)能力的“智能體”。這一進(jìn)化,或?qū)⒅匦露x機(jī)器人的技術(shù)邊界,開啟新一輪創(chuàng)新變革。

英偉達(dá)

英偉達(dá)

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。收起

查看更多

相關(guān)推薦