人類文明的每一次跨越都伴隨著工具的革新。從蒸汽機(jī)的齒輪到計(jì)算機(jī)的代碼,生產(chǎn)力的進(jìn)化始終與技術(shù)的“具身化”緊密相連。當(dāng)大語言模型掀起認(rèn)知革命,具身智能正以“物理實(shí)體+自主決策”的雙重屬性重新定義工業(yè)、醫(yī)療、服務(wù)等領(lǐng)域的運(yùn)行邏輯。在這場革命中,東土科技以自主研發(fā)的鴻道Intewell工業(yè)操作系統(tǒng)與MaVIEW開發(fā)平臺,為智能體的“大腦”與“肢體”架起確定性橋梁。
具身智能:物理世界的認(rèn)知革命
具身智能(Embodied AI)是人工智能領(lǐng)域的前沿方向,其核心在于讓AI系統(tǒng)通過物理實(shí)體與環(huán)境交互,形成“感知-決策-執(zhí)行”的閉環(huán)。與傳統(tǒng)AI僅處理虛擬數(shù)據(jù)不同,具身智能需要解決三大核心問題:
1、環(huán)境感知:通過視覺、觸覺等多模態(tài)傳感器實(shí)時(shí)捕捉物理世界狀態(tài),例如工業(yè)機(jī)器人需識別0.1mm級的零件錯位;
2、動態(tài)決策:基于大語言模型理解人類自然語言指令,并轉(zhuǎn)化為機(jī)器可執(zhí)行的動作序列;
3、精準(zhǔn)執(zhí)行:在微秒級時(shí)間內(nèi)完成動作控制,確保機(jī)械臂運(yùn)動軌跡誤差小于±0.01mm。
特斯拉Optimus人形機(jī)器人展示的抓取咖啡杯能力,正是具身智能的典型應(yīng)用——視覺系統(tǒng)識別杯體位置,強(qiáng)化學(xué)習(xí)算法規(guī)劃抓取路徑,力控傳感器調(diào)整末端執(zhí)行器壓力。而在工業(yè)場景中,這種能力被進(jìn)一步放大:半導(dǎo)體封裝設(shè)備需要同步控制100臺機(jī)械臂,良品率要求達(dá)到99.999%;電力巡檢機(jī)器人需在復(fù)雜地形中保持平衡,同時(shí)完成設(shè)備溫度檢測。
東土科技集團(tuán)副總經(jīng)理兼AI公司總經(jīng)理張人杰博士指出:“具身智能的競爭本質(zhì)是‘確定性’的競爭。工業(yè)場景中0.1秒的通信延遲可能導(dǎo)致產(chǎn)線宕機(jī),服務(wù)機(jī)器人誤動作可能威脅人身安全。我們必須構(gòu)建從操作系統(tǒng)到通信協(xié)議的完整技術(shù)棧,讓智能體在復(fù)雜環(huán)境中穩(wěn)定運(yùn)行?!?,他曾擔(dān)任大眾集團(tuán)AI科技公司CEO和BlackBerry QNX大中華區(qū)總經(jīng)理,對操作系統(tǒng)和AI的關(guān)聯(lián)性感觸頗深。
VLA模型:讓機(jī)器“看懂、聽懂、行動”
視覺-語言-動作(Vision-Language-Action, VLA)模型是具身智能的認(rèn)知飛躍,其通過多模態(tài)對齊實(shí)現(xiàn)“所見即所動”。例如,機(jī)器人可通過視覺識別“紅色閥門”,結(jié)合自然語言指令“逆時(shí)針旋轉(zhuǎn)30度”,生成精確的力矩控制信號。美國Figure AI公司開發(fā)的Figure 01人形機(jī)器人已展示此類能力:通過云端大模型解析操作手冊,VLA模型協(xié)調(diào)視覺伺服與關(guān)節(jié)電機(jī),完成設(shè)備檢修任務(wù)。
VLA模型的技術(shù)要求:
異構(gòu)計(jì)算能力:需同時(shí)處理視覺數(shù)據(jù)(GPU加速)、語言解析(NPU推理)、動作控制(實(shí)時(shí)CPU);
確定性響應(yīng):從視覺識別到機(jī)械臂動作的全鏈路延遲需穩(wěn)定在10ms以內(nèi);
群體協(xié)作:多機(jī)器人需共享環(huán)境語義地圖,避免任務(wù)沖突。
鴻道Intewell操作系統(tǒng):唯一通過四項(xiàng)最高安全認(rèn)證的工業(yè)“神經(jīng)中樞”
鴻道Intewell操作系統(tǒng)是國內(nèi)首個(gè)通過汽車(ISO 26262 ASIL-D)、工業(yè)控制(IEC 61508 SIL3)、醫(yī)療儀器(IEC 62304 Class C)、軌道交通(EN 50128 SIL4)四項(xiàng)功能安全認(rèn)證的工業(yè)操作系統(tǒng),其安全性與可靠性達(dá)到國際頂尖水平。該系統(tǒng)的核心優(yōu)勢包括:
1、異構(gòu)算力動態(tài)分配:支持AI芯片與實(shí)時(shí)控制芯片混合部署,視覺處理延遲≤5ms,控制指令抖動誤差≤±2μs;
2、云邊協(xié)同架構(gòu):云端訓(xùn)練通用動作策略庫,邊緣端通過MaVIEW工具適配場景參數(shù),例如調(diào)整抓取力度適應(yīng)不同材質(zhì)工件;
3、群體智能協(xié)議棧:通過AUTBUS時(shí)間敏感網(wǎng)絡(luò)實(shí)現(xiàn)納秒級時(shí)鐘同步,確保多機(jī)器人協(xié)作時(shí)環(huán)境地圖一致性。
在半導(dǎo)體封裝場景中,鴻道Intewell系統(tǒng)驅(qū)動AI模型同步處理100路攝像頭數(shù)據(jù),良品率提升至99.999%。在汽車工廠中,焊接機(jī)器人自主學(xué)習(xí)新產(chǎn)品工藝,換型時(shí)間從2小時(shí)縮短至10分鐘。
從工廠到城市:具身智能的滲透圖譜
1、工業(yè)制造:
電熔鎂砂熔煉系統(tǒng)通過AI動態(tài)調(diào)優(yōu),單噸能耗降低5.1%;
汽車焊接產(chǎn)線采用自適應(yīng)路徑規(guī)劃算法,生產(chǎn)線換型時(shí)間縮短至10分鐘;
2、醫(yī)療服務(wù):
微創(chuàng)手術(shù)機(jī)器人集成工業(yè)精密控制算法,實(shí)現(xiàn)0.1mm定位精度;
康復(fù)外骨骼通過步態(tài)自適應(yīng)算法,幫助帕金森患者訓(xùn)練效率提升50%;
3、城市服務(wù):
無人清掃車集群調(diào)度覆蓋面積提升3倍;
倉儲機(jī)器人集群協(xié)同效率達(dá)到人工團(tuán)隊(duì)的15倍。
未來:人機(jī)共生的工業(yè)革命
隨著VLA模型與鴻道Intewell操作系統(tǒng)的深度融合,具身智能將呈現(xiàn)兩大趨勢:
1、自主進(jìn)化能力:機(jī)器人通過實(shí)時(shí)數(shù)據(jù)回流優(yōu)化動作策略,例如手術(shù)機(jī)器人基于術(shù)后并發(fā)癥數(shù)據(jù)迭代力控算法;
2、人機(jī)共生界面:自然語言指令直接驅(qū)動工業(yè)設(shè)備,如操作員說出“提高熔爐溫度5%”,系統(tǒng)自動完成熱電偶校準(zhǔn)與PID參數(shù)調(diào)整。
目前東土科技研發(fā)的AI機(jī)器人平臺,已經(jīng)能夠?yàn)榭蛻籼峁┛焖僭突牡痛a開發(fā)工具和系統(tǒng),大大減少客戶在垂直領(lǐng)域開發(fā)具身智能的成本。與此同時(shí),東土科技也在積極研發(fā)下一代鴻道系統(tǒng),目標(biāo)實(shí)現(xiàn)“VLA模型+數(shù)字孿生”閉環(huán),預(yù)計(jì)2030年支持百萬級智能體協(xié)同網(wǎng)絡(luò)。張人杰博士展望:“未來的工廠將是‘軟件定義’的——通過統(tǒng)一操作系統(tǒng),企業(yè)能像開發(fā)手機(jī)App一樣定制具身智能體,東土科技期待能跟更多的客戶和合作伙伴一起,構(gòu)建健康、可持續(xù)的自主具身智能生態(tài)”。
撰稿:
東土科技集團(tuán)副總經(jīng)理
兼東土科技上??气櫣究偨?jīng)理
張人杰