在汽車機器人行業(yè)近十年,近兩年看過近百家具身智能人形機器人企業(yè),投資近 10 家后,跟大家分享點自己的想法~
1. 關于投融資時機:本輪具身智能人形機器人的投資熱點可能要接近尾聲了,大部分該出手的機構已經陸續(xù)出手了,剩下的要么不信,要么就要等商業(yè)化之后了,留給PPT融資的時間不多了
2. 關于技術路線:現(xiàn)在還有大量媒體投資人熱衷于給企業(yè)貼標簽,這個是AI Native團隊,那個是傳統(tǒng)控制團隊,其實今年以來技術路線迅速收斂,大家都迅速轉向具身大模型端到端感知控制了,借用銀河王鶴老師一張圖如下,最底層特定動作或許傳統(tǒng)控制更有效,但要實現(xiàn)泛化通用實現(xiàn)具身智能,目前大家都是一個技術路線具身大模型
3. 關于具身大模型:具身大模型包括數(shù)據(jù)、算法、算力三部分,算力不論,那是英偉達的事,核心就是數(shù)據(jù)和算法
4. 關于數(shù)據(jù):數(shù)據(jù)模態(tài)很多,視覺力覺觸覺聽覺等等,數(shù)據(jù)來源也很多,仿真simulation遙操作video等等,要實現(xiàn)泛化通用,一定是多模態(tài)多來源數(shù)據(jù)綜合才有可能實現(xiàn),所以現(xiàn)在其實不存在所謂的simulation派和遙操作派,大家都是多模態(tài)多來源的數(shù)據(jù),爭議點是未來終局的數(shù)據(jù)到底以哪一類為主,自動駕駛最后是以真實數(shù)據(jù)為主,主要因為汽車太多,但機器人太少了
5. 關于算法:主力算法其實就是兩個,模仿學習、強化學習,新算法都在找,但還沒找到,這兩算法大家都在用,重點是更下層的改進,比如PPO、BC如何演進
6. 關于端到端:端到端在自動駕駛上已經被證明是有效的,但在機器人到底是哪個端到哪個端呢,感知端到執(zhí)行端是端到端,那任務規(guī)劃部分究竟要不要外接大語言模型?如果外接了還算不算端到端?爭議點其實是小腦的端到端,還是大小腦一起端到端
7. 關于大腦:最近穹徹盧策吾老師、智平方、若愚等都要做大腦,我理解真正的大腦是Open AI,因為只有大語言模型才能做任務規(guī)劃,除非他們要做中國的Open AI,但聽上去應該不是這個意思,現(xiàn)在市場上所謂做大腦的應該都沒辦法做任務分解和規(guī)劃,那就是要做小腦了,在人形機器人身體硬件沒有標準化的情況下,其實小腦和身體是強耦合的,很難想象用一個腦控制市場上這么多種類的人形,脫離硬件單獨做一個通用的具身大模型目前無法使用,每種硬件都需要單獨微調,工作量很大
8. 關于形態(tài):如果只是室內場景,輪式人形是可以的,如果室內加室外場景通用,那還是需要足式人形,如果下半身進展足夠快,輪式人形就只是個過渡形態(tài)了,參考星動最新的視頻,目前下半身的進展相當驚艷,室外真實場景下能跑到 3.6m/s,相當于人類跑步配速 438
9. 關于上半身和下半身:上下半身都很重要,如果非要選一個,上半身更重要一點,但關鍵是下半身能看到各家的差距,上半身的差距現(xiàn)在還看不出來,做輪式人形的企業(yè),其實在下半身已經被拉開了差距
10. 關于泛化:泛化和數(shù)據(jù)量強相關,數(shù)據(jù)量達到Billion級后,會逐漸產生泛化能力,目前核心是數(shù)據(jù)量的積累
下面看看全球及中國的企業(yè)
全球三大巨頭、六大獨角獸
三大巨頭:Tesla、Google、英偉達
七大獨角獸:Figure、π、Skild、Agility、波士頓動力、Covariant、空間智能
這些介紹的資料很多,我就不寫了,大家自己查
國內四巨頭,六大創(chuàng)業(yè)公司
四巨頭:華為、小米、小鵬、優(yōu)必選
創(chuàng)業(yè)公司:按估值超過10億的主要是智元、宇樹、傅利葉、樂聚、銀河、浙江人形、逐際、星動、星海圖九家,剩下都在10億以下,今天主要分析這 9 家估值超過10億的公司,剩下的下篇文章分析未來潛力
宇樹科技:硬件第一
這個應該大家沒什么疑問,9.9萬的價格、空翻視頻已經證明了一切,另外值得說的是宇樹的硬件享譽海內外,美國各大高校研究所都在買宇樹的硬件,科研市場基本都被宇樹占領了
浙江人形:融資金額第一
從去年到今年,具身智能人形機器人賽道融資兇猛,但梳理到現(xiàn)在,雖然智元、銀河都融資很猛,但融資金額最大的還是浙江人形,天使輪融資超過 12 億,浙大熊蓉老師團隊技術+中控技術產業(yè)背景,前景看好,下面說明幾個優(yōu)勢:
一是熊蓉老師其實是搞AI的,熊老師是正兒八經的計算機專業(yè)畢業(yè),學的就是AI,是國內最早做人形機器人的團隊之一,近20年人形機器人研發(fā)經驗,從一開始的傳統(tǒng)控制到最新的AI控制,從大腦到小腦,團隊都有很深厚的積累
二是浙江人形是完全公司化運營的,不是純研發(fā)機構,名字主要是為了申請政府補貼等,大股東中控技術是工業(yè)控制領域龍頭上市公司,有強大的市場產業(yè)資源,未來也是沖著IPO去的
星動紀元:端到端第一
今年開始大家都在轉向具身大模型,星動進展是比較快的,現(xiàn)在上半身操作大家還看不出明顯差別,但下半身星動是很明確領先的,下面著重說明幾個優(yōu)勢
一是陳建宇教授是搞AI的,星動是這一波里在AI方向上走的最遠的,很多企業(yè)底層還在用MPC的時候,星動已經完全端到端AI驅動了,在機器人頂會?RSS 2024上,陳老師的DWL端到端強化學習框架獲得滿分論文,是全清華大學 3 篇滿分論文之一,下半年預計在模仿學習領域還會有一篇滿分頂刊論文,在AI上持續(xù)有很大的貢獻
二是星動產業(yè)化團隊完整,已有大車企高管、機器人上市公司高管加入負責商業(yè)化
三是星動全身進展最快,上半身行業(yè)進展都不快,星動全自研上半身靈巧手+模仿學習操作保持在行業(yè)第一梯隊,全身移動室外真實場景下能跑到3.6m/s,這相當于人類跑步配速438,移動速度全球第一,未來一個模型端到端驅動上下半身會持續(xù)領先
逐際:漸進式第一
逐際是標準的漸進式實現(xiàn)具身智能人形機器人的企業(yè),從四輪足、雙足下半身、到全身逐步產業(yè)化落地,下面說明幾個優(yōu)勢:
一是產業(yè)化團隊完整,天使輪融資完成后就引入原思科高管、文遠知行COO張力負責商業(yè)化
二是張巍教授是搞AI的,張巍教授也是計算機專業(yè)畢業(yè)的,從模型控制、強化學習、real2sim2real、視頻預訓練,提出CTS(Concurrent Teacher-Student)的并行教師-學生強化學習新架構,顯著提升了足式機器人在復雜地形上的運動能力和魯棒性,在AI上是有明確貢獻的
三是浙進化落地第一,現(xiàn)在上半身大家都無法應用落地,逐際率先推出下半身可落地銷售的產品,上半身跟大家一樣在同步推進,屬于下半身領先上半身相當,總體當然還是領先的,24年已經實現(xiàn)了批量的銷售收入
綜合以上分析,目前中國具身智能人形機器人四小龍應該是:宇樹、星動、逐際、浙江人形
最后梳理一下目前在具身智能/機器人領域布局較多的投資機構
30家:聯(lián)想創(chuàng)投(中控、固高、星動、逐際、浙江人形、戴盟、本末、跨維、云芯、中科慧靈、來福、迦智、未來、云跡、阿童木、艾利特、曠視、艾吉威、長木谷、康諾思騰、愛博、Noah、磅策、邁步、飛馬、零重力、崧智、筑橙、中飛艾維等)
13家:源碼資本(云鯨、宇樹、梅卡、銀河、加速進化、擎朗、斯坦德、可以、XYZ、橡鷺、法奧、星邁、艾歐)
11家:梅花創(chuàng)投(月泉、大道、柔觸、勱微、千巡、潛行、博信、由利、珞石、科比特、多保)
11家:美團戰(zhàn)投(銀河、宇樹、普渡、高仙、非夕、梅卡、未來、史河、盈合、康諾思騰、法奧)
10家:IDG(銀河、星海圖、傅利葉、大寰、梅卡、未來、領鵲、優(yōu)艾、小鵬、天太)
利益相關:本人曾主導星動、逐際、浙江人形的投資