• 正文
    • 01、分拆獨(dú)立,走上正軌
    • 02、投身創(chuàng)業(yè)大潮:智能駕駛與具身智能
    • 03、Waymo的故事仍在續(xù)寫
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

離開Waymo的日子

02/01 08:55
1094
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者 | 李雨晨,編輯 | 林覺民

自動駕駛是一場馬拉松,不是百米沖刺。時至今日,Waymo的成敗難以定義,但它是當(dāng)之無愧的自動駕駛之王。

Waymo是公認(rèn)的無人駕駛行業(yè)先驅(qū)者,如果你有異議,那我們暫時求同存異并保持微笑?!边@是前Waymo員工夏飛在自己知乎專欄里寫下的一句話。

從最早期的Waymo華人第一人朱佳俊、小馬智行北美負(fù)責(zé)人張一萌到輕舟系的于騫、侯聰、大方、汪堃、李棟,再到90后創(chuàng)業(yè)者高繼揚(yáng)和趙行,2009年成立至今,Waymo涌現(xiàn)出了幾百位華人面孔。這群聰明、勤奮、嗅覺敏銳的人,成為十多年來中國智能駕駛以及具身智能的見證者與參與者。

歲月如梭,斗轉(zhuǎn)星移。當(dāng)初與Waymo一同引領(lǐng)風(fēng)騷的創(chuàng)業(yè)明星Cruise、Argo AI、Motional等等,或黯然下線、或委身他處,但Waymo仍在續(xù)寫L4的江湖故事。

01、分拆獨(dú)立,走上正軌

在2016年更名為Waymo之前,谷歌無人車內(nèi)部一直用的是“chauffeur”這一名字(法語“司機(jī)”的意思)。Waymo由谷歌X實(shí)驗室孵化,跟總部不在一棟樓里。谷歌X最大的特點(diǎn)是,里面有很多造型奇特的硬件如機(jī)械臂、熱氣球、太陽能板。這棟樓的保密級別很高,谷歌的人無法進(jìn)入?,F(xiàn)在,這棟樓是Deepmind的人在辦公,機(jī)器人團(tuán)隊也在其中。

朱佳俊是Waymo最早期的五位創(chuàng)始人之一,本科畢業(yè)于復(fù)旦大學(xué)計算機(jī)系。在弗吉尼亞大學(xué)上學(xué)時,朱佳俊利用暑假來到Google Street View(街景)團(tuán)隊實(shí)習(xí)。到了第三周,他就獨(dú)立完成了一個新的基于計算機(jī)視覺的改進(jìn),并因此收獲了自己在谷歌的第一份專利。此前,用戶想接近一個特定街景,只能通過數(shù)次點(diǎn)擊圖中一個既定箭頭,費(fèi)時又費(fèi)力;朱佳俊做出的“click-to-go”讓圖中任意點(diǎn)都能成為旅程起點(diǎn)。后來,朱佳俊在國際會議SIGGGRAPH上遇到了當(dāng)時Google Street View團(tuán)隊的核心成員Luc,朱佳俊與谷歌就此結(jié)緣。

作為團(tuán)隊里的第一位華人,朱佳俊有著超乎年齡的成熟與老練。他寫下了Waymo的第一版感知系統(tǒng),在內(nèi)部有著很高的地位。在2016年的架構(gòu)融合前,感知和視覺是兩個組。朱佳俊只負(fù)責(zé)感知,不負(fù)責(zé)視覺。除了感知,朱佳俊還領(lǐng)導(dǎo)仿真團(tuán)隊,仿真團(tuán)隊的名字叫“Crystal ball”(水晶球)。還有一個組名為Magic,做的是視覺、預(yù)測和場景理解。這三部分任務(wù)都是要用機(jī)器學(xué)習(xí)去做,所以最早的機(jī)器學(xué)習(xí)不是應(yīng)用在感知組,而是在Magic組。Magic組的負(fù)責(zé)人是Dave Ferguson,后來和朱佳俊一起創(chuàng)辦了Nuro。

朱佳俊和Dave Ferguson2014年,朱佳俊幫小組招募成員,他找到了谷歌搜索組的張一萌。碩士期間,張一萌在卡內(nèi)基梅隆大學(xué)(CMU)的語言技術(shù)研究所。當(dāng)時,計算機(jī)視覺(CV)比自然語言處理(NLP)更火,張一萌就找到了視覺領(lǐng)域?qū)<谊愖婧步淌?,跟著他直到博士。陳祖翰教授現(xiàn)在是新加坡國立大學(xué)的常務(wù)副校長。

張一萌2012年,張一萌獲得計算機(jī)視覺和機(jī)器學(xué)習(xí)方向的博士學(xué)位,并加入谷歌。這一年,是人工智能的標(biāo)志性年份,2024年諾獎得主Hinton和其他兩位作者發(fā)布的AlexNet在ImageNet挑戰(zhàn)賽上一戰(zhàn)成名,極大地推動了卷積神經(jīng)網(wǎng)絡(luò)(CNN)的發(fā)展。不過,此時的深度學(xué)習(xí)并沒有在產(chǎn)業(yè)界引起大的波瀾。張一萌回憶到,“我還在康奈爾的時候,AlexNet還沒有引起足夠的討論,效果遠(yuǎn)沒有讓人覺得可以應(yīng)用在工業(yè)界。”張一萌當(dāng)時所在團(tuán)隊的產(chǎn)品形態(tài)類似于Zoom。

當(dāng)時,谷歌內(nèi)部有很多這樣創(chuàng)業(yè)性質(zhì)的團(tuán)隊。遺憾的是,這個組的產(chǎn)品不太成功被高層取消,張一萌需要在公司里找其他項目。朱佳俊聽到消息后主動找到了她,問:“要不要來了解一下無人車?”谷歌的無人車項目雖然從2009年就開始試水,但此時仍然是一個“Research Team”,離真正的產(chǎn)品比較遠(yuǎn),算不上人人都想進(jìn)的明星團(tuán)隊。但既然朱佳俊發(fā)出邀請,張一萌決定還是聊一聊。

她問了朱佳俊一個問題:項目什么時候落地?朱佳俊回答:“兩年,兩年就可以對公眾開放。”加入之后,張一萌才發(fā)現(xiàn)自己被“忽悠”了:無人車的辦公室還沒有原先的組規(guī)模大。感知團(tuán)隊只有10人左右,華人不多,早于張一萌加入的還有賈兆寅。賈兆寅是張一萌在康奈爾大學(xué)的師弟,后來在2017年加入滴滴任前沿業(yè)務(wù)技術(shù)負(fù)責(zé)人。賈兆寅是感知組的第一個Manager,帶了4-5個人的小團(tuán)隊,被朱佳俊委以重任。賈兆寅走的時候,他的師妹江韻也一起離職。谷歌的精英文化,讓這家巨頭吸納了諸多天才,包括AI大神——AlexNet作者之一的Alex Krizhevsky。當(dāng)時,Alex是從Google Brain被借調(diào)到無人車小組。

Alex是一個很特別的人。為了訓(xùn)練模型,他手寫了一套深度學(xué)習(xí)框架——Cuda-Convnet。后來,賈揚(yáng)清在美國加州大學(xué)伯克利分校讀博士,看到了Cuda-Convnet愛不釋手并且還找到了Alex。雖然沒有從Alex手上拿到代碼,但這也促使賈揚(yáng)清寫出了日后大名鼎鼎的框架——Caffe。Alex對于Waymo的貢獻(xiàn)在于,幫助調(diào)試出了很多模型,最早的點(diǎn)云檢測模型就是出自他手。

2015年8月,谷歌進(jìn)行組織架構(gòu)大調(diào)整,成立母公司Alphabet,以廣告為商業(yè)模式/盈利基礎(chǔ)的成熟業(yè)務(wù),包括Search、Android、YouTube、Apps、Maps和Ads被保留在谷歌旗下,諸多探索型業(yè)務(wù)則被劃分到不同的實(shí)體繼續(xù)推進(jìn),谷歌X實(shí)驗室也就此成為Alphabet旗下的獨(dú)立公司。站在高層角度來看,分拆Waymo是一個正確且必要的決定,既可以避免“追逐廣告收入”的心態(tài)蔓延到Waymo優(yōu)勢項目,又可以尋求外部融資,給初創(chuàng)團(tuán)隊更多的股票和期權(quán)激勵。不過,讓谷歌高層沒想到的是,早年間設(shè)立的一項激勵計劃卻砸到了自己的腳。

故事的起因是:為了留住技術(shù)人才,Waymo曾經(jīng)制定了一個薪資包,將薪酬分成四份。第一份在某一時間點(diǎn)發(fā),如果能待到2016年年底、完成一些里程碑,就可以拿到剩下錢里的一大半。當(dāng)時,Waymo的項目估值85億美元,谷歌拿出45億美元當(dāng)作獎金。谷歌的這一場造富運(yùn)動,讓很多人拿到數(shù)百萬到數(shù)千萬美元不等的回報,并且沒有競業(yè)協(xié)議的限制,這些錢成了Waymo元老們外出創(chuàng)業(yè)的底氣。2016年1月,時任谷歌無人車團(tuán)隊技術(shù)負(fù)責(zé)人的工程師 Anthony Levandowski 、谷歌地圖原負(fù)責(zé)人Lior Ron、硬件研發(fā)主管Bryan Salesky、Dave Ferguson和朱佳俊等人離職,這也讓waymo有了持續(xù)半年左右的離職潮。8月,谷歌無人車項目的靈魂人物——CTO Chris Urmson離職。

Chris UrmsonChris Urmson于2009年加入谷歌,當(dāng)時谷歌尚未啟動無人駕駛汽車項目,在他的帶領(lǐng)下,谷歌確立了不要方向盤、不要剎車,開發(fā)完全自動駕駛的技術(shù)路線。Urmson雖是CTO的頭銜,卻更多是以CEO的身份帶領(lǐng)團(tuán)隊。但是,John Krafcik(原現(xiàn)代美國公司CEO)的空降讓Urmson不滿,最終演變?yōu)?016年初Urmson和Larry Page大吵一架。在員工看來,作為接任者的Krafcik在內(nèi)部的口碑并不差。Krafcik有一頭銀發(fā),非常有個人魅力。他永遠(yuǎn)都是站著辦公,腳底下踩著一個平衡球。Urmson走后,Dmitri Dolgov接管了技術(shù)團(tuán)隊,成為了這支團(tuán)隊新的CTO。輕舟聯(lián)合創(chuàng)始人、前CTO,現(xiàn)總裁侯聰回憶,Waymo為了留住Urmson,在一次全員會上專門給他過了一次生日。

2016年底拆分獨(dú)立臨近時,Waymo在組織上做了一次大整合。被整合的有ML(machine learning)組,這個組里分為Reserach team、Infra team。后來,Reserach team和視覺、感合并成了一個大的感知部門,從谷歌請了一個法國人做負(fù)責(zé)人;Onboard ?Infra、仿真、Offboard Infra,還有地圖定位組成一個部門;決策、規(guī)劃、控制、預(yù)測等劃歸在一個部門。三個部門直接向CTO Dmitri Dolgov匯報,而Waymo的技術(shù)風(fēng)格、商業(yè)思維也越來越像一支正規(guī)軍。侯聰2013年加入谷歌,2016年加入Waymo后與張一萌做起了搭檔,侯聰負(fù)責(zé)感知的系統(tǒng)開發(fā)。對于Waymo硬件能力的更新?lián)Q代,他的感觸最深。

侯聰他回憶,從2016年起,Waymo已經(jīng)開始做第四代硬件,搭載了四個GPU,算力得到大幅突破,很多模型(視覺、預(yù)測等)也開始跑起來。Waymo沿襲了谷歌的做事風(fēng)格,從軟件到硬件力圖全棧自研,雷達(dá)激光雷達(dá)、相機(jī)、車載電腦這些都是由Waymo設(shè)計,交給臺灣超恩、廣達(dá)來代工。其中,廣達(dá)和其他代工廠不一樣的特點(diǎn)在于,不是使用車規(guī)級的相機(jī),而是選擇像素高的相機(jī)來保證整體效果。

在具體數(shù)量上,第三代無人車的硬件約有4個攝像頭,第四代增加到了19個攝像頭,第五代硬件又猛漲到30個攝像頭,被人稱之為“武裝到牙齒”。這些攝像頭分布在車頂和車身的各個地方,通過紅外線的方式檢測盲區(qū)是否有行人。Waymo和谷歌一直被外界貼以單打獨(dú)斗、大包大攬、不計成本的標(biāo)簽,但其實(shí)很多操作都是為了更好的工程化效果。

第一個例子是,無人車有一個容易被忽視的問題——相機(jī)的去污。Waymo的第四代車頂上有一個圓形的罩子,里面包括了一個主雷達(dá)、16個相機(jī)。但是由于是圓形,很多蟲子、鳥糞、雨水沾在罩子上后,雨刮器無法去污,因此第五代硬件又回歸了早期的平面形態(tài)。還有紅綠燈的識別問題。目前很多交通燈都使用LED技術(shù),會有頻閃。如果曝光時間和頻閃不一致,相機(jī)拍到的燈就會有亮暗相間的條紋。另外,由于與周圍物體的亮度相差大,相機(jī)拍攝晚上的紅綠燈容易過曝,尤其是左轉(zhuǎn)或者右轉(zhuǎn)的箭頭,識別不清。

Waymo想了一個辦法:給相機(jī)裝上一個灰鏡,強(qiáng)制延長曝光時間,以此解決紅綠燈的識別問題。侯聰透露,“為什么Waymo一圈有16個相機(jī),其中有8個都是為了看LED燈。不僅看紅綠燈,還有警燈和消防車燈,以及一些牌子上面的文字?!钡诙€例子是激光雷達(dá)。在很長一段時間里,市面上沒什么好的激光雷達(dá)可用,唯一可用的就是Velodyne,但是Velodyne的要價太高,導(dǎo)致Waymo的成本居高不下。

另一方面,Velodyne的產(chǎn)能非常低且經(jīng)常出問題,Waymo曾試著找Velodyne溝通,但對方明確表示暫時沒有改進(jìn)計劃,這讓谷歌感覺受制于人。這也是Waymo在硬件上大搞自研的核心原因。侯聰表示,Waymo幾乎所有零部件都不是車規(guī)級的,比如相機(jī)用的是索尼消費(fèi)級的傳感器。當(dāng)時的硬件條件下,車規(guī)級的相機(jī)只能達(dá)到800萬像素水平,但是Waymo需要的是一個4000萬像素、能有優(yōu)秀夜間成像效果的相機(jī),這就只能自研。降本,也是谷歌自研思路的一個考慮。

Waymo早期采用英特爾芯片作為計算平臺,主要是基于服務(wù)器CPU至強(qiáng)和FPGA加速卡。FPGA具有非常高的帶寬,但價格較高。為此,Waymo甚至還計劃自主研發(fā)芯片,但后來發(fā)現(xiàn)芯片研發(fā)的難度太大,技術(shù)迭代太快,難以實(shí)現(xiàn)固化而放棄。2017年,侯聰日后的創(chuàng)業(yè)搭檔于騫加入了感知組。于騫2001年從清華計算機(jī)本科畢業(yè),楊士強(qiáng)教授是他的系主任,于騫和美團(tuán)創(chuàng)始人王興是同學(xué)(清華電子工程系無線電專業(yè))。于騫讀博時,計算機(jī)視覺(CV)還是個冷門學(xué)科,圖形學(xué)比較熱,因為可以用在電影制作方面,容易變現(xiàn)。但于騫選擇CV是因為他在清華人工智能國家重點(diǎn)實(shí)驗室,跟隨張鈸院士。于騫一直堅定地認(rèn)為,“在人工智能領(lǐng)域,計算機(jī)視覺才是最接近智能的技術(shù)?!?/p>

于騫當(dāng)時,于騫做的是基于雙目視覺的無人車項目也使用單線激光雷達(dá)。在清華校園和周邊的開放道路上,于騫和他的同學(xué)們做了各種實(shí)驗。2013年底,于騫加入了谷歌地圖。一直到2017年2月,于騫做到了谷歌地圖的街景組關(guān)鍵項目技術(shù)負(fù)責(zé)人,谷歌內(nèi)部叫商業(yè)發(fā)現(xiàn)項目,目的是讓地圖不僅僅是給導(dǎo)航用,更要將大量的本地商業(yè)信息(類似餐館、加油站、商店等)增加到地圖元素中,尤其是通過谷歌大規(guī)模的街景數(shù)據(jù)高度自動化的完成本地商業(yè)信息的發(fā)現(xiàn)、定位、分類和匹配工作。當(dāng)時很少有人相信可以通過街景信息高度自動化的產(chǎn)生最新的本地商業(yè)信息,這部分工作幫助谷歌地圖完成面向本地化的轉(zhuǎn)變,保持了谷歌地圖的競爭力。在他看來,谷歌的工程師基礎(chǔ)非常扎實(shí)。

Waymo團(tuán)隊中的大多數(shù)工程水平甚至比谷歌還要高,篩選過程非常嚴(yán)苛。于騫回憶,創(chuàng)始人Larry Page和Sergey Brin都對Waymo很重視。Waymo內(nèi)部創(chuàng)新和技術(shù)氛圍很濃,特別是Sergey, 有時會和大家一起開會。Sergey穿著隨意,會穿著短褲進(jìn)來加入討論。還有一次,于騫邀請了發(fā)明GAN網(wǎng)絡(luò)的人Ian Goodfellow來做講座,于騫是那次講座的主持人。Sergey特別感興趣,陪著一起聽完了整個研討會,中午和大家一起吃午飯。“Sergey對技術(shù)非常關(guān)注,所以谷歌的demo能燒這么多錢往前走,源自創(chuàng)始人的支持?!敝旒芽≡f到,“Google的兩個創(chuàng)始人Larry Page和Sergey Brin都很開放、也很有使命感,他們樂意為這些長線項目買單?!鼻癢aymo感知組成員、美團(tuán)無人車感知負(fù)責(zé)人夏飛也直言,“別的不說,Waymo一次版本更新迭代就要花不少錢,還不算研發(fā)費(fèi)用,國內(nèi)很難有公司愿意砸錢評估?!痹诠雀韪邔拥闹С窒?,Waymo的商業(yè)化有了明顯起色。2018年12月,Waymo自動駕駛打車服務(wù)的產(chǎn)品Waymo One正式上線。摩根斯坦利給出Waymo1750億美元的估值,而前一年這個數(shù)字僅為700億美元。

02、投身創(chuàng)業(yè)大潮:智能駕駛與具身智能

估值膨脹的背后,是Waymo正在一步步擴(kuò)張與增員的事實(shí)。2018年,Waymo的感知組有將近200人,張一萌在內(nèi)部的職級是L6(Tech Lead),這個職級不低。然而,感知組的L6還有3、4個。張一萌只能分到一部分項目,她坦言,“感覺自己能做更多的事情,但只發(fā)揮了40%的能力”。另一方面,組織架構(gòu)的精細(xì)與流程化,意味著一個決策會牽動各方利益。2019年1月,The Information梳理了一份Waymo的組織架構(gòu)。這時候的Waymo有950名員工,在內(nèi)部被稱為“Waymonauts”,還有至少幾百名外包人員。

工程部是規(guī)模最大的團(tuán)隊,占了員工總數(shù)的三分之二,其他部門的規(guī)模相對較小。在這950名員工中,有350人屬于軟件工程團(tuán)隊,260人屬于硬件工程團(tuán)隊。張一萌表示,“在Waymo,想做出改變需要得到各個組的同意。真正實(shí)施的時候又要跟很多人溝通。發(fā)展到后期,Waymo就已經(jīng)是一個不可輕易調(diào)整的龐大‘系統(tǒng)’?!毙●R智行是張一萌接觸比較早的公司。當(dāng)時,張一萌和創(chuàng)始人彭軍在一家咖啡館見面,兩人感覺不錯。但張一萌還想看看其他機(jī)會,彭軍對她說:“我們肯定不怕(你去其他家),這個自信還是有的,去聊吧?!焙髞?,張一萌花了4、5個月的時間廣約面試,最終的選項只留下百度和小馬,她在百度的最后一輪面試官是李彥宏。但最終在2018年9月,張一萌選擇了小馬。

和她同一天入職的,還有現(xiàn)在小馬副總裁、廣州研發(fā)中心負(fù)責(zé)人莫璐怡。小馬員工評價,張一萌早期給公司做出的最大貢獻(xiàn)在于完善了小馬的感知閉環(huán)。入職后,張一萌發(fā)現(xiàn)小馬的短板在于,研發(fā)沒有形成數(shù)據(jù)驅(qū)動的方式。在0-1的創(chuàng)業(yè)初期,驗證代碼的最直接方式就是把代碼部署到車上跑一圈。但從1-10的階段,各個版本之間的差異不大,路測無法作出準(zhǔn)確的評價。這個時候,團(tuán)隊之間就會為了“上不上新的算法”而爭論,拖累研發(fā)節(jié)奏。張一萌在內(nèi)部提的概念是“Development Circle”,讓數(shù)據(jù)不僅僅在訓(xùn)練過程中發(fā)揮價值,而是進(jìn)一步在評價體系和仿真系統(tǒng)中進(jìn)行流轉(zhuǎn)。數(shù)據(jù)驅(qū)動的思維,也成為小馬研發(fā)體系的關(guān)鍵基礎(chǔ),并一直延續(xù)至今。2024年11月,小馬正式在美股上市,市值超45億美元。張一萌走后不久,于騫的本科同學(xué)、IDG資本合伙人??庹业搅怂?。??飧嬖V了他中國自動駕駛領(lǐng)域的創(chuàng)業(yè)機(jī)會。

后續(xù),于騫邀請侯聰一起組創(chuàng)業(yè)局。那時已是2018年底,侯聰覺得創(chuàng)業(yè)時間太晚,就考慮了半個月。一個小插曲是,早在2017年,侯聰就曾差點(diǎn)加入小馬智行。當(dāng)時,樓天城先聯(lián)系了侯聰,后來彭軍又找了侯聰三次,甚至帶上自己的夫人和侯聰夫婦共進(jìn)晚餐,但是最終因為各種原因,侯聰沒有加入小馬。在侯聰看來,彭軍是一個很稱職的CEO,為了招人盡心盡力。后來,張一萌要去小馬時,侯聰順勢推了一把說“這是一個很好的團(tuán)隊,是一個很好的機(jī)會?!焙髞?,半個月時間一到,于騫再找過來時,侯聰就答應(yīng)加入。最終,于騫、侯聰、大方、汪堃走到了一起,在硅谷一個深圳市政府做的名為“Shenzhen Lab”的孵化器里租了幾個工位,在孵化器門口找來一個集裝箱,買了一臺林肯進(jìn)行改裝,輕舟的創(chuàng)業(yè)故事就此開始。

輕舟分為L2量產(chǎn)和L4(無人駕駛小巴)兩條發(fā)展路線。在L2量產(chǎn)領(lǐng)域站穩(wěn)腳跟,離不開地平線與理想的支持,一個是給投資,一個是給定點(diǎn)。最早的時候,于騫在USC的師弟黃暢(地平線聯(lián)創(chuàng)兼CTO)都在硅谷的NEC Lab,地平線創(chuàng)始人余凱是當(dāng)時NEC Lab的主任,于騫和徐?。ǖ仄骄€首席生態(tài)官)的關(guān)系也很密切。有意思的是,在進(jìn)行智駕方案的芯片選型時,于騫最早見的人是黑芝麻智能的創(chuàng)始人單記章。當(dāng)時,黑芝麻的華山芯片還在設(shè)計階段,單記章問過于騫關(guān)于自動駕駛芯片的需求。不過,輕舟最終加入了地平線陣營。

余凱給輕舟投了一筆錢,幫助輕舟度過關(guān)鍵的早期階段。在此后的時間里,余凱經(jīng)常會給輕舟站臺,哪怕是輕舟自己的發(fā)布會。于騫對雷峰網(wǎng)說,“我們非常感激地平線和余凱,同時地平線也感激我們。因為在基于J5的中階方案上,我們承載了他們最大的出貨量?!陛p舟和地平線更應(yīng)該共同感謝的,其實(shí)是理想汽車。2020年9月,地平線發(fā)布了J3芯片。8個月后,J3量產(chǎn)上車?yán)硐隣NE。為了響應(yīng)理想的需求,余凱動用了地平線的全部精銳,組建了一支300人的團(tuán)隊派駐理想。在當(dāng)時經(jīng)歷了大瘦身的地平線里,這幾乎占據(jù)了總兵力的四分之一。理想ONE上市后一炮而紅,地平線迎來了大規(guī)模放量。次年,地平線的“J5”系列產(chǎn)品也用了不到7個月在理想L系列上實(shí)現(xiàn)了量產(chǎn)。2023年3月,輕舟開始與理想談合作,直到9月份才正式確定合作,這中間有著漫長的考察過程。當(dāng)時,理想正在考慮要把智駕芯片從J5換成英偉達(dá)的Orin,但最終沒有成行。由于聯(lián)創(chuàng)的Waymo背景,輕舟開發(fā)了很多底層工具。

與理想合作時,輕舟發(fā)現(xiàn)理想的工具質(zhì)量還有很大的提升空間,幫著它一起優(yōu)化。2024年8月底,于騫向雷峰網(wǎng)表示,“有40萬輛車裝載了我們的智能駕駛軟件。真正在車輛上應(yīng)用的軟件規(guī)模,我們還是最大的,這說明我們的穩(wěn)定性可靠性得到真正市場的考驗。”到了12月,輕舟官宣中高階智駕解決方案量產(chǎn)交付上車正式突破50萬套。

2019年從Waymo離職創(chuàng)業(yè)之前,于騫面試了一個人——星海圖的創(chuàng)始人高繼揚(yáng)。兩人見面是在2018年底,于騫是高繼揚(yáng)在USC(南加州大學(xué))的學(xué)長。高繼揚(yáng)在Ram(Ram Nevatia,南加州大學(xué)計算機(jī)科學(xué)系計算機(jī)視覺領(lǐng)域的研究專家)教授組里,跟他同組的還有地平線的黃暢。當(dāng)時黃暢正在念博士后,算得上是高繼揚(yáng)的大師兄。大四這一年,高繼揚(yáng)去商湯實(shí)習(xí)開始接觸AI。

在商湯的時候,他認(rèn)識了Momenta的創(chuàng)始人曹旭東。這個時候,高繼揚(yáng)已經(jīng)感受到了AI的潛力,讀博的時候切換了方向。在導(dǎo)師Ram教授的指導(dǎo)下,他僅用了3年半的時間就完成學(xué)業(yè),成為USC IRIS計算機(jī)視覺實(shí)驗室最快畢業(yè)的博士。因為用了很短的時間讀完博,所以高繼揚(yáng)自認(rèn)為沒有特別引以為傲的論文。但好處在于,高繼揚(yáng)趕在了好的時間點(diǎn)進(jìn)入自動駕駛行業(yè)。在Waymo,高繼揚(yáng)作為高級軟件工程師,參與了基于機(jī)器學(xué)習(xí)的行為預(yù)測項目,并和趙行、孫晨聯(lián)合發(fā)表了著名的VectorNet模型。(孫晨是高繼揚(yáng)的學(xué)長,當(dāng)初也是孫晨將高繼揚(yáng)引薦給Ram教授)

VectorNet是一個基于神經(jīng)網(wǎng)絡(luò)的預(yù)測和規(guī)劃算法。相比廣泛使用的ResNet ,VectorNet在預(yù)測的精準(zhǔn)度上提高了18%。更重要的是,它在進(jìn)行行為預(yù)測時占用的內(nèi)存僅為ResNet的29%,計算量也僅為后者的20%。論文發(fā)表之后,不少公司開始用圖神經(jīng)網(wǎng)絡(luò)的方式去做預(yù)測規(guī)劃。2021年1月,高繼揚(yáng)加入Momenta。Momenta是業(yè)內(nèi)知名的“卷王”,去車企駐廠是一件非常平常的事情。高繼揚(yáng)向雷峰網(wǎng)表示,“在服務(wù)客戶這件事上,我們就是服務(wù)員,保質(zhì)、保量、保時間。做技術(shù)的覺得技術(shù)過硬就可以,但沒有給客戶創(chuàng)造價值就等于零?!备呃^揚(yáng)對Momenta的日子心存感激,高繼揚(yáng)進(jìn)去之后向聯(lián)創(chuàng)孫剛匯報。孫剛的管理風(fēng)格是“無為而治”,但是他很會充分放權(quán)、捏合團(tuán)隊。在Momenta,從感知、定位、規(guī)控、泊車、行車、AI Infra,所有的事情高繼揚(yáng)都經(jīng)歷了一遍。

Momenta的第一個自動駕駛量產(chǎn)項目——車位檢測算法,就是由高繼揚(yáng)負(fù)責(zé)給博世交付。博世的研發(fā)中心在蘇州。高繼揚(yáng)帶領(lǐng)團(tuán)隊幾乎把蘇州一半的停車場跑了一遍。每個停車場采數(shù)據(jù)、訓(xùn)練,訓(xùn)完之后隨機(jī)找停車場泊車。為了建立客戶信心,高繼揚(yáng)向客戶承諾:一周一發(fā)版,版版有提升,在這樣的經(jīng)歷下,Momenta慢慢建立起了交付方法論。2022年4月份,Momenta給上汽做第一次交付,交付的第一個功能是泊車和車道保持。但在2022年春節(jié)前,Momenta的泊車成功率大概只有60%,高繼揚(yáng)被指派來負(fù)責(zé)泊車。由于出入不便,高繼揚(yáng)樓上睡覺樓下調(diào)車,把泊車成功率從60%提升到了95%。2022年6月,高繼揚(yáng)正式開始負(fù)責(zé)NOA領(lǐng)航輔助系統(tǒng)系統(tǒng),接手了規(guī)控、NOA系統(tǒng)研發(fā)團(tuán)隊。等2023年4月份交付完成后,已經(jīng)成為NOA負(fù)責(zé)人的高繼揚(yáng)在5月份提出了離職,正式投身創(chuàng)業(yè)大潮。

而他的創(chuàng)業(yè)伙伴,正是他在Waymo前同事、VectorNet網(wǎng)絡(luò)的合作者——趙行。趙行本科在浙大,后在MIT取得了博士學(xué)位,師從MIT AI&D (人工智能與決策)系主任Antonio Torralba教授——多模態(tài)深度學(xué)習(xí)的開創(chuàng)者之一。后來,趙行加入谷歌Waymo擔(dān)任研究科學(xué)家,負(fù)責(zé)算法方面的工作,是Research組的研究員。2020年底,趙行離開了供職一年半的Waymo。當(dāng)時,已經(jīng)創(chuàng)業(yè)的于騫曾經(jīng)向他伸出了橄欖枝。但趙行最終選擇去清華大學(xué)交叉信息院擔(dān)任助理教授。2024年3月,在英偉達(dá)GTC 2024上,理想發(fā)布了智能駕駛方案——“端到端 +VLM(視覺語言大模型)快慢雙系統(tǒng)”,其中VLM正是理想和趙行所在的清華MARS Lab的合作成果。VLM的能力在于,即使遇到從未見過(訓(xùn)練過)的場景,也能像人類一樣通過理解、分析、推理,最終安全應(yīng)對。按照李想的話說,“不再需要養(yǎng)幾千人的團(tuán)隊去搞corner case,而且團(tuán)隊越多corner case越多了。”也正是從這篇文章之后,理想的智駕進(jìn)度被大大提速,在2024年取得了肉眼可見的成果。趙行和圖森未來的前CEO侯曉迪也是朋友。

有一年CVPR上,侯曉迪找他喝酒,正好當(dāng)時一位MIT的老師也在。侯曉迪口才出色,這位老師聽后直接邀請侯曉迪去MIT講課。高繼揚(yáng)也認(rèn)識侯曉迪。剛畢業(yè)的時候,高繼揚(yáng)曾面試過圖森未來,聊技術(shù)問題時侯曉迪的壓迫感十足,這給高繼揚(yáng)的心理造成了“巨大壓力”。他對于侯曉迪的印象是:“很犀利、很sharp的人,他是傳統(tǒng)視覺出身,深度學(xué)習(xí)也很懂,兩者結(jié)合非常好?!?023年5月,趙行和星海圖的另一位聯(lián)創(chuàng)許華哲一起去非洲參加學(xué)術(shù)會議,當(dāng)時許華哲還在清華,他聽說趙行有具身智能方面的創(chuàng)業(yè)規(guī)劃,就找趙行了解。趙行表示,“不如來聊聊?星海圖現(xiàn)在也在籌建期。”于是,趙行就拉著許華哲跟高繼揚(yáng)一起吃飯,三人聊的非常投機(jī)。2023年9月5日,星海圖正式成立。十一假期的第一天,許華哲帶組里的PhD去郊游,郊游那天他決定加入星海圖。2024年11月,星海圖宣布完成超2億元Pre-A輪融資。

03、Waymo的故事仍在續(xù)寫

Waymo系出身的自動駕駛創(chuàng)業(yè)者,和“清華系”、“百度系”一樣,是自動駕駛領(lǐng)域繞不開的存在。于騫向雷峰網(wǎng)說過,“Waymo有一個中國人微信群,我在的時只有20多人,現(xiàn)在群成員已經(jīng)增加到500人了?!边@些在Waymo來來往往的華人,成為未來中國自動駕駛乃至具身智能領(lǐng)域的探路者。但是并不是所有人的離別,都是為了投身創(chuàng)業(yè)。

Waymo本身的一些問題,也是他們離開的重要原因。“架構(gòu)比較復(fù)雜。”這是前Waymo感知組成員、美團(tuán)無人車感知負(fù)責(zé)人夏飛談及離開的主要原因?!癢aymo不得不處理大量的長尾場景。Waymo需要下定決心簡化現(xiàn)有系統(tǒng),但這個取決于多方的認(rèn)知?!迸c他持有類似觀點(diǎn)是高繼揚(yáng)。在高繼揚(yáng)看來,Waymo在2021年后走下坡路,人才密度有所降低,這是因為Waymo的大方向有問題,與AI行業(yè)技術(shù)的發(fā)展規(guī)律相悖。AI有兩個衡量維度:失效成本,泛化性要求。

L4級自動駕駛的失效成本高,泛化性要求高。大語言模型對泛化性的要求高,但失效成本很低;具身智能失效成本高于大語言模型,但是顯著低于自動駕駛,同時對泛化性的要求也較低,因為具身智能的商業(yè)化過程是一個以崗位替代為核心邏輯的過程。高繼揚(yáng)表示,Waymo開城思路是從區(qū)域L4起步,這就決定了需要圍繞各個目標(biāo)城市來拆解任務(wù),系統(tǒng)里就產(chǎn)生了幾十個模型,每個模型背后都是一個小團(tuán)隊支持,在“人比事多”之后,大家會出現(xiàn)搶項目或者相互掣肘的現(xiàn)象;其次,Waymo是Google的子公司,CEO、CTO是職業(yè)經(jīng)理人,這對于一個沒有穩(wěn)定業(yè)務(wù)的創(chuàng)業(yè)公司不利,因為出錯之后無人負(fù)責(zé),也沒有人可以強(qiáng)力糾偏。也有人不太認(rèn)同高繼揚(yáng)的觀點(diǎn)。張一萌認(rèn)為,谷歌整體的文化是bottom up(自下而上)不是top down(自上而下)。

2014年,張一萌加入時,是Chris Urmson和Dmitri Dolgov在管理方向。但當(dāng)時Waymo是走在最前端的公司,沒有任何的參照可言。作為技術(shù)引領(lǐng)者,不像追隨者一樣有清晰的方向。在探索新東西的時候,自下而上會有更多創(chuàng)新的靈感。張一萌認(rèn)為,以現(xiàn)在的眼光去審視過去Waymo的做法有失妥當(dāng)。從2016年到2020年的這段時間里,最可用的方法就是將任務(wù)分成一個個小模型。當(dāng)時有很多學(xué)術(shù)論文確實(shí)是從研究大模型開始,但那個時候的GPU條件受限,不足以去支撐大模型?!癢aymo這樣的公司包袱會重一些,但是也在改變。

小馬當(dāng)年也是多個模型,前兩年才慢慢換成一個大模型的方式。如果小馬在2021年成立,肯定直接走大模型的路線?!睂τ?a class="article-link" target="_blank" href="/manufacturer/1000004/">特斯拉與Waymo的不同開城思路,張一萌仍然認(rèn)為,L4必須一個個城市去開,特斯拉的方式更適合L2。即使今天特斯拉去做L4,也一定是如此操作。有Waymo前員工贊同這一說法:“AI背景的人,或許對Waymo開城思路有所質(zhì)疑??梢院苊鞔_的感覺到,大部分人都是盲人摸象,只能看到自己領(lǐng)域里的東西。無人系統(tǒng)很復(fù)雜,雖然代碼都是公開的,但是很少有人能夠全部知道其他人在做什么。核心在于Waymo賣服務(wù),特斯拉賣車,不是Waymo傻或者笨,而是兩者的目標(biāo)不一樣?!?/p>

兩種不同的觀點(diǎn)對應(yīng)的是在不同歷史階段的技術(shù)路線選擇。對于Waymo來說,能走到今天已經(jīng)殊為不易。2023年,智能駕駛行業(yè)進(jìn)入低谷期,Waymo裁員137人且裁員范圍大部分集中在技術(shù)崗位。加上1月份的首輪裁員,Waymo共裁員209人,占到其員工總數(shù)的8%。不久前,通用宣布由于開發(fā)成本過高,將停止Cruise自動駕駛出租車業(yè)務(wù)。同時,其合作伙伴日本本田汽車也宣布將停止向Cruise提供資金。Waymo的同行者少了一位,當(dāng)初引領(lǐng)行業(yè)熱潮的Cruise匆匆下線。只有Waymo還在一直堅持。2024年10月,Waymo完成一輪56億美元的融資,這是Waymo迄今為止籌集的最大一輪融資。根據(jù)規(guī)劃,新的投資將用于加速與Uber的合作,并宣布將于2025年在美國奧斯汀和亞特蘭大推出Robotaxi服務(wù)。

自動駕駛是一場馬拉松,不是百米沖刺。時至今日,Waymo的成敗難以定義,但它是當(dāng)之無愧的自動駕駛之王?!癢aymo有一幫特別聰明的人,做事非常認(rèn)真、專業(yè),代碼質(zhì)量非常高。在全世界,你想找到第二個這樣的團(tuán)隊是不容易的?!睆腤aymo離開的這些人,正在繼續(xù)書寫智能駕駛和具身智能的江湖故事。

Waymo

Waymo

Waycom,第一家替代電信運(yùn)營商IDF中的云,新阿基坦。電信、主機(jī)和信息管理器。100%云電話。

Waycom,第一家替代電信運(yùn)營商IDF中的云,新阿基坦。電信、主機(jī)和信息管理器。100%云電話。收起

查看更多

相關(guān)推薦