對話 | 蓋世汽車CEO、蓋世汽車資訊總編?周曉鶯
撰文 | 蓋世汽車編輯 宋凡
當人工智能與汽車工業(yè)的齒輪緊密咬合,自動駕駛技術(shù)正以顛覆性的姿態(tài)重塑人類出行的未來。在這場全球化的技術(shù)競逐中,Mobileye——這家由計算機科學家Amnon Shashua教授掌舵的企業(yè),始終以“高性能”的引擎驅(qū)動行業(yè)邊界。從早期基于視覺感知的ADAS系統(tǒng),到即將量產(chǎn)的“可脫眼”自動駕駛方案“Chauffeur”,Mobileye用25年的技術(shù)積淀證明:真正的變革,不僅需要算法的突破,更在于成本、安全與全球化落地之間的極致平衡。
在接受蓋世汽車的C Talk高端系列訪談時,Amnon Shashua教授以學者與企業(yè)家交織的視角,勾勒出Mobileye的野心與務(wù)實。其核心武器——EyeQ系列芯片,通過“每秒幀數(shù)”這一實戰(zhàn)效率標尺,打破了傳統(tǒng)TOPS指標的桎梏,將算力競爭從紙面參數(shù)拉回真實場景。新一代EyeQ6芯片實現(xiàn)了十倍性能躍升,為第二代SuperVision多攝像頭系統(tǒng)的量產(chǎn)提供了堅實支撐。而面向?qū)⒂?027年發(fā)布的Chauffeur方案,Mobileye則試圖以較低的成本,實現(xiàn)高速公路場景下L3-L4級“合法可脫眼”駕駛。這背后,是Mobileye獨創(chuàng)的“冗余哲學”:通過成像雷達、路網(wǎng)智能技術(shù)與多子系統(tǒng)融合,壓縮故障率,構(gòu)筑自動駕駛的安全壁壘。
當行業(yè)陷入“端到端”的技術(shù)內(nèi)卷時,Mobileye以復合人工智能系統(tǒng)(Compound AI System)的實踐站穩(wěn)腳跟。Amnon Shashua教授明確指出:“消費級汽車的整個系統(tǒng)成本應(yīng)該控制在幾千美元,否則沒有商業(yè)意義。”而自動駕駛的未來,終將回歸到成本與規(guī)模化落地的理性競爭之中。交通出行領(lǐng)域的變革不是一輛酷炫的演示車,而是讓數(shù)千萬普通消費者用得起、敢信賴的技術(shù)。Mobileye的變革不僅預(yù)示著自動駕駛初級躍遷,更指向從“可脫眼”駕駛邁向全域無人駕駛的遠景——一個由技術(shù)進步驅(qū)動、共享出行理念重構(gòu)的新時代。
面對中國市場的蓬勃生機,Amnon Shashua教授毫不掩飾對其的重視。他表示,Mobileye已與極氪等品牌展開深度合作,實現(xiàn)技術(shù)方案在量產(chǎn)車型中的廣泛應(yīng)用,并致力于為中國車企的全球化戰(zhàn)略提供無縫對接。未來,Mobileye將繼續(xù)為中國車企提供全球化的技術(shù)支持,成為中國車企出海的“隱形橋梁”。
站在AI與物理世界交融的臨界點,這位身兼多家前沿AI公司創(chuàng)始人的教授,將Mobileye的未來錨定在“Physical AI”的疆域。“人工智能真的是刻進了Mobileye的DNA里?!?隨著AI在現(xiàn)實世界中更廣泛的應(yīng)用和擴展,未來,Mobileye的業(yè)務(wù)發(fā)展可能從汽車領(lǐng)域拓展至如機器人等其他領(lǐng)域,從單一場景進化到全域無人駕駛。或許正如他預(yù)言的那般:當“可脫眼”駕駛未來十年內(nèi)走進現(xiàn)實,人類與機器的協(xié)作范式將迎來新一輪重構(gòu)。而這場變革的密碼,早已深埋在Mobileye的基因里:用教授的深度思考,與企業(yè)家的廣袤視野,書寫技術(shù)普惠的真正答案。
在這場交通領(lǐng)域的變革中,Mobileye憑借其深厚的技術(shù)積累和全球化布局,正穩(wěn)步邁向自動駕駛的未來。接下來,讓我們通過Amnon Shashua教授的詳細解讀,深入了解Mobileye如何通過技術(shù)創(chuàng)新與戰(zhàn)略布局,推動自動駕駛的普及與變革。
以下為訪談實錄,對話
周曉鶯:您覺得您自己更偏向是企業(yè)家還是教授?
Prof. Amnon Shashua:兩個都是。
周曉鶯:那您更喜歡哪個身份?
Prof. Amnon Shashua:我都喜歡。
周曉鶯:但這兩個身份很不一樣。
Prof. Amnon Shashua:的確不同。作為教授需要專注于一個細分的領(lǐng)域然后深入研究。所以,這能產(chǎn)生的影響是有限的。作為企業(yè)家既能深入又能拓寬領(lǐng)域。因此,可以對社會產(chǎn)生更大的影響。而將兩者結(jié)合起來才是真正令人興奮的。既能深入研究,又能產(chǎn)生更廣的社會影響。
感知革新:Mobileye重塑出行新生態(tài)
周曉鶯:是的,我注意到,您創(chuàng)立了很多公司,Mobileye是其中之一。您能簡要介紹一下Mobileye的核心業(yè)務(wù)嗎?
Prof. Amnon Shashua:Mobileye最初是一家專注于視覺感知和攝像頭數(shù)據(jù)處理的公司,這是我們的DNA。能夠利用攝像頭輸入、視頻輸入,并以此詮釋交通場景,進而發(fā)展出高級駕駛輔助功能。這些駕駛輔助功能會警示你注意避免道路碰撞、在碰撞發(fā)生前及時剎車、提醒你注意路上行人、交通標志或紅綠燈信號等。理解場景并采取行動來減輕或避免碰撞事故的發(fā)生。這就是Mobileye成立的最初愿景,這也是我們收入的重要組成部分。
我們設(shè)計了一款非常高效的芯片——我們稱之為 “EyeQ”系列,現(xiàn)在已經(jīng)迭代到第六代。隨著時間的推移,我們開始業(yè)務(wù)擴張。在原有業(yè)務(wù)基礎(chǔ)上,我們開發(fā)出一套多攝像頭系統(tǒng)——我們稱之為 “SuperVision”。這套解決方案的首次推出是在中國市場。搭載它的是極氪 001 和 009 車型、以及極星4車型。它可以360度解讀交通道路場景,并支持在特定運行設(shè)計域內(nèi)實現(xiàn)可脫手駕駛。但駕駛員仍然需要對駕駛負責。駕駛員需要專注于路況,不能做其他事情。不過汽車本身已經(jīng)具備了可脫手駕駛的能力這就是目前我們所處的階段。
第一代SuperVision方案是在中國推出的,其搭載量超過了30萬輛汽車,為我們將復雜技術(shù)應(yīng)用到量產(chǎn)車型中帶來了大量實踐經(jīng)驗。
我們第二代SuperVision方案將于明年推出,搭載到奧迪、保時捷、以及整個大眾汽車集團的車型上,使用的是我們的EyeQ6芯片。新的方案計算能力提升了十倍。我們可以將更多AI技術(shù)融入系統(tǒng)中,提供的是功能更加強大、同時具備更高可用性的系統(tǒng)。
我們的愿景遠不止于此。我們相信,為了實現(xiàn)在交通出行領(lǐng)域的變革,必須從“需注視”的系統(tǒng)——即駕駛員駕駛時需專注路況,進化到“可脫眼”的系統(tǒng)——即駕駛員可以在駕駛中合法的做其他事情,無需專注路況。
我們將這樣的方案稱之為“Chauffeur”。首款Chauffeur方案將于2027年初在奧迪車型上實現(xiàn)量產(chǎn)搭載。它將先在特定設(shè)計運行域的高速公路上應(yīng)用。這套系統(tǒng)非常實用,可以以最高130 km/h的速度行駛、能夠?qū)崿F(xiàn)自動變道、自動跟隨路線、并允許駕駛員在行駛中合法做其他事情。
周曉鶯:這已經(jīng)是 L3 或接近 L4 的系統(tǒng)了。
Prof. Amnon Shashua:是的,這是 L3-L4 的系統(tǒng)。駕駛員仍需坐在駕駛位上,但同時可以在做其他事情,不需要專注路況。比如,你可以使用手機,實現(xiàn)“可脫手”、“可脫眼”的駕駛。
為什么說這是一次變革呢?因為一旦駕駛員在長時間駕駛中可以“脫眼”… 實際上,我們大部分駕駛是在高速公路上完成的。比如在美國,駕駛車輛從舊金山開到洛杉磯總共五小時車程,其中一小時是在市區(qū)道路,剩下四小時是在高速公路。假設(shè)這五小時中,你可以用四小時進行工作。
周曉鶯:對的,這樣可以節(jié)省很多時間。
Prof. Amnon Shashua:這是一種巨大的價值體現(xiàn)。因此,這顯然是一種顛覆性的變革。問題是,目前還沒有公司成功構(gòu)建出這樣的技術(shù)。原因是什么?
目前的成功經(jīng)驗,比如Waymo的Robotaxi。他們的技術(shù)路線是投入大量傳感器。如果你去他們展臺參觀一下他們的車輛,你會看到車上安裝了很多傳感器。這些傳感設(shè)備的成本加起來大概是幾萬美元,而這對于消費級汽車而言并不適用。消費級汽車的整個系統(tǒng)成本應(yīng)該控制在幾千美元,否則沒有商業(yè)意義。所以,還沒有人展示過如何用幾千美元的成本,實現(xiàn)既經(jīng)濟實惠、又能達到“可脫眼”駕駛系統(tǒng)所需的精確度。
與現(xiàn)有系統(tǒng)相比,這種精確度是質(zhì)的飛躍。
現(xiàn)有的“可脫手”駕駛系統(tǒng),即使是最好的系統(tǒng),平均干預(yù)間隔時間也只有幾個小時,5個小時、10個小時。而“可脫眼”駕駛系統(tǒng)要求的平均干預(yù)間隔時間需要在數(shù)萬小時到數(shù)百萬小時之間。因此,需要跨越如此巨大的障礙,才能實現(xiàn)從“需注視”駕駛到“可脫眼”駕駛的過渡。
不是一個平穩(wěn)的過渡,而是一個飛躍性的進步。這正是 Mobileye 的目標所在,也是 Mobileye 90% 的精力所在。我們致力于構(gòu)建這類技術(shù),因為它將帶來一場出行變革。
我們是從“Chauffeur”方案開始。同時,我們也在研發(fā)無人駕駛出租車(Robotaxi)。等會兒我們參觀展臺時,我會向您介紹基于大眾汽車旗下ID Buzz平臺打造的Robotaxi。
因此,“Chauffeur”方案是創(chuàng)造出行變革的第一步。Mobileye 95% 的精力都用在構(gòu)建實現(xiàn)這一目標的技術(shù)。
AI定義競爭新格局
周曉鶯:立足起點,展望未來,我們看到了人工智能的崛起。人工智能現(xiàn)在成為一個熱門話題,它改變了很多行業(yè)的工作和生活方式。那么 Mobileye是如何將 AI 技術(shù)融入到實際應(yīng)用中的?
Prof. Amnon Shashua:過去十年的人工智能變革極其重要,它改變了一切。
這一切始于 2012 年的深度神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)使開發(fā)者能夠?qū)⒃紙D像和視頻輸入到神經(jīng)網(wǎng)絡(luò)中,從中找到場景中的物體,例如車輛。在深度神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前,開發(fā)者需要通過其他方式提取圖像中的特征,然后用機器學習從特征中識別物體。有了深度神經(jīng)網(wǎng)絡(luò),輸入原始圖像和視頻就能進行檢測。但這需要一些創(chuàng)新能力,將二維圖像中的感知數(shù)據(jù)提升到三維,并整合來自多個攝像頭的信息。
隨著Transformer模型的問世,下一個飛躍出現(xiàn)在2017年。它也是ChatGPT等語言模型構(gòu)建的基石。
其突破在于能夠在不同領(lǐng)域之間建立協(xié)同性。在Transformer出現(xiàn)之前,計算機視覺需要專門的知識體系、自然語言處理也需要一套專門知識、語音或聲學處理又需要另一套專業(yè)知識。而Transformer出現(xiàn)后,這一切趨于統(tǒng)一。
為什么呢?因為Transformer可以將輸入源轉(zhuǎn)化為詞元,也就是“tokens”。然后有一套模型逐一處理這些tokens,這種方法叫做“自回歸”。輸入一些tokens,然后預(yù)測下一個token。接著,把輸出內(nèi)容也轉(zhuǎn)換為tokens。然后,這個模型從輸入tokens轉(zhuǎn)換到輸出tokens。
它并不在意這些tokens是否來自圖像、是否來自語言、或是聲音、或是其他來源。于是,所有這些不同的學科融合為一體。這是一個重大突破。它為我們這個領(lǐng)域帶來了從原始圖像中提取多攝像頭的圖像,直接生成三維感知的能力。
可以將車輛直接放置在三維空間中,而不再需要先經(jīng)過二維的處理,然后拼接各部分,再構(gòu)建三維感知。這極大加速了圖像處理能力。這是一個巨大的變革。
在Mobileye,我們正所做的是,利用所有這些Transformer技術(shù)以及即將發(fā)布的下一代芯片EyeQ6,以非常高效的方式賦能我們達到非常高的精確度。
我的意思是,看一下現(xiàn)在的AI 系統(tǒng),比如ChatGPT。它們的優(yōu)化并不在精確度上,它們的優(yōu)化側(cè)重于可用性上。如果把 GPT-3、GPT-o1 等進行對比,會有什么變化?
語言模型能解決越來越多的問題,但精確度提升并不大。精確度是指——你問一個問題,它是否給出了正確答案?它可能會產(chǎn)生“幻覺”,可能會給出錯誤的答案。所以,它們的優(yōu)化側(cè)重于可用性,而不是精確度。
如果你想開發(fā)出“可脫眼”駕駛的自動駕駛汽車,你要優(yōu)化的就是精確度。而這正是僅僅依靠數(shù)據(jù)驅(qū)動引擎會遇到的問題。比如說,以攝像頭為例,如果只是通過不斷輸入數(shù)據(jù)來訓練,是否可以達到如此高的精確度?目前還沒有人能夠給出答案。
機器學習系統(tǒng)并未優(yōu)化精確度,它們的優(yōu)化側(cè)重于可用性。因此,你需要做些不同的事情。我們正在做的這件與眾不同的事的靈感來自航空領(lǐng)域,就是飛機。飛機恰恰是一個需要極高精度的機器。飛機不會突然從天上掉下來。
周曉鶯:的確,這絕對無法接受。
Prof. Amnon Shashua:那么它們是怎么做到的呢?它們通過創(chuàng)建冗余機制,每個功能都由多個子系統(tǒng)來實現(xiàn)。這些子系統(tǒng)執(zhí)行相同的任務(wù),從而形成倍增效應(yīng)。假設(shè)一個系統(tǒng)有一定的故障率,如果再增加一個故障率相同的系統(tǒng),故障率將會呈現(xiàn)平方關(guān)系,實際上達到了故障率相乘的效果。也就是說,通過多子系統(tǒng)的配置,可以非??焖俚剡_到極高精度。
我們在Mobileye面臨的問題是——如何設(shè)計這些子系統(tǒng)才能提高精確度?
除了攝像頭之外,我們需要開發(fā)另一種傳感器。它的性能要求與攝像頭相當,但其工作原理則與攝像頭完全不同。于是,我們開始研發(fā)成像雷達。
這些雷達是高清的,分辨率非常高。它們的輸出與攝像頭相似,但原理完全不同。它們能夠在任何天氣條件下工作。但它們的故障點與攝像頭完全不同,從而實現(xiàn)了另一套獨立的系統(tǒng)。那現(xiàn)在就有了兩套子系統(tǒng)——一套來自成像雷達,一套來自攝像頭。
此外,我們也開始在軟件中設(shè)計更多子系統(tǒng)。例如,可以把地圖看作一種傳感器,將攝像頭看到的視圖看作另一種傳感器?,F(xiàn)在,你擁有兩套獨立的信息,可以將它們?nèi)诤显谝黄?、結(jié)合起來,這就形成了冗余。
核心在于,如何將一個問題分解為多個子系統(tǒng)從而提升精確度。因為這就是關(guān)鍵所在。如果無法達到如此高的精確度,就無法構(gòu)建“可脫眼”的自動駕駛系統(tǒng)。你只能停留在“需注視”駕駛階段。雖然這也是一個不錯的產(chǎn)品,但它并不是革命性的。
革命性的變化指的是,具備讓駕駛員“可脫眼”駕駛,去合法做其他事情的能力。例如,使用智能手機,或者小憩,但無需專注路況。這是最大的挑戰(zhàn)。
周曉鶯:當行業(yè)邁入AI時代,競爭難度是增加了還是減少了?
Prof. Amnon Shashua:要想回答這個問題,我們要回到關(guān)于語言模型的討論。
有很多公司都在構(gòu)建語言模型,比如名列前茅的OpenAI和Anthropic、還有Google的Gemini。目前這條賽道擠進了超過 100 家公司,這些公司構(gòu)成了一個長尾效應(yīng)。
現(xiàn)在有一個網(wǎng)站叫Chatbot Arena。這個網(wǎng)站會對市面上所有語言模型進行排名。但他們的排名方式不是通過基準測試,因為如今的基準測試都存在偏差。那些聲稱自己通過了基準測試的說法不夠可信。因為這些系統(tǒng)是在整個互聯(lián)網(wǎng)環(huán)境下訓練的,這也就包括了這些基準測試的數(shù)據(jù),所以就很難準確評估。
所以他們采用了眾源方式——當一個人提問時,他會收到來自兩個不同語言模型的答案,然后需要評估哪個答案更合適。通過這種方式,他們就能對所有語言模型進行排名。當然,OpenAI和Anthropic排在了最前列,后面則是一個巨大的長尾市場。
所以,現(xiàn)如今想處于行業(yè)中游位置比五年前容易得多。但處于中游位置并沒有多大意義,因為99% 的使用量都來自前兩家公司。
我們所在領(lǐng)域的情況也類似。如今想打造一輛性能不錯的演示車比五年前容易很多。但要從一輛演示車到覆蓋多款車型、多家主機廠的規(guī)?;慨a(chǎn),就是一個巨大的飛躍。再比如,打造一輛可以連續(xù)自動駕駛半小時或一小時而無需人工接管的車是一回事,但要打造一輛100 萬小時才需要人工接管一次的車則完全是另一回事了。
所以,想要躋身行業(yè)頂尖仍然非常困難,而處于行業(yè)中游位置現(xiàn)在比五年前容易得多,但這毫無意義。
周曉鶯:我認為處于中游或中游以下毫無價值。
Prof. Amnon Shashua:沒錯,這毫無價值。
技術(shù)與執(zhí)行力鑄就未來基石
周曉鶯:那么,Mobileye的優(yōu)勢是什么?是如何保持行業(yè)領(lǐng)先的?
Prof. Amnon Shashua:這涉及的方面很廣,并不是只靠人工智能或軟件,遠不止這些。
首先是芯片。我們的芯片非常高效且成本很低,這使我們能夠以非常實惠的價格構(gòu)建系統(tǒng)。同時,我們的芯片還專為運行我們構(gòu)建的人工智能堆棧而設(shè)計,這是我們的一大優(yōu)勢。
第二個優(yōu)勢是,我們暫時把人工智能放一邊,談?wù)勅斯ぶ悄苤獾氖虑?。另一個優(yōu)勢是我們可以通過智能路網(wǎng)技術(shù)來構(gòu)建高精地圖。例如,歐洲大部分地區(qū)、美國大部分地區(qū)已經(jīng)通過我們的技術(shù)完成了繪制。
第三個優(yōu)勢是數(shù)據(jù)。我們擁有650PB的數(shù)據(jù)。這是一個巨大的數(shù)據(jù)量,其中有300PB是視頻數(shù)據(jù)。換而言之,我們擁有數(shù)千萬小時的錄制視頻數(shù)據(jù),遍布全球?!氨椴既颉狈浅V匾?。因為,如果你只在某個地區(qū)擁有大量數(shù)據(jù),那么當你在另一個地區(qū)駕駛時,系統(tǒng)表現(xiàn)是否一樣呢?它也許并不能正常運作,它可能屬于分布外的數(shù)據(jù)。因此,你需要覆蓋全球的數(shù)據(jù),這也是Mobileye的優(yōu)勢之一。在過去的25年里,我們積累了大量數(shù)據(jù)。
其次,我們還擁有龐大的基礎(chǔ)設(shè)施以及便捷的數(shù)據(jù)訪問方式。比如說,你碰到一個邊緣情況,即使你只是口頭描述它——例如,路上有一輛車翻車了。我們的技術(shù)和搜索引擎在你口頭描述一輛車在路上翻倒時,它就在650PB的數(shù)據(jù)庫中搜索并反饋給你翻倒在路上的車的相關(guān)圖片。
我們利用這些數(shù)據(jù)不斷完善和優(yōu)化系統(tǒng)。我們擁有龐大的模擬器、豐富的硬件環(huán)路,使得系統(tǒng)可以在一夜之間運行數(shù)萬小時的數(shù)據(jù)。一夜之間,也就是成千上萬的系統(tǒng)共同運行,就是一個巨大的執(zhí)行機器。
Mobileye至今已銷售并交付了超過1.9億顆芯片。也就是說,全球有超過1.9億輛車正在使用Mobileye的技術(shù),差不多占全球所有汽車總量的15% 左右。這非常了不起。有超過1200款車型正在使用Mobileye芯片。這一切都為我們提供了大量的經(jīng)驗和技術(shù)積累。
在人工智能之前,Mobileye強在執(zhí)行。
執(zhí)行力強意味著你可以以最優(yōu)的成本帶來最好的技術(shù),因為成本很重要。如果你只有非常優(yōu)秀的技術(shù),但成本很高,那么你在量產(chǎn)上會受限。如果你能做到低成本,但技術(shù)不夠先進,那你同樣會受到限制,并且使用場景也會受限。Mobileye做到了兩全其美——既有高質(zhì)量的產(chǎn)品,同時又將成本壓到很低。
那說到人工智能,更是我們的專長所在了。
我本人是一名計算機科學教授,我的專長就是人工智能。我擔任教授已經(jīng)有20年了。我的同事Shai Shalev-Shwartz 是Mobileye的首席技術(shù)官(CTO),同樣是一名計算機科學和人工智能領(lǐng)域的教授。
我是數(shù)家人工智能公司的聯(lián)合創(chuàng)始人,包括機器人領(lǐng)域的Mentee Robotics公司、人形機器人和語言模型領(lǐng)域的AI21 Labs公司。我最近又創(chuàng)立了一家新公司名叫Double AI,致力于研發(fā)下一代人工智能,一種可以取代如牛頓和愛因斯坦這個層級專家的人工智能。如何才能創(chuàng)造出能夠解決只有愛因斯坦才能解決的問題的人工智能呢?這是我正在研究的另一個領(lǐng)域。
所以人工智能真的是刻進了Mobileye的DNA里。當把所有元素結(jié)合起來,你會發(fā)現(xiàn)Mobileye是一家非常獨特的公司。
Mobileye的宏遠藍圖與未來航向
周曉鶯:是的。我們可以看到,在我們這個時代,新技術(shù)正源源不斷地涌現(xiàn)。展望未來,十年之期,您認為Mobileye的未來會是什么樣的?
Prof. Amnon Shashua:Mobileye的愿景首先是——以實惠的價格實現(xiàn)“可脫眼“的自動駕駛技術(shù),成本幾千美元左右。
從高速公路開始,然后逐步拓展到更多類型的道路,最終在消費級汽車層面實現(xiàn)完全無人駕駛。不是在無人駕駛出租車層面,而是消費級汽車層面。所以第一次革命是實現(xiàn)“可脫眼”的駕駛。
第二次革命是實現(xiàn)車內(nèi)無需駕駛員的駕駛。這意味著什么呢?這意味著,一個家庭只需一臺車。我開車上班然后讓車自己開回家,因為車內(nèi)不需要司機。
周曉鶯:是自動駕駛。
Prof. Amnon Shashua:這將會是又一場變革。因為它改變了我們今天對車輛的所有權(quán)和使用方式。我們所需的車輛的數(shù)量將大幅減少,而出行的保障依然不變。我認為這是在我們的十年規(guī)劃末期可能實現(xiàn)的愿景,也就是從現(xiàn)在起至少六七年之后的事情。
那在近兩三年之內(nèi),從“可脫眼”的自動駕駛技術(shù)開始,逐年進步,提供越來越多的應(yīng)用場景,直到可以在消費級汽車層面做到完全無人駕駛。
周曉鶯:大概五年后?
Prof. Amnon Shashua:差不多五到七年,八年的樣子。
周曉鶯:很快就會實現(xiàn)。
Prof. Amnon Shashua:在我們這個行業(yè),十年內(nèi)都可以稱為是“不久的將來”。
另外,我認為未來Mobileye的業(yè)務(wù)會隨著人工智能在現(xiàn)實世界中更廣泛的應(yīng)用而擴展,比如到機器人領(lǐng)域。我認為,Mobileye將會成為在現(xiàn)實世界中運用AI技術(shù)的公司。我聽過一個很不錯的名字,是黃仁勛在一次演講中提到的“Physical AI”。我預(yù)期中的Mobileye就是一家可以量產(chǎn)“Physical AI”技術(shù)的公司。
周曉鶯:不僅僅是在汽車領(lǐng)域?
Prof. Amnon Shashua:是的,不局限于汽車領(lǐng)域。首先攻克汽車行業(yè),然后再向其他領(lǐng)域拓展。
自動駕駛的終局不止端到端
周曉鶯:談及智能駕駛領(lǐng)域,目前,我們看到有很多公司都在應(yīng)用端到端技術(shù),您對此有什么見解?
Prof. Amnon Shashua:關(guān)于端到端技術(shù)討論有很多,我認為這些議論沒有太大意義。即使某個公司聲稱 “我們正在做端到端” ,實際上他們做的不止是 “端到端”。
到底什么是“端到端”?
“端到端”就是,比如說,以攝像頭為例,你拿視頻信息作為輸入,那輸出將是控制指令。Mobileye也在做“端到端”。在我CES新聞發(fā)布會的演講中,我展示了一段Mobileye的視頻。那就是一個端到端——從圖像輸入到控制輸出。
Mobileye與其他做“端到端”的公司的不同在于,他們主張,只要有端到端就可以解決所有問題,但Mobileye認為,還需要冗余。僅僅有“端到端”是不夠的,你需要額外的路徑來創(chuàng)建子系統(tǒng)。不僅涉及傳感器的多樣化,還需要有不同的算法。所以,端到端只是其中一條路徑,還有需要其他額外的路徑——我們稱之為復合人工智能系統(tǒng)。
因此,Mobileye的方法是,端到端是復合人工智能系統(tǒng)中的一個組成部分。
周曉鶯:好的,這是一個不同的洞見。你們認為,“端到端”并不是全部。
Prof. Amnon Shashua:是的,端到端是一個元素,一個部分,然后還有其他部分。
算力衡量新視角
周曉鶯:當下的自動駕駛領(lǐng)域,我們看到很多公司都在算力上展開競爭。您認為,算力越高越好嗎?還是其實有其他途徑來解決問題?
Prof. Amnon Shashua:算力確實是一個必要條件。因為如今的AI技術(shù)需要越來越強的算力來支撐。問題是,如何衡量算力?標準的衡量方法是每秒萬億次操作,也就是所謂的TOPS。Mobileye認為這是錯誤的衡量標準。
周曉鶯:錯誤的?
Prof. Amnon Shashua:我們認為,應(yīng)該有其他指標來科學地衡量芯片的效率。所以Mobileye衡量的是每秒幀數(shù)。拿一個算法,看看這顆芯片運行起這個算法來每秒可以處理多少幀畫面?
例如,我們展示了EyeQ5和EyeQ6的差異。用TOPS衡量的話,差異只是兩倍。但用每秒幀數(shù)衡量,差距是10倍。
周曉鶯:居然有10倍的差距。
Prof. Amnon Shashua:這意味著在使用TOPS和每秒幀數(shù)衡量之間,會產(chǎn)生巨大的差異。所以我們認為,每秒幀數(shù)這個數(shù)值才真正有意義,因為它直接反映了芯片能夠輸出的實際性能。
打個比方,有一個算法,我更關(guān)心的是運行這個算法的速度到底有多快。至于TOPS,并不十分重要。因為芯片內(nèi)部通常集成了多個加速器,它不僅僅是CPU,還有其他專用硬件加速器。而且,這些額外的加速器,即使我們競爭對手的芯片,比如英偉達的,也有多種類型的加速器,而不僅僅是GPU。
因此,用TOPS衡量等于把所有東西都放在一個籃子里。但每個加速器都有其最合適的工作負載,所以每秒幀數(shù)才是衡量效率的最佳標準。這也是Mobileye衡量芯片效率的方法。
我們的EyeQ6芯片性能足夠強大,通過合理芯片配置,可以支持我們所需的全部自動駕駛功能。我們的系統(tǒng)配置是從單顆EyeQ6芯片開始,我們稱之為環(huán)視ADAS——包括前置攝像頭、四個泊車攝像頭和環(huán)繞式雷達,僅需一顆EyeQ6芯片即可。
SuperVision方案配備了兩顆EyeQ6芯片,包括車身的11個攝像頭和若干雷達作為可選項。
“可脫手”的Chauffeur方案則用了三顆EyeQ6芯片;Robotaxi方案配備了四顆EyeQ6芯片。
到2027年,EyeQ6將被EyeQ7迭代替換掉。EyeQ7將會具備更強勁的性能。也就是說,原來需要兩顆EyeQ6的系統(tǒng)未來只需一顆EyeQ7芯片。原來需要四顆EyeQ6的系統(tǒng)將被兩顆EyeQ7芯片取代。這樣一來,進一步實現(xiàn)了成本優(yōu)化。
周曉鶯:成本的降低,是客戶最期待的結(jié)果。
Prof. Amnon Shashua:歸根究底,一切都是對成本和性能的優(yōu)化。你需要兩者兼俱。當前的大環(huán)境下,只抓其中一頭是遠遠不夠的。
全球視野賦能中國車企走向世界
周曉鶯:您在去年到訪了中國,您有沒有親自體驗過中國的電動車?
Prof. Amnon Shashua:中國的“可脫手,需注視”的智能駕駛功能令人印象深刻,極其令人印象深刻。它們成本更高一些、需要更強的算力支撐、搭載了更多的傳感器,但在性能方面表現(xiàn)確實非常非常出色。
周曉鶯:現(xiàn)在,越來越多的中國車企都在希望走向全球市場,您認為它們將面臨哪些挑戰(zhàn)?有什么建議嗎?或者Mobileye可以在海外市場為它們提供哪些幫助?
Prof. Amnon Shashua:我們在中國的大多數(shù)客戶都是具備全球化雄心的中國車企。事實上,今年,我們預(yù)計ADAS產(chǎn)品將會在中國市場增長約40%。這正是得益于這些有全球化拓展計劃的中國車企,比如奇瑞、吉利等。
Mobileye的優(yōu)勢在于,我們的系統(tǒng)可以在全球范圍內(nèi)無縫適配。車企不需要為每個目標市場單獨收集數(shù)據(jù)。與這些有全球拓展計劃的中國車企合作,為我們帶來了在中國市場可持續(xù)發(fā)展的機會,且還將不斷增長。
地域差異中鋪就自動駕駛之路
周曉鶯:談到自動駕駛的發(fā)展,不同國家和地區(qū)的開發(fā)進程和實際應(yīng)用場景存在明顯差異。從您的角度看,真正意義上的自動駕駛將如何在部分地區(qū)實現(xiàn)?哪個地區(qū)會是率先實現(xiàn)自動駕駛的呢?
Prof. Amnon Shashua:這正是地圖變得至關(guān)重要的地方,也就是高精地圖。
因為如果把地圖看作記憶的話,當你開車經(jīng)過一個你曾經(jīng)到過的地方,你會感覺更加自在從容。而當你開車進入一個陌生的區(qū)域時,你會更加專注,因為這個地方對你來說是未知的。所以把地圖看作記憶的話,有了這些“記憶”,你就能更輕松實現(xiàn)全球范圍的拓展,比起你第一次進入一個未知的地方要輕松許多。
初次接觸一個地方時,會遇到全新的駕駛文化、交通規(guī)則等。但這些挑戰(zhàn)都可以通過“記憶”被化解。因此,地理拓展的關(guān)鍵因素之一,就是能夠獲取全球范圍內(nèi)的地圖支持。
AI時代:挑戰(zhàn)與機遇并存
周曉鶯:好的,最后一個問題。我想請問教授關(guān)于教育和人工智能的問題。由于人工智能發(fā)展迅猛,我常常思考未來教育會怎樣?尤其是對于孩子們來說,他們應(yīng)該學些什么來才能更好的應(yīng)對將來?
Prof. Amnon Shashua:首先,我們聊一下谷歌的搜索革命。二十年前,那些有大量事實知識的人,常常被奉為非常聰明,非常有才智的人。但現(xiàn)在,人們會覺得記住這么多事有必要嗎?谷歌一下就什么都知道了。
我認為這個現(xiàn)象在未來會被進一步放大。當你擁有人工智能時,那些重復性任務(wù)——像是把文章主旨提煉出來、或是把多篇文章結(jié)合起來寫一篇綜合總結(jié)、甚至創(chuàng)建計劃之類的事情,都可以通過AI自動完成。所以,現(xiàn)在人類需要思考哪些是機器做不到的?這就是將來能區(qū)分成功的人類與不太成功的人類的關(guān)鍵所在。
從今天來看,成功的人類不再是那些有大量事實知識的人,因為一切都可以搜索獲取。而且AI也會有它的局限性。我認為AI會是人類一個非常有用的工具,來幫助人類提高生產(chǎn)力。而那些不懂得如何使用AI的人將會被時代拋在后面。
所以,在教育層面,學習如何使用AI是至關(guān)重要的。這意味著老師們需要更加努力。因為你需要能夠設(shè)計出就算學生使用了AI工具,做起來難度也比較高的作業(yè)。不能假設(shè)他們不會使用AI工具。所以你需要給他們設(shè)計一些就算他們拿AI工具去完成,依然很有挑戰(zhàn)性的作業(yè)去做,讓他們必須付出努力才能完成。
因此,教育的挑戰(zhàn)在于老師需要布置比現(xiàn)在更有難度的作業(yè)。
周曉鶯:這很難。
Prof. Amnon Shashua:這是一項巨大挑戰(zhàn)。