4月11日,第八屆 HAOMO AI DAY舉辦。作為中國聚焦自動駕駛技術(shù)的盛會之一,這次AI DAY的行業(yè)關(guān)注度也很高。
過去在這個會上,毫末智行都會發(fā)布最新的一些自動駕駛行業(yè)技術(shù)動向,比如2021年9月發(fā)布的數(shù)據(jù)智能系統(tǒng),去年4月份舉行AI DAY上發(fā)布毫末城市NOH,發(fā)布毫末小魔駝2.0等。
今年的AI DAY,有一些特別。
2月17日,毫末智行宣布自動駕駛認知大模升級為DriveGPT,并表示將在AI DAY上公布進展。
DriveGPT的發(fā)布,宣告著自動駕駛正在邁進3.0時代,接下來毫末還會有什么動作,其實是外界比較關(guān)心的事情。比如,新技術(shù)能夠產(chǎn)生怎樣的影響?接下來行業(yè)會發(fā)生怎樣的變化?
這次AI DAY中也許就有答案。
自動駕駛生成式大模型升級:DriveGPT雪湖·海若
毫末的AI DAY,總是不讓人失望,每次都有新體驗、新技術(shù)、新動態(tài)。
三個月一次的舉辦節(jié)奏很有深意,而且每次都有重磅信息披露,科技行業(yè)要做到“季更”,其實不太容易,背后需要有充足的技術(shù)儲備和迭代能力,另外“季更”也能倒逼著企業(yè)研發(fā)不斷迭代。
這次AI DAY上,毫末主要宣布了這么幾件事:
發(fā)布DriveGPT雪湖·海若,MANA 架構(gòu)全新升級。
宣布與三大主機廠合作,量產(chǎn)裝機爭奪戰(zhàn)開始。
2024年毫末城市NOH落地百城。
末端物流與商業(yè)進一步落地。
信息量很大,但人們關(guān)注的焦點很清晰:業(yè)內(nèi)首個自動駕駛生成式大模型——DriveGPT雪湖·海若。
董事長張凱在演講中提到,毫末其實提前兩年就開始布局 AI 大模型,ChatGPT還沒有像現(xiàn)在這么人盡皆知。直到ChatGPT火了之后,人們對大模型才開始有所了解。
在打“提前量”這件事上,毫末還是很認真的,畢竟毫末是行業(yè)內(nèi)最早一批堅定做漸進路線的自動駕駛企業(yè),也是最早圍繞著商業(yè)化、落地去布局的玩家。
與ChatGPT相似的是,雪湖·海若也是通過RLHF(人類反饋學(xué)習(xí)強化學(xué)習(xí))算法,對自動駕駛技術(shù)本身進行優(yōu)化。
不同之處在于,ChatGPT用人們聊天對話輸入,然后用文字輸出,雪湖·海若(DriveGPT)則是輸入駕駛數(shù)據(jù),比如駕駛場景、駕駛習(xí)慣。輸出的是能力更強的自動駕駛技術(shù)。
相比技術(shù)細節(jié),其實更需要關(guān)注的是,雪湖·海若的發(fā)布意味著什么?
在談擎說AI看來,接下來可能會有這么幾個變化:
1、重塑了汽車智能化的技術(shù)路線。
過去的汽車智能化,更多是產(chǎn)品的智能化,并不是核心技術(shù)的智能化。
比如智能座艙,他能帶來智能化體驗,這個是用戶最能感知到的,比如語音交互、情感智能等等,主打智能化概念。做這種類型的智能汽車,需要的是產(chǎn)業(yè)整合能力,但缺的是核心技術(shù)護城河,這類車企最多,寒冬來了之后也最危險。
真正的智能化技術(shù)是能夠自我學(xué)習(xí),自我生長的,真正的自動駕駛,也應(yīng)如此。過去的自動駕駛技術(shù),本質(zhì)上還是需要人去優(yōu)化算法,調(diào)整參數(shù)。
雪湖·海若對行業(yè)最大影響在于,用技術(shù)去“培育”技術(shù),這可能會產(chǎn)生深遠影響。自此,自動駕駛技術(shù)自身有了自我進化的能力,自動駕駛技術(shù)演化的方式就此改變。
2、極大地拓展毫末城市NOH產(chǎn)品的能力,幫助毫末城市NOH進一步量產(chǎn)迭代。
雪湖·海若對行業(yè)的影響會更直接。按照毫末的說法是:DriveGPT 可以逐步應(yīng)用到城市 NOH、并且提升城市輔助駕駛的能力。
ChatGPT之所以強,是因為改變了AI本身演化的方式,更有效率,更成熟。
DriverGPT雪湖·海若則“重新開了一個主線”,人類反饋強化學(xué)習(xí)(RLHF)算法下,大量的老司機面臨的真實的場景數(shù)據(jù)去訓(xùn)練AI決策。
也就是說,在雪湖·海若的幫助下,將來毫末城市NOH的能力可能會更強,場景感知能力、自動駕駛能力也能快速迭代,搭載毫末城市NOH的車輛也能有“老司機”一樣的能力。
只要數(shù)據(jù)樣本夠多,那么城市NOH面臨的長尾場景問題,可能會更容易被解決,這有助于毫末城市NOH進一步量產(chǎn)迭代。
3、把行業(yè)帶入“大模型”時代。
發(fā)布會上,一個頗為重要的信息是,雪湖·海若的能力對行業(yè)來說是開放的。
目前,北京交通大學(xué)計算機與信息技術(shù)學(xué)院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等多家企業(yè)和機構(gòu)已經(jīng)加入。
毫末方面還表示, DriveGPT 會面向公眾逐步開放三大應(yīng)用場景,包括駕駛場景自動標注、駕駛行為驗證、困難場景脫困等。
自動駕駛技術(shù)發(fā)展到現(xiàn)在,硬件性能早已不是天花板,關(guān)鍵是自動駕駛感知決策能力以及數(shù)據(jù)樣本的量級。ChatGPT的成功表明,大模型可能才是行業(yè)最終的解決方案。
雪湖·海若的發(fā)布只是一個開始,接下來大模型在自動駕駛領(lǐng)域的應(yīng)用規(guī)模會更大。
自動駕駛3.0時代,量產(chǎn)導(dǎo)向、降本、規(guī)模化
過去,自動駕駛行業(yè)經(jīng)歷過估值高光也經(jīng)歷過寒冬。
整個行業(yè)從熱到冷再到熱,最后經(jīng)過驗證錘煉得出來一個方向:“行泊一體,量產(chǎn)為王”。
當(dāng)下行業(yè)中的玩家們也不再爭論L4還是L2,而是都埋下頭去做量產(chǎn)方案,去做滿足主機廠需求的方案。
原因很簡單,前裝市場的商業(yè)化規(guī)模在進一步增長。
毫末智行董事長張凱提到一個數(shù)據(jù):2022年中國乘用車市場L2及以上輔助駕駛前裝搭載率升至 29.40%,前裝標配交付 585.99 萬輛,預(yù)估2025 年高級別輔助駕駛搭載率超過 70%。
也就是說,行泊一體的解決方案NOA產(chǎn)品,將會在23、24年大規(guī)模落地。對于自動駕駛企業(yè)來說,這意味著服務(wù)主機廠需要的能力也在變化。
在談擎說AI來看,城市輔助駕駛來到前裝量產(chǎn)階段,技術(shù)之外,降本和規(guī)?;彩呛诵母偁幜Α?/p>
量產(chǎn)的1.0時代,需要的是工程化能力,所以一些L4廠商做L2的過程中,也需要補足工程化能力。到了量產(chǎn)的2.0時代,不僅需要工程能力,更需要降本增效能力。
但降本這件事,不僅靠供應(yīng)鏈資源整合能力,也靠的是對工程、技術(shù)的理解。
在降本上,毫末其實很有一套。
比如,毫末把視覺 BEV 感知框架引入到了車端魚眼相機,做到了在 15 米范圍內(nèi)達到 30cm 的測量精度,2 米內(nèi)精度高于 10cm 的視覺精度效果。結(jié)果就是,這樣的精度下,泊車場景下純視覺就能替代超聲波雷達,從而進一步降低成本。
再比如,海若DriveGPT的幫助下,可實現(xiàn) 4D Clip 數(shù)據(jù)自動化標注的規(guī)?;a(chǎn),降低行業(yè)使用數(shù)據(jù)的成本。據(jù)悉,單幀圖片整體標注成本僅相當(dāng)于行業(yè)的 1/20。
這些技術(shù)、工程能力,最終反饋到產(chǎn)業(yè)鏈上,就是終端車型的智能化成本可能會更低。長期來看,汽車終端市場價格內(nèi)卷是大趨勢,能幫助車企降低成本的一級供應(yīng)商,才是好的供應(yīng)商。
降本之后,終端價格打下來,城市輔助駕駛、自動駕駛產(chǎn)品才能進一步完成規(guī)?;?,合作伙伴才能越來越多。
規(guī)?;芰ι?,就是能不能持續(xù)打開新的市場,不斷地擴充“朋友圈”。
毫末也公布了最新的商業(yè)化進展:
DriveGPT 首發(fā)車型新摩卡 DHT-PHEV,即將量產(chǎn)上市;搭載毫末NOH車型即將上市;海若大模型進一步升級感知能力。
另外一個重要的消息是,毫末官宣了與三大主機廠合作。
毫末智行表示,目前已經(jīng)與三家主機廠簽署戰(zhàn)略合作協(xié)議,達成面向 L2+級別智能駕駛領(lǐng)域的全方位戰(zhàn)略合作,相關(guān)項目已經(jīng)在交付中。
這個簽約,其實很有分量。對于行業(yè)來說,意味著打響了量產(chǎn)裝機“爭奪戰(zhàn)”,是商業(yè)化的重要節(jié)點。
這靠的其實還是技術(shù)能力。
比如,技術(shù)的前瞻性。
目前,毫末被國際頂會收錄的學(xué)術(shù)論文達到 6 篇 ,最新的兩篇分別入選計算機視覺識別領(lǐng)域三大頂會之一的 CVPR 和全球首個智能車專業(yè)期刊 IEEE TIV,走在AI算法前沿領(lǐng)域。
技術(shù)壁壘夠強,就更容易打開商業(yè)化空間。
一方面,與三大主機廠達成合作,意味著毫末靠技術(shù)優(yōu)勢打破了汽車行業(yè)的“門派之見”,接下來商業(yè)化空間更大。
另一方面,最能體現(xiàn)技術(shù)能力,還是雪湖·海若DriveGPT。
DriveGPT對于自動駕駛公司來說,味著成長性,意味著引領(lǐng)行業(yè)的能力。
這就像是比亞迪的“刀片電池”,能夠代表行業(yè)最頂尖的能力,這讓毫末智行城市NOH有更多的信心走出去,成長為參天大樹。
談擎說AI認為,長期來看DriveGPT+前裝規(guī)?;?,會改變自動駕駛行業(yè)格局,DriveGPT正在把行業(yè)帶入一個全新的3.0量產(chǎn)時代。
技術(shù)驅(qū)動行業(yè)中,技術(shù)代差能快速改變市場格局。(這也是谷歌這么忌憚OpenAI的原因)
過去,自動駕駛行業(yè)中,大家其實技術(shù)水平整體差距沒有想象中那么大,而DriveGPT的出現(xiàn),可能意味著一次“技術(shù)爆炸”。
從ChatGPT2到ChatGPT4 的變化是明顯的,但OPEN AI的創(chuàng)始人透露,這里面其實更多的是數(shù)據(jù)量級的差異。
DriveGPT也是如此,訓(xùn)練的數(shù)據(jù)量越大,技術(shù)越成熟,越容易拉開與行業(yè)其他玩家的差距。
此次AI DAY上,毫末也透露出了自動駕駛數(shù)據(jù)智能體系 MANA的升級情況。
目前,MANA 計算基礎(chǔ)服務(wù)針對大模型訓(xùn)練在參數(shù)規(guī)模、穩(wěn)定性和效率方面做了專項優(yōu)化,感知和認知相關(guān)大模型能力統(tǒng)一整合到 DriveGPT 中。數(shù)據(jù)顯示,MANA 的學(xué)習(xí)時長超過 56 萬小時,虛擬駕齡相當(dāng)于人類司機 6.8 萬年。現(xiàn)在這些數(shù)據(jù)仍然在不斷增長。
數(shù)據(jù)量變會不會引發(fā)自動駕駛的“質(zhì)變”?自動駕駛行業(yè)中每個人都希望知道答案。
目前來看,這個最重要的問題,可能需要毫末來回答。
結(jié)語:
從此次AI DAY來看,DriveGPT很可能正在開啟自動駕駛的另一個時代。
自動駕駛未來是確定的,AI的未來也是確定的,問題在于實現(xiàn)的過程需要探索。這么多公司在前仆后繼,不斷改良,勇攀技術(shù)高峰,就是不斷探索的過程。
DriveGPT是自動駕駛行業(yè)階段性探索的成果。這個成果對于整個AI的發(fā)展也有重要意義,接下來AIGPT能力進一步深化,可能會有更多GPT 出現(xiàn)。
接下來,關(guān)于AI的歷史會如何書寫,值得期待。