作者:熊宇翔,編輯:羅松松
不久前,退網(wǎng)多時的李想再次出現(xiàn)在公眾視野。歸來的李想一改往日單人演講式的發(fā)言方式,選擇了用接受媒體采訪的對談方式,探討了理想汽車在人工智能領(lǐng)域的戰(zhàn)略布局和未來愿景。
當(dāng)然,形式雖然變了,但李想依然理想,本次對談保持了他一貫高信息密度、體系化的談話輸出。
上一次還是在2023年春天,李想選擇的主題是如何理解造車。這一次,李想的主題已經(jīng)進(jìn)化成了如何理解AI,以及,如何用造車通向AGI。
對這一次主題略顯宏大的談話,各方質(zhì)疑正如采訪者張小珺所問:一個造車時選擇用增程開局的實用主義者,怎么似乎突然間變成了擁有宏偉AI愿景的理想主義者?
李想沒有直接回答,但三小時的問答和理想過去九年的實踐,本身構(gòu)成了回答:做不做AI對他來說不構(gòu)成問題,何處切入AI,何時All in AI,如何做好AI,才是真正的問題。
為什么從造車All in AI
作為一個相信AI的創(chuàng)業(yè)者,李想為什么不直接做AI,而要從造車切入AI?
看起來和問題關(guān)系不大,但最底層的回答是:為了更好地改造物理世界。這個答案的產(chǎn)生,則要追溯到十年甚至更早之前。
2013年,汽車之家在美上市,市值突破30億美元,成為國內(nèi)最成功的汽車網(wǎng)站。這段創(chuàng)業(yè)中,李想培養(yǎng)了對市場的需求洞察、對產(chǎn)品的精準(zhǔn)定義的能力,也錘煉了帶隊打勝仗的能力和對創(chuàng)業(yè)節(jié)奏的把握能力,同時,積累了財富和投資人的信任。
但李想創(chuàng)業(yè)最大的遺憾也恰恰來自這段經(jīng)歷——選擇的創(chuàng)業(yè)領(lǐng)域過于垂直,以至于“為了一棵樹,錯過了一片森林”。
李想不止一次地用零售電商和汽車電商的命運分野,分析了這種遺憾。
在移動互聯(lián)網(wǎng)熱潮期,零售電商們不僅在線上提供了交易平臺,也顯著地改變了零售在線下的倉儲、物流、交付等環(huán)節(jié),革命性地提升了效率。基于對現(xiàn)實中零售業(yè)態(tài)巨大改造釋放出的價值,零售電商成長出多家千億乃至萬億級企業(yè)。
同一時期,汽車之家與其他同行嘗試用電商改造汽車零售,卻均以失敗告終。究其原因,汽車交易有更多無法被壓縮的環(huán)節(jié)發(fā)生在真實的線下而非虛擬的線上。對于一家大部分業(yè)態(tài)都在互聯(lián)網(wǎng)上,自身體量又有限的企業(yè),大規(guī)模改造汽車交易還是太難了。
零售電商與汽車電商截然不同的結(jié)局,帶給李想的是兩點略微苦澀的啟示:
一是一家企業(yè)的價值,歸根結(jié)底要用“多大程度改變了物理世界”來衡量;
二是物理世界雖然還有廣袤的改造余地,但基本已是難啃的骨頭,互聯(lián)網(wǎng)打法顯出疲態(tài),得使用更先進(jìn)的業(yè)態(tài)和技術(shù)。
當(dāng)李想在2015年再次出發(fā)創(chuàng)業(yè),正與AI合流的新能源汽車不意外地成為最佳選擇。
作為新一輪能源革命和信息革命的交匯點,智能電動汽車兼具移動、空間、軟硬件、大規(guī)模制造屬性——很少有其他產(chǎn)業(yè)能像它一樣,如此多維地和物理世界產(chǎn)生關(guān)聯(lián),又積極地?fù)肀ё钚碌募夹g(shù)潮流,這為AI發(fā)揮作用提供了充足空間。
加入造車大軍后,理想的A面是將增程電動、家庭用車做大做強(qiáng),B面則可套用一句老話,“用AI把汽車的各個環(huán)節(jié)重做一遍?!?/p>
其中能見度高的AI產(chǎn)品,是智能助手理想同學(xué),以及端到端+VLM架構(gòu)的智能駕駛。數(shù)據(jù)顯示,2024年理想同學(xué)累計喚醒23.8億次,累計智駕里程超過29億公里,在國內(nèi)車企中居于領(lǐng)先位置。
領(lǐng)先的先決條件是飽和投入。2024年,理想的百億研發(fā)費用,近一半用在了AI上,讓理想將關(guān)鍵的AI能力掌握在自己手里。
比如國內(nèi)多數(shù)車企的智能助手選擇調(diào)用第三方大模型能力,理想則為理想同學(xué)自研了基座模型Mind GPT。在智能駕駛領(lǐng)域,理想的團(tuán)隊率先量產(chǎn)了采用端到端+VLM雙系統(tǒng)架構(gòu)的智能駕駛,將自家高階智駕車型銷售占比提升至50%以上。
一個細(xì)節(jié):理想車輛下線檢測時采用無人駕駛節(jié)省人力
在不易被外界關(guān)注的環(huán)節(jié),理想也在使用AI為生產(chǎn)經(jīng)營提質(zhì)增效。
比如在零售、營銷、客服、財務(wù)、 金融反欺詐等職能部門,理想的智能商業(yè)團(tuán)隊部署了相應(yīng)的AI模型來輔助工作。
理想整車生產(chǎn)流程中AI的存在感也頗高。比如理想一度被電驅(qū)NVH傳統(tǒng)檢測方法測不準(zhǔn)、效率低的問題困擾,但在理想智能工業(yè)團(tuán)隊訓(xùn)練出一個AI檢測模型,部署在電驅(qū)供應(yīng)商的產(chǎn)線邊實現(xiàn)就地檢測后,難題迎刃而解。
類似的AI能力嵌入在生產(chǎn)制造的各個環(huán)節(jié),串聯(lián)起來則是被理想稱為Li-MOS的智能制造操作系統(tǒng)。理想L6從上市發(fā)售到爬滿2.6萬輛/月的產(chǎn)能只用了不到兩個月,帶給行業(yè)一點小小的爬產(chǎn)震撼,其中Li-MOS的支持尤為重要。
到2024年,理想對物理世界的改造初見成效:對用戶,交付了上百萬輛搭載理想同學(xué)和智駕能力的車型,改變了數(shù)百萬人的出行體驗;對行業(yè),提供了一套AI化的高效生產(chǎn)經(jīng)營體系范本;基于這些改造提供的價值,理想也成為一家千億級公司。
李想在上一段創(chuàng)業(yè)中未盡的愿望,通過AI驅(qū)動的造車完成了序章。
為什么這時候All in AI
不過這不足以解釋另一個問題:作為宣稱對AI有信仰的一家公司,理想為什么不是在自動駕駛創(chuàng)業(yè)浪潮興起的2016年All in AI,也不是在Transfomer大放異彩的2021年All in AI,而是在2023年才把AI作為陽謀,在2024年末才喊出了AGI的目標(biāo)?
以李想的“創(chuàng)業(yè)節(jié)奏論”解釋則是,一家企業(yè)不應(yīng)在0-10的階段,做10-100階段的事。
OpenAI的例子表明,AGI很可能是有史以來最壯烈、復(fù)雜的商業(yè)/技術(shù)競賽,它需要海量的資金、數(shù)據(jù)、算力,以及頂級人才,有著漫長的實現(xiàn)周期,競爭維度也超越了既有商業(yè)組織的邊界。
以AGI為己任的OpenAI創(chuàng)立于2015年,匯聚了過去十余年AI領(lǐng)域的超級大腦,至2024年累計融資179億美元且越虧越多,為了訓(xùn)練模型OpenAI幾乎爬光整個互聯(lián)網(wǎng)的公開數(shù)據(jù),其最大股東微軟為了提供算力支持,去年向英偉達(dá)購買了近50萬顆Hopper GPU。
在這樣的競賽中,即使是市值萬億的頂級企業(yè)也心驚膽戰(zhàn)。而理想如果沒有選擇“先造車,廣積糧”的迂回路線,很可能連AGI的友誼賽名額都拿不到。
如果以AGI為目的地回望,理想成立這九年主要的經(jīng)營目標(biāo)可以總結(jié)為:度過企業(yè)的0-1、1-10階段,找到一塊有足夠利潤和數(shù)據(jù)產(chǎn)出的根據(jù)地,點出AGI的前置科技樹,籌集AGI競爭的入場券。
正因為對創(chuàng)業(yè)節(jié)奏的理解,理想選擇了以增程路線切入造車。同樣,對節(jié)奏的把握也貫穿在理想打造AI產(chǎn)品的過程中。
比如在早期資源受限的情況下,理想在智駕產(chǎn)品上采取了跟隨策略,同時做好了可以長期發(fā)揮效用的數(shù)據(jù)沉淀與基建工作,等待算力、算法、數(shù)據(jù)升級。在2023有了進(jìn)一步的商業(yè)成功,智駕的營養(yǎng)系統(tǒng)——現(xiàn)金、算力和數(shù)據(jù)都足夠充沛后,理想果斷轉(zhuǎn)向端到端+VLM,引領(lǐng)了技術(shù)范式,實現(xiàn)了智駕體驗的快速提升,帶動了高配車型銷售。
這種變道超車一方面離不開智駕部門打硬仗的戰(zhàn)役能力,另一方面也考驗企業(yè)對內(nèi)部能力、資源進(jìn)行評估,對外部環(huán)境、需求變化進(jìn)行感知,做出決斷的戰(zhàn)略能力。
理想在2024年末All in AI,實際是管理層進(jìn)一步看到了內(nèi)外部條件的變化,判斷可以、也需要開啟下一篇章:
于內(nèi),以理想同學(xué)和智能駕駛為代表,理想的AI產(chǎn)品在2024年打了勝仗,積累了數(shù)據(jù),培養(yǎng)了人才隊伍,收獲了商業(yè)回報,AI能力的建設(shè)度過了1-10階段,在認(rèn)知智能和空間智能上都取得了一定建樹,通往AGI的路徑不再是空談。
于外,無論是馬斯克創(chuàng)辦xAI,還是量化出身的幻方推出技驚四座的DeepSeek V3,都表明人工智能正在進(jìn)一步打破不同類型企業(yè)的邊界,在AI上不思進(jìn)取會面臨被跨行業(yè)而來的對手用AI端掉飯碗的風(fēng)險。
但同時,在基座模型上領(lǐng)先的企業(yè)們,在Scaling Law的規(guī)則下一路狂飆后,終于撞到了一堵無形的墻——網(wǎng)絡(luò)上的公開數(shù)據(jù)已經(jīng)耗竭,接下來將考驗垂直場景和物理世界數(shù)據(jù)的收集利用,成本與難度要高得多。而智能電動汽車恰好是一個足夠大的細(xì)分場景,也是絕佳的物理世界數(shù)據(jù)生產(chǎn)終端。
對理想來說,All in AI最好的時機(jī)到了。
該用什么方式All in AI
選擇全面躬身入局后,理想的AI方法論也依然帶著鮮明的理想式烙印:把AI的產(chǎn)品做得更好,吸引更多人。
12月27日,理想AI Talk的最后一天,理想同學(xué)APP在App Store、小米應(yīng)用商城等上線,這是車企研發(fā)的智能助手首次從車機(jī)進(jìn)入手機(jī)。此前,車企的語音助手只搭載于車上,用在車內(nèi),服務(wù)自家車主,超出汽車場景與其他設(shè)備搶用戶,會被認(rèn)為偏離造車主線。
但這一“不務(wù)正業(yè)”的舉動,在理想的規(guī)劃中是通往AGI的必由之路。
一方面,只在車內(nèi)單一場景發(fā)揮作用的智能助手,最終不可能是一個好的助手——用戶很難指望一個在你開車時嘮會兒嗑的對話機(jī)器人真的懂你??缭讲煌脑O(shè)備、場景,被足夠多的用戶使用足夠長的時間,智能助手才會越來越智能,越來越好用。
另一方面,ChatGPT橫空出世后,對話機(jī)器人成為AI最廣泛的應(yīng)用。更重要的,自然語言很可能會成為AGI時代最通用的交互入口,以對話形式與人交互的智能助手,將是最基本且普遍的產(chǎn)品形態(tài)。如果一家企業(yè)的目標(biāo)是AGI,智能助手的產(chǎn)品打造和技術(shù)建設(shè)都是不可繞過的一環(huán)。
但將理想同學(xué)推向手機(jī)、進(jìn)入更多場景,也意味著加入一個更激烈的戰(zhàn)場,需要更強(qiáng)的實力。理想選擇在基座模型上下功夫。理想新一版端到端多模態(tài)模型Mind GPT3o已正式上線為理想同學(xué)提供支持,其響應(yīng)速度達(dá)到百毫秒級,能夠理解不同模態(tài),記憶、規(guī)劃、工具、表達(dá)能力均得到提升。
李想向團(tuán)隊提出了目標(biāo),未來幾年在國內(nèi)保證理想大語言模型的基座模型位于行業(yè)前三,這是一個頗具挑戰(zhàn)性的任務(wù)。
2024年末,國內(nèi)排行前三的智能助手豆包、文心一言、Kimi月活分別約6000萬、1300萬、1280萬,比理想同學(xué)的月活用戶有一個數(shù)量級的領(lǐng)先,且同時登陸PC與手機(jī),提供的能力也更多元。再次扮演追趕者的理想,勢必要在2025年對Mind GPT的資金、人才密度進(jìn)一步加碼。
在另一頭,去年讓理想成功躋身智駕第一梯隊的智駕團(tuán)隊,也并無閑暇享受勝利。因為理想智駕業(yè)務(wù)的階段性目標(biāo)并非問鼎L2輔助駕駛,而是實現(xiàn)有監(jiān)督的自動駕駛即L3。
在2025年,理想將尋求高階智駕產(chǎn)品能力的進(jìn)一步提升,比如將接管里程提升至500公里。這需要更快地轉(zhuǎn)動數(shù)據(jù)飛輪。理想預(yù)估,要達(dá)成接管里程500公里的目標(biāo),需要從50億乃至100億公里駕駛里程中,篩選2000萬個老司機(jī)駕駛視頻片段供端到端網(wǎng)絡(luò)訓(xùn)練。
這是一項對數(shù)據(jù)和算力體系的魔鬼考驗。但理想以每個月超2萬輛速度擴(kuò)充的高階智駕車隊,成倍增長的智駕里程,高度自動化的標(biāo)注體系,以及8.1EFlops的云端算力儲備,提供了可行性。
與此同時,理想也開始努力鞏固在國內(nèi)智駕領(lǐng)域“先進(jìn)技術(shù)量產(chǎn)先鋒”的地位。
在最新一版智駕系統(tǒng)中,理想將高速場景納入到端到端架構(gòu),并首次推出了智駕的AI推理可視化——引入思維鏈技術(shù), 在AD Max車型上展示端到端和VLM系統(tǒng)的感知、推理過程。
智駕系統(tǒng)對自身思考過程進(jìn)行展現(xiàn),是解決端到端架構(gòu)黑箱難題的重要方法。打開神經(jīng)網(wǎng)絡(luò)的黑箱,既可贏取用戶的信任,也便于智駕團(tuán)隊對問題場景追根溯源,持續(xù)提升智駕模型的能力。
用一句話總結(jié)理想在2025年的AI戰(zhàn)略,便是理想同學(xué)和高階智駕將繼續(xù)作為理想AI拳頭產(chǎn)品,成倍接入資源,獲取更多用戶,在產(chǎn)品形態(tài)和性能方面向上“摸高”。
理想之所以選擇兩手抓,是因為兩者分別代表認(rèn)知(語言)智能和空間(行為)智能,也是人類主要的兩種智能表現(xiàn)方式。但人類能夠?qū)煞N智能融匯應(yīng)用,這是AI目前的短板。反過來意味著,如果能讓AI同時掌握兩種智能,很可能就找到了AGI的鑰匙。
因此在All in AI的階段,理想已經(jīng)開啟下一代基座模型VLA(視覺語言行動模型)的預(yù)研——目的是將認(rèn)知智能和空間智能統(tǒng)一起來,讓一輛理想像人一樣同時擁有認(rèn)知智能和空間智能,從而實現(xiàn)L4自動駕駛,成為李想定義中“你的助手”。三年之后,理想計劃推出首款為L4級自動駕駛定義的汽車。
屆時,或許就是理想開啟機(jī)器人產(chǎn)品線,邁向打造“硅基家人”的開始。
編輯:羅松松
視覺設(shè)計:疏睿
責(zé)任編輯:李墨天