文:談擎說(shuō)AI 作者:鄭開車
智能經(jīng)濟(jì)時(shí)代,有人將數(shù)據(jù)比作石油,比作燃料。誠(chéng)然,拿無(wú)人駕駛賽道來(lái)講,數(shù)據(jù)標(biāo)注是實(shí)現(xiàn)無(wú)人駕駛系統(tǒng)準(zhǔn)確性的前提。
數(shù)據(jù)標(biāo)注將無(wú)標(biāo)記的數(shù)據(jù)加上標(biāo)簽或標(biāo)注,使其成為有標(biāo)記的數(shù)據(jù),這樣機(jī)器學(xué)習(xí)算法才能夠利用這些數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),從而提高自動(dòng)駕駛系統(tǒng)的準(zhǔn)確性和性能。
在談擎說(shuō)AI看來(lái),詩(shī)意的講,數(shù)據(jù)標(biāo)注的價(jià)值可以用一句古詩(shī)來(lái)比擬——“問渠那得清如許,為有源頭活水來(lái)”。無(wú)人駕駛想要提高準(zhǔn)確性,想要“清如許”,需要”源頭活水來(lái)”。給數(shù)據(jù)做上標(biāo)注,就是對(duì)“源頭活水”的凈化。
從這個(gè)維度來(lái)講,數(shù)據(jù)標(biāo)注是智駕賽道的“源頭創(chuàng)新”。
作為“源頭”,那么數(shù)據(jù)標(biāo)注的發(fā)展、進(jìn)化、創(chuàng)新就顯得尤為重要。為了更好的認(rèn)知數(shù)據(jù)標(biāo)注賽道,談擎說(shuō)AI團(tuán)隊(duì)連線云測(cè)數(shù)據(jù)總經(jīng)理賈宇航,探究數(shù)據(jù)標(biāo)注產(chǎn)業(yè)背后的圭臬。
//量產(chǎn)比拼時(shí)代:數(shù)據(jù)標(biāo)注賽道的進(jìn)化路徑
在國(guó)內(nèi)乘用車市場(chǎng),高階智能駕駛輔助功能滲透率不斷提升。據(jù)工信部相關(guān)數(shù)據(jù)顯示,2021年中國(guó)L2級(jí)輔助駕駛乘用車新車市場(chǎng)滲透率達(dá)到23.5%,2022年上半年其滲透率增加至30%,并且滲透率還在持續(xù)不斷提升。有機(jī)構(gòu)預(yù)測(cè),到2025年,中國(guó)L2級(jí)以上智能汽車的銷量將突破1000萬(wàn)臺(tái),滲透率將達(dá)到50%。
用戶需求井噴,主機(jī)廠跑馬圈地,無(wú)人駕駛企業(yè)加速量產(chǎn),是智能駕駛賽道的基本面。想要量產(chǎn),想規(guī)?;杀景芽啬芰?、駕駛交付體驗(yàn)等都提出了新的要求。
首先,精準(zhǔn)度。
智能駕駛系統(tǒng)對(duì)感知模型精度的要求也越來(lái)越高,因此,提升車輛感知模型的精度需要大規(guī)模且高質(zhì)量的數(shù)據(jù)集去訓(xùn)練。
“其實(shí)早在21年的時(shí)候,云測(cè)數(shù)據(jù)就發(fā)布了智能駕駛的數(shù)據(jù)解決方案1.0版本,1.0版本的解決方案圍繞著企業(yè)整個(gè)研發(fā)周期——針對(duì)企業(yè)預(yù)研階段,云測(cè)數(shù)據(jù)為其提供相關(guān)行業(yè)場(chǎng)景基礎(chǔ)數(shù)據(jù)集進(jìn)行訓(xùn)練,解決場(chǎng)景識(shí)別等基礎(chǔ)問題;到了基于特定場(chǎng)景的定制開發(fā)階段,云測(cè)數(shù)據(jù)提供場(chǎng)景化的數(shù)據(jù)采集與標(biāo)注服務(wù),滿足當(dāng)前階段對(duì)AI數(shù)據(jù)精度和規(guī)模的需求;對(duì)于形成數(shù)據(jù)閉環(huán)的第三階段,云測(cè)數(shù)據(jù)提供一整套成熟工具幫助完成數(shù)據(jù)采集、標(biāo)注、管理一系列流程,幫助企業(yè)優(yōu)化迭代?!痹茰y(cè)數(shù)據(jù)總經(jīng)理賈宇航對(duì)談擎說(shuō)AI表示道。
高質(zhì)量AI數(shù)據(jù)才能釋放人工智能的價(jià)值。對(duì)于智能駕駛技術(shù)而言,這樣的數(shù)據(jù)精確化顯得更為重要:一方面,現(xiàn)實(shí)交通場(chǎng)景復(fù)雜、安全威脅多,非常重視數(shù)據(jù)分析的效率和敏捷;另一方面,標(biāo)注數(shù)據(jù)質(zhì)量的高低將直接影響智能駕駛的判斷和用戶體驗(yàn)。有優(yōu)質(zhì)數(shù)據(jù)存在,才會(huì)訓(xùn)練出優(yōu)質(zhì)的算法。
其次,效率。
在談擎說(shuō)AI看來(lái),提高效率,主要是分為兩種,一種是管理效率,一種是技術(shù)效率。
我們先來(lái)看管理效率,智能駕駛有很多落地場(chǎng)景且數(shù)據(jù)量極為龐大,不斷的迭代更新,要想提高效率,數(shù)據(jù)標(biāo)注人員培訓(xùn)的規(guī)范化、溝通成本、業(yè)務(wù)流程管理至關(guān)重要。
另一個(gè)是技術(shù)效率。
“其實(shí)在數(shù)據(jù)處理工具鏈層面上,云測(cè)數(shù)據(jù)做了很多標(biāo)準(zhǔn)化。比如研發(fā)上更強(qiáng)調(diào)系統(tǒng)集成這個(gè)概念,面對(duì)每一個(gè)企業(yè)不同的數(shù)據(jù)底座來(lái)講,會(huì)有很多不同需要,或者不同企業(yè)之間數(shù)據(jù)流轉(zhuǎn)的規(guī)范是不同的。云測(cè)數(shù)據(jù)這個(gè)過(guò)程之中將數(shù)據(jù)處理工具進(jìn)行標(biāo)準(zhǔn)API接口研發(fā),快速支持企業(yè)靈活調(diào)用?!痹茰y(cè)數(shù)據(jù)總經(jīng)理賈宇航如是說(shuō)。
標(biāo)準(zhǔn)化,意味著更高的效率,對(duì)于無(wú)人駕駛來(lái)講,技術(shù)日新月異,行業(yè)變革速度很快,高效率的交付質(zhì)量,保證了時(shí)效性,智能汽車現(xiàn)在是OTA遠(yuǎn)程升級(jí),早日升級(jí)保證了用戶體驗(yàn),以及產(chǎn)品競(jìng)爭(zhēng)力。
在談擎說(shuō)AI看來(lái),對(duì)于云測(cè)數(shù)據(jù)來(lái)講,其技術(shù)能力是產(chǎn)品化和產(chǎn)品標(biāo)準(zhǔn)化的前提。對(duì)于數(shù)據(jù)標(biāo)注行業(yè)來(lái)講,標(biāo)準(zhǔn)化,也將促進(jìn)智能駕駛數(shù)據(jù)標(biāo)注市場(chǎng)的開拓和發(fā)展。
最后是數(shù)據(jù)安全。
從數(shù)據(jù)的采集、數(shù)據(jù)的標(biāo)注,再到數(shù)據(jù)的管理,每一個(gè)環(huán)節(jié)都必須保證數(shù)據(jù)不被泄露、不被竊取。不少企業(yè)放棄公有云,通過(guò)私有云部署、內(nèi)外網(wǎng)絡(luò)隔離、實(shí)時(shí)數(shù)據(jù)流量監(jiān)控等方式進(jìn)行。
在談擎說(shuō)AI看來(lái),如果說(shuō)數(shù)據(jù)標(biāo)注的效率、質(zhì)量是一個(gè)數(shù)據(jù)標(biāo)注企業(yè)的上限,那么數(shù)據(jù)安全則是一個(gè)企業(yè)的下限,上限決定了企業(yè)的天花板,下限則決定了能否站在數(shù)據(jù)標(biāo)注的舞臺(tái)之上。自動(dòng)駕駛數(shù)據(jù)養(yǎng)料的質(zhì)量,決定著無(wú)人駕駛企業(yè)的競(jìng)爭(zhēng)力,是企業(yè)的基石。算法、算力具有非獨(dú)家性,數(shù)據(jù)卻是獨(dú)家的,保證數(shù)據(jù)安全的基礎(chǔ)上,對(duì)數(shù)據(jù)的充分利用,將是決定未來(lái)商業(yè)化進(jìn)展的關(guān)鍵一環(huán)。
//升級(jí)賦能:卷自己推動(dòng)行業(yè)發(fā)展
Grand View Research預(yù)計(jì),到2027年,全球無(wú)人駕駛數(shù)據(jù)標(biāo)注市場(chǎng)年均復(fù)合增長(zhǎng)率為28.8%。為了更好的適應(yīng)、引領(lǐng)這個(gè)蓬勃發(fā)展的賽道,云測(cè)數(shù)據(jù)發(fā)布云測(cè)數(shù)據(jù)智能駕駛數(shù)據(jù)解決方案2.0,全新升級(jí)。
這次的2.0版本主要是圍繞以下三個(gè)方面:
升級(jí)賦能:以集成數(shù)據(jù)底座為核心,全面升級(jí)數(shù)據(jù)標(biāo)注及數(shù)據(jù)管理工具鏈。
升級(jí)賦能:升級(jí)人工標(biāo)注與自動(dòng)標(biāo)注交互能力,全面提升數(shù)據(jù)標(biāo)注效率。
升級(jí)賦能:針對(duì)特定算法類型的數(shù)據(jù)持續(xù)優(yōu)化迭代,并納入更多場(chǎng)景數(shù)據(jù)。
對(duì)于此次2.0版本,云測(cè)數(shù)據(jù)總經(jīng)理賈宇航給出了自己的理解:
首先:2.0版本,這一次迭代會(huì)有一個(gè)新的出發(fā)點(diǎn)。目前整個(gè)的智能駕駛行業(yè)處于規(guī)模量產(chǎn)階段,對(duì)于不少智駕企業(yè)已經(jīng)在逐漸的搭建自己的數(shù)據(jù)系統(tǒng)、數(shù)據(jù)閉環(huán),云測(cè)數(shù)據(jù)更加強(qiáng)調(diào)去幫助企業(yè)在系統(tǒng)集成性、數(shù)據(jù)流轉(zhuǎn)的層面的優(yōu)化,這個(gè)是升級(jí)的第一點(diǎn)。
其次:云測(cè)數(shù)據(jù)智能駕駛數(shù)據(jù)解決方案2.0集成了不同模型的預(yù)標(biāo)注能力,包括圖像整幀、自選物體、區(qū)域、點(diǎn)云批次識(shí)別和文本識(shí)別等,重新定義了基于預(yù)標(biāo)注的人工標(biāo)注效能,如能效看板、綜合看版等。
最后:我們看到了越來(lái)越多傳感器融合等相關(guān)的技術(shù)在自動(dòng)駕駛中應(yīng)用,此次升級(jí)的2.0方案針對(duì)特定算法類型的數(shù)據(jù)持續(xù)優(yōu)化迭代,涵蓋點(diǎn)云4D疊幀、語(yǔ)義分割聯(lián)合標(biāo)注和智能ID軌跡預(yù)測(cè)。數(shù)據(jù)集也更加豐富,納入了更多場(chǎng)景數(shù)據(jù),標(biāo)注方法也從原來(lái)以點(diǎn)線面體為主進(jìn)化到融合4D標(biāo)注規(guī)則和標(biāo)注工藝。在服務(wù)方面,數(shù)據(jù)標(biāo)注精度、反饋給企業(yè)的時(shí)效性有了大幅提升。
在談擎說(shuō)AI看來(lái),云測(cè)數(shù)據(jù)智能駕駛數(shù)據(jù)解決方案2.0,將對(duì)行業(yè)產(chǎn)生以下影響:
1 服務(wù)智能駕駛企業(yè)的門檻在提升,如今大模型時(shí)代,如何借助工具提升效率、更好的為智駕客戶賦能,需要AI數(shù)據(jù)服務(wù)具備敏銳的洞察力和精進(jìn)的技術(shù)研發(fā)能力,才能夠及時(shí)識(shí)別和把握新行業(yè)發(fā)展趨勢(shì),取得領(lǐng)先優(yōu)勢(shì)。
2 數(shù)據(jù)標(biāo)注行業(yè)良莠不齊,云測(cè)數(shù)據(jù)的智能駕駛數(shù)據(jù)解決方案2.0為行業(yè)提供了可供參考的服務(wù)標(biāo)準(zhǔn),推動(dòng)行業(yè)發(fā)展走向規(guī)范化的新階段,通過(guò)提供高質(zhì)量、高效率的方案來(lái)解決自動(dòng)駕駛產(chǎn)業(yè)落地的數(shù)據(jù)需求,為無(wú)人駕駛賽道發(fā)展保駕護(hù)航,夯實(shí)了這個(gè)行業(yè)的地基。
3 伴隨汽車智能化演進(jìn),輔助駕駛、智能泊車等功能正日趨成熟。對(duì)于汽車的智能功能而言,決定一項(xiàng)功能用戶體驗(yàn)的好壞、是否成為賣點(diǎn),需要反復(fù)精細(xì)打磨產(chǎn)品、提升產(chǎn)品質(zhì)量,而作為實(shí)現(xiàn)AI功能的上游數(shù)據(jù)訓(xùn)練環(huán)節(jié),需要高效、高質(zhì)的AI數(shù)據(jù)支撐,從而打造出用戶體驗(yàn)良好、具備差異化優(yōu)勢(shì)的智能應(yīng)用。
對(duì)于智駕賽道而言,是典型的木桶理論,團(tuán)隊(duì)協(xié)助、管理能力、數(shù)據(jù)、算力儲(chǔ)備、缺一不可。但如果說(shuō)從底層邏輯來(lái)看,數(shù)據(jù)更為重要。業(yè)界大牛陸奇曾不止一次在公眾場(chǎng)合表示,數(shù)據(jù)是人工智能時(shí)代的核心產(chǎn)能。如何挖掘數(shù)據(jù)價(jià)值,不啻為智駕企業(yè)的核心要義。
//大模型時(shí)代:數(shù)據(jù)標(biāo)注賽道將走向何方?
要說(shuō)當(dāng)下最火的賽道,無(wú)疑是大模型,現(xiàn)在的科技圈進(jìn)入了百模大戰(zhàn)。AI數(shù)據(jù)影響、甚至是決定著AI的質(zhì)量,同時(shí)人工智能的快速發(fā)展,也在影響著AI數(shù)據(jù)標(biāo)注賽道。
"人工標(biāo)注和自動(dòng)標(biāo)注后的人工審核校驗(yàn)和微調(diào),這是未來(lái)的一種業(yè)態(tài)。在這個(gè)趨勢(shì)下,自動(dòng)標(biāo)注的數(shù)據(jù)量的占比可能會(huì)越來(lái)越高。其實(shí)這里邊會(huì)發(fā)現(xiàn)有一個(gè)很有意思的概念,就是自動(dòng)標(biāo)注的占比可能會(huì)越來(lái)越高,人工標(biāo)注的占比可能會(huì)相對(duì)會(huì)減少,但是整個(gè)的數(shù)據(jù)的需要、標(biāo)注的數(shù)據(jù)量是在逐漸的增大的,所以人工標(biāo)注的需求量還是增加的、處于攀升的過(guò)程之中。"云測(cè)數(shù)據(jù)總經(jīng)理賈宇航對(duì)談擎說(shuō)AI表示道。
對(duì)于大模型熱,云測(cè)數(shù)據(jù)有著自己的思考,不是一味的跟風(fēng)也不是對(duì)新技術(shù)置之不理,而是更好的結(jié)合:第一點(diǎn)是云測(cè)數(shù)據(jù)的工具與大模型做更好的結(jié)合;第二點(diǎn)布局則是針對(duì)這些大模型相關(guān)企業(yè),云測(cè)數(shù)據(jù)持續(xù)精進(jìn)為其提供對(duì)應(yīng)的場(chǎng)景化數(shù)據(jù)。
在談擎說(shuō)AI看來(lái),大模型的本質(zhì)是為了提升效率,高質(zhì)量交付,為客戶賦能。作為工具類產(chǎn)品,要更快能適用新的體系,為客戶賦能,更好的耦合客戶的系統(tǒng),不是拿著錘子找釘子,大模型火了就盲目跟進(jìn),而是根據(jù)需求,去開發(fā)適用于企業(yè)的應(yīng)用。
縱觀整個(gè)出行領(lǐng)域,從傳統(tǒng)汽車到智能汽車,底層邏輯是從制造驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng)的產(chǎn)品革命,數(shù)據(jù)是當(dāng)下的核心驅(qū)動(dòng)力,得數(shù)據(jù)者得天下,為智駕企業(yè)做好賦能,也是對(duì)中國(guó)乃至全球汽車產(chǎn)業(yè)進(jìn)化的有利助攻。