[汽車之家 行業(yè)] 由智能化、電動化帶來的全球汽車產(chǎn)業(yè)的大變革已經(jīng)取得成效。在這一輪變革中,技術(shù)快速迭代,消費(fèi)者需求也發(fā)生了明顯改變,甚至在我國形成了“無智能,不電動”的特有現(xiàn)象。若將智能、電動這兩個標(biāo)簽拆分來看,后者相對較低的門檻本就是我國繞過傳統(tǒng)壁壘實(shí)現(xiàn)競爭的根源所在,前者則是“換道超車”的差異化競爭的重要倚仗。
也就是說在隨后的進(jìn)一步變革中,智能化能力的強(qiáng)弱,將直接決定車企的競爭上限。如今的智能座艙發(fā)展可謂日新月異,巨屏、車外語音、手勢操控等新配置/功能不斷涌現(xiàn),而在智能駕駛領(lǐng)域,大家越來越卷。
其實(shí)想實(shí)現(xiàn)真正的自動駕駛,無非是兩條路徑:第一條是自上而下,直接定位到L4\\\\L5級別無人駕駛,再將配置、能力逐步下放,從而實(shí)現(xiàn)低成本解決絕大部分無人場景;第二條則是如今主機(jī)廠們慣用的形式,自下而上,量產(chǎn)低級別智能駕駛,并通過其環(huán)節(jié)中產(chǎn)生的大量數(shù)據(jù)不斷迭代技術(shù),向更高級別演進(jìn)。在這條路線中,能否量產(chǎn)是最關(guān)鍵一環(huán)。
據(jù)汽車之家研究院公布的《中國智能汽車發(fā)展趨勢洞察》報(bào)告中顯示,2022年,主動剎車、車道保持輔助系統(tǒng)、自適應(yīng)巡航系統(tǒng)等L2級智能駕駛代表性功能的市場滲透率高速增長,哪怕此前略顯保守的海外品牌,也將上述部分功能當(dāng)成了新車標(biāo)配。
但在真正考驗(yàn)“L2+”智能駕駛能力的領(lǐng)域,比如城市NOA(面向城市域的高階智能駕駛輔助系統(tǒng),不同車企間叫法不同),能實(shí)現(xiàn)向上突破者寥寥。大部分公布了城市NOA功能的企業(yè),要么屬于“期貨”尚未兌現(xiàn),要么是采用內(nèi)測、早鳥等形式推送,距離真正的量產(chǎn)尚有距離。而自動駕駛領(lǐng)域的下半場競爭的開端,也就藏在上述量產(chǎn)難題之中。
★路線之爭:從【重】地圖到【輕】地圖
從目前來看,有能力涉足城市NOA領(lǐng)域的玩家并不在少數(shù)。走從下到上路線的企業(yè)有毫末智行、蔚來、理想、小鵬、集度等;走從上到下路線的企業(yè)有百度、輕舟智航、小馬智行等。不過從推出時間和推廣規(guī)模來看,這些車企的城市NOA大多集中在廣州、深圳、上海這三個城市。
比如小鵬,2022年9月,小鵬城市NGP智能導(dǎo)航輔助駕駛在廣州正式開啟試點(diǎn),首批被推送的用戶是從廣州提交過智能輔助駕駛建議的P5車主中隨機(jī)選取,且初期必須得經(jīng)歷“新手模式”——即在部分條件適宜路段使用城市NGP超過100公里,時長超過7天后才可解鎖全部路段。自此一段時間后,該功能才逐漸面在深圳、上海開放。
曾在某次上海車展前夕憑借“自動駕駛”視頻火遍全網(wǎng)的極狐,雖然在2022年5月就交付了極狐阿爾法S HI版,但到9月才于深圳開啟城市NCA功能測試,并于隨后延伸至上海。
之所以早期城市NOA集中在廣州、深圳、上海,是因?yàn)樯鲜鋈蟪鞘惺菄鴥?nèi)最早一批頒發(fā)高精地圖城市試點(diǎn)的許可的城市。與高速域不同,面向城市域的高階智能駕駛要面對的復(fù)雜路況呈指數(shù)級增長,信號燈變化、潮汐車道變化、路面行人軌跡預(yù)測、非機(jī)動車軌跡預(yù)測……這一切場景對于企業(yè)軟硬件綜合能力要求極高。曾有數(shù)據(jù)顯示,小鵬城市NGP感知模型的數(shù)量已經(jīng)達(dá)到高速NGP的4倍,預(yù)測/規(guī)劃/控制相關(guān)代碼量則提升至88倍,其復(fù)雜程度由此可見一斑。
面對上述復(fù)雜場景,在軟硬件綜合能力沒那么強(qiáng)大時絕對精度和相對精度均在 1 米以內(nèi)的,蘊(yùn)含道路類型、曲率、車道線位置等道路信息,以及路邊基礎(chǔ)設(shè)施、障礙物、交通標(biāo)志等環(huán)境對象信息,同時包括交通流量、紅綠燈狀態(tài)信息等實(shí)時動態(tài)信息的,高精度、高新鮮度、高豐富度的高精地圖高精地圖就成為了車企快速上馬城市NOA的“捷徑”。
但事物都有兩面性,高精地圖的局限性,以及其資質(zhì)難獲取等特性也成為局限住車企NOA快速量產(chǎn)的關(guān)鍵原因。在2023中國汽車論壇上,重慶長安汽車股份有限公司首席專家李偉曾剖析過“重地圖”模式的弊端。他認(rèn)為該模式屬于遞增式投入,雖然前期高速+少量城市數(shù)據(jù)采購成本不高,但后期隨城市擴(kuò)展,采購成本激增,不僅如此,還面臨地圖鮮度不足、覆蓋不足的長期問題,這必然導(dǎo)致智駕系統(tǒng)魯棒性差。
『高精地圖示意圖』
至于其長期成本有多高,華為常務(wù)董事、終端BG CEO、智能汽車解決方案BU CEO余承東曾舉過一個例子:“僅僅采集上海市高精地圖,采集了一兩年、9000公里,都沒有把上海完全覆蓋。并且從國家安全的角度,幾個月才允許刷新,但是中國的道路天天在改,所以說依賴于高精地圖真的沒法廣泛使用!闭?yàn)榇耍瑯I(yè)內(nèi)也逐漸達(dá)成共識——想讓城市NGP快速實(shí)現(xiàn)量產(chǎn),去圖化可能是唯一途徑。
在業(yè)內(nèi),毫末智行無疑是第一批打出“重感知”派招牌的企業(yè)。早在2022年,毫末智行便官宣了搭載HPilot 3.0系統(tǒng),可實(shí)現(xiàn)城市NOH領(lǐng)航輔助功能的量產(chǎn)車型;今年4月,在第八屆毫末AI DAY上,該企業(yè)又宣布上述功能的新“載體”——魏牌的新摩卡DHT-PHEV和魏牌藍(lán)山(參數(shù)|詢價(jià))。根據(jù)現(xiàn)有規(guī)劃,毫末智行旗下的城市NOH功能將率先在北京、上海、保定等城市落地。
『請點(diǎn)擊圖片查看清晰內(nèi)容』
除毫末外,小鵬、華為等此前依賴高精地圖的企業(yè)也開始進(jìn)行“重感知”進(jìn)化。其中小鵬的XNGP已經(jīng)進(jìn)行無圖化測試,預(yù)計(jì)在年底擴(kuò)展到50個城市;余承東則宣布華為不依賴于高精地圖的城區(qū)NCA將在第三季度內(nèi)實(shí)現(xiàn)15城落地,到四季度將增加到 45城。就連地圖巨頭百度都已經(jīng)在向重感知方案靠攏,其ANP3.0系統(tǒng)已經(jīng)將“BEV 環(huán)視三維感知”技術(shù)作為安全冗余。
★技術(shù)之爭:【數(shù)據(jù)能力】才是門檻
根據(jù)西部證券公布的預(yù)測顯示,未來城市NOA將是一塊大蛋糕,其車型數(shù)量規(guī)模可能會在2023-2025年分別達(dá)到11.9萬輛、67.6萬輛和243.6萬輛。但想在這塊蛋糕中多吃多占,可不僅僅是確定路線這么簡單。
在沒有或不依賴高精地圖時,如將傳感器識別到的數(shù)據(jù)進(jìn)行處理,并通過其做到更大規(guī)模的城市泛化,適應(yīng)不同城市“亂七八糟”的路況、場景。以最基本的識別紅綠燈控車、別紅綠燈這一在部分人看來可能很基礎(chǔ)的功能為例。我國不同城市的紅綠燈規(guī)格都不甚相同,有三排燈、有五排燈,有橫著的、有豎著的……先不提算法,為了滿足上述場景,收集來的數(shù)據(jù)規(guī)模就會和以前實(shí)現(xiàn)指數(shù)級增長。
在這種數(shù)據(jù)規(guī)模下,像以前一樣依靠CNN卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型似乎就不再適用了。在這方面,率先提出擺脫高精地圖,甚至取消激光雷達(dá),采用純視覺方案的特斯拉給大家開了個好頭,開始用Transformer大模型替代CNN,利用其結(jié)構(gòu)簡潔、可無限堆疊基本單元得到巨大參數(shù)量的特性來提升。
相比于CNN,Transformer在的數(shù)據(jù)量越大,其效果就越好。有研究表明,當(dāng)訓(xùn)練數(shù)據(jù)集增大到包含 1億張圖像時,Transformer的性能開始超過CNN。而當(dāng)圖像數(shù)量增加到10億張時,兩者的性能差距變得更大。
在國內(nèi),毫末智行則是率先引入Transformer大模型的自動駕駛公司。雖然時間上沒有特斯拉早,但毫末智行的創(chuàng)新在于用Transformer做時間和空間上的前融合。
比如面臨一段在正常不過的路,人眼看到的是雙向四車道,是連續(xù)的視覺圖像,而攝像頭的識別卻并非連貫的,而是一幀一幀的圖片。假設(shè)車往左偏5厘米,人識別出來的信息很正常,掰直即可,原有方案下攝像頭識別的可就復(fù)雜了,也許以為路本身就是“歪的”,這種時間上的“斷點(diǎn)”再加上前后左右、側(cè)前側(cè)后等方向攝像頭識別出的空間上的“亂象”,若沒有高精地圖進(jìn)行糾正,則很可能成把系統(tǒng)“干懵”,無法進(jìn)行有效拼接。
而毫末的方法是用Transformer 做時間和空間上的前融合,也就是通過該大模型的注意力特征,提取不同圖片像素之間的相關(guān)性,用其特征向量進(jìn)行前融合,再通過神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)預(yù)測。這樣不僅能解決多角度攝像頭無法拼接出“上帝視角”的問題,甚至還能融合激光雷達(dá)數(shù)據(jù),來給視覺效果進(jìn)行補(bǔ)充。
對此,毫末智行技術(shù)總監(jiān)潘興曾用城市領(lǐng)域最容易出現(xiàn)的車道線場景作為范例。他表示,和高速場景不同,城區(qū)道路車道線極為復(fù)雜,有的地方被磨沒了,有的地方可能重新粉刷,但舊的車道線還沒完全鏟除。這種場景下,Transformer大模型的注意力機(jī)制可以很好的解決問題。
值得注意的是,城市域NOA所面臨的類似場景還有很多。比如復(fù)雜十字路口處有多個紅燈,到底哪個燈亮了車輛才應(yīng)該走?想解決諸如此類的千千萬萬個場景,就得識別大量的數(shù)據(jù)、做大量的標(biāo)注、模擬大量的場景、進(jìn)行大量的學(xué)習(xí)、加以大量的調(diào)整、寫大量的規(guī)則……
上述“大量”要怎么解決?用毫末智行CEO顧維灝的話說,行業(yè)里搞了20年,把預(yù)測、規(guī)劃、決策、控制,每一項(xiàng)都分成一個個小任務(wù),20 年也沒搞成。直到類GPT(Generative Pre-trained Transformer)技術(shù)開始應(yīng)用。
今年4月11日,毫末智行正式發(fā)布自動駕駛生成式大模型DriveGPT,中文名為“雪湖·海若”和爆火的ChatGPT類似,只不過ChatGPT采用自然語言進(jìn)行輸入與輸出,DriveGPT則面向自動駕駛場景,用感知融合后的文本序列輸入,以自動駕駛場景文本序列作為輸出,將自動駕駛場景Token化,形成“Drive Language”,最終完成自車的決策規(guī)控、障礙物預(yù)測以及決策邏輯鏈的輸出等任務(wù)。通俗來說就是,把上述所有小任務(wù)縮減為兩個大任務(wù),一個是感知,一個是認(rèn)知。
另外,毫末智行也開始和生態(tài)伙伴探索四大應(yīng)用能力,包括智能駕駛、駕駛場景識別、駕駛行為驗(yàn)證、困難場景脫困。比如,在場景識別中,毫末DriveGPT單針圖片的整體標(biāo)注成本,僅相當(dāng)于行業(yè)的1/10。而這項(xiàng)技術(shù)向行業(yè)的開放使用,將會大幅降低行業(yè)使用數(shù)據(jù)的成本,從而提升自動駕駛技術(shù)的發(fā)展。
毫末可以逐步將DriveGPT應(yīng)用在城市NOH、捷徑推薦、智能陪練以及脫困場景中。DriveGPT的加入,能夠讓車輛行駛會更安全,規(guī)控動作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動作。
而這就是毫末給出來的去圖方案,極為考驗(yàn)數(shù)據(jù)處理能力。而這種處理能力,加上自動駕駛數(shù)據(jù)量——也就是誰先量產(chǎn),通過量產(chǎn)出來的車收集更多的數(shù)據(jù)并加以處理,最終實(shí)現(xiàn)滾雪球式的技術(shù)迭代,這才是城市NOA功能的門檻所在。
寫在最后:
高精地圖成本高、采集難、鮮活度差,而依賴大量基建的車路協(xié)同方案的實(shí)現(xiàn)難度要更高于高精地圖,在此前提下,想量產(chǎn)城市NOA,實(shí)現(xiàn)正向循環(huán),著實(shí)不是一件容易的事。
據(jù)毫末智行董事長張凱表示,該企業(yè)之所以能快速實(shí)現(xiàn)量產(chǎn),無非是做好了一下幾個閉環(huán):用戶需求閉環(huán)——對駕駛場景數(shù)據(jù)持續(xù)分析完善策略,并進(jìn)行新功能體驗(yàn)反饋;研發(fā)效能閉環(huán)——將數(shù)據(jù)驅(qū)動理念深入到產(chǎn)品需求定義、感知與認(rèn)知算法開發(fā)等產(chǎn)品開發(fā)流程,整體開發(fā)效率提升;數(shù)據(jù)積累閉環(huán)——在車端部署診斷服務(wù)數(shù)據(jù)場景標(biāo)簽覆蓋92%的駕駛場景;數(shù)據(jù)價(jià)值閉環(huán)——大模型持續(xù)挖掘數(shù)據(jù)價(jià)值解決關(guān)鍵問題;產(chǎn)品自完善閉環(huán)——實(shí)現(xiàn)售后問題處理速度較傳統(tǒng)方式的十倍效率提升,實(shí)現(xiàn)最快10分鐘定位售后問題;業(yè)務(wù)工程化閉環(huán)——進(jìn)一步完善了從采集回流、標(biāo)注訓(xùn)練、系統(tǒng)標(biāo)定、仿真驗(yàn)證等環(huán)節(jié)到最終 OTA 釋放環(huán)節(jié)的產(chǎn)品研發(fā)全流程工程化閉環(huán)。上述閉環(huán)光是看起來就已經(jīng)頗為復(fù)雜,實(shí)現(xiàn)起來就更不容易,這種門檻實(shí)則已經(jīng)篩選掉了很多玩家。
對此,即便體量(單指智能汽車)龐大如特斯拉,也要通過開放FSD給其余車企的形式進(jìn)一步擴(kuò)大數(shù)據(jù)收集能力。在這方面,背靠長城并逐漸擴(kuò)大朋友圈的毫末智行、給眾多主機(jī)廠提供方案的華為似乎也有一定的規(guī)模優(yōu)勢。相信在這種挑戰(zhàn)下,糾結(jié)“靈魂論”的主機(jī)廠會越來越少,畢竟在自動駕駛下半場競爭的急迫環(huán)境中,如此數(shù)據(jù)體量、技術(shù)能力,已經(jīng)不是靠自研和收購能解決的了。(文/汽車之家 陳燦 )
好評理由:
差評理由: