[汽車之家 行業(yè)] 11月15日,第二十二屆廣州國(guó)際汽車展覽會(huì)正式開幕。在本屆車展中,汽車之家邀請(qǐng)了極氪智能科技產(chǎn)品管理部部長(zhǎng)石穿空展開深入交流,共話車市風(fēng)云、聚力行業(yè)未來(lái)。
在此次交流中,石穿空向汽車之家表示:“此次車展,我們發(fā)布了面向未來(lái)的技術(shù)架構(gòu),引入了端到端Plus的概念。Plus是什么呢?就是我們的數(shù)字先覺網(wǎng)絡(luò)。數(shù)字先覺網(wǎng)絡(luò)不是一個(gè)圖,它更多是本地司機(jī)的長(zhǎng)期記憶,就和大腦的海馬體有點(diǎn)像的,短期的記憶。它每天都在發(fā)生,又很重要,轉(zhuǎn)化成長(zhǎng)期記憶存儲(chǔ)起來(lái)給大腦調(diào)用,跟海馬體的功能很像。有它的加持,可以做到?jīng)Q策的提前,規(guī)避潛在的風(fēng)險(xiǎn)!
以下為對(duì)話實(shí)錄:
汽車之家:目前無(wú)圖智駕大概量產(chǎn)上車的情況怎么樣?
石穿空:我們現(xiàn)在包括無(wú)圖城市NZP10月份開始大規(guī)模公測(cè),到今天為止我們進(jìn)一步擴(kuò)大公測(cè)規(guī)模,預(yù)計(jì)可以達(dá)到萬(wàn)人的規(guī)模。到今年年底整個(gè)無(wú)圖NZP就會(huì)釋放給全量的用戶。本身我們?nèi)珖?guó)萬(wàn)人用戶可以到處都能用,到年底所有用戶都可以放給他們,包括搭載“浩瀚智駕2.0”的幾個(gè)車型都會(huì)開放出去。
汽車之家:我們的無(wú)圖智駕在今年年底可以全國(guó)開通,全國(guó)跑了?
石穿空:全國(guó)和全量搭載浩瀚智駕2.0系統(tǒng)車型的用戶。
汽車之家:如何理解我們的數(shù)字先覺網(wǎng)絡(luò),端到端架構(gòu)是怎么應(yīng)用?
石穿空:因?yàn)闃O氪相對(duì)來(lái)說(shuō)起步比其他新勢(shì)力,一些頭部友商起步比較晚,所以我們?cè)谡麄(gè)技術(shù)的規(guī)劃,尤其是技術(shù)架構(gòu)的規(guī)劃上面,寧愿在開始的時(shí)候想的清楚一點(diǎn),這樣避免在后面少走彎路。我們一開始就做了很多思考,端到端是行業(yè)都比較認(rèn)同的技術(shù),本身這個(gè)事情是確定要去做的。
從去年12月第一代發(fā)布的時(shí)候,我們已經(jīng)在做。包括近期友商在做的視覺大語(yǔ)言模型,我們阿爾法實(shí)驗(yàn)室也在做這個(gè)研究,同步我們?cè)诿髂晟习肽,甚至可能?huì)更早,類似于視覺語(yǔ)言大模型也會(huì)上車。
在這個(gè)基礎(chǔ)上我們也會(huì)思考,汽車的傳感器不只是視覺,還有激光,還有毫米波雷達(dá),甚至將來(lái)還包括聲音,因?yàn)槿碎_車時(shí)都有各方面的思路,這些信息都是對(duì)于自動(dòng)駕駛來(lái)說(shuō),我們將來(lái)不僅會(huì)搞視覺語(yǔ)言大模型,還會(huì)做多模態(tài)的語(yǔ)言大模型,MLM的大模型。這是行業(yè)在走的方向,我們也是提前去思考的,并且端到端已經(jīng)在今年8月正式落地了。
我們同時(shí)在思考另外一個(gè)問(wèn)題,比如我經(jīng)常在杭州灣和上海待的時(shí)間比較多,開車去上海和杭州灣,用句夸張的話說(shuō),我閉著眼睛都知道上下班的路是怎么樣,相當(dāng)于是本地老司機(jī)。其實(shí)我們會(huì)發(fā)現(xiàn),包括落地端到端之后,整個(gè)無(wú)圖NZP我們做了很多測(cè)試,本身它實(shí)際的體驗(yàn)已經(jīng)非常好了,相信整個(gè)行業(yè)也是一樣的。包括路口的通行,類人性已經(jīng)非常好了。但我們發(fā)現(xiàn)一些問(wèn)題是端到端和VLM,甚至將來(lái)的MLM可能解決不了的。我們思考一個(gè)問(wèn)題,為什么一個(gè)本地老司機(jī)在本地開的很好,但到了外地他就會(huì)謹(jǐn)慎很多。因?yàn)槲覀兿氩煌,你的駕駛技巧也在,駕駛經(jīng)驗(yàn)也在,該學(xué)的這些知識(shí)也都學(xué)過(guò),為什么到陌生的地方就是變謹(jǐn)慎了,開的慢了,所以我們帶著這個(gè)疑問(wèn)也在目前技術(shù)架構(gòu)上思考這些問(wèn)題。
這就是今天我們帶來(lái)思考的結(jié)果,也是跟行業(yè)分享一下我們思考探索的情況,今天上午我們發(fā)布了面向未來(lái)的技術(shù)架構(gòu),在端到端+MLM,以及有一個(gè)安全底線基礎(chǔ)模型上,我們引入了端到端Plus的概念。Plus是什么呢?就是我們的數(shù)字先覺網(wǎng)絡(luò)。舉個(gè)例子,比如說(shuō)你看到前面某一個(gè)車,可能是三車道的路,其中一個(gè)車道前面有一個(gè)深坑。人開呢,這個(gè)深坑會(huì)繞開,或者實(shí)在繞不開,可能會(huì)減速。端到端Plus大模型如果這種場(chǎng)景學(xué)習(xí)過(guò),它在光照條件比較好的情況也能去處理的。有可能在五六十米、七八十米之外看見之后,它學(xué)過(guò)了,周邊的交通環(huán)境也比較好,可能會(huì)繞開,當(dāng)它繞不開也會(huì)減速通行。但這里仍然存在一個(gè)問(wèn)題,有些場(chǎng)景下,比如說(shuō)逆光或者黑夜,有可能整個(gè)光照條件也不好,等它到七八十米時(shí)并不能很好地實(shí)時(shí)識(shí)別,可能要等到更近了,包括大燈照的更清楚了,才能識(shí)別準(zhǔn)確,更可信任了。那時(shí)候已經(jīng)是二三十米了,等它識(shí)別出來(lái),一個(gè)80碼的速度去過(guò),它可能來(lái)不及響應(yīng)。識(shí)別之后有可能不得不來(lái)個(gè)急減速,體感就很不好。急減速之后還得壓過(guò)去,這個(gè)坑如果深的話,有可能胎或者輪轂都會(huì)受到傷害。甚至更嚴(yán)重的,還會(huì)影響方向盤,還會(huì)導(dǎo)致事故。
也有些人會(huì)說(shuō)不一定減速,周邊沒有障礙的話可以發(fā)起急的轉(zhuǎn)向,但要在二三十米發(fā)起急轉(zhuǎn)向,后方有來(lái)車也是很危險(xiǎn)的。不管怎么樣,這種情況就會(huì)導(dǎo)致潛在風(fēng)險(xiǎn)的可能。你有數(shù)字先覺網(wǎng)絡(luò),因?yàn)檫@條路假設(shè)是陌生的,沒有辦法。這條路你是每天上下班都會(huì)開的,我不一定要看見,我在1公里之外,甚至200米開外就知道前面是有個(gè)坑的,我沒必要等到看到再去做響應(yīng),可能會(huì)提前去做一些響應(yīng),是表達(dá)這個(gè)意思。數(shù)字先覺網(wǎng)絡(luò)可以做到?jīng)Q策的提前,規(guī)避潛在的風(fēng)險(xiǎn)。
舉個(gè)例子,比如他們都說(shuō)扁鵲治病很厲害,但真正厲害的是扁鵲治未病之病,生小病時(shí)已經(jīng)治好了,其實(shí)先覺網(wǎng)絡(luò)就是這樣一個(gè)思考!
汽車之家:比如我們很多車在路上跑會(huì)收集很多數(shù)據(jù),把實(shí)時(shí)數(shù)據(jù),比如路況信息,一些障礙信息提前輸入到端到端Plus網(wǎng)絡(luò)之中,同樣路況下我知道前面有一定障礙風(fēng)險(xiǎn)了,提前減速,做提前的準(zhǔn)備,再結(jié)合端到端更好地去過(guò)這個(gè)路口或路段。
石穿空:對(duì),我們說(shuō)本地老司機(jī)。
汽車之家:極氪車主都可以共享數(shù)據(jù)。
石穿空:現(xiàn)在我們剛起步,將來(lái)我們規(guī)劃當(dāng)中你開的本地化信息也可以共享。我這邊要強(qiáng)調(diào)數(shù)字先覺網(wǎng)絡(luò)不是一個(gè)圖,這次我們的無(wú)圖NZP只用了SD的導(dǎo)航信息,任何高清地圖我們都沒有用。數(shù)字先覺更多是本地司機(jī)的長(zhǎng)期記憶,就和大腦的海馬體有點(diǎn)像的,短期的記憶。它每天都在發(fā)生,又很重要,然后會(huì)轉(zhuǎn)化成長(zhǎng)期記憶存儲(chǔ)起來(lái)給大腦調(diào)用,跟海馬體的功能很像。我們起了一個(gè)名字叫“數(shù)字先覺網(wǎng)絡(luò)”,幫助大家更好的理解,它不只是一個(gè)圖。圖里可能是一些車道級(jí)信息,然后停止線,拓?fù)渥龅煤芗?xì),但你會(huì)發(fā)現(xiàn)坑不能算作傳統(tǒng)意義上的高精地圖。還有小區(qū)路口,經(jīng)常有車躥出來(lái),這不是高清地圖能標(biāo)識(shí)的。還有紅綠燈被樹葉遮擋,這種是動(dòng)態(tài)的時(shí)空環(huán)境的信息。
我們把數(shù)據(jù)先覺網(wǎng)絡(luò)歸納兩部分:1.信息先覺,有道路先覺、行為先覺、時(shí)空先覺。2.經(jīng)驗(yàn)先覺,我們將來(lái)會(huì)利用數(shù)字先覺網(wǎng)絡(luò)去把人駕的經(jīng)驗(yàn)和信息進(jìn)一步學(xué)習(xí)和提煉,實(shí)現(xiàn)駕駛經(jīng)驗(yàn)的先覺。我們知道上海司機(jī)開車的風(fēng)格和武漢司機(jī),成都、重慶、廣州的開車風(fēng)格都不一樣,不僅每個(gè)地方司機(jī)開車風(fēng)格不一樣,甚至每個(gè)人開車風(fēng)格也不一樣。這里把人開車的風(fēng)格,將來(lái)也可以丟到數(shù)字先覺網(wǎng)絡(luò)里訓(xùn)練,可以實(shí)現(xiàn)千城千面,更遠(yuǎn)的將來(lái)可以實(shí)現(xiàn)千人千面,因?yàn)橹挥凶约旱拈_車風(fēng)格是最習(xí)慣的。你把一個(gè)上海司機(jī)開車風(fēng)格丟到武漢去,他肯定不喜歡的。
端到端比以前規(guī)則時(shí)代已經(jīng)好很多了,因?yàn)橐?guī)則時(shí)代可能更像是新手司機(jī),我不知道這樣比喻對(duì)不對(duì)?赡芾蠋熃踢^(guò)的,教練教過(guò)的,他知道,他會(huì)去開,老師沒有教過(guò)的,他不知道怎么辦了,像新手司機(jī)。端到端之后,他更像一個(gè)開了幾年的老司機(jī),老師教過(guò)的東西,他上了路也有沒有遇到的情況,他自己摸索了。就像數(shù)據(jù)給喂了之后,他摸索學(xué)會(huì)了,有一些老師沒有教過(guò)的也能開。它的泛化性比規(guī)則要好,因?yàn)閿?shù)據(jù)丟進(jìn)去之后,它不僅遇到的問(wèn)題知道怎么解,類似的一連串的問(wèn)題也能解。端到端還是比規(guī)則時(shí)代提升了很多。
如果比作駕駛考試的話,相對(duì)于原來(lái)規(guī)則你考個(gè)六七十分,端到端上限能大幅度提升到90分。而VLM/MLM,像人類老司機(jī)一樣,我們開車場(chǎng)景不只是車或者人,有一些物理世界通識(shí)在里面。比如一個(gè)尼龍袋,端到端學(xué)習(xí)后認(rèn)為是一個(gè)突出的物體,是個(gè)GOD通用障礙物,不能撞。但有了VLM/MLM,它知道是尼龍袋可以壓過(guò)去,有更多的知識(shí)在里面,不僅是交通知識(shí),會(huì)幫助這個(gè)司機(jī)變成一個(gè)人類老司機(jī)。
如果說(shuō)端到端+VLM/MLM,可以做到95分,再進(jìn)一步你要考到99分的話,就需要數(shù)字先覺網(wǎng)絡(luò),將來(lái)在更多的情況下體驗(yàn)會(huì)更好。
汽車之家:特斯拉和小鵬已經(jīng)是純視覺,還有激光雷達(dá)的輔助,極氪未來(lái)考慮純視覺路線,還是激光雷達(dá)技術(shù)作為保障?
石穿空:在技術(shù)上我們兩條路線都是在做準(zhǔn)備的,為什么都在做準(zhǔn)備呢?其實(shí)有一個(gè)信息,我不知道你有沒有注意到,我們“浩瀚智駕1.0”發(fā)布之后,我們上線的007既有激光版又有純視覺版的。像其他友商最近在上純視覺的智駕,其實(shí)我們?nèi)ツ?2月份時(shí)候已經(jīng)上了純視覺版的,那時(shí)候只支持高速的能力。我們第一次量產(chǎn)時(shí)是同時(shí)配置兩個(gè)車型,其他廠商要么發(fā)激光的,要么先發(fā)視覺的,沒有兩個(gè)配置一塊同時(shí)發(fā)的。
對(duì)于第二點(diǎn)來(lái)說(shuō),你的問(wèn)題更多是純視覺將來(lái)要不要去做純視覺版城區(qū)的智駕。技術(shù)上我們會(huì)一直準(zhǔn)備的,但用不用,這里有兩個(gè)考量,我們本身的觀點(diǎn)認(rèn)為作為將來(lái)智駕的發(fā)展,包括現(xiàn)在從安全角度來(lái)講,激光也還是有必要的。因?yàn)榧す獗旧硎侵鲃?dòng)光的探測(cè),它在整個(gè)探測(cè)結(jié)果的時(shí)延、精度以及測(cè)速和測(cè)量距離、位置的精度上,其實(shí)是有天然不可替代的優(yōu)勢(shì)。然后尤其在黑夜或者雨霧、逆光場(chǎng)景,它不像攝像頭會(huì)需要ISP做不同的調(diào)校,讓算法去調(diào)優(yōu)。本身算力就會(huì)涉及到時(shí)延,激光是主動(dòng)物理的探測(cè),純視覺是基于算法的,時(shí)延上本身就會(huì)有些影響。還有測(cè)量精度,激光是有些優(yōu)勢(shì)的。我們認(rèn)為純視覺就像教一個(gè)小孩去學(xué)習(xí),他本身學(xué)習(xí)能力要很強(qiáng),視覺是打底的,是主要的東西。但激光并不是沒有用,激光的優(yōu)勢(shì)是顯而易見的。你優(yōu)先把視覺做得很強(qiáng),再用激光好上加好。
我們認(rèn)為激光將來(lái)更多用于安全的冗余、安全的兜底,包括面向?qū)?lái)更高階的駕駛,怎么去做冗余,傳感器的冗余是很有必要的,這是技術(shù)上的思考。
當(dāng)然,是不是激光或者純視覺,更多是商業(yè)上的思考,成本上去掉激光會(huì)更便宜一點(diǎn)。還有車型的定位是怎樣的,其實(shí)好多用戶越來(lái)越懂智駕了,它的芯片算力大不大,有沒有配置激光,用戶第一印象就是有沒有這個(gè)。有了這個(gè),我們會(huì)認(rèn)為好,然后再說(shuō)算法怎么牛,體驗(yàn)好不好。所以是兩方面,一方面是技術(shù)的,一方面是商業(yè)上的車型定位,以及這個(gè)車型將來(lái)對(duì)應(yīng)的用戶群體怎么樣,這個(gè)可能不是技術(shù)上怎么樣,技術(shù)上就做好準(zhǔn)備。
汽車之家:我們現(xiàn)在聽到一些用戶聲音,一種是用純視覺的,覺得算法已經(jīng)特別好了;還有一種認(rèn)為用純視覺就省成本,不給高端硬件。還有的認(rèn)為用激光的更安全更有保證,還有的認(rèn)為用激光的算法不好,用戶也在搖擺之中,這個(gè)階段智駕大家還是在選走哪個(gè)方向,哪個(gè)路走得更順,我們都可以去選擇。
石穿空:這兩個(gè)技術(shù)路線,我個(gè)人認(rèn)為不是技術(shù)路線之爭(zhēng),因?yàn)閹Ъす庠谝曈X算法上的技術(shù)儲(chǔ)備我們一直在做的,不會(huì)說(shuō)用激光之后純視覺就不搞了,肯定純視覺基礎(chǔ)上再加入激光,同步在搞,本身不是技術(shù)路線之爭(zhēng),完全是產(chǎn)品定義的考量。你可以有純視覺,也可以有激光,具體取決于自己車型面向的是什么樣的用戶群體,你的車想賣到什么樣的成本價(jià)位,用戶群體是怎樣的,是這個(gè)思考,我認(rèn)為不是技術(shù)路線。我不認(rèn)為搞了激光之后,視覺技術(shù)就不搞了。
汽車之家:最后一個(gè)問(wèn)題,剛才聊了這么多智駕方面,極氪除了智駕,在本身產(chǎn)品競(jìng)爭(zhēng)力上也很強(qiáng),現(xiàn)在有什么可以分享新技術(shù),以及未來(lái)極氪產(chǎn)品的規(guī)劃。
石穿空:面對(duì)未來(lái)兩三年的技術(shù)架構(gòu),包括我們?cè)缟习l(fā)布端到端Plus的新技術(shù)架構(gòu)和數(shù)字先覺網(wǎng)絡(luò),技術(shù)方面我就不再重復(fù)了。
產(chǎn)品上最新的規(guī)劃,也是前面陳總介紹過(guò)的,除了無(wú)圖城市NZP,我在年底會(huì)全國(guó)全量釋放給搭載“浩瀚智駕2.0”車型,車位到車位的功能,2025年就看車位到車位了,因?yàn)?024年大家都在看無(wú)圖全國(guó),2025年就在看車位到車位。車位到車位,其實(shí)目前為止,但我還沒有看今天廣州車展的情況,反正之前我了解到也就1-2家友商給媒體試駕過(guò),給用戶試駕過(guò),其實(shí)沒有幾家。我們極氪是第一批這樣去發(fā),包括10月底我們已經(jīng)給大量媒體真正體驗(yàn)過(guò)端到端,我們地庫(kù)的兩個(gè)抬桿可以過(guò),還上了高速的ETC,我們的端到端支持一次可以過(guò)4個(gè)抬桿。
汽車之家:今天友商這些我們?cè)趯?shí)踐中已經(jīng)可以體驗(yàn)了。
石穿空:因?yàn)槲覀儽旧聿窜嚨哪芰σ埠軓?qiáng),機(jī)械車位也可以支持,因?yàn)楝F(xiàn)在整個(gè)行業(yè)支持機(jī)械車位的也就一兩家。我們針對(duì)無(wú)劃線車位,本身泊車就支持。所以端到端我們預(yù)計(jì)2025年1月份會(huì)分批開始啟動(dòng),向用戶推送。我們的目標(biāo)是計(jì)劃在2025年年中左右,上半年看能不能更大規(guī)模給用戶推送出去,大概是這樣的。
汽車之家:謝謝,今年極氪是給了我們非常多驚喜的品牌,包括產(chǎn)品,包括技術(shù),包括價(jià)格。
石穿空:下半年我們迭代很快,包括無(wú)圖智駕方案,用戶反饋說(shuō)其實(shí)他沒有那么急,但極氪是真的快!
汽車之家:以前我們感覺新勢(shì)力往前跑得很快,我們這些有傳統(tǒng)車企背景的品牌會(huì)比較嚴(yán)謹(jǐn),F(xiàn)在看,極氪不管從嚴(yán)謹(jǐn)角度還是從技術(shù)迭代角度都很快,讓用戶可以持續(xù)體驗(yàn),在銷量上勢(shì)頭也很猛,包括7X銷量也是能印證的。除了卷價(jià)格之外,極氪的產(chǎn)品力也很強(qiáng)。
好評(píng)理由:
差評(píng)理由: