【核心觀點】
智能副駕:以前開發智能座艙時,各種人機交互模式都是相互割裂的,相當于有眼睛,有耳朵,卻沒有一個統一的大腦?,F在技術進步了,可以把這些功能全部放到大模型中訓練,機器的識別水平能夠做到非常接近于人,真的可以稱之為智能副駕。
車端算力:對于手機產業來說,把算力放在云端無疑是比較好的選擇;但是對于汽車產業來說,車端必須要有一定的算力,因為汽車是移動的,而網絡信號不可能真正實現全方位、無死角的覆蓋。
高階自動駕駛:實現高階自動駕駛有兩條路線:一是直接奔向L4,即Robotaxi路線;二是循序漸進、逐步優化。后者可能更容易實現,我們還是要經歷從輔助駕駛到高級輔助駕駛、最后到高階自動駕駛的漸進過程,逐步實現各種功能的開放。
落地場景:在現階段最重要的工作是找準合適的場景,然后把落地工作做到位。自動泊車是應該優先落地的第一場景,而自動跟車是第二場景,這兩個場景都值得企業全力投入,把產品體驗和成本做到極致,這樣消費者一定會買單的。
“去地圖”不可行:地圖是確定位置和進行導航的基礎。汽車離不開地圖,所以嚴格意義上的“去地圖”根本沒有可行性。
先驗傳感器:高精地圖可以動態、實時地更新車輛前方的狀況,所以可將其看作是智能汽車的一種傳感器——先驗傳感器,這對于高級輔助駕駛或者高階自動駕駛都非常重要。
地圖實時更新:目前地圖生產的各個環節及整個鏈條已經取得了巨大的進步。地圖生產最大進步就是現在數據源比以前實現了數量級上的跨越,而且還在不斷增多,每一輛使用導航功能的汽車都在為地圖生產做出貢獻。第二個進步是數據識別工具鏈的全面升級,實現了地圖局部更新,并且能夠及時發布。
【對話實錄】
大模型有望讓機器智能真正接近于人
趙福全:下面具體談談汽車智能化,這實際上是一個綜合性的大話題。在通過V2X(車聯網)實現汽車與諸多要素互聯的基礎上,車企的重點工作主要有兩項,一是智能座艙,二是自動駕駛。
在我看來,首先要做好的是智能座艙,因為智能座艙可以讓消費者充分感受到車輛的個性化,這一點在業界已經形成了共識。而對智能座艙來說,人機交互是最重要的。近年來智能座艙特別是人機交互的相關技術進步得很快,例如當前多種模式相互融合的多模態交互日益成為發展方向。
智能座艙應該也是四維圖新的重要業務領域之一吧?畢竟現在圍繞著地圖的人機交互已經成為智能座艙中必不可少的一部分了。不知道程總怎么看智能座艙?您覺得智能座艙后續將如何發展?其競爭的關鍵點在哪里?
程鵬:您說得很對,智能座艙與四維圖新的業務有非常緊密的關聯。這里面的邏輯是這樣的:地圖告訴用戶,汽車在哪里,這是確定A點位置的問題;導航告訴用戶,汽車怎樣開到目的地,這是從A點移動到B點的問題;而路況監測通過車聯網告訴用戶,從A移動到B點的過程中會發生什么,如需要多長時間?路上有沒有事故?這是如何安全、快速、便捷地從A點移動到B點的問題,也是我們正在研究并希望能夠更好解決的問題。
結果我們發現,解決這個問題是極其復雜的。大家都有體會,大中城市特別是一線城市的交通擁堵是很嚴重的。有數據顯示,北京通勤者人均每天要在汽車上耗費1小時40分鐘。而一天不過24小時,除去睡眠等時間,這差不多相當于人們可支配時間的10%了。我們常說,時間就是生命,這意味著我們有10%的生命都消耗在了行車的過程中。所以,四維圖新決定去做自動駕駛,致力于逐步把人從駕駛中解放出來。這樣一來,人在車上的自由時間就會越來越多。所以,四維圖新也要做好智能座艙,讓用戶在車上有更好的體驗。這就是我們從地圖出發進行業務拓展的內在邏輯。
應該說,我們做地圖已經二十年了,深深地感到這是一項艱苦的工作。因為地圖需要不斷更新,而且用戶可能永遠都不會百分百滿意。只要有一個地方發生了變化,地圖卻沒有及時體現出來,用戶就會不滿,就會認為地圖質量不好??梢?,做地圖是很有挑戰性的。而四維圖新二十年來堅持不懈,就是要應對這種挑戰,把這項有價值的工作一直做下去。
以地圖為基礎,我們開展智能座艙相關業務也已經有十多年了。記得我一開始就提出了一個目標,讓用戶進入到車內就不再用手機了。然而這是一個很難達成的目標,甚至可以說我們很長時間都看不到希望。因為與手機不同,人與車之間最方便的交互方式就是語音。而語音交互技術是很難的,包括機器對人類自然語言的理解、不同音區的識別、環境噪聲的處理以及語音引擎的能力等,都不簡單。很多時候我們訓練了好多次,機器才勉強能聽懂一點點。這就導致語音交互的準確率到了一定程度之后,就很難再提高了。我們的測試表明,語音交互的準確率要達到95%以上是非常困難的,而這樣的準確率對汽車用戶來說還不夠。
好在不斷有新技術涌現出來,尤其是GPT(生成式預訓練模型),即所謂大模型投入應用后,我覺得終于看到了希望。借助于GPT,我們有望實現讓人們進入到車內就完全不用手機了。最近我們從GPT-3入手,找專業的團隊合作開展了研究?,F在我可以有把握地說,在GPT-3.5和GPT-4這種規模級別的大模型的訓練下,用戶已經感覺不出和他對話的是機器了。
同時,人機交互不只有語音,您剛才也講到了多模態。有了大模型之后,我們還可以把多模態的交互方式放在一起訓練,從而真正實現語音交互與其他交互方式的有機融合。比如攝像頭可用于識別人的表情、動作,甚至能準確判斷駕駛員有沒有喝酒;又如毫米波雷達可用于監測人的心跳、呼吸;再如座椅靠背的傳感器可以感知人的體溫。這些信息與用戶聲音傳遞出的語氣、心情等信息結合起來,就可以更全面、精準地把握用戶狀態,優化用戶體驗。
以前開發智能座艙時,上述這些交互模式都是相互割裂的。語音交互歸屬語音系統,攝像頭歸屬乘客監測系統,諸如此類,所有功能都是獨立開發的。相當于有眼睛,有耳朵,卻沒有一個統一的大腦?,F在我們把這些功能全都放到大模型中訓練,結果發現機器的識別水平能夠做到非常接近于人,真的可以稱之為智能副駕了。舉個例子,駕駛F1賽車需要極快的反應速度,很需要輔助支持;但車內只有一個座位,不可能配備人類副駕。而智能副駕或者說機器導航員可以適時告訴駕駛員,前面多少米需要左轉或右轉等信息,從而提供很大的幫助?,F在已經有一些大模型能夠做到這種程度了,四維圖新也做出了樣品,預計再過一段時間就能推向市場。
趙福全:這樣說來,不只是地圖領域,程總也是為人機交互領域做出了重大貢獻的企業領軍人。正是因為有很多像四維圖新這樣的企業共同努力,我們才得以看到擁有更高人機交互能力的智能座艙由量變到質變的發展前景。那么據您所知,大模型真正走向市場應用還有哪些障礙呢?
程鵬:我認為,障礙主要在大模型的輕量化和網絡的延遲上。眾所周知,大模型對算力的要求非常高,所以GPU(圖形處理器)等功能都集中在云端。未來我們希望能把大模型適當輕量化,至少可以把部分功能放在車端,以實時應對相關的狀況。當然,即便大模型實現了輕量化,將其部分功能放到車端,也會對車端的算力提出不小的挑戰。此外,還有網絡的問題。使用大模型時必然會有大量數據在車端和云端之間傳輸。而汽車與手機完全不同:手機通常是在網絡信號穩定的建筑物內靜止使用,出現信息延遲的可能性較小,并且偶有延遲也沒什么關系;汽車則是在網絡信息不太穩定的室外移動使用,其波及范圍更廣、場景變化更多,在行駛過程中難免遇到信息延遲,并且一旦延遲就可能導致安全事故。這對于大模型在汽車產品上的應用,確實是一個比較突出的挑戰。
趙福全:在您看來,與當前算力主要放在車端的車載交互系統相比,在性能上更勝一籌的大模型,大致什么時間能夠量產?現在大模型還不能量產的原因主要是技術問題,還是成本問題?又或者是兩類問題兼而有之?
程鵬:最近我們已經把樣品拿給客戶看過了,這個客戶是一家致力于打造高端產品的車企,對智能化有很高的要求。而這家車企看了我們的樣品后,應該說是非常震撼。這款樣品估計兩三年后就可以量產,現在軟件本身已經沒什么問題了,主要問題還是性價比。我覺得,要提高這類產品的性價比,通信基礎設施的建設以及計算芯片的進步也很關鍵。
趙福全:您認為最終在汽車產品上量產應用的人機交互大模型,其主要算力應該是放在車端,還是云端呢?
程鵬:這個問題我是這樣看的:對于手機產業來說,把算力放在云端無疑是比較好的選擇;但是對于汽車產業來說,車端必須要有一定的算力,因為汽車是移動的,而網絡信號不可能真正實現全方位、無死角的覆蓋。我們做地圖時需要在各種區域、各個時段測試網絡信號的強弱,還要專門研究網絡如何優化,所以對全國各個基站的覆蓋范圍和強度都很了解。我認為,要確保大模型在每一個地點都能正常使用,且體驗足夠好,完全依靠云端算力實在太難了,還是要在車端部署相當程度的算力才行。
趙福全:您在這方面有豐富的實戰經驗,非常了解網絡系統的實際情況,結合汽車具有移動性的特點,您判斷大模型的算力是不能全都放在云端的。那后續會不會是這樣的發展過程:現在車載芯片是以計算芯片為主;未來車端的算力將逐步轉移到云端,所以車載芯片將以通信芯片為主,同時車端仍適當保留一部分算力。不過這似乎是一個理想化的過程,而且這種轉變恐怕需要很長的時間。這是不是因為我們對未來網絡和云的發展潛能估計得有些悲觀了呢?不少從業者還是期待把車端的諸多業務放到云端來完成,再基于通信手段來實現對車輛的遠程控制。您對此怎么看?
程鵬:我覺得這種轉變不大可能。我們還是以手機來做對比,現在手機的通信能力無疑越來越強了,那它的算力是越來越強了,還是越來越弱了?顯然也越來越強了。同樣的,汽車不僅是連接的節點,也是智能的終端,未來車端的算力肯定也會越來越強。而且一旦汽車具備了更強的算力,肯定會涌現出與之匹配的很多新需求。正如您剛才講到的,未來汽車將是一個母生態,有著孕育和承載更多新產品、新應用、新服務的能力,而算力正是這種能力的重要組成部分。當汽車沒有足夠的算力時,大家自然不會去研究相應的產品、應用和服務;可是當汽車具備了更強的算力后,就會有人去思考,我能用這個算力來做些什么,于是就會產生一系列的新產品、新應用和新服務。
趙福全:我認為,未來汽車將是一個移動的智能空間,尤其是當車輛逐步實現了自動駕駛、把人從駕駛中解放出來之后,汽車的空間屬性將進一步放大。屆時汽車既是生活空間,又是工作空間,還是娛樂空間,將真正實現三合一。甚至有人半開玩笑地講,將來只需要買一輛汽車,就等于擁有了一個可移動的家,各種事情都可以在車上完成。我覺得這并非天方夜譚。事實上,現在英國、荷蘭等國家就有人住在船上,這些船還有通訊地址,可以正常收發郵件。在這樣的前景下,智能座艙的重要性無疑會愈發突顯,我們完全可以暢想更多的應用場景。
剛才程總和大家分享了很多非常重要的觀點。您闡釋了自己對于地圖、自動駕駛以及智能座艙內在邏輯關系的系統認知。您談到,首先要告訴用戶“你在哪里”,即所在的位置;然后要告訴用戶“你怎樣去那里”,即兩點之間的路徑;最后要告訴用戶“你去那里的過程會怎樣”,即在兩點之間移動時會遇到的情況,如途中是否堵車等等,以此來確定如何更安全、更快速、更便捷地移動。對于這三個問題,地圖無疑都是基礎性的支撐,決定著我們能在多大程度上優化車輛的移動過程。而您也談到了,要做好地圖是非常困難的。
為了更好地解決上述第三個問題,我們一方面要努力做好自動駕駛,另一方面也要努力做好智能座艙。對后者來說,人機交互最為關鍵。因為人的需求總要通過某種方式傳遞給機器,同時機器必須準確理解相應的需求并做出回應,這樣才能確保智能座艙的功能及其體驗。但是此前各種不同的人機交互方式都是相互割裂、獨立開發的,而且最主要的語音交互方式在準確率上還不盡如人意,這就導致用戶的體驗始終不夠好。歸根結底,這是因為機器仍然做不到接近于人,不能像人那樣綜合、準確、快速地處理和利用各種信息。
不過程總興奮地談到,GPT大模型讓我們看到了希望。我注意到,您沒有講ChatGPT,即面向聊天的大模型。因為GPT本身并不限于文字,可以是語音,也可以是圖像,例如人的表情或手勢,還可以是各種方式的組合。有了這樣的綜合處理能力,機器將非常接近于人。當大模型在車上應用時,就可以通過車內人員的語言、表情、手勢以及身心狀態等各方面的信息,做出綜合的判斷和行動。不過,大模型應用于汽車產品還面臨一系列挑戰。特別是如您談到的,汽車與手機不同,必須最大限度地確保安全,因此對數據傳輸的速度和穩定性都有更高的要求。但我毫不懷疑,這場革命性的改變終將實現。而您談到,四維圖新基于大模型的產品在兩三年后就會量產,這非常讓人期待。
說到底,大模型需要很高的算力,其性價比的提高還有賴于通信能力的升級和計算芯片的進步。展望未來,我認為,智能汽車作為可移動的數據節點和智能終端,必須具備很強的通信能力;同時在滿足必要需求的前提下,車端應盡可能少部署算力,而將更多的算力放到云端;并以強大的通信基礎設施和車輛通信能力,充分保障大量數據在車端和云端之間的順暢流通。唯有如此,汽車才能以更低的成本實現更多的功能和更好的體驗,進而實現所謂智能時代的科技平權。這才是智能座艙的最高境界,也是很多人都希望把算力轉移到云端的根本原因。
發展自動駕駛需要企業保持戰略定力,落地重點場景
趙福全:我想剛才這番交流,一定讓大家對智能座艙有了更多的理解,也有了更多的期待。那么自動駕駛呢?有了GPT的賦能,自動駕駛在規劃行車路線和操控車輛時,會不會也有根本性的改變?我們都知道,自動駕駛需要感知能力、決策能力以及執行能力,那GPT能不能把感知、決策與執行系統打通呢?
事實上對于自動駕駛,當前業內也有不少質疑的聲音。曾經自動駕駛的熱度極高,很多自動駕駛初創公司的估值都非常驚人,然而今天的狀況可以說冷清了許多。具體來看,一是L2+已逐漸成為產品標配,而車企正面臨著性價比方面的嚴峻挑戰;二是大家發現量產L3的困難超出預期,之前可以歸咎于法規限制,但是現在法規逐步松動了,如何平衡好技術投入和體驗升級的問題卻并沒有得到真正的解決;三是大家普遍認為過去對于L4量產時間的估計太過樂觀,一些車企甚至因此中斷了對L4的投入。
不知道程總怎樣看待自動駕駛技術產業化發展的現狀?對于不同級別的自動駕駛技術,四維圖新的開發策略是怎樣的?
程鵬:前面談到,四維圖新的業務早就已經從地圖拓展到了智能座艙和自動駕駛,甚至可以說,我們現在是以自動駕駛為龍頭來拉動其他相關產品的研發。從2015年開始,我們做自動駕駛也已有八年了。在這期間,我從來沒有悲觀過,也沒有過分樂觀過。我覺得,對于自動駕駛我們應該管理好自己的期待值。那些過分樂觀的人就是期待值太高了;反過來,過分悲觀的人期待值又太低了。我記得,早在2015、2016年的時候,就有樂觀的人認為,到2021年就能實現L4。而時間到了2022、2023年,還有悲觀的人認為,L4永遠都實現不了。不過如果我們認真審視這些年來自動駕駛技術的發展歷程,可能就不會太悲觀,也不會太樂觀,更不會受資本市場一時冷熱的影響了。
今天我仍然堅信,L4一定能夠實現,即人可以徹底脫手,不需要再握著方向盤。也就是說,汽車完全不需要人來控制的時代最終必將到來,只不過是時間早晚的問題罷了。當然,前進的過程注定充滿挑戰。尤其是因為汽車產業有其特殊性:其他產業的試錯成本相對較低;但汽車產品對安全性的要求非常高,事關汽車安全的試錯成本極其高昂。因此,任何新增的功能都不能給用戶帶來行車安全上的隱患,否則無論多么智能都沒有意義。事實上,智能汽車的目的就是給用戶提供更好的生活,這顯然必須以確保功能安全為前提。正因如此,所有開發自動駕駛的公司,即便技術和資金實力再強,也必須步步為營、循序漸進。
而這些年我也確實看到了,自動駕駛技術正在一點一點不斷進步,包括我們自己的產品也在不斷提升。所以不管外界怎么說,四維圖新肯定會繼續努力。其實現在已經有越來越多的消費者接受了某些自動駕駛功能,例如輔助泊車。說到底,自動駕駛的最終落地,不在于企業自認為技術有多先進,而在于用戶愿不愿意為之買單。只要我們把L4的相關功能及場景都逐一做到位,讓用戶的接受度越來越高,那L4完全落地的時刻自然就會到來。
在我看來,自動泊車是L4最容易實現的第一場景。所謂L4的自動泊車,就是在抵達目的地以后,人可以下車,由車輛自動尋找停車位并泊好;等到再次用車時,車輛從停車位自動駛出來接人。這個場景中車內無人,所以即使出現一些狀況,危害也不大。同時這個場景對時間也不太敏感,車輛可以低速泊入或駛出停車位,在技術上相對容易。更重要的是,這個場景是用戶經常遇到的,可以切實為用戶帶來便利。所以,用戶通常愿意也敢于嘗試。事實上,高階自動駕駛的某個場景究竟能否落地,很大程度上就取決于用戶敢不敢嘗試。相較于用戶坐在車內且車速較快的其他場景,自動泊車場景無疑具有先天優勢。
自動跟車,也就是自適應巡航,應該是第二場景。當前,這個功能的使用也很普遍?;旧暇邆銵2或L2+功能的車輛,用戶都會用到這個功能。因為遇到交通擁堵的時候,駕駛者需要頻繁踩踏板,是很累的,這時候使用自動跟車功能就輕松多了。而且無論是在城區內,還是在高速公路上,現在自動跟車功能都做得比較到位了。車輛可以自動跟著前車行駛,并保持安全的車距。
總體來看,實現高階自動駕駛有兩條路線:一是直接奔向L4,即Robotaxi路線;二是循序漸進、逐步優化。我本人一直是第二條路線的堅定支持者。我覺得,我們還是要經歷從輔助駕駛到高級輔助駕駛、最后到高階自動駕駛的漸進過程,逐步實現各種功能的開放。所以,雖然四維圖新現在也有開發L4的一個小團隊,但我們近期的目標并不是量產;我們全力推進量產的一直是L2+高級輔助駕駛的產品,現在這款產品已經裝車量產了,而且在市場上賣得很不錯。
趙福全:程總講得非常好。關于高階自動駕駛如何發展的問題,實際上是不好回答的。特別是近期業界一直有一種很強的聲音,不看好高階自動駕駛。不少原本致力于L4的企業紛紛轉向L2+,大家當然知道L2+不是真正的自動駕駛,但這也是當前情況下企業為了盡早推出產品、回收資金的一種“無奈”量產,或者說是很多自動駕駛初創公司為了生存下去不得不采取的一種折衷辦法。
而程總表示,自己從來沒有悲觀過,也沒有過分樂觀過。作為進入汽車智能化領域二十年的一名老兵,您并不是因為長時間的磨礪而變得遲鈍了,而是深刻理解了技術創新的基本規律。任何前景美妙的新生事物,一開始總是不乏一批狂熱的參與者。然而企業管理者不能狂熱,因為經營企業需要冷靜。程總就是這樣冷靜的參與者,您既堅信自動駕駛是未來汽車產業的大勢所趨,又對推進自動駕駛的長期性和復雜性有足夠的認識。所以,既不會盲目樂觀地超前發展,也不會因為資本熱度的降低或者某些企業的失敗而放棄投入。
剛才程總談到,四維圖新原本是一家地圖供應商,而現在是以自動駕駛為龍頭拉動整個公司的各項業務。這意味著四維圖新在地圖、人機交互、芯片以及數據等業務上的創新發展,都是圍繞著自動駕駛來展開的。這充分說明了,您對自動駕駛長期前景的高度重視和堅定信心,將其視為汽車產業發展的必由之路。另一方面,您認為企業必須一步一個腳印地穩步推進自動駕駛。畢竟企業既要考慮未來的發展,更要考慮眼前的生存。所以,四維圖新決定先從L2+入手,現階段重點做好L2+產品的量產;同時,四維圖新很早就成立了L4的研發團隊,以提前做好前瞻儲備。
實際上,高階自動駕駛本來也不會一蹴而就,不可能一夜之間就出現了完美的全天候自動駕駛產品。所以,發展自動駕駛一定是一個循序漸進的過程。只不過有些企業是從L2、L2+做起,逐步積累地邁向L4乃至L5;而另一些企業則直接瞄準了L4。但在研發L4的過程中,企業也需要“沿途下蛋”,將某些功能逐一落地,這既是為了驗證已有的創新成果,也是為了獲得一定的回報,以保障后續的投入。從這個意義上講,我倒覺得這兩種路線其實殊途同歸,在現階段最重要的工作都是找準合適的場景,然后把落地工作做到位。對此,程總給出了很重要的觀點——自動泊車是應該優先落地的第一場景,而自動跟車是第二場景,這兩個場景都值得企業全力投入,把產品體驗和成本做到極致,這樣消費者一定會買單的。至于說實現的是L2+、還是L4的功能,或者說是由高到低、還是由低到高來實現的,都無關緊要。
由此出發,我認為,那些認為高階自動駕駛遙遙無期甚至不可能實現的悲觀者無疑是錯誤的。事實上,現在的悲觀者中,可能有不少人正是此前的過度樂觀者,因為戰略誤判而投入過多、過早,以至于沒有賺到錢,甚至陷入了企業經營危機。這顯然是自身判斷的失誤,而非產業大勢的變化。
在此我還想特別強調,企業家和投資者是有本質區別的。資本追逐熱點,追求短線和賺快錢并沒有錯;但企業家必須有定力,應該追求長線、持續的發展模式和盈利能力,對于認準的方向,切不可隨波逐流,更不可朝令夕改。所以企業在引入資本時,也要考慮投資者是不是有一定的戰略遠見,或者會不會影響自己的戰略自主權,以免被純粹的資本考量所裹挾,導致急功近利,危及企業的長遠發展。
“去地圖”沒有可行性,自動駕駛需要地圖賦能
趙福全:程總,談到自動駕駛,一個不可回避的話題就是高精地圖。應該說長期以來大家普遍認為,解決了高精地圖的問題,自動駕駛的很多難題就都迎刃而解了。不過現在看來,高精地圖的問題也不好解決,無論是成本,還是更新速度等方面,都有挑戰。尤其像中國這樣地大物博的國家,保持地圖的快速更新是很困難的。此外,地圖不是隨便就可以采集和使用的,因為任何國家都會有很多敏感的地理信息,所以地圖供應商不得不面對相關法律法規的限制。這并不是中國特色,全球各國都是如此。
時至今日,一方面,車企感覺高精地圖的性價比還不夠好,同時受到的限制也比較多;另一方面,市場對自動駕駛產品的需求又非常強烈。所以,就產生了所謂“輕地圖”甚至“去地圖”的技術方案,對此業界也有很多爭論。那么,四維圖新作為一家資深的地圖供應商,是如何理解自動駕駛與地圖的關系的?您覺得高精地圖怎樣才能做到高性價比和快速迭代,以滿足市場需求?
程鵬:我認為,“無地圖”或者“去地圖”都不太可能發生。第一,現在一些車企提出的“去地圖”,本質上只是在車端不安裝高精地圖而已,但在云端進行全局規劃和車道引導時還是要用到地圖。如果車企完全不用地圖,那就無法知道自己的車輛在哪里,也無法知道要去哪里,更無法知道途中應該怎樣走、是否需要切換路線等等。所以,地圖和汽車天生就是一對。正如前面我講到的,地圖解決汽車當前在哪里、目的地在哪里的問題;導航解決汽車以什么路線從當前位置移動到目的地的問題;而自動駕駛解決汽車如何更安全、快速和便捷地從當前位置移動到目的地的問題。顯然,地圖是解決這三個問題的基礎。因此,汽車永遠也不可能沒有地圖,或者說汽車是肯定要使用地圖的。
第二,也有一些車企提出的“去地圖”方案,是依賴強大的實時建圖能力,而且這種實時生成高精地圖的能力確實在不斷增強。前面也提到了大模型,有了規模更大的數據以及能力更強的算法,實時建圖的能力當然會提升。不過需要注意的是,肯定還會有一些信息是汽車上的傳感器無法實時采集到的,比如一公里以后的車道匯聚或者車流量變化情況。除非車企每天都派出無人機在天上跟隨車輛來采集這些信息,但這無疑是不可能的。
所以,我還是希望,想把自動駕駛產品真正做到位的同行們都能認識到,地圖對于智能汽車是必不可少的一部分。當然,地圖的用法可能會有所變化。一是從技術角度看,可以考慮把高精地圖從車端改為布置到云端,或者說在車端由完整的高精地圖改為輕量級的高精地圖;二是從系統角度看,可以把高精地圖看作智能汽車的一種傳感器,我將其稱為先驗傳感器,相當于幫助車輛提前看到前方路況的傳感器,這對于高級輔助駕駛或者高階自動駕駛都是非常重要的。既然有這樣的傳感器,汽車為什么不使用呢?畢竟高精地圖可以動態、實時地更新車輛前方的狀況。而如果不用高精地圖,那就要用別的傳感器來采集這些信息,這將帶來高昂的成本。試想,使用三個激光雷達與使用高精地圖相比,哪個方案成本更高是顯而易見的。
趙福全:這還不只是哪種方案成本更高的問題,選擇激光雷達的方案,即使用上10個激光雷達,也測不到1公里以外的情況,更不可能掌握50公里以外的情況。在這方面,地圖所能發揮的作用是不可替代的。
程鵬:您說得太對了。何況從性價比的角度來看,使用高精地圖也是一個非常不錯的選擇。我覺得,任何一套系統在選擇構成時,都不應該只看某個組成部分的性價比,更應該看系統整體的性價比。而在高級輔助駕駛或高階自動駕駛系統中,綜合考慮采購成本和服務費用等,高精地圖是性價比較高的選項。
前面我也提到了,做地圖不是一件容易的工作,不僅需要持續的投入,而且要做好非常難。但是我們不能因為地圖難做就不做了,或者就不用了。就像自動駕駛、芯片等等,也都很難做,可大家還在持續努力。當然,根據產業發展的情況,有時候可能需要適當調整節奏,包括重新評估投入的資源、使用的方式和量產的計劃等。不過我認為,努力做好、用好地圖的決心不應該有絲毫的動搖。
更進一步來說,長期來看,我判斷汽車終究是要使用高精地圖的。盡管現在車輛的實時建圖能力不斷增強,然而至多也只能是在車輛可感知的兩三百米范圍內發揮作用,無法從根本上解決自動駕駛的功能安全問題。在自動駕駛領域有一個專業術語叫Corner Case,即所謂邊緣案例。通常這些邊緣案例發生的概率很低,但卻正是人工智能不“擅長”處理的。如果沒有高精地圖,智能汽車將很難決策應該如何做出合理的響應。
舉個例子,當汽車在行駛中遇到突發狀況已經難以避免碰撞時,是選擇追尾前車,還是選擇撞向路邊的護欄?在這種極端的情況下,智能汽車應該選擇危害最小、損失最少的撞擊方案。此時,實時掌握護欄是什么形狀的、又是什么材料的,就變得至關重要。而包含道路系統幾何特征和復雜屬性等各種信息的高精地圖可以為此提供有力支撐,從而顯著增強邊緣案例下汽車的功能安全。
總之,我覺得對于自動駕駛技術方案的選擇,我們還是應該從全面確保行車安全的前提出發,從能否切實支撐自動駕駛產品量產的角度考慮。
趙福全:程總不僅是地圖公司的企業家,也是地圖領域的技術專家。您剛才這番話非常重要,從企業和技術的雙重維度,為大家闡明了地圖的重要作用,特別是強調了我們應該與時俱進地客觀看待高精地圖的價值。
第一,對于當前業界出現的“去地圖”的聲音,有些只是自媒體的標題黨文章,也有些是發聲者帶有自身的某種商業目的,當然還有些確實是出于個人的不同理解,但這部分人通常也并不完全否定地圖的作用??傮w而言,我感覺“去地圖”的聲音被不合理地放大了。
第二,正如程總所言,汽車是離不開地圖的,所以嚴格意義上的“去地圖”根本沒有可行性。地圖可以告訴我們所在地以及目的地的位置,也可以為我們指示從所在地到目的地的路線。也就是說,地圖是確定位置和進行導航的基礎。當然,我們日常使用的導航地圖與自動駕駛系統使用的高精地圖有很大的差別。高精地圖不只精度要達到厘米級,而且還要對諸如車道線、護欄等道路情況進行精準的幾何標注。而程總認為,這些信息對于確保自動駕駛汽車的功能安全至關重要,因此高精地圖和導航地圖一樣,對汽車來說是不可或缺的。
第三,自動駕駛系統希望高精地圖在全域范圍內做到高精度,同時做到實時更新。這個目標太過理想化了,很可能永遠都無法完全實現。但這并不意味我們不能逐漸接近這個理想目標,事實上,今天的高精地圖已經取得了顯著進步?,F在一些企業提出的所謂“去地圖”方案,其實并不是拋開了高精地圖,而是出于成本壓力,只使用現有的高精地圖,不再強求全域覆蓋和實時更新罷了。如果真的完全不用高精地圖,那就得靠車端的其他傳感器來補足相關的信息,這樣自動駕駛系統的成本恐怕只會更高,而且還可能導致車輛定位等功能的下降。
所以,正如程總指出的,“去地圖”這個說法具有一定的誤導性?,F在很多車企正使用著地圖供應商經過多年努力完善后的高精地圖,盡管現有的地圖還不是理想狀態,但相比之前已經進步了太多。在這樣的基礎上談“去地圖”,我倒覺得這其實是對高精地圖持續進步的一種肯定。
另外,站在當前的時間點上,隨著車端各種傳感器的能力、數據處理的能力以及信息傳輸的能力大幅提升,車企確實可以考慮另辟蹊徑,通過實時建圖的方式來替代高精地圖。特別是對于目前日益成為標配、越來越考驗性價比的L2+高級輔助駕駛來說,這未嘗不是一種可選的方案。然而未來的高階自動駕駛,恐怕還是不能脫離高精地圖。因為唯有高精地圖才能提供整個區域內交通狀況及道路設施等的精準信息,從而讓汽車在一系列危險的邊緣案例場景下,能夠以相對較低的成本來確保足夠的功能安全。我認為,程總的這個觀點很重要。
地圖生產的各個環節、整個鏈條都取得了巨大進步
趙福全:接下來我們探討一下地圖的制作。我們知道,原來地圖供應商都是依靠地圖采集車,就是那種頂著多種傳感設備的車輛,到處采集地圖數據的;而現在地圖采集方式已經發生了很大的改變。利用今天這個機會,請您談一談地圖的生產技術和模式都有哪些進步?目前還有哪些局限性?比如當前所謂的眾源方式,是不是每輛車都能成為地圖信息的提供者?但如果某輛車提供的數據存在問題,又該怎么辦呢?
程鵬:在過去的二十年中,四維圖新做出了不少中國第一,包括中國第一張導航地圖、中國第一張實時路況地圖、中國第一顆國產化車規級的量產MCU(微控制器)芯片等等。我也有幸成為了親歷者。應該說,這一路走過來,我們確實遇到過很多艱難的技術挑戰。
就拿地圖來說,我們最早的一版地圖就是幾個人開著一輛車,帶著一張交通圖、一個GPS軌跡記錄儀、一臺照相機,然后走街串巷,拍下一條條道路、一個個路口的照片,最后做成地圖的。這就是二十年前地圖的生產方式。顯然,那個時候是做不到快速更新道路情況變化的。
而現在我們能夠做到,中國幾百萬公里的道路,任何一個地方發生變化,我們當天就能掌握信息,當天就能更新到地圖上。這是怎樣實現的呢?說起來,做地圖本身是一個非常復雜的系統工程,而這個系統工程包含兩個關鍵點:一是增加數據源的數量,即從盡可能多的源頭獲取地圖數據信息。二是快速分辨信息的有效性,即以某種工具盡可能快地識別海量數據中哪些是有效信息、哪些是無效信息。這樣才能獲取足夠的信息,并將其中的有效信息快速提煉出來,然后轉變成地圖,及時發布給用戶。而以這兩個關鍵點為核心,地圖生產的各個環節、整個鏈條目前都已經取得了巨大的進步。
第一個進步,我認為也是最大的進步,就是現在的數據源比以前多得多,而且還在不斷增多。以前的數據源就是我們公司的100多輛地圖采集車,包括我在內,大家都得成天開著車到處采集數據。而現在每一輛使用導航功能的汽車都在為地圖生產做出貢獻。由于每天都有千萬量級的用戶在使用導航功能,所以,數據源的增加實現了數量級上的跨越。
第二個進步是數據識別工具鏈的全面升級。以前我們制作地圖時使用的是型號為880的服務器,將數據上傳之后,需要運行一個月才能處理完畢,導致地圖的實時性極差。這主要是因為傳統的拓撲關系是一個整體,要制作一張地圖就要構建一個完整的數據庫,通常耗時一個月才能建好,因此地圖更新的周期非常漫長。而現在地圖編譯的整個工具鏈都已經發生了變化,在新的拓撲關系下地圖可以瓦片式地構建和迭代。也就是說,地圖可以一小塊一小塊地更新,并且在更新的同時就能及時發布。畢竟現在多數車輛都已實現了聯網,所以,我們能夠將更新了的地圖第一時間傳遞給用戶。