近日,特斯拉CEO馬斯克不到24小時的“閃電訪華”引起廣泛關注,有消息稱其目的在于推動完全自動駕駛(FSD)系統在華落地。這次短暫的訪華讓馬斯克收獲頗豐,特斯拉通過了中國汽車數據安全4項全部要求,成為其中唯一一家符合合規要求的外資企業。
今年來,特斯拉動作不斷,從推送基于端到端神經網絡的新一代FSD,到宣布8月份發布Robotaxi完全擺脫駕駛員的出租車,無一不在彰顯其在自動駕駛里的領軍地位。在汽車智能化的大潮之下,自動駕駛已成為車企和各路資本爭相布局的重點領域。結合當下火爆的人工智能深度學習技術,頭部玩家嘗試“設備上做減法,算法上做加法”,“重感知”還是“純視覺”,自動駕駛的實現方式受到越來越多的關注。
AI技術賦能
“純視覺”方案有了落地基
在汽車電動化浪潮下,車企之間加速“內卷”,車型不斷推陳出新,更長的續航、更“壕”的內飾、更低的價格……但僅僅做到增配減價似乎不足以打動消費者,越來越多的主機廠以及技術服務商著力在自動駕駛技術上做文章。
當下,實現自動駕駛出現了兩條路徑:特斯拉選擇徹底放棄激光雷達,選擇依賴攝像頭的“純視覺”自動駕駛方案;不少車企則堅持配置雷達設備,選擇“重感知”的多設備融合自動駕駛路徑。
今年3月,特斯拉在北美推送了FSD軟件更新,馬斯克稱其是一次大版本更新的“重磅發布”。據悉,新版本在算法層面做了較大改動,全程使用端到端神經網絡,無需任何人工程序規則介入,汽車的自動駕駛能力有了明顯進步。
在自動駕駛技術上,特斯拉無疑扮演著領頭羊角色。正是基于神經網絡應用深度學習算法,特斯拉才有了拋棄雷達設備的底氣,成為“純視覺”駕駛方案的堅定擁護者。
南方科技大學教授、無人駕駛專家郝祁表示,自動駕駛企業普遍采用了基于程序規則的算法體系,汽車在行駛中根據既有程序命令去執行相關操作,這需要多傳感器合作為汽車提供準確的環境信息。當前,基于人工智能技術的應用,端到端模型正在改變自動駕駛傳統模塊化的實現方式,無需冗長的代碼來制定規則,而是利用海量數據進行訓練,讓汽車擁有自主學習的能力以應對復雜的駕駛場景。“人工智能算法能力提升,自動駕駛中對于行駛場景的解析能力更強,因此,通過硬件設備獲取信息需求就自然而然降低了。”他說。
如果說算法是“純視覺”方案實現的基礎,低成本則是推動其商業化背后的動力。
郝祁指出,在自動駕駛的傳感器設備中,激光雷達雖然近幾年價格下降很快,但與攝像頭相比,仍然是成本較高的設備。激光雷達的成本可以分為設備成本與開發成本兩部分,其應用的激光線束越多價格就會越高,開發與之相適應的算法數據集也是一筆不小的支出。
感知融合視覺
多傳感器協作仍是行業主流
當下,采用感知融合視覺的多傳感器協作方式實現自動駕駛依然是主流選擇。
近年來,國內以“蔚小理”為代表的造車新勢力、傳統主機廠以及百度、華為等科技大廠紛紛布局自動駕駛,并且不斷有新的自動駕駛初創公司參與其中。它們大多主張通過搭載激光雷達、毫米波雷達、攝像頭等方式來增強單車感知能力,從而實現快速量產,完成商業化落地。
與人類駕駛員開車的方式類似,自動駕駛的核心系統由三部分構成:感知系統、決策系統與執行系統。
郝祁表示,車輛需要通過傳感器感知分析行使環境與交通標識,并對周圍運動目標的軌跡進行預測,根據機動協議進行路徑規劃和運動規劃形成決策,再按照實際道路情況做出加油、剎車或者轉向變道的操作。在實現自動駕駛的過程中,感知是先決條件,這就類似于駕駛員的眼睛,對路況信息進行捕獲之后才能做出準確的駕駛操作。
“采用多傳感器融合的方式,可以讓設備功能取長補短,最終形成一個綜合解決方案。”深圳清華大學研究院無人駕駛智慧城服研發中心主任陸有源指出,在自動駕駛中,攝像頭和激光雷達的分工不同,攝像頭像素高主要用于圖像信息的采集,實現精細化識別,例如各類車道線、交通標志、行人、障礙物等。激光雷達的作用則在于精準測算距離,且不受光照影響白天和晚上都能照常工作,但無法對障礙物的語義、材質軟硬進行精確描述。
“激光雷達屬于探測環境信息的主動傳感器,通過發射激光束的往返時間來精準測算汽車與前方障礙物的距離,而攝像頭屬于被動傳感器,容易受到天氣與光照的影響。單純從技術的角度出發,多融合方案一定具備優勢,感知設備哪怕只是作為輔助做出很小的糾正,汽車的安全性能也能提升一大截。”郝祁說。
技術日新月異
自動駕駛將走向何方?
依托攝像頭的“純視覺”與多設備融合的“重感知”,兩種方案各有所長,哪一種才是自動駕駛最佳的實現方式?
“我比較看好‘純視覺’自動駕駛方案,特斯拉采用的端到端神經網絡實際是從仿生學的角度讓機器模仿人類開車,人類駕駛員只用眼睛就足以識別周圍的駕駛環境,而攝像頭充當的就是眼睛的功能。普及‘純視覺’方案取決于兩個因素,一是攝像頭硬件技術的迭代升級,二是人工智能算法體系的先進性。”陸有源說。
陸有源表示,攝像頭技術的升級讓汽車具備識別更多復雜環境的能力。當前,人工智能算法正越來越多地應用到自動駕駛中,“純視覺”方案推廣的關鍵還在于能否進行充分的模型訓練,數據基礎是否牢固,只要有海量豐富的數據積累,攝像頭就足以應對各種場景。
根據特斯拉描繪的藍圖,利用神經網絡深度學習,降低了汽車對于雷達感知類傳感器設備的依賴度,汽車還能越開越智能,自動駕駛越用越流暢,這看起來的確令人興奮,但落地實施并不容易。
算法開發的投入就是一筆不小的開支,足以讓后來者望而卻步。根據馬斯克的計劃,特斯拉今年將在訓練和推理人工智能方面投入約100億美元。早在今年1月,特斯拉還追加了5億美元新投資,購買約1萬個英偉達GPU芯片。可見,沒有持續的真金白銀投入,用AI賦能自動駕駛難有保障。
郝祁認為,用單一視覺傳感器就實現自動駕駛,需要引入人工智能通用大模型,讓自動駕駛的汽車形成足夠豐富的“知識庫”,而不是只進行駕駛技能單項訓練,知識結構越豐富,駕駛中出現問題的可能性就會越小,但大模型訓練的能耗和成本十分高昂。
在自動駕駛落地驗證的過程中,駕駛安全始終是繞不開的領域。郝祁還表示,人工智能技術目前還在發展初期尚存短板,比方說,自動駕駛中如果出現事故,神經網絡不具備追溯性,無法找到問題的來源,在安全性問題上算法本身還有很大的優化空間。
自動駕駛仍然處于發展初期,市場各方都在爭搶這塊大蛋糕。站在創新大變革的時代,技術路徑到底如何選擇,且讓我們拭目以待。
特斯拉:完全自動駕駛落地僅“一步之遙”
特斯拉首席執行官埃隆·馬斯克最近表示,我強烈建議你一定要試用FSD,不了解FSD的話你很難說自己了解特斯拉。現階段業內對特斯拉FSD V12都比較期待,對其是否能進入中國市場也充滿想象。那么特斯拉FSD有何神奇?
特斯拉FSD全稱為Full-Self Driving(全自動駕駛),是特斯拉研發的一套智能駕駛系統。基于大規模行駛里程、自研運算平臺、巨大算力的布局,目前FSD已進入V12.3階段。特斯拉方面表示,完全自動駕駛距離走入現實僅“一步之遙”,其大規模商用一旦落地,將成為特斯拉利潤豐厚的“現金奶牛”。
FSD V12的工作原理很簡單。系統通過車輛攝像頭拍攝畫面,跟特斯拉積累的近萬億公里的歷史行程數據進行比對,篩選出一些與當下場景很接近的場景數據。根據駕駛員之前怎么操作的,FSD就怎么操作。
值得一提的是,現在FSD沒有任何預設條件,也沒有對應規矩,FSD完全根據學習人類的經驗來做判斷。這個AI程序的工作變得非常簡單,對硬件、算法要求直線下降,而且功耗也變低,但從實際的開車效果來看,已經非常接近于人類司機的駕駛效果。
今年開始,特斯拉的智能駕駛軟件FSD V12版本已經在北美加速落地,同時,特斯拉已經將FSD從測試版本的“FSD Beta”更名為“FSD Supervised”,業內認為,這意味著FSD已經結束公測,進入規模商業化的環節。