久久久国产精品视频_国产成人精品日本亚洲专_日本午夜大片免费观看视频_97av麻豆蜜桃一区二区

首頁 > 活動線報 > 每日福利 > 關(guān)于高階智駕不可不知的四個詞:端到端、D2D、VLM、VLA

關(guān)于高階智駕不可不知的四個詞:端到端、D2D、VLM、VLA

發(fā)布時間:2025-03-20 00:45:37來源: 18638159832

幾年前談到自動駕駛,廠家卷的還是芯片算力和激光雷達數(shù)量,但如今消費者已經(jīng)意識到,硬件的豐儉與實際的智駕能力并不成正比,很多時候都是割韭菜的噱頭。最典型的例子是放言“4顆(激光雷達)以下別說話”的機甲龍,以及搭載4顆英偉達Orin芯片,總算力達到1016 TOPS的蔚來ET7,前者胎死腹中,后者寂寂無名。

從去年開始,業(yè)界迅速從卷硬件過渡到卷軟件。相比看得見摸得著的芯片和激光雷達,軟件的宣傳話術(shù)更加晦澀抽象,讓外行不明覺厲。筆者建議,下面這4個出現(xiàn)率極高的專業(yè)術(shù)語,你有必要了解一下,能幫你從“韭菜”變專家。

1、端到端——高階智駕的底子

端到端(E2E)這一自動駕駛的算法范式,由特斯拉率先跑通,后續(xù)大批企業(yè)跟進,成為業(yè)內(nèi)公認的發(fā)展方向。

簡單來說,端到端自動駕駛算法模擬人腦神經(jīng)元連接,在模型的一端輸入感知信息,另一端直接輸出軌跡或者控制信號,實現(xiàn)了對駕駛行為的“融會貫通”。相比傳統(tǒng)模塊化流水線式的架構(gòu),端到端能夠使信息無損傳遞,減少人為偏見,大幅提升智駕的能力上限;同時,機器可以從“行為”學(xué)習“行為”,讓駕駛變得更加絲滑和擬人化。

在廠家的描述中,端到端就是打通自動駕駛的“金鑰匙”。但事實上,向高階發(fā)展的技術(shù)路徑仍沒有完全收斂,它存在著“先天缺陷”,自身可解釋性和驗證性較差。如同人腦,會短路,會出現(xiàn)幻覺,你卻很難說清到底哪里出了問題。

長安汽車首席智能駕駛技術(shù)官陶吉認為,“端到端的學(xué)習肯定是通往終極自動駕駛的必要一步,但肯定不是充分的一步”。

隨著自動駕駛技術(shù)的快速發(fā)展,端到端算法模型的入門門檻大幅降低。小馬智行CTO樓天城直言,現(xiàn)階段,訓(xùn)練出一個一般性能的端到端模型不是問題,挖點人,基于公開的駕駛數(shù)據(jù),大差不差都能搞出來。這也是為什么一夜之間,各家車企都拿出了自研的端到端智駕系統(tǒng)。

但有一點需要明確,端到端本身屬于架構(gòu)層面的概念,與模仿學(xué)習、強化學(xué)習、LLM、VLA等技術(shù)手段/方法并不是同一層面的概念。類似于汽車的電子電氣架構(gòu)從分布式升級到域集中式,再到中央計算架構(gòu)的過程,在每一個特定的架構(gòu)階段,各廠商可以采用不同的算法和硬件來實現(xiàn)。因此,即使是在相同的電子電氣架構(gòu)模式下,也會有表現(xiàn)差異巨大的系統(tǒng)。所以千萬不要迷信“端到端”。

2、D2D——衡量端到端性能的關(guān)鍵功能

D2D即Door to Door,意為從出發(fā)車位泊出到目的地車位泊入,車輛可實現(xiàn)全程無接管的點到點全場景自動駕駛。

2025年高階智駕進入快速普及期,市場競爭邏輯已經(jīng)從“人無我有”升級為“人有我優(yōu)”。如今各家都在強調(diào)智駕的體驗和好用度,在之前“全國都能開”的基礎(chǔ)上,追求實現(xiàn)“車位到車位、門到門”等全場景的智能駕駛體驗。

D2D正在成為衡量端到端性能的關(guān)鍵指標之一,借助該功能,車企能夠向用戶展示智駕系統(tǒng)在全場景下的連貫性與完整性,以及其實際應(yīng)用的價值。目前,包括華為、理想、小米、極氪等多個企業(yè),已經(jīng)開始分批推送D2D功能。

不過,業(yè)界對這一功能的理解和實現(xiàn)方式不盡相同。一種以理想為代表,采用的是“VPA(記憶泊車/代客泊車)+NOA(智駕領(lǐng)航)+VPA”的技術(shù)路徑,即在停車場路段,驅(qū)動系統(tǒng)行駛的是記憶泊車/代客泊車模式,駛?cè)牍_道路后,則立刻轉(zhuǎn)變?yōu)橹邱{領(lǐng)航模式。其強項是可自主通行ETC,且不限范圍、無需學(xué)習,全國超1萬個收費站均可識別通行。

而特斯拉、小鵬這一派則用一套模式打通全場景,即無論是在園區(qū)封閉路段、地下停車場區(qū)域還是在公開路段,顯示界面一直保持智駕NOA畫面,不會隨場景變化切換軟件系統(tǒng)。它們更注重智駕應(yīng)對復(fù)雜路況的連貫性與完整性,其車輛能夠在整個“車位到車位”過程中,應(yīng)對復(fù)雜路口、匯流變道、識別并避讓特種車輛,實現(xiàn)U型掉頭等特殊操作,做到全程無接管。

無論選擇哪種路徑,實現(xiàn)D2D都意味著智駕能力要接近L3級水平,這對算法、算力和數(shù)據(jù)提出了巨大挑戰(zhàn)。從2024年開始,端到端+VLM雙架構(gòu)成為業(yè)界新寵,被視為L3的主要解決方案。

3、VLM——端到端1.0的外掛

VLM即視覺語言模型,相當于LLM(大語言模型)的進階版,可將視覺信息(如圖片、視頻)和自然語言文本聯(lián)系起來,此前在具身智能領(lǐng)域已有較多探索。

‌在自動駕駛領(lǐng)域,VLM能夠識別道路環(huán)境、交通標志、行人、車輛等,并通過大量訓(xùn)練理解交通場景中的復(fù)雜交互事件,為自動駕駛系統(tǒng)提供決策支持。

VLM的引入使得自動駕駛系統(tǒng)的決策更加擬人化,能夠根據(jù)當前環(huán)境做出合理的駕駛決策,從而提高系統(tǒng)的安全性和可靠性‌。

在國內(nèi),理想是第一家公開將VLM概念引入自動駕駛的車企。它在車端芯片上部署了雙系統(tǒng)方案。系統(tǒng)1(端到端模型)完全靠自己的視覺感知,執(zhí)行操作。系統(tǒng)2(VLM)能夠提供復(fù)雜環(huán)境的理解能力、讀懂導(dǎo)航地圖的能力以及交通規(guī)則的理解能力,輔助系統(tǒng)1進行規(guī)劃決策。系統(tǒng)1可以解決智能駕駛過程中95%的場景,剩下5%的情況就要交由系統(tǒng)2來進行理解和判斷。

這就相當于VLM是端到端的外掛,或副駕教練的角色。目前,吉利汽車的“千里浩瀚”智駕系統(tǒng),以及小米智駕系統(tǒng)HAD采用了端到端+VLM架構(gòu)。

但也有企業(yè)認為,VLM占用的算力和所實現(xiàn)的功能之間的投入產(chǎn)出比不夠高,“兩個模型,資源占用方面不是最高效的方式,會降低模型效果,只不過現(xiàn)在的數(shù)據(jù)還不能支撐一個模型訓(xùn)練好。這是一個過渡階段,將來還是會融合。”

“特斯拉的路徑已經(jīng)證明了,好的司機是不需要教練的。”在一些業(yè)內(nèi)人士的眼中,VLM是端到端1.0的一次技術(shù)優(yōu)化,而真正的2.0換代升級是VLA。

4、VLA——端到端技術(shù)換代

VLA(視覺-語言-動作模型)最早由Google DeepMind提出,是在VLM的基礎(chǔ)上發(fā)展而來的,被視為端到端大模型2.0——多模態(tài)機器學(xué)習模型。在自動駕駛領(lǐng)域,VLA模型可以從傳感器數(shù)據(jù)中提取豐富的環(huán)境信息,借助語言模型理解人類指令并生成可解釋的決策過程,最后將多模態(tài)信息轉(zhuǎn)化為具體的駕駛操作指令。

與傳統(tǒng)的視覺語言模型(VLM)相比,VLA 的優(yōu)勢在于其不僅可以解析圖像和文本信息,還能實現(xiàn)類人推理與全局理解。

據(jù)元戎啟行CEO周光介紹,在面對復(fù)雜的交通規(guī)則、潮汐車道、長時序推理等特殊場景時,VLA模型能夠比以往的系統(tǒng)更好地理解和應(yīng)對。例如,在推理時長方面,傳統(tǒng)的基于規(guī)則(rule-based)方案只能推理1秒鐘的路況信息并做出決策控制;端到端1.0階段的系統(tǒng)能夠推理未來7秒的路況,而VLA模型則能夠?qū)资氲穆窙r進行推理,顯著提升了自動駕駛系統(tǒng)的決策能力和適應(yīng)性。

此外,VLA系統(tǒng)透明,能通過車內(nèi)大屏向用戶解釋“為什么這么開”,從而增強用戶對自動駕駛系統(tǒng)的信任感。

有行業(yè)人士表示,VLA模型對智駕的演進意義重大,讓端到端理解世界的能力更強后,“長遠來看,在L2輔助駕駛到L4自動駕駛的飛躍中,VLA可能會成為關(guān)鍵跳板”。

目前在國內(nèi),理想已開始研發(fā)下一代VLA智駕大模型,目標在今年下半年實現(xiàn)項目落地。吉利汽車和元戎啟行也在積極推動VLA,各家都在比拼落地時間。

但短期內(nèi),VLA上車還面臨兩大難點。一是車端算力不足,理想車端雙Orin-X芯片運行端到端+VLM算力已經(jīng)比較吃緊。而VLA的模型結(jié)構(gòu)更復(fù)雜,參數(shù)也會進一步擴大,對硬件算力和數(shù)據(jù)閉環(huán)的迭代能力要求就更高。

以元戎啟行的VLA模型RT-2為例,其參數(shù)量高達50億以上,而理想汽車的VLM模型參數(shù)量為22億,不到RT-2的一半。因此業(yè)內(nèi)普遍認為,部署VLA模型對芯片算力的要求要提升到英偉達DRIVE Thor級別(單顆算力為2000TOPS)。

未來具備更強芯片整合能力和垂直整合能力的企業(yè),有望在VLA技術(shù)的競爭中占據(jù)先發(fā)優(yōu)勢。目前行業(yè)頭部競爭者如特斯拉、華為、蔚小理、Momenta等都在逐漸走向軟硬一體,針對自研模型定制化開發(fā)更匹配的智駕芯片,可以做到最大程度的優(yōu)化。

另一大挑戰(zhàn)是如何將端到端與多模態(tài)大模型的數(shù)據(jù)與信息作深度交融。這考驗著智駕團隊的模型框架定義能力、模型快速迭代能力。

地平線副總裁兼首席架構(gòu)師蘇箐曾對筆者表示,特斯拉目前在智駕領(lǐng)域依舊“遙遙領(lǐng)先”,其最強之處在于工程化能力——不僅要持續(xù)創(chuàng)新,快速將前沿理論轉(zhuǎn)化為可量產(chǎn)的技術(shù)和產(chǎn)品,還要注重效率和成本。

可以肯定的是,2025年開始大規(guī)模普及的高階智駕,將帶動新一輪市場洗牌,價格向下,體驗向上成為各家比拼的關(guān)鍵詞。而這背后,是對企業(yè)的深刻變革,和對競爭規(guī)則的重新定義。

端到端架構(gòu)打破了傳統(tǒng)模塊化開發(fā)模式,車企需加強跨部門協(xié)作,并且強調(diào)AI領(lǐng)軍人才,提升AI主導(dǎo)的智能駕駛研發(fā)能力。同時,工程化能力成為核心競爭力,除了研發(fā)投入與人才儲備,端到端落地速度/智駕迭代頻率/數(shù)據(jù)閉環(huán)能力等,可以幫助我們觀察車企的工程化能力。

雖然市場看似一夜之間“普及”了端到端,但實際上,強弱之間的差距會越來越大,VLA的研發(fā)需要大量資源投入,只有少數(shù)頭部大廠才能支撐全棧自研,技術(shù)和數(shù)據(jù)的雙重優(yōu)勢將進一步鞏固它們的市場地位,中小玩家難以望其項背,最終不論營銷如何包裝,都要依靠供應(yīng)商補齊智駕短板。

每日福利更多>>

廣汽集團升級智駕技術(shù)品牌 將不設(shè)上限支持昊鉑品牌發(fā)展 國產(chǎn)之光!麒麟 X90 自研 PC 處理器橫空出世,震撼科技圈 IDC:2024年中國PC顯示器市場出貨量2705萬臺 阿里正在開發(fā)殺手級AI應(yīng)用,或比抖音更受歡迎 在眾贏財富通交了服務(wù)費怎么退?答案是:可以退!怎么申請退款流程公布!誤導(dǎo)性宣傳欺騙股民已退費! 農(nóng)村夫妻養(yǎng)牛逆襲:靠抖音賣牛肉,年入百萬 京東外賣全職騎手已突破萬人,平臺承擔騎手繳納五險一金全部成本 大決 策36800元核心團隊可靠嗎?不靠譜,夸大收益坑慘投資者!真相不寒而栗!已退費! Alipay+攜手成都天府通:香港游客逛成都,可用港版“支付寶”乘坐公交、地鐵 降低購房成本 金融政策發(fā)力穩(wěn)樓市 房產(chǎn)市場開啟“電車時刻”住宅升級浪潮下,你的房子該何去何從? 驍龍8 Gen3旗艦突降千元!真我GT5 Pro掀起價格戰(zhàn),影像旗艦誰更值 超級移動娛樂終端 華為將推Pura X新形態(tài)手機 OPPO Find N5更多消息,F(xiàn)ind N3低至百元網(wǎng)友直呼按打買 斯柯達Elroq SUV——縮小版的斯柯達Enyaq 雷克薩斯雙重驚喜來襲!“時光煥新計劃”最高19000元置換補貼禮 車長超5米的大型SUV也有操控?深度試駕東風奕派eπ008 小米SU7到底怎么樣?30萬級純電轎車真實測評 四五十歲中年人最適合的十款轎車深度解析 2025款起YA獅跑(Sportage):韓系猛將的銷量新貴,買它值不值? 2025 款起YA獅跑全面評測!家用 SUV 的 “六邊形戰(zhàn)士”? “電”亮未來 東風汽車以硬核實力加速科技躍遷 智駕普惠浪潮來襲!!傳祺向往 S7以“普及先鋒” 重塑智駕市場格局 全新大眾速騰來襲,1.5T最大功率160馬力,風阻0.25Cd,油耗5.71L 同樣的價格你選合資還是國產(chǎn)?賽科龍RT2 VS新大洲本田NS150GX 2025款比YA迪唐DM-i深度評測】家庭SUV新標桿,智駕升級值不值? 德系豪華:奔馳E300動力越級+油耗親民,家庭與商務(wù)的全能答案 都說豐田不好,但為什么全球銷量第一?到底值不值得買? 豐田 Rav4 插電式混合動力車:毫不妥協(xié)的 SUV 吉利XING愿起售不足7萬,至高續(xù)航410km,難怪它月銷近3萬