午夜欧美性欧美,91在线免费视频观看,欧美视屏在线观看

幾年前談到自動駕駛，廠家卷的還是芯片算力和激光雷達數(shù)量，但如今消費者已經(jīng)意識到，硬件的豐儉與實際的智駕能力并不成正比，很多時候都是割韭菜的噱頭。最典型的例子是放言“4顆（激光雷達）以下別說話”的機甲龍，以及搭載4顆英偉達Orin芯片，總算力達到1016 TOPS的蔚來ET7，前者胎死腹中，后者寂寂無名。

關(guān)于高階智駕不可不知的四個詞：端到端、D2D、VLM、VLA

從去年開始，業(yè)界迅速從卷硬件過渡到卷軟件。相比看得見摸得著的芯片和激光雷達，軟件的宣傳話術(shù)更加晦澀抽象，讓外行不明覺厲。筆者建議，下面這4個出現(xiàn)率極高的專業(yè)術(shù)語，你有必要了解一下，能幫你從“韭菜”變專家。

1、端到端——高階智駕的底子

端到端（E2E）這一自動駕駛的算法范式，由特斯拉率先跑通，后續(xù)大批企業(yè)跟進，成為業(yè)內(nèi)公認的發(fā)展方向。

簡單來說，端到端自動駕駛算法模擬人腦神經(jīng)元連接，在模型的一端輸入感知信息，另一端直接輸出軌跡或者控制信號，實現(xiàn)了對駕駛行為的“融會貫通”。相比傳統(tǒng)模塊化流水線式的架構(gòu)，端到端能夠使信息無損傳遞，減少人為偏見，大幅提升智駕的能力上限；同時，機器可以從“行為”學(xué)習“行為”，讓駕駛變得更加絲滑和擬人化。

在廠家的描述中，端到端就是打通自動駕駛的“金鑰匙”。但事實上，向高階發(fā)展的技術(shù)路徑仍沒有完全收斂，它存在著“先天缺陷”，自身可解釋性和驗證性較差。如同人腦，會短路，會出現(xiàn)幻覺，你卻很難說清到底哪里出了問題。

長安汽車首席智能駕駛技術(shù)官陶吉認為，“端到端的學(xué)習肯定是通往終極自動駕駛的必要一步，但肯定不是充分的一步”。

關(guān)于高階智駕不可不知的四個詞：端到端、D2D、VLM、VLA

隨著自動駕駛技術(shù)的快速發(fā)展，端到端算法模型的入門門檻大幅降低。小馬智行CTO樓天城直言，現(xiàn)階段，訓(xùn)練出一個一般性能的端到端模型不是問題，挖點人，基于公開的駕駛數(shù)據(jù)，大差不差都能搞出來。這也是為什么一夜之間，各家車企都拿出了自研的端到端智駕系統(tǒng)。

但有一點需要明確，端到端本身屬于架構(gòu)層面的概念，與模仿學(xué)習、強化學(xué)習、LLM、VLA等技術(shù)手段/方法并不是同一層面的概念。類似于汽車的電子電氣架構(gòu)從分布式升級到域集中式，再到中央計算架構(gòu)的過程，在每一個特定的架構(gòu)階段，各廠商可以采用不同的算法和硬件來實現(xiàn)。因此，即使是在相同的電子電氣架構(gòu)模式下，也會有表現(xiàn)差異巨大的系統(tǒng)。所以千萬不要迷信“端到端”。

2、D2D——衡量端到端性能的關(guān)鍵功能

D2D即Door to Door，意為從出發(fā)車位泊出到目的地車位泊入，車輛可實現(xiàn)全程無接管的點到點全場景自動駕駛。

2025年高階智駕進入快速普及期，市場競爭邏輯已經(jīng)從“人無我有”升級為“人有我優(yōu)”。如今各家都在強調(diào)智駕的體驗和好用度，在之前“全國都能開”的基礎(chǔ)上，追求實現(xiàn)“車位到車位、門到門”等全場景的智能駕駛體驗。

D2D正在成為衡量端到端性能的關(guān)鍵指標之一，借助該功能，車企能夠向用戶展示智駕系統(tǒng)在全場景下的連貫性與完整性，以及其實際應(yīng)用的價值。目前，包括華為、理想、小米、極氪等多個企業(yè)，已經(jīng)開始分批推送D2D功能。

關(guān)于高階智駕不可不知的四個詞：端到端、D2D、VLM、VLA

不過，業(yè)界對這一功能的理解和實現(xiàn)方式不盡相同。一種以理想為代表，采用的是“VPA（記憶泊車/代客泊車）+NOA（智駕領(lǐng)航）+VPA”的技術(shù)路徑，即在停車場路段，驅(qū)動系統(tǒng)行駛的是記憶泊車/代客泊車模式，駛?cè)牍_道路后，則立刻轉(zhuǎn)變?yōu)橹邱{領(lǐng)航模式。其強項是可自主通行ETC，且不限范圍、無需學(xué)習，全國超1萬個收費站均可識別通行。

而特斯拉、小鵬這一派則用一套模式打通全場景，即無論是在園區(qū)封閉路段、地下停車場區(qū)域還是在公開路段，顯示界面一直保持智駕NOA畫面，不會隨場景變化切換軟件系統(tǒng)。它們更注重智駕應(yīng)對復(fù)雜路況的連貫性與完整性，其車輛能夠在整個“車位到車位”過程中，應(yīng)對復(fù)雜路口、匯流變道、識別并避讓特種車輛，實現(xiàn)U型掉頭等特殊操作，做到全程無接管。

無論選擇哪種路徑，實現(xiàn)D2D都意味著智駕能力要接近L3級水平，這對算法、算力和數(shù)據(jù)提出了巨大挑戰(zhàn)。從2024年開始，端到端+VLM雙架構(gòu)成為業(yè)界新寵，被視為L3的主要解決方案。

3、VLM——端到端1.0的外掛

VLM即視覺語言模型，相當于LLM（大語言模型）的進階版，可將視覺信息（如圖片、視頻）和自然語言文本聯(lián)系起來，此前在具身智能領(lǐng)域已有較多探索。

‌在自動駕駛領(lǐng)域，VLM能夠識別道路環(huán)境、交通標志、行人、車輛等，并通過大量訓(xùn)練理解交通場景中的復(fù)雜交互事件，為自動駕駛系統(tǒng)提供決策支持。

VLM的引入使得自動駕駛系統(tǒng)的決策更加擬人化，能夠根據(jù)當前環(huán)境做出合理的駕駛決策，從而提高系統(tǒng)的安全性和可靠性‌。

關(guān)于高階智駕不可不知的四個詞：端到端、D2D、VLM、VLA

在國內(nèi)，理想是第一家公開將VLM概念引入自動駕駛的車企。它在車端芯片上部署了雙系統(tǒng)方案。系統(tǒng)1（端到端模型）完全靠自己的視覺感知，執(zhí)行操作。系統(tǒng)2（VLM）能夠提供復(fù)雜環(huán)境的理解能力、讀懂導(dǎo)航地圖的能力以及交通規(guī)則的理解能力，輔助系統(tǒng)1進行規(guī)劃決策。系統(tǒng)1可以解決智能駕駛過程中95%的場景，剩下5%的情況就要交由系統(tǒng)2來進行理解和判斷。

這就相當于VLM是端到端的外掛，或副駕教練的角色。目前，吉利汽車的“千里浩瀚”智駕系統(tǒng)，以及小米智駕系統(tǒng)HAD采用了端到端+VLM架構(gòu)。

但也有企業(yè)認為，VLM占用的算力和所實現(xiàn)的功能之間的投入產(chǎn)出比不夠高，“兩個模型，資源占用方面不是最高效的方式，會降低模型效果，只不過現(xiàn)在的數(shù)據(jù)還不能支撐一個模型訓(xùn)練好。這是一個過渡階段，將來還是會融合。”

“特斯拉的路徑已經(jīng)證明了，好的司機是不需要教練的。”在一些業(yè)內(nèi)人士的眼中，VLM是端到端1.0的一次技術(shù)優(yōu)化，而真正的2.0換代升級是VLA。

4、VLA——端到端技術(shù)換代

VLA（視覺-語言-動作模型）最早由Google DeepMind提出，是在VLM的基礎(chǔ)上發(fā)展而來的，被視為端到端大模型2.0——多模態(tài)機器學(xué)習模型。在自動駕駛領(lǐng)域，VLA模型可以從傳感器數(shù)據(jù)中提取豐富的環(huán)境信息，借助語言模型理解人類指令并生成可解釋的決策過程，最后將多模態(tài)信息轉(zhuǎn)化為具體的駕駛操作指令。

與傳統(tǒng)的視覺語言模型（VLM）相比，VLA 的優(yōu)勢在于其不僅可以解析圖像和文本信息，還能實現(xiàn)類人推理與全局理解。

關(guān)于高階智駕不可不知的四個詞：端到端、D2D、VLM、VLA

據(jù)元戎啟行CEO周光介紹，在面對復(fù)雜的交通規(guī)則、潮汐車道、長時序推理等特殊場景時，VLA模型能夠比以往的系統(tǒng)更好地理解和應(yīng)對。例如，在推理時長方面，傳統(tǒng)的基于規(guī)則（rule-based）方案只能推理1秒鐘的路況信息并做出決策控制；端到端1.0階段的系統(tǒng)能夠推理未來7秒的路況，而VLA模型則能夠?qū)资氲穆窙r進行推理，顯著提升了自動駕駛系統(tǒng)的決策能力和適應(yīng)性。

此外，VLA系統(tǒng)透明，能通過車內(nèi)大屏向用戶解釋“為什么這么開”，從而增強用戶對自動駕駛系統(tǒng)的信任感。

有行業(yè)人士表示，VLA模型對智駕的演進意義重大，讓端到端理解世界的能力更強后，“長遠來看，在L2輔助駕駛到L4自動駕駛的飛躍中，VLA可能會成為關(guān)鍵跳板”。

目前在國內(nèi)，理想已開始研發(fā)下一代VLA智駕大模型，目標在今年下半年實現(xiàn)項目落地。吉利汽車和元戎啟行也在積極推動VLA，各家都在比拼落地時間。

但短期內(nèi)，VLA上車還面臨兩大難點。一是車端算力不足，理想車端雙Orin-X芯片運行端到端+VLM算力已經(jīng)比較吃緊。而VLA的模型結(jié)構(gòu)更復(fù)雜，參數(shù)也會進一步擴大，對硬件算力和數(shù)據(jù)閉環(huán)的迭代能力要求就更高。

以元戎啟行的VLA模型RT-2為例，其參數(shù)量高達50億以上，而理想汽車的VLM模型參數(shù)量為22億，不到RT-2的一半。因此業(yè)內(nèi)普遍認為，部署VLA模型對芯片算力的要求要提升到英偉達DRIVE Thor級別（單顆算力為2000TOPS）。

未來具備更強芯片整合能力和垂直整合能力的企業(yè)，有望在VLA技術(shù)的競爭中占據(jù)先發(fā)優(yōu)勢。目前行業(yè)頭部競爭者如特斯拉、華為、蔚小理、Momenta等都在逐漸走向軟硬一體，針對自研模型定制化開發(fā)更匹配的智駕芯片，可以做到最大程度的優(yōu)化。

另一大挑戰(zhàn)是如何將端到端與多模態(tài)大模型的數(shù)據(jù)與信息作深度交融。這考驗著智駕團隊的模型框架定義能力、模型快速迭代能力。

地平線副總裁兼首席架構(gòu)師蘇箐曾對筆者表示，特斯拉目前在智駕領(lǐng)域依舊“遙遙領(lǐng)先”，其最強之處在于工程化能力——不僅要持續(xù)創(chuàng)新，快速將前沿理論轉(zhuǎn)化為可量產(chǎn)的技術(shù)和產(chǎn)品，還要注重效率和成本。

可以肯定的是，2025年開始大規(guī)模普及的高階智駕，將帶動新一輪市場洗牌，價格向下，體驗向上成為各家比拼的關(guān)鍵詞。而這背后，是對企業(yè)的深刻變革，和對競爭規(guī)則的重新定義。

端到端架構(gòu)打破了傳統(tǒng)模塊化開發(fā)模式，車企需加強跨部門協(xié)作，并且強調(diào)AI領(lǐng)軍人才，提升AI主導(dǎo)的智能駕駛研發(fā)能力。同時，工程化能力成為核心競爭力，除了研發(fā)投入與人才儲備，端到端落地速度/智駕迭代頻率/數(shù)據(jù)閉環(huán)能力等，可以幫助我們觀察車企的工程化能力。

雖然市場看似一夜之間“普及”了端到端，但實際上，強弱之間的差距會越來越大，VLA的研發(fā)需要大量資源投入，只有少數(shù)頭部大廠才能支撐全棧自研，技術(shù)和數(shù)據(jù)的雙重優(yōu)勢將進一步鞏固它們的市場地位，中小玩家難以望其項背，最終不論營銷如何包裝，都要依靠供應(yīng)商補齊智駕短板。

久久久国产精品视频_国产成人精品日本亚洲专_日本午夜大片免费观看视频_97av麻豆蜜桃一区二区

關(guān)于高階智駕不可不知的四個詞：端到端、D2D、VLM、VLA

每日福利更多>>