亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
如何定義端對端的自動駕駛系統(tǒng),應(yīng)該期望端對端解決什麼問題?
關(guān)於端對端自動駕駛的一些誤解?
數(shù)據(jù)驅(qū)動和傳統(tǒng)方法之間關(guān)系如何調(diào)和?
傳統(tǒng)方法 = rule based if else?
總結(jié)
首頁 科技週邊 人工智慧 聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些迷思?

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些迷思?

Apr 15, 2024 pm 04:13 PM
端到端 自動駕駛

最近一個月由於眾所周知的一些原因,非常密集地和行業(yè)內(nèi)的各種老師同學(xué)進行了交流。交流中必不可免的一個話題自然是端到端與火爆的特斯拉 FSD V12。想藉此機會,整理當(dāng)下這個時刻的一些想法和觀點,供大家參考和討論。

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些迷思?

如何定義端對端的自動駕駛系統(tǒng),應(yīng)該期望端對端解決什麼問題?

依照最傳統(tǒng)的定義,端到端的系統(tǒng)指的是一套系統(tǒng),輸入感測器的原始訊息,直接輸出任務(wù)關(guān)心的變數(shù)。例如,在影像辨識中,CNN相對於傳統(tǒng)的特徵提取器 分類器的方法就可以稱之為端到端。在自動駕駛?cè)蝿?wù)中,輸入各種感知器的資料(相機/LiDAR/Radar/IMU等),直接輸出車輛行駛的控制訊號(油門/方向盤角度等)。為了考慮不同車型之間的適配問題,也可以將輸出放寬為車輛行駛的軌跡。這便是一種傳統(tǒng)意義上的定義,或者說是我所謂的做狹義端對端的定義。在這樣一個基礎(chǔ)上,也衍生出了一些中間任務(wù)的監(jiān)督來提升性能能力。

然而,除了這樣狹義的定義之外,我們還應(yīng)該從本質(zhì)上思考一下,端到端的本質(zhì)是什麼? 我認(rèn)為端對端的本質(zhì)應(yīng)該是感知訊息的無損傳遞。我們先回想一下在非端到端系統(tǒng)中,感知和PnC模組的介面是什麼樣子的。一般我們會有針對白名單物體(車,人,etc)的偵測/屬性分析/預(yù)測,會有對靜態(tài)環(huán)境的理解(道路結(jié)構(gòu)/限速/紅綠燈,etc),如果做的更細緻一些的話,還會做通用障礙物的一些檢測工作。 從宏觀的角度來講,感知輸出的這些訊息,都是對複雜駕駛場景的一種抽象,而且是人工定義的顯式抽象。然而,對於一些非常見場景中,現(xiàn)在的顯式抽象難以充分錶達場景中會影響駕駛行為的因素,亦或是我們需要定義的任務(wù)過多過瑣碎,也難以枚舉盡所有需要的任務(wù)。所以端到端系統(tǒng),提供了一種(也許是隱式)全面表示,希望能夠自動地?zé)o損地將這樣的資訊作用於PnC。我認(rèn)為,所有能滿足這樣的系統(tǒng),都可以叫做廣義端對端。

對於其他的問題,例如對動態(tài)互動場景的一些最佳化,我個人的觀點認(rèn)為至少並非只有端到端才能解決這些問題,傳統(tǒng)方法是可以解決好這些問題的。當(dāng)然,在資料量夠大的時候,端到端可能會提供一個還不錯的solution。關(guān)於這個事情是否有必要,會在後幾個問題中展開討論。

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些迷思?

關(guān)於端對端自動駕駛的一些誤解?

一定要輸出控制訊號和路點才是端到端

#對於廣義端到端的概念,如果能認(rèn)同上面所講的概念,那麼這個問題就很容易理解了。端到端的強調(diào)的是訊息的無損傳遞,而不是一定要直接輸出任務(wù)量。這樣的端到端處理方法需要大量的兜底方案來確保安全,而且在實作過程中也會遇到一些問題,在後續(xù)處理中會逐漸展開。

端對端系統(tǒng)一定要基於大模型或純視覺

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些迷思?

#端對端自動駕駛的概念和大模型自動駕駛以及純視覺自動駕駛沒有任何必然的關(guān)聯(lián)。這三個概念是完全獨立存在的,一個端到端的系統(tǒng)不必一定是傳統(tǒng)意義上的大模型驅(qū)動的,也不一定是純粹視覺。三者之間有些關(guān)聯(lián),但不等同。

之前我有一篇文章詳細闡述過這些概念之間的關(guān)係,詳見:https://zhuanlan.zhihu.com/p/664189972

長遠來看,上述狹義的端對端系統(tǒng)有沒有可能達到L3等級以上自動駕駛?

其實我先想來吐槽一句,號稱要用大模型來顛覆L4的人,都沒有實際做過L4;號稱端到端包治百病的人,也都從來沒做過PnC。於是和許多對端到端狂熱的人聊下來,就變成了一個純粹的無法證實也無法證偽的宗教信仰之爭。我們做前沿研發(fā)的同學(xué),還是應(yīng)該更實事求是,講究證據(jù)一些。 。 。最起碼對想要顛覆的東西有一些基礎(chǔ)認(rèn)知和了解其中棘手的問題,這是應(yīng)該有的基本科學(xué)素質(zhì)。 。 。

言歸正傳,目前來看,我是悲觀的。暫且不論目前號稱是純端到端的FSD,性能還遠遠不能達到L3級別以上所需的可靠性和穩(wěn)定性,未來就算是統(tǒng)計意義上這個車輛和人類是一樣安全的,還要面臨如何和人類駕駛員的錯誤做align的問題。更直白一點來說,就是說,一個自動駕駛系統(tǒng)想要讓大眾和輿論接受,關(guān)鍵可能不在於一個絕對的事故率和致死率,而是在於大眾是否能接受有一些場景中,對於人類是相對輕鬆解決,而機器會犯錯的。這個需求對於純端到端系統(tǒng)來說更難以實現(xiàn)。更具體的在我21年的一個回答中有闡述,詳見:

如何看待李彥宏朋友圈發(fā)表:無人駕駛肯定會出事,只是這個機率比有人駕駛低多了?

https://www.zhihu.com/question/530828899/answer/2590673435?utm_psn=1762524415009697792

#在北美的Waymo和Cruise為例,其實分別都沒有出過不少事故,但是為什麼Cruise最後一次出現(xiàn)的事故讓監(jiān)管和大眾尤為不能接受呢?這起事故發(fā)生了兩次傷害,第一次的碰撞,對於人類駕駛也是相當(dāng)難以避免的,其實也是可以接受的。但在這次的碰撞發(fā)生之後,發(fā)生了嚴(yán)重的二次傷害:系統(tǒng)錯誤地判斷了碰撞位置和傷員位置,為了不阻塞交通,降級到了靠邊停車的模式,將傷員拖拽很久。這樣的一個行為,是任何一個正常的人類駕駛員都不會做出的事情,而且影響非常惡劣。這個事情直接導(dǎo)致了Cruise後續(xù)的一些動盪。這個事情其實也給我們敲響了警鐘,如何避免這樣的事情發(fā)生,應(yīng)該是自動駕駛系統(tǒng)研發(fā)和營運上認(rèn)真考慮的問題。

那麼站在現(xiàn)在的這個時刻,下一代量產(chǎn)輔助駕駛系統(tǒng)中切實可行的方案是什麼?

簡單來說,我認(rèn)為一個合適的系統(tǒng)應(yīng)該是先充分挖掘傳統(tǒng)系統(tǒng)的能力上限,然後再去結(jié)合端到端的靈活和普適性,也就是一個漸進式端對端的方案。當(dāng)然這兩者如何有機地結(jié)合就是個付費內(nèi)容了,哈哈。 。 。但我們可以分析一下,現(xiàn)在所謂的端到端或是learning based planner實際落地在做的事情是什麼。

以我有限的了解,目前所謂端到端模型在行車中使用的時候,在輸出的軌跡之後都會去接一個基於傳統(tǒng)方法兜底的方案,或者是這樣的learning based planner和傳統(tǒng)的軌跡規(guī)劃演算法會同時輸出多條軌跡,再透過一個selector來選擇一條執(zhí)行。如果這樣設(shè)計系統(tǒng)架構(gòu),這麼一個級連繫統(tǒng)的效能上限其實是被這樣的兜底方案和selector限制住的。如果這樣的方案仍然是基於純feedforward learning的,仍會有不可預(yù)測的失效,本質(zhì)上並不能達到兜底的目的。如果考慮在這樣輸出的軌跡上使用一個傳統(tǒng)的規(guī)劃方法再去優(yōu)化或選擇,那相當(dāng)於learning based方法出的軌跡,只是給這樣的一個最佳化和搜尋問題做了一個初始解,我們?yōu)楹尾恢苯尤?yōu)化和搜尋這樣的軌跡呢?

當(dāng)然有同學(xué)會跳出來講,這樣的一個優(yōu)化或搜尋問題是非凸的,狀態(tài)空間很大不可能在車載系統(tǒng)上跑到即時。我請大家在這裡仔細想這樣一個問題:在過去10年中,感知系統(tǒng)至少吃到了100x的算力紅利發(fā)展,但是我們的PnC模組呢?如果我們同樣允許PnC模組使用大算力,結(jié)合上近幾年先進優(yōu)化演算法的一些發(fā)展,這樣的結(jié)論仍然成立嗎?針對這樣的問題,我們不應(yīng)該固步自封,路徑依賴,而是從第一原理思考什麼才是對的。

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些迷思?

數(shù)據(jù)驅(qū)動和傳統(tǒng)方法之間關(guān)系如何調(diào)和?

其實和自動駕駛非常類似的一個例子就是下棋,剛好在今年2月份的時候Deepmind發(fā)表了一篇文章(Grandmaster-Level Chess Without Search:https://arxiv.org/abs/2402.04494)就在探索只用數(shù)據(jù)驅(qū)動,拋棄AlphaGo和AlphaZero中的MCTS search是否可行。類比到自動駕駛中就是,只用一個網(wǎng)絡(luò)直接輸出action,拋棄掉后續(xù)所有的步驟。文章的結(jié)論是,在相當(dāng)?shù)囊?guī)模的數(shù)據(jù)和模型參數(shù)下,不用搜索仍然可以得到一個還算合理的結(jié)果,然而和加上搜索的方法比,還有非常顯著的差距。(文章中這里的對比其實也不盡公平,實際差距應(yīng)該更大)尤其是在解一些困難的殘局上,純數(shù)據(jù)驅(qū)動性能非常糟糕。這類比到自動駕駛中,也就是意味著,需要多步博弈的困難場景或corner case,仍然很難完全拋棄掉傳統(tǒng)的優(yōu)化或者搜索算法。像AlphaZero一樣合理地運用各種技術(shù)的優(yōu)勢,才是最為高效提升性能的方式。

傳統(tǒng)方法 = rule based if else?

這個觀念也是我在和很多人的交流中需要反復(fù)糾正的。按照很多人的定義,只要不是純數(shù)據(jù)驅(qū)動,就叫做rule based。還是舉下棋這個例子,去死記硬背定式和棋譜是rule based,但是像AlphaGo和AlphaZero一樣通過搜索和優(yōu)化賦予模型reasoning的能力,我認(rèn)為并不能叫做rule based。這恰恰也是目前大模型本身所欠缺的,也是研究者通過CoT等方式試圖賦予一個learning based model的。然而人開車每一個動作都是有明確的動機的,這和需要純數(shù)據(jù)驅(qū)動的圖像識別等無法清晰描述原因的任務(wù)不同。在一個合適的算法架構(gòu)設(shè)計下,決策軌跡都應(yīng)該成為變量,在一個科學(xué)的目標(biāo)指引下統(tǒng)一優(yōu)化。而不是通過強行打patch和調(diào)參去修各種case。這樣的一個系統(tǒng)自然也不會存在各種hardcode的奇怪的rule。

總結(jié)

最終總結(jié)一下,端到端也許是一個很有希望的技術(shù)路線,但是這樣一個概念如何付諸實踐還有很多有待探索的事情。是不是狂堆數(shù)據(jù)和模型參數(shù)就是唯一正確的解決方案,目前在我看來并不是的。我覺得,任何時刻作為一個前沿研究的技術(shù)人員,我們都應(yīng)該真正奉行馬斯克所講的第一性原理和工程師思維,從實踐中思考問題的本質(zhì),而不是將馬斯克本身變成第一性原理。想要真正遙遙領(lǐng)先,就不應(yīng)該放棄思考,人云亦云,否則就只能在不斷想要彎道超車。

以上是聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些迷思?的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF? 為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF? Jan 17, 2024 pm 02:57 PM

寫在前面&筆者的個人理解三維Gaussiansplatting(3DGS)是近年來在顯式輻射場和電腦圖形學(xué)領(lǐng)域出現(xiàn)的一種變革性技術(shù)。這種創(chuàng)新方法的特點是使用了數(shù)百萬個3D高斯,這與神經(jīng)輻射場(NeRF)方法有很大的不同,後者主要使用隱式的基於座標(biāo)的模型將空間座標(biāo)映射到像素值。 3DGS憑藉其明確的場景表示和可微分的渲染演算法,不僅保證了即時渲染能力,而且引入了前所未有的控制和場景編輯水平。這將3DGS定位為下一代3D重建和表示的潛在遊戲規(guī)則改變者。為此我們首次系統(tǒng)性地概述了3DGS領(lǐng)域的最新發(fā)展與關(guān)

自動駕駛場景中的長尾問題怎麼解決? 自動駕駛場景中的長尾問題怎麼解決? Jun 02, 2024 pm 02:44 PM

昨天面試被問到了是否做過長尾相關(guān)的問題,所以就想著簡單總結(jié)一下。自動駕駛長尾問題是指自動駕駛汽車中的邊緣情況,即發(fā)生機率較低的可能場景。感知的長尾問題是目前限制單車智慧自動駕駛車輛運行設(shè)計域的主要原因之一。自動駕駛的底層架構(gòu)和大部分技術(shù)問題已經(jīng)解決,剩下的5%的長尾問題,逐漸成了限制自動駕駛發(fā)展的關(guān)鍵。這些問題包括各種零碎的場景、極端的情況和無法預(yù)測的人類行為。自動駕駛中的邊緣場景"長尾"是指自動駕駛汽車(AV)中的邊緣情況,邊緣情況是發(fā)生機率較低的可能場景。這些罕見的事件

你是否真正掌握了座標(biāo)系轉(zhuǎn)換?自動駕駛離不開的多感測器問題 你是否真正掌握了座標(biāo)系轉(zhuǎn)換?自動駕駛離不開的多感測器問題 Oct 12, 2023 am 11:21 AM

一先導(dǎo)與重點文章主要介紹自動駕駛技術(shù)中幾種常用的座標(biāo)系統(tǒng),以及他們之間如何完成關(guān)聯(lián)與轉(zhuǎn)換,最終建構(gòu)出統(tǒng)一的環(huán)境模型。這裡重點理解自車到相機剛體轉(zhuǎn)換(外參),相機到影像轉(zhuǎn)換(內(nèi)參),影像到像素有單位轉(zhuǎn)換。 3d向2d轉(zhuǎn)換會有對應(yīng)的畸變,平移等。重點:自車座標(biāo)系相機機體座標(biāo)系需要被重寫的是:平面座標(biāo)系像素座標(biāo)系難點:要考慮影像畸變,去畸變和加畸變都是在像平面上去補償二簡介視覺系統(tǒng)一共有四個座標(biāo)系:像素平面座標(biāo)系(u,v)、影像座標(biāo)系(x,y)、相機座標(biāo)系()與世界座標(biāo)系()。每種座標(biāo)系之間均有聯(lián)繫,

SIMPL:用於自動駕駛的簡單高效的多智能體運動預(yù)測基準(zhǔn) SIMPL:用於自動駕駛的簡單高效的多智能體運動預(yù)測基準(zhǔn) Feb 20, 2024 am 11:48 AM

原文標(biāo)題:SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving論文連結(jié):https://arxiv.org/pdf/2402.02519.pdf程式碼連結(jié):https://github.com/HKUST-Aerial-Robotics/SIMPLobotics單位論文想法:本文提出了一種用於自動駕駛車輛的簡單且有效率的運動預(yù)測基線(SIMPL)。與傳統(tǒng)的以代理為中心(agent-cent

Sparse4D v3來了!推進端到端3D偵測與追蹤 Sparse4D v3來了!推進端到端3D偵測與追蹤 Nov 24, 2023 am 11:21 AM

新標(biāo)題:Sparse4Dv3:推進端到端的3D檢測和追蹤技術(shù)論文連結(jié):https://arxiv.org/pdf/2311.11722.pdf需要重新寫的內(nèi)容是:程式碼連結(jié):https://github.com/linxuewu/ Sparse4D重寫的內(nèi)容:作者所屬單位為地平線公司論文想法:在自動駕駛感知系統(tǒng)中,3D偵測與追蹤是兩項基本任務(wù)。本文基於Sparse4D框架更深入研究了這個領(lǐng)域。本文引入了兩個輔助訓(xùn)練任務(wù)(時序?qū)嵗ルs訊-TemporalInstanceDenoising和品質(zhì)估計-Q

選擇相機還是光達?實現(xiàn)穩(wěn)健的三維目標(biāo)檢測的最新綜述 選擇相機還是光達?實現(xiàn)穩(wěn)健的三維目標(biāo)檢測的最新綜述 Jan 26, 2024 am 11:18 AM

0.寫在前面&&個人理解自動駕駛系統(tǒng)依賴先進的感知、決策和控制技術(shù),透過使用各種感測器(如相機、光達、雷達等)來感知周圍環(huán)境,並利用演算法和模型進行即時分析和決策。這使得車輛能夠識別道路標(biāo)誌、檢測和追蹤其他車輛、預(yù)測行人行為等,從而安全地操作和適應(yīng)複雜的交通環(huán)境。這項技術(shù)目前引起了廣泛的關(guān)注,並認(rèn)為是未來交通領(lǐng)域的重要發(fā)展領(lǐng)域之一。但是,讓自動駕駛變得困難的是弄清楚如何讓汽車了解周圍發(fā)生的事情。這需要自動駕駛系統(tǒng)中的三維物體偵測演算法可以準(zhǔn)確地感知和描述周圍環(huán)境中的物體,包括它們的位置、

自動駕駛與軌跡預(yù)測看這篇就夠了! 自動駕駛與軌跡預(yù)測看這篇就夠了! Feb 28, 2024 pm 07:20 PM

軌跡預(yù)測在自動駕駛中承擔(dān)著重要的角色,自動駕駛軌跡預(yù)測是指透過分析車輛行駛過程中的各種數(shù)據(jù),預(yù)測車輛未來的行駛軌跡。作為自動駕駛的核心模組,軌跡預(yù)測的品質(zhì)對於下游的規(guī)劃控制至關(guān)重要。軌跡預(yù)測任務(wù)技術(shù)堆疊豐富,需熟悉自動駕駛動/靜態(tài)感知、高精地圖、車道線、神經(jīng)網(wǎng)路架構(gòu)(CNN&GNN&Transformer)技能等,入門難度很高!許多粉絲期望能夠盡快上手軌跡預(yù)測,少踩坑,今天就為大家盤點下軌跡預(yù)測常見的一些問題和入門學(xué)習(xí)方法!入門相關(guān)知識1.預(yù)習(xí)的論文有沒有切入順序? A:先看survey,p

FisheyeDetNet:首個以魚眼相機為基礎(chǔ)的目標(biāo)偵測演算法 FisheyeDetNet:首個以魚眼相機為基礎(chǔ)的目標(biāo)偵測演算法 Apr 26, 2024 am 11:37 AM

目標(biāo)偵測在自動駕駛系統(tǒng)當(dāng)中是一個比較成熟的問題,其中行人偵測是最早得以部署演算法之一。在多數(shù)論文當(dāng)中已經(jīng)進行了非常全面的研究。然而,利用魚眼相機進行環(huán)視的距離感知相對來說研究較少。由於徑向畸變大,標(biāo)準(zhǔn)的邊界框表示在魚眼相機當(dāng)中很難實施。為了緩解上述描述,我們探索了擴展邊界框、橢圓、通用多邊形設(shè)計為極座標(biāo)/角度表示,並定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優(yōu)於其他模型,並同時在用於自動駕駛的Valeo魚眼相機資料集上實現(xiàn)了49.5%的mAP

See all articles