亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
如何定義端到端的自動駕駛系統(tǒng),應(yīng)該期望端到端解決什么問題?
關(guān)于端到端自動駕駛的一些誤區(qū)?
數(shù)據(jù)驅(qū)動和傳統(tǒng)方法之間關(guān)系如何調(diào)和?
傳統(tǒng)方法 = rule based if else?
總結(jié)
首頁 科技周邊 人工智能 聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些誤區(qū)?

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些誤區(qū)?

Apr 15, 2024 pm 04:13 PM
端到端 自動駕駛

最近一個月由于眾所周知的一些原因,非常密集地和行業(yè)內(nèi)的各種老師同學(xué)進(jìn)行了交流。交流中必不可免的一個話題自然是端到端與火爆的特斯拉 FSD V12。想借此機(jī)會,整理一下在當(dāng)下這個時刻的一些想法和觀點,供大家參考和討論。

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些誤區(qū)?

如何定義端到端的自動駕駛系統(tǒng),應(yīng)該期望端到端解決什么問題?

按照最傳統(tǒng)的定義,端到端的系統(tǒng)指的是一套系統(tǒng),輸入傳感器的原始信息,直接輸出任務(wù)關(guān)心的變量。例如,在圖像識別中,CNN相對于傳統(tǒng)的特征提取器 分類器的方法就可以稱之為端到端。在自動駕駛?cè)蝿?wù)中,輸入各種傳感器的數(shù)據(jù)(相機(jī)/LiDAR/Radar/IMU等),直接輸出車輛行駛的控制信號(油門/方向盤角度等)。為了考慮不同車型之間的適配問題,也可以將輸出放寬為車輛行駛的軌跡。這便是一種傳統(tǒng)意義上的定義,或者說是我所謂的做狹義端到端的定義。在這樣一個基礎(chǔ)上,也衍生出了一些中間任務(wù)的監(jiān)督來提升性能能力。

然而,除了這樣狹義的定義之外,我們還應(yīng)該從本質(zhì)上思考一下,端到端的本質(zhì)是什么?我認(rèn)為端到端的本質(zhì)應(yīng)當(dāng)是感知信息的無損傳遞。我們先回想一下在非端到端系統(tǒng)中,感知和PnC模塊的接口是什么樣子的。一般我們會有針對白名單物體(車,人,etc)的檢測/屬性分析/預(yù)測,會有對靜態(tài)環(huán)境的理解(道路結(jié)構(gòu)/限速/紅綠燈,etc),如果做的更細(xì)致一些的話,還會做通用障礙物的一些檢測工作。從宏觀的角度來講,感知輸出的這些信息,都是對復(fù)雜駕駛場景的一種抽象,而且是人工定義的顯式抽象。然而,對于一些非常見場景中,現(xiàn)在的顯式抽象難以充分表達(dá)場景中會影響駕駛行為的因素,亦或是我們需要定義的任務(wù)過多過瑣碎,也難以枚舉盡所有需要的任務(wù)。所以端到端系統(tǒng),提供了一種(也許是隱式)全面表示,希望能夠自動地?zé)o損地將這樣的信息作用于PnC。我認(rèn)為,所有能滿足這樣的系統(tǒng),都可以叫做廣義端到端。

對于其他的問題,比如對動態(tài)交互場景的一些優(yōu)化,我個人的觀點認(rèn)為至少并非只有端到端才能解決這些問題,傳統(tǒng)方法是可以解決好這些問題的。當(dāng)然,在數(shù)據(jù)量足夠大的時候,端到端可能會提供一個還不錯的solution。關(guān)于這個事情是否有必要,會在后幾個問題中展開討論。

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些誤區(qū)?

關(guān)于端到端自動駕駛的一些誤區(qū)?

一定要輸出控制信號和路點才是端到端

對于廣義端到端的概念,如果能夠認(rèn)同上面所講的概念,那么這個問題就很容易理解了。端到端的強(qiáng)調(diào)的是信息的無損傳遞,而不是一定要直接輸出任務(wù)量。這樣的端到端處理方法需要大量的兜底方案來保證安全,而且在實現(xiàn)過程中也會遇到一些問題,在后續(xù)處理中會逐漸展開。

端到端系統(tǒng)一定要基于大模型或者純視覺

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些誤區(qū)?

端到端自動駕駛的概念和大模型自動駕駛以及純視覺自動駕駛沒有任何必然的聯(lián)系。這三個概念是完全獨(dú)立存在的,一個端到端的系統(tǒng)不必一定是傳統(tǒng)意義上的大模型驅(qū)動的,也不一定就是純視覺。三者之間有一些關(guān)聯(lián),但不等同。

之前我有一篇文章詳細(xì)闡述過這些概念之間的關(guān)系,詳見:https://zhuanlan.zhihu.com/p/664189972

長遠(yuǎn)來看,上述狹義的端到端系統(tǒng)有沒有可能實現(xiàn)L3級別以上自動駕駛?

其實我先想來吐槽一句,號稱要用大模型來顛覆L4的人,都沒有實際做過L4;號稱端到端包治百病的人,也都從來沒做過PnC。于是和很多對端到端狂熱的人聊下來,就變成了一個純粹的無法證實也無法證偽的宗教信仰之爭。我們做前沿研發(fā)的同學(xué),還是應(yīng)該更實事求是,講究證據(jù)一些。。。最起碼對想要顛覆的東西有一些基礎(chǔ)認(rèn)知和了解一下其中棘手的問題,這是應(yīng)該有的基本科學(xué)素質(zhì)。。。

言歸正傳,目前來看,我是悲觀的。暫且不論目前號稱是純端到端的FSD,性能還遠(yuǎn)遠(yuǎn)不能達(dá)到L3級別以上所需要的可靠性和穩(wěn)定性,未來就算是統(tǒng)計意義上這個車輛和人是一樣安全的,還要面臨如何和人類駕駛員的錯誤做align的問題。更直白一點來說,就是說,一個自動駕駛系統(tǒng)想要讓大眾和輿論接受,關(guān)鍵可能不在于一個絕對的事故率和致死率,而是在于大眾是否能接受有一些場景中,對于人類是相對輕松解決,而機(jī)器會犯錯的。這個需求對于純端到端系統(tǒng)來說更難以實現(xiàn)。更具體的在我21年的一個回答中有闡述,詳見:

如何看待李彥宏朋友圈發(fā)表:無人駕駛肯定會出事,只是這個概率比有人駕駛低多了?

https://www.zhihu.com/question/530828899/answer/2590673435?utm_psn=1762524415009697792

舉在北美的Waymo和Cruise為例,其實分別都出過不少事故,但是為什么Cruise最后一次出現(xiàn)的事故讓監(jiān)管和大眾尤為不能接受呢?這個事故發(fā)生了兩次傷害,第一次的碰撞,對于人類駕駛員也是相當(dāng)難以避免的,其實也是可以被接受的。但是在這一次的碰撞發(fā)生之后,發(fā)生了嚴(yán)重的二次傷害:系統(tǒng)錯誤地判斷了碰撞位置和傷員位置,為了不阻塞交通,降級到了靠邊停車的模式,將傷員拖拽很久。這樣的一個行為,是任何一個正常的人類駕駛員都不會做出的事情,而且影響非常惡劣。這個事情直接導(dǎo)致了Cruise后續(xù)的一些動蕩。這個事情其實也給我們敲響了警鐘,如何避免這樣的事情發(fā)生,應(yīng)該是自動駕駛系統(tǒng)研發(fā)和運(yùn)營中認(rèn)真考慮的問題。

那么站在現(xiàn)在的這個時刻,下一代量產(chǎn)輔助駕駛系統(tǒng)中切實可行的方案是什么?

簡單來說,我認(rèn)為一個合適的系統(tǒng)應(yīng)當(dāng)是首先充分挖掘傳統(tǒng)系統(tǒng)的能力上限,然后再去結(jié)合端到端的靈活和普適性,也就是一個漸進(jìn)式端到端的方案。當(dāng)然這兩者如何有機(jī)地結(jié)合就是個付費(fèi)內(nèi)容了,哈哈。。。但是我們可以分析一下,現(xiàn)在所謂的端到端或者learning based planner實際落地在做的事情是什么。

以我有限的了解,目前所謂端到端模型在行車中使用的時候,在輸出的軌跡之后都會去接一個基于傳統(tǒng)方法兜底的方案,或者是這樣的learning based planner和傳統(tǒng)的軌跡規(guī)劃算法會同時輸出多條軌跡,再通過一個selector來選擇一條執(zhí)行。如果這樣設(shè)計系統(tǒng)架構(gòu),這么一個級連系統(tǒng)的性能上限其實是被這樣的兜底方案和selector限制住的。如果這樣的方案仍然是基于純feedforward learning的,仍會有不可預(yù)測的失效,本質(zhì)上并不能達(dá)到兜底的目的。如果考慮在這樣輸出的軌跡上使用一個傳統(tǒng)的規(guī)劃方法再去優(yōu)化或者選擇,那相當(dāng)于learning based方法出的軌跡,只是給這樣的一個優(yōu)化和搜索問題做了一個初始解,我們?yōu)楹尾恢苯尤?yōu)化和搜索這樣的軌跡呢?

當(dāng)然有同學(xué)會跳出來講,這樣的一個優(yōu)化或者搜索問題是非凸的,狀態(tài)空間很大不可能在車載系統(tǒng)上跑到實時。我請大家在這里仔細(xì)想這樣一個問題:在過去10年中,感知系統(tǒng)至少吃到了100x的算力紅利發(fā)展,但是我們的PnC模塊呢?如果我們同樣允許PnC模塊使用大算力,結(jié)合上近幾年先進(jìn)優(yōu)化算法的一些發(fā)展,這樣的結(jié)論仍然成立嗎?針對這樣的問題,我們不應(yīng)該固步自封,路徑依賴,而是應(yīng)該從第一性原理思考什么才是對的。

聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些誤區(qū)?

數(shù)據(jù)驅(qū)動和傳統(tǒng)方法之間關(guān)系如何調(diào)和?

其實和自動駕駛非常類似的一個例子就是下棋,剛好在今年2月份的時候Deepmind發(fā)表了一篇文章(Grandmaster-Level Chess Without Search:https://arxiv.org /abs/2402.04494)就在探索只用數(shù)據(jù)驅(qū)動,拋棄AlphaGo和AlphaZero中的MCTS search是否可行。類比到自動駕駛中就是,只用一個網(wǎng)絡(luò)直接輸出action,拋棄掉后續(xù)所有的步驟。文章的結(jié)論是,在相當(dāng)?shù)囊?guī)模的數(shù)據(jù)和模型參數(shù)下,不用搜索仍然可以得到一個還算合理的結(jié)果,然而和加上搜索的方法比,還有非常顯著的差距。 (文章中這里的對比其實也不盡公平,實際差距應(yīng)該更大)尤其是在解一些困難的殘局上,純數(shù)據(jù)驅(qū)動性能非常糟糕。這類比到自動駕駛中,也就是意味著,需要多步博弈的困難場景或corner case,仍然很難完全拋棄掉傳統(tǒng)的優(yōu)化或者搜索算法。像AlphaZero一樣合理地運(yùn)用各種技術(shù)的優(yōu)勢,才是最為高效提升性能的方式。

傳統(tǒng)方法 = rule based if else?

這個觀念也是我在和很多人的交流中需要反復(fù)糾正的。按照很多人的定義,只要不是純數(shù)據(jù)驅(qū)動,就叫做rule based。還是舉下棋這個例子,去死記硬背定式和棋譜是rule based,但是像AlphaGo和AlphaZero一樣通過搜索和優(yōu)化賦予模型reasoning的能力,我認(rèn)為并不能叫做rule based。這恰恰也是目前大模型本身所欠缺的,也是研究者通過CoT等方式試圖賦予一個learning based model的。然而人開車每一個動作都是有明確的動機(jī)的,這和需要純數(shù)據(jù)驅(qū)動的圖像識別等無法清晰描述原因的任務(wù)不同。在一個合適的算法架構(gòu)設(shè)計下,決策軌跡都應(yīng)該成為變量,在一個科學(xué)的目標(biāo)指引下統(tǒng)一優(yōu)化。而不是通過強(qiáng)行打patch和調(diào)參去修各種case。這樣的一個系統(tǒng)自然也不會存在各種hardcode的奇怪的rule。

總結(jié)

最終總結(jié)一下,端到端也許是一個很有希望的技術(shù)路線,但是這樣一個概念如何付諸實踐還有很多有待探索的事情。是不是狂堆數(shù)據(jù)和模型參數(shù)就是唯一正確的解決方案,目前在我看來并不是的。我覺得,任何時刻作為一個前沿研究的技術(shù)人員,我們都應(yīng)該真正奉行馬斯克所講的第一性原理和工程師思維,從實踐中思考問題的本質(zhì),而不是將馬斯克本身變成第一性原理。想要真正遙遙領(lǐng)先,就不應(yīng)該放棄思考,人云亦云,否則就只能在不斷想要彎道超車。

以上是聊聊端到端與下一代自動駕駛系統(tǒng),以及端到端自動駕駛的一些誤區(qū)?的詳細(xì)內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF? 為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF? Jan 17, 2024 pm 02:57 PM

寫在前面&筆者的個人理解三維Gaussiansplatting(3DGS)是近年來在顯式輻射場和計算機(jī)圖形學(xué)領(lǐng)域出現(xiàn)的一種變革性技術(shù)。這種創(chuàng)新方法的特點是使用了數(shù)百萬個3D高斯,這與神經(jīng)輻射場(NeRF)方法有很大的不同,后者主要使用隱式的基于坐標(biāo)的模型將空間坐標(biāo)映射到像素值。3DGS憑借其明確的場景表示和可微分的渲染算法,不僅保證了實時渲染能力,而且引入了前所未有的控制和場景編輯水平。這將3DGS定位為下一代3D重建和表示的潛在游戲規(guī)則改變者。為此我們首次系統(tǒng)地概述了3DGS領(lǐng)域的最新發(fā)展和關(guān)

自動駕駛場景中的長尾問題怎么解決? 自動駕駛場景中的長尾問題怎么解決? Jun 02, 2024 pm 02:44 PM

昨天面試被問到了是否做過長尾相關(guān)的問題,所以就想著簡單總結(jié)一下。自動駕駛長尾問題是指自動駕駛汽車中的邊緣情況,即發(fā)生概率較低的可能場景。感知的長尾問題是當(dāng)前限制單車智能自動駕駛車輛運(yùn)行設(shè)計域的主要原因之一。自動駕駛的底層架構(gòu)和大部分技術(shù)問題已經(jīng)被解決,剩下的5%的長尾問題,逐漸成了制約自動駕駛發(fā)展的關(guān)鍵。這些問題包括各種零碎的場景、極端的情況和無法預(yù)測的人類行為。自動駕駛中的邊緣場景"長尾"是指自動駕駛汽車(AV)中的邊緣情況,邊緣情況是發(fā)生概率較低的可能場景。這些罕見的事件

你是否真正掌握了坐標(biāo)系轉(zhuǎn)換?自動駕駛離不開的多傳感器問題 你是否真正掌握了坐標(biāo)系轉(zhuǎn)換?自動駕駛離不開的多傳感器問題 Oct 12, 2023 am 11:21 AM

一先導(dǎo)與重點文章主要介紹自動駕駛技術(shù)中幾種常用的坐標(biāo)系統(tǒng),以及他們之間如何完成關(guān)聯(lián)和轉(zhuǎn)換,最終構(gòu)建出統(tǒng)一的環(huán)境模型。這里重點理解自車到相機(jī)剛體轉(zhuǎn)換(外參),相機(jī)到圖像轉(zhuǎn)換(內(nèi)參),圖像到像素有單位轉(zhuǎn)換。3d向2d轉(zhuǎn)換會有相應(yīng)的畸變,平移等。重點:自車坐標(biāo)系相機(jī)機(jī)體坐標(biāo)系需要被重寫的是:平面坐標(biāo)系像素坐標(biāo)系難點:要考慮圖像畸變,去畸變和加畸變都是在像平面上去補(bǔ)償二簡介視覺系統(tǒng)一共有四個坐標(biāo)系:像素平面坐標(biāo)系(u,v)、圖像坐標(biāo)系(x,y)、相機(jī)坐標(biāo)系()和世界坐標(biāo)系()。每種坐標(biāo)系之間均存在聯(lián)系,

SIMPL:用于自動駕駛的簡單高效的多智能體運(yùn)動預(yù)測基準(zhǔn) SIMPL:用于自動駕駛的簡單高效的多智能體運(yùn)動預(yù)測基準(zhǔn) Feb 20, 2024 am 11:48 AM

原標(biāo)題:SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving論文鏈接:https://arxiv.org/pdf/2402.02519.pdf代碼鏈接:https://github.com/HKUST-Aerial-Robotics/SIMPL作者單位:香港科技大學(xué)大疆論文思路:本文提出了一種用于自動駕駛車輛的簡單高效的運(yùn)動預(yù)測基線(SIMPL)。與傳統(tǒng)的以代理為中心(agent-cent

Sparse4D v3來了!推進(jìn)端到端3D檢測和跟蹤 Sparse4D v3來了!推進(jìn)端到端3D檢測和跟蹤 Nov 24, 2023 am 11:21 AM

新標(biāo)題:Sparse4Dv3:推進(jìn)端到端的3D檢測和跟蹤技術(shù)論文鏈接:https://arxiv.org/pdf/2311.11722.pdf需要重新寫的內(nèi)容是:代碼鏈接:https://github.com/linxuewu/Sparse4D重新寫的內(nèi)容:作者所屬單位為地平線公司論文思路:在自動駕駛感知系統(tǒng)中,3D檢測和跟蹤是兩項基本任務(wù)。本文基于Sparse4D框架更深入地研究了該領(lǐng)域。本文引入了兩個輔助訓(xùn)練任務(wù)(時序?qū)嵗ピ?TemporalInstanceDenoising和質(zhì)量估計-Q

選擇相機(jī)還是激光雷達(dá)?實現(xiàn)魯棒的三維目標(biāo)檢測的最新綜述 選擇相機(jī)還是激光雷達(dá)?實現(xiàn)魯棒的三維目標(biāo)檢測的最新綜述 Jan 26, 2024 am 11:18 AM

0.寫在前面&&個人理解自動駕駛系統(tǒng)依賴于先進(jìn)的感知、決策和控制技術(shù),通過使用各種傳感器(如相機(jī)、激光雷達(dá)、雷達(dá)等)來感知周圍環(huán)境,并利用算法和模型進(jìn)行實時分析和決策。這使得車輛能夠識別道路標(biāo)志、檢測和跟蹤其他車輛、預(yù)測行人行為等,從而安全地操作和適應(yīng)復(fù)雜的交通環(huán)境.這項技術(shù)目前引起了廣泛的關(guān)注,并認(rèn)為是未來交通領(lǐng)域的重要發(fā)展領(lǐng)域之一。但是,讓自動駕駛變得困難的是弄清楚如何讓汽車了解周圍發(fā)生的事情。這需要自動駕駛系統(tǒng)中的三維物體檢測算法可以準(zhǔn)確地感知和描述周圍環(huán)境中的物體,包括它們的位置、

自動駕駛與軌跡預(yù)測看這一篇就夠了! 自動駕駛與軌跡預(yù)測看這一篇就夠了! Feb 28, 2024 pm 07:20 PM

軌跡預(yù)測在自動駕駛中承擔(dān)著重要的角色,自動駕駛軌跡預(yù)測是指通過分析車輛行駛過程中的各種數(shù)據(jù),預(yù)測車輛未來的行駛軌跡。作為自動駕駛的核心模塊,軌跡預(yù)測的質(zhì)量對于下游的規(guī)劃控制至關(guān)重要。軌跡預(yù)測任務(wù)技術(shù)棧豐富,需要熟悉自動駕駛動/靜態(tài)感知、高精地圖、車道線、神經(jīng)網(wǎng)絡(luò)架構(gòu)(CNN&GNN&Transformer)技能等,入門難度很大!很多粉絲期望能夠盡快上手軌跡預(yù)測,少踩坑,今天就為大家盤點下軌跡預(yù)測常見的一些問題和入門學(xué)習(xí)方法!入門相關(guān)知識1.預(yù)習(xí)的論文有沒有切入順序?A:先看survey,p

FisheyeDetNet:首個基于魚眼相機(jī)的目標(biāo)檢測算法 FisheyeDetNet:首個基于魚眼相機(jī)的目標(biāo)檢測算法 Apr 26, 2024 am 11:37 AM

目標(biāo)檢測在自動駕駛系統(tǒng)當(dāng)中是一個比較成熟的問題,其中行人檢測是最早得以部署算法之一。在多數(shù)論文當(dāng)中已經(jīng)進(jìn)行了非常全面的研究。然而,利用魚眼相機(jī)進(jìn)行環(huán)視的距離感知相對來說研究較少。由于徑向畸變大,標(biāo)準(zhǔn)的邊界框表示在魚眼相機(jī)當(dāng)中很難實施。為了緩解上述描述,我們探索了擴(kuò)展邊界框、橢圓、通用多邊形設(shè)計為極坐標(biāo)/角度表示,并定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優(yōu)于其他模型,并同時在用于自動駕駛的Valeo魚眼相機(jī)數(shù)據(jù)集上實現(xiàn)了49.5%的mAP

See all articles