亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
一、前言
二、背景
三、MULTI-GRID ASSIGNMENT
#五、實(shí)驗(yàn)及視覺(jué)化
首頁(yè) 科技週邊 人工智慧 用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

Jun 01, 2024 pm 09:46 PM
目標(biāo)偵測(cè) 網(wǎng)格

一、前言

目前領(lǐng)先的目標(biāo)偵測(cè)器是基於深度CNN的主幹分類(lèi)器網(wǎng)路重新調(diào)整用途的兩級(jí)或單級(jí)網(wǎng)路。 YOLOv3就是這樣一種眾所周知的最先進(jìn)的單級(jí)檢測(cè)器,它接收輸入圖像並將其劃分為大小相等的網(wǎng)格矩陣。具有目標(biāo)中心的網(wǎng)格單元負(fù)責(zé)偵測(cè)特定目標(biāo)。

今天分享的,就是提出了一種新的數(shù)學(xué)方法,該方法為每個(gè)目標(biāo)分配多個(gè)網(wǎng)格,以實(shí)現(xiàn)精確的tight-fit邊界框預(yù)測(cè)。研究者也提出了一種有效的離線(xiàn)複製貼上資料增強(qiáng)來(lái)進(jìn)行目標(biāo)偵測(cè)。新提出的方法顯著優(yōu)於一些目前最先進(jìn)的目標(biāo)偵測(cè)器,並有望獲得更好的效能。

二、背景

目標(biāo)偵測(cè)網(wǎng)路旨在使用精確匹配邊界框在影像上定位物件並準(zhǔn)確標(biāo)記它們。最近,有兩種不同的方法可以實(shí)現(xiàn)這一目標(biāo)。第一種方法是效能方面,最主要的方法是兩階段目標(biāo)檢測(cè),最好的代表是區(qū)域卷積神經(jīng)網(wǎng)路(RCNN)及其衍生物[Faster R-CNN: Towards real-time object detection with region proposal networks]、[Fast R-CNN]。相比之下,第二組目標(biāo)檢測(cè)實(shí)現(xiàn)的因其出色的檢測(cè)速度和輕量級(jí)而被人們所知,被稱(chēng)為單階段網(wǎng)絡(luò),代表性示例為[You only look once: Unified, real-time object detection]、[SSD: Single shot multibox detector]、[Focal loss for dense object detection]。兩階段網(wǎng)絡(luò)依賴(lài)於一個(gè)潛在的區(qū)域建議網(wǎng)絡(luò),該網(wǎng)絡(luò)生成了可能包含感興趣對(duì)象的圖像的候選區(qū)域。此網(wǎng)路產(chǎn)生的候選區(qū)域可以包含物件感興趣的區(qū)域,在單階段目標(biāo)偵測(cè)中,偵測(cè)是在一個(gè)完整的前向傳遞中同時(shí)處理分類(lèi)和定位。因此,通常情況下,單階段網(wǎng)路更輕、更快且易於實(shí)現(xiàn)。

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

今天的研究依然是堅(jiān)持YOLO的方法,特別是YOLOv3,並提出了一種簡(jiǎn)單的hack,可以同時(shí)使用多個(gè)網(wǎng)絡(luò)單元元素預(yù)測(cè)目標(biāo)座標(biāo)、類(lèi)別和目標(biāo)置信度。每個(gè)物件的多網(wǎng)路單元元素背後的基本原理是透過(guò)強(qiáng)制多個(gè)單元元素在同一物件上工作來(lái)增加預(yù)測(cè)緊密擬合邊界框的可能性。

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

多重網(wǎng)格指派的一些優(yōu)點(diǎn)包括:

目標(biāo)偵測(cè)器提供它正在偵測(cè)的物件的多視角圖,而不僅僅依靠一個(gè)網(wǎng)格單元來(lái)預(yù)測(cè)物件的類(lèi)別和座標(biāo)。

(b ) 較少隨機(jī)且不確定的邊界框預(yù)測(cè),這意味著高精度和召回率,因?yàn)楦浇木W(wǎng)路單元被訓(xùn)練來(lái)預(yù)測(cè)相同的目標(biāo)類(lèi)別和座標(biāo);

(c) 減少具有感興趣物件的網(wǎng)格單元與沒(méi)有感興趣物件的網(wǎng)格之間的不平衡。

此外,由於多網(wǎng)格分配是對(duì)現(xiàn)有參數(shù)的數(shù)學(xué)利用,並且不需要額外的關(guān)鍵點(diǎn)池化層和後處理來(lái)將關(guān)鍵點(diǎn)重新組合到其對(duì)應(yīng)的目標(biāo),如CenterNet和CornerNet,可以說(shuō)它是一個(gè)更實(shí)現(xiàn)無(wú)錨或基於關(guān)鍵點(diǎn)的目標(biāo)偵測(cè)器試圖實(shí)現(xiàn)的自然方式。除了多網(wǎng)格冗餘註釋?zhuān)芯空哌€引入了一種新的基於離線(xiàn)複製貼上的資料增強(qiáng)技術(shù),用於準(zhǔn)確的目標(biāo)檢測(cè)。

三、MULTI-GRID ASSIGNMENT

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

#上圖包含三個(gè)目標(biāo),分別是狗狗、腳踏車(chē)和汽車(chē)。為簡(jiǎn)潔起見(jiàn),我們將解釋我們?cè)谝粋€(gè)物件上的多網(wǎng)格分配。上圖顯示了三個(gè)物件的邊界框,其中包含更多關(guān)於狗的邊界框的細(xì)節(jié)。下圖顯示了上圖的縮小區(qū)域,重點(diǎn)是狗的邊界框中心。包含狗邊界框中心的網(wǎng)格單元的左上角座標(biāo)以數(shù)字0標(biāo)記,而包含中心的網(wǎng)格周?chē)钠渌藗€(gè)網(wǎng)格單元的標(biāo)籤從1到8。

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

到目前為止,我已經(jīng)解釋了包含目標(biāo)邊界框中心的網(wǎng)格如何註釋目標(biāo)的基本事實(shí)。這種對(duì)每個(gè)物件僅一個(gè)網(wǎng)格單元的依賴(lài)來(lái)完成預(yù)測(cè)類(lèi)別的困難工作和精確的tight-fit邊界框引發(fā)了許多問(wèn)題,例如:

(a)正負(fù)網(wǎng)格之間的巨大不平衡,即有和沒(méi)有物件中心的網(wǎng)格座標(biāo)

(b)緩慢的邊界框收斂到GT

(c)缺乏要預(yù)測(cè)的物件的多視角(角度)視圖。

所以這裡要問(wèn)的一個(gè)自然問(wèn)題是,「顯然,大多數(shù)物件包含一個(gè)以上網(wǎng)格單元的區(qū)域,因此是否有一種簡(jiǎn)單的數(shù)學(xué)方法來(lái)分配更多這些網(wǎng)格單元來(lái)嘗試預(yù)測(cè)物件的類(lèi)別和座標(biāo)連同中心網(wǎng)格單元?這樣做的一些優(yōu)點(diǎn)是(a)減少不平衡,(b)更快的訓(xùn)練以收斂到邊界框,因?yàn)楝F(xiàn)在多個(gè)網(wǎng)格單元同時(shí)針對(duì)同一個(gè)對(duì)象,(c)增加預(yù)測(cè)tight-fit邊界框的機(jī)會(huì)(d) 為YOLOv3等基於網(wǎng)格的偵測(cè)器提供多視角視圖,而不是物件的單點(diǎn)視圖。新提出的多重網(wǎng)格分配試圖回答上述問(wèn)題。

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

Ground-truth encoding

四、訓(xùn)練

?A. The Detection Network: MultiGridDet

MultiGridDet是一個(gè)目標(biāo)檢測(cè)網(wǎng)絡(luò),透過(guò)從YOLOv3中刪除六個(gè)darknet卷積塊來(lái)使其更輕、更快。一個(gè)卷積塊有一個(gè)Conv2D Batch Normalization LeakyRelu。移除的區(qū)塊不是來(lái)自分類(lèi)主幹,即Darknet53。相反,將它們從三個(gè)多尺度檢測(cè)輸出網(wǎng)路或頭中刪除,每個(gè)輸出網(wǎng)路兩個(gè)。儘管通常深度網(wǎng)路表現(xiàn)良好,但太深的網(wǎng)路也往往會(huì)快速過(guò)度擬合或大幅降低網(wǎng)路速度。

B. The Loss function

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

#Coordinate activation function plot with different β values

C. Data Augmentation

離線(xiàn)複製貼上人工訓(xùn)練圖像合成工作如下:首先,使用簡(jiǎn)單的圖像搜索腳本,使用地標(biāo)、雨、森林等關(guān)鍵字從Google圖像下載數(shù)千張背景無(wú)物件圖像,即沒(méi)有我們感興趣的物件的圖像。然後,我們從整個(gè)訓(xùn)練資料集的隨機(jī)q個(gè)影像中迭代地選擇p個(gè)物件及其邊界框。然後,我們產(chǎn)生使用它們的索引作為ID選擇的p個(gè)邊界框的所有可能組合。從組合集合中,我們選擇滿(mǎn)足以下兩個(gè)條件的邊界框子集:

  • if arranged in some random order side by side, they must fit within a given target background image area
  • and should efficiently utilize the background image space in its entirety or at least most part of it without the objects overlap.

#五、實(shí)驗(yàn)及視覺(jué)化

Pascal VOC 2007上的效能比較

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註

###################### ######coco資料集上的效能比較###############################從圖中可以看出,第一行顯示了六個(gè)輸入影像,而第二行顯示了網(wǎng)路在非極大抑制(NMS)之前的預(yù)測(cè),最後一行顯示了MultiGridDet在NMS之後對(duì)輸入影像的最終邊界框預(yù)測(cè)。 ############

以上是用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線(xiàn)上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開(kāi)發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺(jué)化網(wǎng)頁(yè)開(kāi)發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

熱門(mén)話(huà)題

Laravel 教程
1597
29
PHP教程
1488
72
目標(biāo)偵測(cè)新SOTA:YOLOv9問(wèn)世,新架構(gòu)讓傳統(tǒng)卷積重?zé)ㄉ鷻C(jī) 目標(biāo)偵測(cè)新SOTA:YOLOv9問(wèn)世,新架構(gòu)讓傳統(tǒng)卷積重?zé)ㄉ鷻C(jī) Feb 23, 2024 pm 12:49 PM

在目標(biāo)檢測(cè)領(lǐng)域,YOLOv9在實(shí)現(xiàn)過(guò)程中不斷進(jìn)步,通過(guò)采用新架構(gòu)和方法,有效提高了傳統(tǒng)卷積的參數(shù)利用率,這使得其性能遠(yuǎn)超前代產(chǎn)品。繼2023年1月YOLOv8正式發(fā)布一年多以后,YOLOv9終于來(lái)了!自2015年JosephRedmon和AliFarhadi等人提出了第一代YOLO模型以來(lái),目標(biāo)檢測(cè)領(lǐng)域的研究者們對(duì)其進(jìn)行了多次更新和迭代。YOLO是一種基于圖像全局信息的預(yù)測(cè)系統(tǒng),其模型性能不斷得到增強(qiáng)。通過(guò)不斷改進(jìn)算法和技術(shù),研究人員取得了顯著的成果,使得YOLO在目標(biāo)檢測(cè)任務(wù)中表現(xiàn)出越來(lái)越強(qiáng)大

用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註 用於精確目標(biāo)偵測(cè)的多網(wǎng)格冗餘邊界框標(biāo)註 Jun 01, 2024 pm 09:46 PM

一、前言目前領(lǐng)先的目標(biāo)偵測(cè)器是基於深度CNN的主幹分類(lèi)器網(wǎng)路重新調(diào)整用途的兩級(jí)或單級(jí)網(wǎng)路。 YOLOv3就是這樣一種眾所周知的最先進(jìn)的單級(jí)檢測(cè)器,它接收輸入圖像並將其劃分為大小相等的網(wǎng)格矩陣。具有目標(biāo)中心的網(wǎng)格單元負(fù)責(zé)偵測(cè)特定目標(biāo)。今天分享的,就是提出了一種新的數(shù)學(xué)方法,該方法為每個(gè)目標(biāo)分配多個(gè)網(wǎng)格,以實(shí)現(xiàn)精確的tight-fit邊界框預(yù)測(cè)。研究者也提出了一種有效的離線(xiàn)複製貼上資料增強(qiáng)來(lái)進(jìn)行目標(biāo)偵測(cè)。新提出的方法顯著優(yōu)於一些目前最先進(jìn)的目標(biāo)偵測(cè)器,並有望獲得更好的效能。二、背景目標(biāo)偵測(cè)網(wǎng)路旨在使用

蘋(píng)果手機(jī)中設(shè)定相機(jī)網(wǎng)格的操作步驟 蘋(píng)果手機(jī)中設(shè)定相機(jī)網(wǎng)格的操作步驟 Mar 26, 2024 pm 07:21 PM

1.開(kāi)啟蘋(píng)果手機(jī)的桌面,找到並點(diǎn)選進(jìn)入【設(shè)定】,2、在設(shè)定的頁(yè)面點(diǎn)選進(jìn)入【相機(jī)】。 3.點(diǎn)選打開(kāi)【網(wǎng)格】右側(cè)的開(kāi)關(guān)即可。

如何利用C++進(jìn)行高效能的影像追蹤與目標(biāo)偵測(cè)? 如何利用C++進(jìn)行高效能的影像追蹤與目標(biāo)偵測(cè)? Aug 26, 2023 pm 03:25 PM

如何利用C++進(jìn)行高效能的影像追蹤與目標(biāo)偵測(cè)?摘要:隨著人工智慧和電腦視覺(jué)技術(shù)的快速發(fā)展,影像追蹤和目標(biāo)偵測(cè)成為了重要的研究領(lǐng)域。本文將透過(guò)使用C++語(yǔ)言和一些開(kāi)源函式庫(kù),介紹如何實(shí)現(xiàn)高效能的影像追蹤和目標(biāo)偵測(cè),並提供程式碼範(fàn)例。引言:影像追蹤和目標(biāo)偵測(cè)是電腦視覺(jué)領(lǐng)域中的兩個(gè)重要任務(wù)。它們?cè)谠S多領(lǐng)域中都有廣泛的應(yīng)用,如視訊監(jiān)控、自動(dòng)駕駛、智慧交通系統(tǒng)等。為了

CSS佈局技巧:實(shí)現(xiàn)圓形網(wǎng)格圖示佈局的最佳實(shí)踐 CSS佈局技巧:實(shí)現(xiàn)圓形網(wǎng)格圖示佈局的最佳實(shí)踐 Oct 20, 2023 am 10:46 AM

CSS佈局技巧:實(shí)現(xiàn)圓形網(wǎng)格圖示佈局的最佳實(shí)踐在現(xiàn)代網(wǎng)頁(yè)設(shè)計(jì)中,網(wǎng)格佈局是一種常見(jiàn)且強(qiáng)大的佈局技術(shù)。而圓形網(wǎng)格圖示佈局則是更獨(dú)特有趣的設(shè)計(jì)選擇。本文將介紹一些最佳實(shí)踐和具體程式碼範(fàn)例,幫助你實(shí)現(xiàn)圓形網(wǎng)格圖示佈局。 HTML結(jié)構(gòu)首先,我們需要設(shè)定一個(gè)容器元素,在這個(gè)容器裡放置圖示。我們可以使用一個(gè)無(wú)序列表(<ul>)作為容器,列表項(xiàng)目(<l

多個(gè)SOTA ! OV-Uni3DETR:提高3D檢測(cè)在類(lèi)別、場(chǎng)景和模態(tài)之間的普遍性(清華&港大) 多個(gè)SOTA ! OV-Uni3DETR:提高3D檢測(cè)在類(lèi)別、場(chǎng)景和模態(tài)之間的普遍性(清華&港大) Apr 11, 2024 pm 07:46 PM

這篇論文討論了3D目標(biāo)偵測(cè)的領(lǐng)域,特別是針對(duì)Open-Vocabulary的3D目標(biāo)偵測(cè)。在傳統(tǒng)的3D目標(biāo)偵測(cè)任務(wù)中,系統(tǒng)需要在預(yù)測(cè)真實(shí)場(chǎng)景中物件的定位3D邊界框和語(yǔ)意類(lèi)別標(biāo)籤,這通常依賴(lài)點(diǎn)雲(yún)或RGB影像。儘管2D目標(biāo)檢測(cè)技術(shù)因其普遍性和速度展現(xiàn)出色,但相關(guān)研究表明,3D通用檢測(cè)的發(fā)展相比之下顯得滯後。目前,大多數(shù)3D目標(biāo)偵測(cè)方法仍依賴(lài)完全監(jiān)督學(xué)習(xí),並受到特定輸入模式下完全標(biāo)註資料的限制,只能識(shí)別經(jīng)過(guò)訓(xùn)練過(guò)程中出現(xiàn)的類(lèi)別,無(wú)論是在室內(nèi)或室外場(chǎng)景。這篇論文指出,3D通用目標(biāo)偵測(cè)面臨的挑戰(zhàn)主要

Python中的電腦視覺(jué)實(shí)例:目標(biāo)偵測(cè) Python中的電腦視覺(jué)實(shí)例:目標(biāo)偵測(cè) Jun 10, 2023 am 11:36 AM

隨著人工智慧的發(fā)展,電腦視覺(jué)技術(shù)已經(jīng)成為了人們關(guān)注的焦點(diǎn)之一。 Python作為一種高效且易學(xué)的程式語(yǔ)言,在電腦視覺(jué)領(lǐng)域的應(yīng)用得到了廣泛的認(rèn)可和推廣。本文將重點(diǎn)放在Python中的電腦視覺(jué)實(shí)例:目標(biāo)偵測(cè)。什麼是目標(biāo)檢測(cè)?目標(biāo)偵測(cè)是電腦視覺(jué)領(lǐng)域中的關(guān)鍵技術(shù),其目的是在一張圖片或影片中識(shí)別出特定目標(biāo)的位置和大小。相較於影像分類(lèi),目標(biāo)偵測(cè)不僅需要辨識(shí)出圖

最新的目標(biāo)偵測(cè)的深度架構(gòu) 參數(shù)少一半、速度快3倍+ 最新的目標(biāo)偵測(cè)的深度架構(gòu) 參數(shù)少一半、速度快3倍+ Apr 09, 2023 am 11:41 AM

簡(jiǎn)要介紹研究作者提出了 Matrix Net (xNet),一種用於目標(biāo)檢測(cè)的新深度架構(gòu)。 xNets將具有不同大小尺寸和縱橫比的目標(biāo)映射到網(wǎng)路層中,其中目標(biāo)在層內(nèi)的大小和縱橫比幾乎是均勻的。因此,xNets提供了一種尺寸和縱橫比感知結(jié)構(gòu)。研究者利用xNets增強(qiáng)基於關(guān)鍵點(diǎn)的目標(biāo)偵測(cè)。新的架構(gòu)實(shí)現(xiàn)了比任何其他單鏡頭偵測(cè)器的時(shí)效性高,具有47.8的mAP在MS COCO資料集,同時(shí)使用了一半的參數(shù)而且相比於第二好框架,其在訓(xùn)練上快了3倍。簡(jiǎn)單結(jié)果展示上圖所示,xNet的參數(shù)及效率要遠(yuǎn)遠(yuǎn)超過(guò)其它模型

See all articles