午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種基于改進(jìn)YOLOv8s算法的航道船舶及航標(biāo)檢測(cè)方法與流程

文檔序號(hào):39724502發(fā)布日期:2024-10-22 13:21閱讀:2來(lái)源:國(guó)知局
一種基于改進(jìn)YOLOv8s算法的航道船舶及航標(biāo)檢測(cè)方法與流程

本發(fā)明涉及圖像識(shí)別,具體涉及基于改進(jìn)yolov8s算法的航道船舶及航標(biāo)檢測(cè)方法。


背景技術(shù):

1、針對(duì)水文條件復(fù)雜,通航密度大的航道,常有不同種類(lèi)船舶經(jīng)過(guò),若使用人工對(duì)船舶及其航標(biāo)進(jìn)行巡檢、分類(lèi),則需要耗費(fèi)大量的人力和物力。因此,衍生出了利用普通的神經(jīng)網(wǎng)絡(luò)模型對(duì)船舶圖像進(jìn)行快速準(zhǔn)確識(shí)別,此方法在軍民領(lǐng)域都有廣泛應(yīng)用,隨著船舶種類(lèi)的增多、圖像質(zhì)量的提高,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行船舶圖像識(shí)別需耗費(fèi)大量時(shí)間,也逐漸被主流淘汰。

2、船舶及其航標(biāo)識(shí)別的難度有三個(gè):第一個(gè)是船舶類(lèi)型眾多,其外在特征存在明顯的差異性,這使得船舶檢測(cè)的精度大打折扣。第二個(gè)是船舶及其航標(biāo)的檢測(cè)的速度要達(dá)到實(shí)時(shí)檢測(cè)的標(biāo)準(zhǔn),對(duì)于算法的速度要求很高。第三個(gè),參數(shù)量太大,間接導(dǎo)致模型占有量和速度性能?chē)?yán)重下滑,致使部署時(shí)系統(tǒng)運(yùn)轉(zhuǎn)慢、效果不理想。

3、針對(duì)以上問(wèn)題,秦溧矯提出了一種基于yolov5s的船舶跨尺度檢測(cè)算法yolo-csship,該類(lèi)技術(shù)通過(guò)添加自適應(yīng)空間并行卷積模塊、卷積自注意力混合模塊來(lái)提高識(shí)別精度。lin?feng等人提出了一種針對(duì)航道漂浮物檢測(cè)改進(jìn)的yolov?5s(fma-yolov?5s)算法,該算法在骨干網(wǎng)的末端增加了一個(gè)特征圖注意(fma)層,在訓(xùn)練過(guò)程中,采用鑲嵌數(shù)據(jù)增強(qiáng)的方法來(lái)提高小目標(biāo)的檢測(cè)效果,在輕量化上表現(xiàn)較為出色。許小華等人提出了一種針對(duì)河湖船舶檢測(cè)改進(jìn)的yolov4-tiny算法,引入sigmoid加權(quán)線(xiàn)性單元(silu)激活函數(shù)與卷積塊注意力模塊,以此提高檢測(cè)幀率。蕭箏等人提出一種基于msam-yokov5的內(nèi)河航道船舶識(shí)別方法,提出多尺度注意力模塊(msam),優(yōu)化錨框參數(shù),降低復(fù)雜背景對(duì)識(shí)別精度的影響。

4、而本發(fā)明針對(duì)上述三個(gè)問(wèn)題,從yolov8s入手,提出一種基于yolov8s的用于航道船舶及航標(biāo)檢測(cè)的方法及模型。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的是為了解決現(xiàn)有針對(duì)船舶及其航標(biāo)識(shí)別的技術(shù)存在的在船舶類(lèi)型眾多時(shí),其外在特征存在明顯的差異性,這使得船舶檢測(cè)的精度大打折扣的技術(shù)問(wèn)題,現(xiàn)有技術(shù)的檢測(cè)速度無(wú)法滿(mǎn)足船舶及其航標(biāo)的檢測(cè)速度需求的技術(shù)問(wèn)題,以及現(xiàn)有技術(shù)參數(shù)量太大,間接導(dǎo)致模型占有量和速度性能?chē)?yán)重下滑,致使部署時(shí)系統(tǒng)運(yùn)轉(zhuǎn)慢、效果不理想的技術(shù)問(wèn)題,而提出的一種基于改進(jìn)yolov8s算法的航道船舶及航標(biāo)檢測(cè)方法及模型。

2、為了解決上述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案為:

3、一種基于改進(jìn)yolov8s算法的航道船舶及航標(biāo)檢測(cè)方法,包括以下步驟:

4、步驟s1:對(duì)捕捉到的目標(biāo)航道的船舶及航標(biāo)數(shù)據(jù)集進(jìn)行篩選整理;

5、步驟s2:經(jīng)過(guò)翻轉(zhuǎn)、裁剪、亮度調(diào)整、模糊處理等圖像預(yù)處理步驟,得到完整數(shù)據(jù)集;

6、步驟s3:使用labelimg對(duì)數(shù)據(jù)集進(jìn)行標(biāo)注,并按一定的比例劃分為訓(xùn)練集、驗(yàn)證集、測(cè)試集;

7、步驟s4:構(gòu)建gce-yolov8s網(wǎng)絡(luò);

8、步驟s5:將所獲得的數(shù)據(jù)集放入gce-yolov8s模型中,結(jié)合gce-yolov8s模型對(duì)獲取的船舶及航標(biāo)圖像進(jìn)行識(shí)別,并使用召回率、平均精度均值、以及每秒傳輸幀數(shù)作為評(píng)價(jià)指標(biāo);

9、步驟s6、使用已訓(xùn)練好的模型對(duì)待檢測(cè)圖像進(jìn)行圖像預(yù)測(cè),精確識(shí)別。

10、在步驟s2中對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,從而對(duì)原數(shù)據(jù)集進(jìn)行擴(kuò)充;

11、在步驟s3中使用labelimg圖片標(biāo)注工具對(duì)收集到的船舶及不同種類(lèi)的航標(biāo)進(jìn)行標(biāo)注,按照一定的比例進(jìn)行數(shù)據(jù)集劃分,得到船舶及航標(biāo)數(shù)據(jù)集的訓(xùn)練集、驗(yàn)證集、測(cè)試集;

12、在步驟s4中將eiou邊框損失函數(shù)作為yolov8新的邊框損失函數(shù)。

13、所采用的eiou邊框損失函數(shù)包括三個(gè)部分:重疊損失、中心距離損失、寬高損失,其計(jì)算公式為:

14、

15、其中iou為預(yù)測(cè)框和真實(shí)框相交區(qū)域面積和合并區(qū)域面積的比值,b,bgt分別表示預(yù)測(cè)框中心點(diǎn)和真實(shí)框中心點(diǎn),ρ2(b,bgt)表示預(yù)測(cè)框和真實(shí)框兩個(gè)中心點(diǎn)之間的歐式距離,c表示同時(shí)包含預(yù)測(cè)框和真實(shí)框的最小閉包區(qū)域的對(duì)角線(xiàn)距離,w,wgt分別表示預(yù)測(cè)框?qū)挾群驼鎸?shí)框?qū)挾?,?(w,wgt)表示預(yù)測(cè)框和真實(shí)框?qū)挾戎g的歐式距離,h,hgt分別表示預(yù)測(cè)框長(zhǎng)度和真實(shí)框長(zhǎng)度,ρ2(h,hgt)表示預(yù)測(cè)框和真實(shí)框長(zhǎng)度之間的歐式距離,cw和ch表示覆蓋預(yù)測(cè)框和真實(shí)框的最小外接框的寬度和長(zhǎng)度。

16、在步驟s5中,將訓(xùn)練集放入gce-yolov8s模型中進(jìn)行訓(xùn)練得到檢測(cè)結(jié)果得到best.pt文件;通過(guò)評(píng)價(jià)指標(biāo)來(lái)進(jìn)行模型評(píng)價(jià),best.pt文件包括召回率(recall,rec)、平均精度均值(mean?average?precision,map)、每秒傳輸幀數(shù)(frames?per?second,fps)和參數(shù)量(parameters)。

17、在步驟s6中,使用訓(xùn)練完成得到的best.pt文件作為本文模型的預(yù)訓(xùn)練權(quán)重,將待測(cè)圖像放入其中進(jìn)行檢測(cè)識(shí)別。

18、在步驟s3中,如圖2所示,所構(gòu)建的gce-yolov8s網(wǎng)絡(luò)包括主干網(wǎng)絡(luò)backbone、頸部網(wǎng)絡(luò)neck、檢測(cè)頭網(wǎng)絡(luò)head,具體如下:

19、主干網(wǎng)絡(luò)backbone具體為:圖像輸入給第一cbs卷積模塊,第一cbs卷積模塊連接第一gbneckv2模塊的輸入,第一gbneckv2模塊輸出連接第一c2fghostv2模塊的輸入,第一c2fghostv2模塊的輸出連接第二gbneckv2模塊的輸入,第二gbneckv2模塊的輸出連接第二c2fghostv2模塊輸入,第二c2fghostv2模塊輸出連接第三gbneckv2模塊的輸入,第三gbneckv2模塊的輸出連接第三c2fghostv2的輸入,第三c2fghostv2的輸出連接第四gbneckv2模塊的輸入,第四gbneckv2模塊的輸出連接第四c2fghostv2的輸入,第四c2fghostv2的輸出連接ca注意力機(jī)制的輸入,ca注意力機(jī)制的輸出連接sppf空間金字塔網(wǎng)絡(luò)的輸入;

20、頸部網(wǎng)絡(luò)neck具體為:由sppf空間金字塔網(wǎng)絡(luò)的輸出分為兩個(gè)分支,一個(gè)輸出連接第一gsconv模塊的輸入,另一個(gè)輸出直接連接第一拼接層模塊的輸入;第一gsconv模塊的輸出連接第一上采樣模塊的輸入,第一上采樣模塊的輸出連接至第二拼接層,將第三c2fghostv2模塊也連接至第二拼接層模塊;通過(guò)第二拼接層模塊的輸出傳遞給第一c2f模塊的輸入,第一c2f模塊的輸出連接第二上采樣模塊的輸入,第二上采樣模塊的輸出連接第三拼接層模塊的輸入,第二c2fghostv2模塊的輸出和第三上采樣模塊的輸出共同連接第三拼接層模塊的輸入;第三拼接層模塊的輸出連接第二c2f模塊的輸入;

21、第二c2f模塊的輸出連接第二gsconv模塊的輸入,第二gsconv模塊的輸出連接第四拼接層模塊的輸入,第四拼接層模塊的輸出連接第三c2f模塊的輸入;第三c2f模塊的輸出連接第三gsconv模塊的輸入,第三gsconv模塊的輸出連接第一拼接層的輸入;第一拼接層的輸出連接第四c2f模塊的輸入;

22、檢測(cè)頭網(wǎng)絡(luò)head具體為:第二c2f模塊的輸出形成第一檢測(cè)頭;第三c2f模塊的輸出形成第二檢測(cè)頭;第四c2f模塊的輸出形成第三檢測(cè)頭。

23、第一檢測(cè)頭具體為:第二c2f模塊的輸出形成兩個(gè)分支,分別為第一檢測(cè)頭一分支、第一檢測(cè)頭二分支;第一檢測(cè)頭一分支具體為:第二c2f模塊的輸出連接第一cbs模塊的輸入,第一cbs模塊的輸出連接第一conv2d模塊的輸入,第一conv2d模塊的輸出連接第一wiou模塊和第一dfl模塊;第一檢測(cè)頭二分支具體為:第二c2f模塊的輸出連接第二cbs模塊的輸入,第二cbs模塊的輸出連接第二conv2d模塊的輸入,第二conv2d模塊的輸出連接第二wiou模塊和第二dfl模塊;

24、第二檢測(cè)頭具體為:第三c2f模塊的輸出形成兩個(gè)分支,分別為第二檢測(cè)頭一分支、第二檢測(cè)頭二分支;第二檢測(cè)頭一分支具體為第三c2f模塊的輸出連接第三cbs模塊的輸入,第三cbs模塊的輸出連接第三conv2d模塊的輸入,第三conv2d模塊的輸出連接第三wiou模塊和第三dfl模塊;第二檢測(cè)頭二分支具體為:第三c2f模塊的輸出連接第四cbs模塊的輸入,第四cbs模塊的輸出連接第四conv2d模塊的輸入,第四conv2d模塊的輸出連接第四wiou模塊和第四dfl模塊;

25、第三檢測(cè)頭具體為:第四c2f模塊的輸出形成兩個(gè)分支,分別為第三檢測(cè)頭一分支、第三檢測(cè)頭二分支;第三檢測(cè)頭一分支具體為:第三c2f模塊的輸出連接第五cbs模塊的輸入,第五cbs模塊的輸出連接第五conv2d模塊的輸入,第五conv2d模塊的輸出連接第五wiou模塊和第五dfl模塊;第三檢測(cè)頭二分支具體為:第三c2f模塊的輸出連接第六cbs模塊的輸入,第六cbs模塊的輸出連接第六conv2d模塊的輸入,第六conv2d模塊的輸出連接第六wiou模塊和第六dfl模塊。

26、圖3是圖1中的gbneckv2模塊,該模塊如圖3所示,在圖3中包括3個(gè)小結(jié)構(gòu)圖,從左至右依次為:步長(zhǎng)為1時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)示意圖、步長(zhǎng)為2時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)示意圖、dfc?attention模塊的結(jié)構(gòu)示意圖。

27、ghostnetv2的瓶頸結(jié)構(gòu)分為步長(zhǎng)為1時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)、步長(zhǎng)為2時(shí)的ghostnetv2的瓶頸結(jié)構(gòu);

28、步長(zhǎng)為1時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)為:

29、輸入特征連接兩個(gè)分支,輸出的第一個(gè)分支連接dfc?attention模塊和第一ghostmodule模塊,第一ghost?module模塊經(jīng)過(guò)bn歸一化操作和relu激活函數(shù)與dfc?attention進(jìn)行乘積操作;將乘積操作后的輸出連接步長(zhǎng)為2的dw卷積的輸入,dw卷積操作的輸出連接第二ghost?module的輸入;將以上操作后的結(jié)果與輸入層的第二個(gè)分支疊加,得到輸出后的結(jié)果;

30、步長(zhǎng)為2時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)為:

31、輸入特征連接兩個(gè)分支,輸出的第一個(gè)分支連接dfc?attention模塊和第一ghostmodule模塊,第一ghost?module模塊經(jīng)過(guò)bn歸一化操作和relu激活函數(shù)與dfc?attention進(jìn)行乘積操作;將乘積操作后的輸出連接第二ghost?module模塊的輸入;將第二ghostmodule模塊的輸出與輸入層的第二個(gè)分支疊加,得到輸出后的結(jié)果。

32、dfc?attention模塊具體為:輸入特征后,連接進(jìn)行下采樣模塊的輸入,下采樣模塊的輸出連接1*1卷積模塊的輸入,1*1卷積模塊的輸出經(jīng)過(guò)歸一化模塊處理后連接fc模塊的輸入,fc模塊的輸出經(jīng)過(guò)歸一化模塊處理后連接sigmoid激活函數(shù)操作的輸入,sigmoid激活函數(shù)操作輸出后得到最終結(jié)果。

33、圖4是圖1中的c2fghostv2模塊,該模塊如圖4所示,具體如下:

34、輸入特征后,給步長(zhǎng)為1、卷積核大小為1*1的第一cbs卷積模塊作為輸入,卷積模塊的輸出連接spilt模塊輸入,spilt模塊的輸出分為兩個(gè)分支進(jìn)行操作;其中一個(gè)分支下,spilt模塊的輸出直接連接拼接層的輸入;另一個(gè)分支下,spilt模塊的輸出模塊個(gè)數(shù)依次累加,依次經(jīng)過(guò)1個(gè)、2個(gè)、3個(gè)一直到n個(gè)ghostnetv2的瓶頸模塊,并且每經(jīng)過(guò)一個(gè)ghostnetv2的瓶頸模塊,其輸出就連接依次拼接層的輸入,疊加進(jìn)行,一共拼接n次;兩個(gè)spilt層的分支的拼接次數(shù)總和為n+1次;拼接層的輸出連接步長(zhǎng)為1、卷積核大小為1*1的第二cbs卷積模塊的輸入,經(jīng)過(guò)第二cbs卷積模塊后輸出結(jié)果。

35、圖5是圖1中的ca注意力機(jī)制模塊,具體如下:

36、將輸入特征圖分別在為寬度和高度兩個(gè)方向分別進(jìn)行全局平均池化,分別獲得在寬度和高度兩個(gè)方向的特征圖;輸入進(jìn)來(lái)的特征層的形狀為[h,w,c],在經(jīng)過(guò)寬方向的平均池化后,獲得的特征層shape為[h,1,c],此時(shí)將特征映射到了高維度上;在經(jīng)過(guò)高方向的平均池化后,獲得的特征層shape為[1,w,c],此時(shí)將特征映射到了寬維度上;

37、然后將兩個(gè)并行階段合并,將寬和高轉(zhuǎn)置到同一個(gè)維度,然后進(jìn)行堆疊,將寬高特征合并在一起,此時(shí)獲得的特征層為:[1,h+w,c],將普通卷積(conv)標(biāo)準(zhǔn)化后連接激活函數(shù)獲得特征;需要注意的是,這里的卷積通道數(shù)一般會(huì)小一點(diǎn),做一個(gè)縮放,可以減少參數(shù)量。卷積后的特征層的shape為[1,h+w,c/r],其中r為縮放系數(shù);

38、之后再次分開(kāi)為兩個(gè)并行階段,再將寬高分開(kāi)成為:[1,h,c/r]和[1,w,c/r],之后進(jìn)行轉(zhuǎn)置;獲得兩個(gè)特征層[h,1,c/r]和[1,w,c/r];

39、然后利用1x1卷積調(diào)整通道數(shù)后取sigmoid獲得寬高維度上的注意力情況,第一特征層[h,1,c/r]在寬上拓展一下,第二特征層[1,w,c/r]在高上拓展一下,然后上述兩個(gè)特征層共同作用之后的輸出連接re-weight模塊的輸入,re-weight模塊的輸出就是ca注意力機(jī)制。

40、圖6是圖1中的gsconv結(jié)構(gòu),具體如下:

41、輸入通道特征圖,輸入進(jìn)行一個(gè)卷積的下采樣操作,將其輸出分為兩個(gè)分支,其中一個(gè)通道數(shù)為c/2的分支直接連接拼接層,另一個(gè)通道數(shù)為c/2分支先經(jīng)過(guò)深度可分離卷積層(dwconv)操作,將其輸出進(jìn)行深度可分離卷積(dsc)操作再連接拼接層;將普通卷積conv層和深度可分離卷積層dwconv層的輸出進(jìn)行拼接(concat)操作;拼接后的特征圖經(jīng)過(guò)一個(gè)shuffle操作,以重新排列特征通道,提高特征間的信息流動(dòng)。最終輸出的特征圖有c2個(gè)通道。

42、本發(fā)明還包括一種gce-yolov8s網(wǎng)絡(luò),所述gce-yolov8s網(wǎng)絡(luò)包括主干網(wǎng)絡(luò)backbone、頸部網(wǎng)絡(luò)neck、檢測(cè)頭網(wǎng)絡(luò)head,具體為:

43、主干網(wǎng)絡(luò)backbone具體為:圖像輸入給第一cbs卷積模塊,第一cbs卷積模塊連接第一gbneckv2模塊的輸入,第一gbneckv2模塊輸出連接第一c2fghostv2模塊的輸入,第一c2fghostv2模塊的輸出連接第二gbneckv2模塊的輸入,第二gbneckv2模塊的輸出連接第二c2fghostv2模塊輸入,第二c2fghostv2模塊輸出連接第三gbneckv2模塊的輸入,第三gbneckv2模塊的輸出連接第三c2fghostv2的輸入,第三c2fghostv2的輸出連接第四gbneckv2模塊的輸入,第四gbneckv2模塊的輸出連接第四c2fghostv2的輸入,第四c2fghostv2的輸出連接ca注意力機(jī)制的輸入,ca注意力機(jī)制的輸出連接sppf空間金字塔網(wǎng)絡(luò)的輸入;

44、頸部網(wǎng)絡(luò)neck具體為:由sppf空間金字塔網(wǎng)絡(luò)的輸出分為兩個(gè)分支,一個(gè)輸出連接第一gsconv模塊的輸入,另一個(gè)輸出直接連接第一拼接層模塊的輸入;第一gsconv模塊的輸出連接第一上采樣模塊的輸入,第一上采樣模塊的輸出連接至第二拼接層,將第三c2fghostv2模塊也連接至第二拼接層模塊;通過(guò)第二拼接層模塊的輸出傳遞給第一c2f模塊的輸入,第一c2f模塊的輸出連接第二上采樣模塊的輸入,第二上采樣模塊的輸出連接第三拼接層模塊的輸入,第二c2fghostv2模塊的輸出和第三上采樣模塊的輸出共同連接第三拼接層模塊的輸入;第三拼接層模塊的輸出連接第二c2f模塊的輸入;

45、第二c2f模塊的輸出連接第二gsconv模塊的輸入,第二gsconv模塊的輸出連接第四拼接層模塊的輸入,第四拼接層模塊的輸出連接第三c2f模塊的輸入;第三c2f模塊的輸出連接第三gsconv模塊的輸入,第三gsconv模塊的輸出連接第一拼接層的輸入;第一拼接層的輸出連接第四c2f模塊的輸入;

46、檢測(cè)頭網(wǎng)絡(luò)head具體為:第二c2f模塊的輸出形成第一檢測(cè)頭;第三c2f模塊的輸出形成第二檢測(cè)頭;第四c2f模塊的輸出形成第三檢測(cè)頭。

47、第一檢測(cè)頭具體為:第二c2f模塊的輸出形成兩個(gè)分支,分別為第一檢測(cè)頭一分支、第一檢測(cè)頭二分支;第一檢測(cè)頭一分支具體為:第二c2f模塊的輸出連接第一cbs模塊的輸入,第一cbs模塊的輸出連接第一conv2d模塊的輸入,第一conv2d模塊的輸出連接第一wiou模塊和第一dfl模塊;第一檢測(cè)頭二分支具體為:第二c2f模塊的輸出連接第二cbs模塊的輸入,第二cbs模塊的輸出連接第二conv2d模塊的輸入,第二conv2d模塊的輸出連接第二wiou模塊和第二dfl模塊;

48、第二檢測(cè)頭具體為:第三c2f模塊的輸出形成兩個(gè)分支,分別為第二檢測(cè)頭一分支、第二檢測(cè)頭二分支;第二檢測(cè)頭一分支具體為第三c2f模塊的輸出連接第三cbs模塊的輸入,第三cbs模塊的輸出連接第三conv2d模塊的輸入,第三conv2d模塊的輸出連接第三wiou模塊和第三dfl模塊;第二檢測(cè)頭二分支具體為:第三c2f模塊的輸出連接第四cbs模塊的輸入,第四cbs模塊的輸出連接第四conv2d模塊的輸入,第四conv2d模塊的輸出連接第四wiou模塊和第四dfl模塊;

49、第三檢測(cè)頭具體為:第四c2f模塊的輸出形成兩個(gè)分支,分別為第三檢測(cè)頭一分支、第三檢測(cè)頭二分支;第三檢測(cè)頭一分支具體為:第三c2f模塊的輸出連接第五cbs模塊的輸入,第五cbs模塊的輸出連接第五conv2d模塊的輸入,第五conv2d模塊的輸出連接第五wiou模塊和第五dfl模塊;第三檢測(cè)頭二分支具體為:第三c2f模塊的輸出連接第六cbs模塊的輸入,第六cbs模塊的輸出連接第六conv2d模塊的輸入,第六conv2d模塊的輸出連接第六wiou模塊和第六dfl模塊。

50、圖3是圖1中的gbneckv2模塊,該模塊如圖3所示,在圖3中包括3個(gè)小結(jié)構(gòu)圖,從左至右依次為:步長(zhǎng)為1時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)示意圖、步長(zhǎng)為2時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)示意圖、dfc?attention模塊的結(jié)構(gòu)示意圖。

51、ghostnetv2的瓶頸結(jié)構(gòu)分為步長(zhǎng)為1時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)、步長(zhǎng)為2時(shí)的ghostnetv2的瓶頸結(jié)構(gòu);

52、步長(zhǎng)為1時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)為:

53、輸入特征連接兩個(gè)分支,輸出的第一個(gè)分支連接dfc?attention模塊和第一ghostmodule模塊,第一ghost?module模塊經(jīng)過(guò)bn歸一化操作和relu激活函數(shù)與dfc?attention進(jìn)行乘積操作;將乘積操作后的輸出連接步長(zhǎng)為2的dw卷積的輸入,dw卷積操作的輸出連接第二ghost?module的輸入;將以上操作后的結(jié)果與輸入層的第二個(gè)分支疊加,得到輸出后的結(jié)果;

54、步長(zhǎng)為2時(shí)的ghostnetv2的瓶頸結(jié)構(gòu)為:

55、輸入特征連接兩個(gè)分支,輸出的第一個(gè)分支連接dfc?attention模塊和第一ghostmodule模塊,第一ghost?module模塊經(jīng)過(guò)bn歸一化操作和relu激活函數(shù)與dfc?attention進(jìn)行乘積操作;將乘積操作后的輸出連接第二ghost?module模塊的輸入;將第二ghostmodule模塊的輸出與輸入層的第二個(gè)分支疊加,得到輸出后的結(jié)果。

56、dfc?attention模塊具體為:輸入特征后,連接進(jìn)行下采樣模塊的輸入,下采樣模塊的輸出連接1*1卷積模塊的輸入,1*1卷積模塊的輸出經(jīng)過(guò)歸一化模塊處理后連接fc模塊的輸入,fc模塊的輸出經(jīng)過(guò)歸一化模塊處理后連接sigmoid激活函數(shù)操作的輸入,sigmoid激活函數(shù)操作輸出后得到最終結(jié)果。

57、圖4是圖1中的c2fghostv2模塊,該模塊如圖4所示,具體如下:

58、輸入特征后,給步長(zhǎng)為1、卷積核大小為1*1的第一cbs卷積模塊作為輸入,卷積模塊的輸出連接spilt模塊輸入,spilt模塊的輸出分為兩個(gè)分支進(jìn)行操作;其中一個(gè)分支下,spilt模塊的輸出直接連接拼接層的輸入;另一個(gè)分支下,spilt模塊的輸出模塊個(gè)數(shù)依次累加,依次經(jīng)過(guò)1個(gè)、2個(gè)、3個(gè)一直到n個(gè)ghostnetv2的瓶頸模塊,并且每經(jīng)過(guò)一個(gè)ghostnetv2的瓶頸模塊,其輸出就連接依次拼接層的輸入,疊加進(jìn)行,一共拼接n次;兩個(gè)spilt層的分支的拼接次數(shù)總和為n+1次;拼接層的輸出連接步長(zhǎng)為1、卷積核大小為1*1的第二cbs卷積模塊的輸入,經(jīng)過(guò)第二cbs卷積模塊后輸出結(jié)果。

59、圖5是圖1中的ca注意力機(jī)制模塊,具體如下:

60、將輸入特征圖分別在為寬度和高度兩個(gè)方向分別進(jìn)行全局平均池化,分別獲得在寬度和高度兩個(gè)方向的特征圖;輸入進(jìn)來(lái)的特征層的形狀為[h,w,c],在經(jīng)過(guò)寬方向的平均池化后,獲得的特征層shape為[h,1,c],此時(shí)將特征映射到了高維度上;在經(jīng)過(guò)高方向的平均池化后,獲得的特征層shape為[1,w,c],此時(shí)將特征映射到了寬維度上;

61、然后將兩個(gè)并行階段合并,將寬和高轉(zhuǎn)置到同一個(gè)維度,然后進(jìn)行堆疊,將寬高特征合并在一起,此時(shí)獲得的特征層為:[1,h+w,c],將普通卷積(conv)標(biāo)準(zhǔn)化后連接激活函數(shù)獲得特征;需要注意的是,這里的卷積通道數(shù)一般會(huì)小一點(diǎn),做一個(gè)縮放,可以減少參數(shù)量。卷積后的特征層的shape為[1,h+w,c/r],其中r為縮放系數(shù);

62、之后再次分開(kāi)為兩個(gè)并行階段,再將寬高分開(kāi)成為:[1,h,c/r]和[1,w,c/r],之后進(jìn)行轉(zhuǎn)置;獲得兩個(gè)特征層[h,1,c/r]和[1,w,c/r];

63、然后利用1x1卷積調(diào)整通道數(shù)后取sigmoid獲得寬高維度上的注意力情況,第一特征層[h,1,c/r]在寬上拓展一下,第二特征層[1,w,c/r]在高上拓展一下,然后上述兩個(gè)特征層共同作用之后的輸出連接re-weight模塊的輸入,re-weight模塊的輸出就是ca注意力機(jī)制。

64、圖6是圖1中的gsconv結(jié)構(gòu),具體如下:

65、輸入通道特征圖,輸入進(jìn)行一個(gè)卷積的下采樣操作,將其輸出分為兩個(gè)分支,其中一個(gè)通道數(shù)為c/2的分支直接連接拼接層,另一個(gè)通道數(shù)為c/2分支先經(jīng)過(guò)深度可分離卷積層(dwconv)操作,將其輸出進(jìn)行深度可分離卷積(dsc)操作再連接拼接層;將普通卷積conv層和深度可分離卷積層dwconv層的輸出進(jìn)行拼接(concat)操作;拼接后的特征圖經(jīng)過(guò)一個(gè)shuffle操作,以重新排列特征通道,提高特征間的信息流動(dòng)。最終輸出的特征圖有c2個(gè)通道。

66、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下技術(shù)效果:

67、本發(fā)明模型在精確度、速度和輕量化方面高于現(xiàn)有檢測(cè)模型,其對(duì)小目標(biāo),距離較遠(yuǎn)的目標(biāo)都具有更低的漏檢率和誤判率,為長(zhǎng)江航道局提供了技術(shù)支持。使目標(biāo)檢測(cè)模型能夠?qū)π∧繕?biāo)和復(fù)雜背景下的船舶和航標(biāo)進(jìn)行精確識(shí)別,且針對(duì)基線(xiàn)模型有較為明顯的改進(jìn)效果,能夠在輕量化的基礎(chǔ)上提高識(shí)別精度、速度,降低誤檢和漏檢,對(duì)部署到系統(tǒng)端具有實(shí)際意義。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1