opencv3及C++HOG特征提取方式是怎樣的-創(chuàng)新互聯(lián)

opencv3及C++HOG特征提取方式是怎樣的,針對這個問題,這篇文章詳細介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

我們提供的服務(wù)有:成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、沾益ssl等。為上1000家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的沾益網(wǎng)站制作公司

HOG特征

HOG(Histograms of Oriented Gradients)梯度方向直方圖

通過利用梯度信息能反映圖像目標(biāo)的邊緣信息并通過局部梯度的大小將圖像局部的外觀和形狀特征化.在論文Histograms of Oriented Gradients for Human Detection中被提出.

HOG特征的提取過程為:

Gamma歸一化;

計算梯度;

劃分cell

組合成block,統(tǒng)計block直方圖;

梯度直方圖歸一化;

收集HOG特征。

Gamma歸一化:

對圖像顏色進行Gamma歸一化處理,降低局部陰影及背景因素的影響.

計算梯度:

通過差分計算出圖像在水平方向上及垂直方向上的梯度:

然后得到各個像素點的梯度的幅值及方向:

劃分cell

將整個窗口劃分成大小相同互不重疊的細胞單元cell(如8×8像素),計算出每個cell的梯度大小及方向.然后將每像素的梯度方向在0?180o0?180o 區(qū)間內(nèi)(無向:0-180,有向:0-360)平均分為9個bins,每個cell內(nèi)的像素用幅值來表示權(quán)值,為其所在的梯度直方圖進行加權(quán)投票.

9bins:

如圖,不同數(shù)量的bins下的錯誤率:

組合成block,統(tǒng)計block直方圖

將2×2個相鄰的cell組成大小為16×16的像素塊即block.依次將block大小的滑動窗口從左到右從上到下滑動,求其梯度方向直方圖向量.

如圖,不同大小的cell與不同大小的block作用下的效果對比:

梯度直方圖歸一化

作者對比了L2-norm、L1-norm、L1-sqrt等歸一化方法,發(fā)現(xiàn)都比非標(biāo)準(zhǔn)數(shù)據(jù)有顯著的改善.其中L2-norm和L1-sqrt效果好,而L1-norm檢測效果要比L2-norm和L1-sqrt低5%.

如圖,不同的歸一化方法效果對比:

這樣通過歸一化能夠進一步地對光照、陰影和邊緣進行壓縮.

收集HOG特征

由于每個cell內(nèi)的梯度方向分成了9個bins,這樣每個細胞單元的HOG特征向量長度是9.

這樣,對于大小為128×64大小的圖像,采用8*8像素的sell,2×2個cell組成的16×16像素的block,采用8像素的block移動步長,這樣檢測窗口block的數(shù)量有((128-16)/8+1)×((64-16)/8+1)=15×7.則HOG特征描述符的維數(shù)為15×7×4×9.

HOG的缺點:

速度慢,實時性差;難以處理遮擋問題。

OpenCV應(yīng)用

利用HOG進行行人檢測時有兩種用法:

1、采用HOG特征+SVM分類器進行行人檢測;

2、利用HOG+SVM訓(xùn)練自己的XML文件。

采用第一種方法,使用HOG特征結(jié)合SVM分類器進行行人檢測,簡單示例:

#include <opencv2/opencv.hpp>#include <opencv2/objdetect.hpp>using namespace std;using namespace cv;int main(){ Mat src, dst; src = imread("E:/image/image/passerby.jpg",1); if (src.empty()) { printf("can not load the image...\n"); return -1; } dst = src.clone(); vector<Rect> findrects, findrect; HOGDescriptor HOG; //SVM分類器 HOG.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector()); //多尺度檢測 HOG.detectMultiScale(src, findrects, 0, Size(4,4), Size(0,0), 1.05, 2); //若rects有嵌套,則取最外面的矩形存入rect for(int i=0; i < findrects.size(); i++) { Rect rect = findrects[i]; int j=0; for(; j < findrects.size(); j++)  if(j != i && (rect & findrects[j]) == rect)  break; if( j == findrects.size())  findrect.push_back(rect); } //框選出檢測結(jié)果 for(int i=0; i<findrect.size(); i++) { RNG rng(i); Scalar color = Scalar(rng.uniform(0,255), rng.uniform(0,255), rng.uniform(0,255)); rectangle(dst, findrect[i].tl(), findrect[i].br(), color, 2); } imshow("src",src); imshow("dst",dst); waitKey(); return 0;}

關(guān)于opencv3及C++HOG特征提取方式是怎樣的問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。

標(biāo)題名稱:opencv3及C++HOG特征提取方式是怎樣的-創(chuàng)新互聯(lián)
新聞來源:http://bm7419.com/article16/didpgg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、軟件開發(fā)、電子商務(wù)、網(wǎng)站維護品牌網(wǎng)站設(shè)計、建站公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

手機網(wǎng)站建設(shè)