opencv3及C++HOG特征提取方式是怎樣的-創(chuàng)新互聯(lián)

opencv3及C++HOG特征提取方式是怎樣的，針對這個問題，這篇文章詳細介紹了相對應(yīng)的分析和解答，希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

我們提供的服務(wù)有：成都網(wǎng)站建設(shè)、成都網(wǎng)站設(shè)計、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、沾益ssl等。為上1000家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù)，是有科學(xué)管理、有技術(shù)的沾益網(wǎng)站制作公司

HOG特征

HOG(Histograms of Oriented Gradients)梯度方向直方圖

通過利用梯度信息能反映圖像目標(biāo)的邊緣信息并通過局部梯度的大小將圖像局部的外觀和形狀特征化．在論文Histograms of Oriented Gradients for Human Detection中被提出．

HOG特征的提取過程為:

Gamma歸一化；

計算梯度；

劃分cell

組合成block，統(tǒng)計block直方圖；

梯度直方圖歸一化；

收集HOG特征。

Gamma歸一化:

對圖像顏色進行Gamma歸一化處理，降低局部陰影及背景因素的影響．

計算梯度:

通過差分計算出圖像在水平方向上及垂直方向上的梯度：

然后得到各個像素點的梯度的幅值及方向：

劃分cell

將整個窗口劃分成大小相同互不重疊的細胞單元cell（如8×8像素），計算出每個cell的梯度大小及方向．然后將每像素的梯度方向在0?180o0?180o 區(qū)間內(nèi)（無向：0-180，有向：0-360）平均分為9個bins，每個cell內(nèi)的像素用幅值來表示權(quán)值，為其所在的梯度直方圖進行加權(quán)投票．

9bins:

如圖，不同數(shù)量的bins下的錯誤率：

組合成block，統(tǒng)計block直方圖

將2×2個相鄰的cell組成大小為16×16的像素塊即block．依次將block大小的滑動窗口從左到右從上到下滑動，求其梯度方向直方圖向量．

如圖，不同大小的cell與不同大小的block作用下的效果對比：

梯度直方圖歸一化

作者對比了L2-norm、L1-norm、L1-sqrt等歸一化方法，發(fā)現(xiàn)都比非標(biāo)準(zhǔn)數(shù)據(jù)有顯著的改善．其中L2-norm和L1-sqrt效果好，而L1-norm檢測效果要比L2-norm和L1-sqrt低5%．

如圖，不同的歸一化方法效果對比：

這樣通過歸一化能夠進一步地對光照、陰影和邊緣進行壓縮．

收集HOG特征

由于每個cell內(nèi)的梯度方向分成了9個bins,這樣每個細胞單元的HOG特征向量長度是9．

這樣，對于大小為128×64大小的圖像，采用8*8像素的sell，2×2個cell組成的16×16像素的block，采用8像素的block移動步長，這樣檢測窗口block的數(shù)量有((128-16)/8+1)×((64-16)/8+1)=15×7．則HOG特征描述符的維數(shù)為15×7×4×9．

HOG的缺點：

速度慢，實時性差；難以處理遮擋問題。

OpenCV應(yīng)用

利用HOG進行行人檢測時有兩種用法：

1、采用HOG特征+SVM分類器進行行人檢測；

2、利用HOG+SVM訓(xùn)練自己的XML文件。

采用第一種方法，使用HOG特征結(jié)合SVM分類器進行行人檢測，簡單示例：

#include <opencv2/opencv.hpp>#include <opencv2/objdetect.hpp>using namespace std;using namespace cv;int main(){ Mat src, dst; src = imread("E:/image/image/passerby.jpg",1); if (src.empty()) { printf("can not load the image...\n"); return -1; } dst = src.clone(); vector<Rect> findrects, findrect; HOGDescriptor HOG; //SVM分類器 HOG.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector()); //多尺度檢測 HOG.detectMultiScale(src, findrects, 0, Size(4,4), Size(0,0), 1.05, 2); //若rects有嵌套,則取最外面的矩形存入rect for(int i=0; i < findrects.size(); i++) { Rect rect = findrects[i]; int j=0; for(; j < findrects.size(); j++) if(j != i && (rect & findrects[j]) == rect) break; if( j == findrects.size()) findrect.push_back(rect); } //框選出檢測結(jié)果 for(int i=0; i<findrect.size(); i++) { RNG rng(i); Scalar color = Scalar(rng.uniform(0,255), rng.uniform(0,255), rng.uniform(0,255)); rectangle(dst, findrect[i].tl(), findrect[i].br(), color, 2); } imshow("src",src); imshow("dst",dst); waitKey(); return 0;}

關(guān)于opencv3及C++HOG特征提取方式是怎樣的問題的解答就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，如果你還有很多疑惑沒有解開，可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。

標(biāo)題名稱：opencv3及C++HOG特征提取方式是怎樣的-創(chuàng)新互聯(lián)
新聞來源：http://bm7419.com/article16/didpgg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供面包屑導(dǎo)航、軟件開發(fā)、電子商務(wù)、網(wǎng)站維護、品牌網(wǎng)站設(shè)計、建站公司

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容