昊虹AI笔记网

 找回密码
 立即注册
搜索
查看: 1194|回复: 0
收起左侧

直方图反向投影的原理详解及OpenCV下的示例源码

[复制链接]

249

主题

252

帖子

976

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
976
昊虹君 发表于 2023-2-22 10:26 | 显示全部楼层 |阅读模式
直方图反向投影的原理详解及OpenCV下的示例源码

读懂本篇博文的预备知识:
对OpenCV的图像直方图计算函数calcHist()进行透彻解析
详解什么叫二维直方图,并利用OpenCV的函数calcHist()绘制图像的H-S二维直方图

直方图的反向投影就是首先计算图像中某一个特征的直方图,然后将这个特征的直方图反向投影到原图像,进而可以判断图像中是否存在该特征,从而实现目标识别等操作。

简单点讲,所谓直方图反向投影就是首先计算某一特征的直方图,然后使用该直方图去寻找图像中是否存在该特征的方法。

直方图的反向投影常用于对目标的跟踪的定位。

OpenCV提供了函数calcBackProject()用于对图像进行直方图的反向投影运算。

函数calcBackProject()的C++原型如下:
  1. void cv::calcBackProject(const Mat * images,
  2.                          int nimages,
  3.                          const int * channels,
  4.                          InputArray hist,
  5.                          OutputArray backProject,
  6.                          const float ** ranges,
  7.                          double scale = 1,
  8.                          bool uniform = true )
复制代码

Python原型如下:
  1. dst=cv.calcBackProject(images, channels, hist, ranges, scale[, dst])
复制代码

原型中各参数的意义如下:

images---需要做直方图反向投影的图像,可以是多幅图像,但是所有的图像应具有相同的尺寸和数据类型,在OpenCV3中,数据类型只能是CV_8U或CV_32F,但是不同图像的通道数可以不同。

nimages---输入图像数量。

channels---输入图像需要参与做直方图反向投影的通道列表。这里需要注意的是,输入直方图hist是几维的就需要有输入图像的几个通道参与。

hist---输入直方图。

backProject---输入图像的直方图反投影图像,与输入图像具有相同尺寸和数据类型的单通道图像。

ranges---输入直方图每个维度的取值范围。

scale---进行直方图反向投影时的比例因子。

uniform----输入直方图是否均匀的标志。例如,如果scale设置为1.0,则反向投影值为正常计算值,如果scale设置为2.0,则反向投影值为正常计算值的两倍。


在使用函数calcBackProject()进行直方图反向投影计算前,我们首先需要知道OpenCV的这个函数是怎么计算图像的反向投影的。


各位朋友,很抱歉,
因为靠写博文为生,
所以如果需要了解“函数calcBackProject()是怎样进行直方图反向投影计算的”,请您破费5元付费阅读。
我把这个问题的答案用“简单明了的语言、一个简单的例子和程序实际验证”写在了下面这个页面中,
https://www.hhai.cc/thread-221-1-1.html
上面这个页面需要密码才能阅读。
阅读密码购买链接如下:
https://shop.autofaka.com//details/D551D90A

明白函数calcBackProject()是怎样进行直方图反向投影计算后,
接下来我们来看一个实例。

下面这幅图是某歌手在唱歌时的截图:


我们希望借助上面这幅图中歌手的面部直方图特征,查找出另一幅图中此歌手的面部大概位置。

另一幅图(lml-02.jpg)如下:


我们可以像下面这样操作完成这个任务。

首先我们从这幅图中截取歌手的面部(lml-template.jpg),如下:


用这个截取的面部作为特征,计算待查找图像的直方图反向投影。
代码如下:
[Python] 纯文本查看 复制代码
# -*- coding: utf-8 -*-
# 出处:昊虹AI笔记网(hhai.cc)
# 用心记录计算机视觉和AI技术

# 博主微信/QQ 2487872782
# QQ群 271891601
# 欢迎技术交流与咨询

# OpenCV的版本为4.4.0
 
import numpy as np
import cv2 as cv
import sys
 
if __name__ == '__main__':
    # 读取图像并判断是否读取成功
    lml_02_image = cv.imread('F:/material/images/histogram_back_projection/lml-02.jpg')
    template_image = cv.imread('F:/material/images/histogram_back_projection/lml-template.jpg')
 
    if lml_02_image is None or template_image is None:
        print('Failed to read calcBackProject.jpg or calcBackProject_template.jpg.')
        sys.exit()
    # 分别将其颜色空间从BGR转换到HSV
    origin_hsv = cv.cvtColor(lml_02_image, cv.COLOR_BGR2HSV)
    template_hsv = cv.cvtColor(template_image, cv.COLOR_BGR2HSV)
 
    # 计算模板图像的直方图
    template_hist = cv.calcHist([template_hsv], [0, 1], None, [180, 256], [0, 180, 0, 256])
 
    # 对模板图像的直方图进行偏移归一化处理
    cv.normalize(template_hist, template_hist, 0, 255, cv.NORM_MINMAX)
    # 计算直方图的反向投影
    result = cv.calcBackProject([origin_hsv], [0, 1], template_hist, [0, 180, 0, 256], 1)
 
    # 显示图像
    cv.imshow('lml-02', lml_02_image)
    cv.imshow('Template Image', template_image)
    cv.imshow('calcBackProject_result', result)
    cv.waitKey(0)
    cv.destroyAllWindows()

运行结果如下图所示:

从运行结果可以看出,根据歌手的面部直方图特征,我们从其演唱时的另一幅截图中找到了它的头部位置。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|昊虹AI笔记网 ( 蜀ICP备2024076726 )

GMT+8, 2024-9-8 13:01 , Processed in 0.025316 second(s), 24 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表