当前位置：首页 > 编程日记 > 正文

用Python实现OpenCV特征提取与图像检索 | Demo

编程日记 2025-01-06 10:40:00

640?wx_fmt=jpeg

参加「CTA 核心技术及应用峰会」，请扫码报名

↑↑↑

作者｜Andrey Nikishaev

翻译 | 张蔚敏

审校 | reason_W

来源 | Python大本营（id：pythonnews)

“拍立淘”“一键识花”“街景匹配”……不知道大家在使用这些神奇的功能的时候，有没有好奇过它们背后的技术原理？其实这些技术都离不开最基本的图像检索技术。本篇文章我们就将对这一技术的原理进行介绍，并通过一个简单的Python脚本来实现一个最基本的图像检索demo。

图像特征

首先我们需要明白图像特征是什么以及它的使用方法。

图像特征是一种简单的图像模式，基于这种模式我们可以描述我们在图像上所看到的内容。例如，在一张跟猫有关的图片中，猫咪的眼睛就可以作为这幅图像的特征。特征在（包括但不限于）计算机视觉中的主要作用是将视觉信息转换为向量空间表示。这种向量空间表示让我们可以利用数学运算对其进行处理，例如通过计算寻找相似向量（这可以用来寻找相似图像或图像中的相似目标）。

如何从图像中获取特征？

从图像中获取特征的方法有两种，第一种是通过提取图像描述符实现（白盒算法）；第二种通过基于神经网络的方法实现（黑盒算法）。本文主要介绍第一种方法。

特征提取的算法有很多，最常用的有：SURF、ORB、SIFT、BRIEF等。这些算法大多是基于图像梯度的。为了简化安装需求，本教程使用的是KAZE描述符，因为其他描述符在python的基础OpenCV库中没有提供。

下面是特征提取器的实现代码：

import cv2
import numpy as np
import scipy
from scipy.misc import imread
import cPickle as pickle
import random
import os
import matplotlib.pyplot as plt
# Feature extractor
# 特征提取器
def extract_features(image_path, vector_size=32):
image = imread(image_path, mode="RGB")
try:
# Using KAZE, cause SIFT, ORB and other was moved to additional module
# which is adding addtional pain during install
#此处为了简化安装步骤，使用KAZE，因为SIFT/ORB以及其他特征算子需要安
#装额外的模块
alg = cv2.KAZE_create()
# Finding image keypoints
#寻找图像关键点
kps = alg.detect(image)
# Getting first 32 of them.
#计算前32个
# Number of keypoints is varies depend on image size and color pallet
#关键点的数量取决于图像大小以及彩色调色板
# Sorting them based on keypoint response value(bigger is better)
#根据关键点的返回值进行排序（越大越好）
kps = sorted(kps, key=lambda x: -x.response)[:vector_size]
# computing descriptors vector
#计算描述符向量
kps, dsc = alg.compute(image, kps)
# Flatten all of them in one big vector - our feature vector
# 将其放在一个大的向量中，作为我们的特征向量
dsc = dsc.flatten()
# Making descriptor of same size
# 使描述符的大小一致
# Descriptor vector size is 64
#描述符向量的大小为64
needed_size = (vector_size * 64)
if dsc.size < needed_size:
# if we have less the 32 descriptors then just adding zeros
# at the end of our feature vector
#如果少于32个描述符，则在特征向量后面补零
dsc = np.concatenate([dsc, np.zeros(needed_size - dsc.size)])
except cv2.error as e:
print 'Error: ', e
return None

return dsc

def batch_extractor(images_path, pickled_db_path="features.pck"):
files = [os.path.join(images_path, p) for p in sorted(os.listdir(images_path))]
result = {}
for f in files:
print 'Extracting features from image %s' % f
name = f.split('/')[-1].lower()
result[name] = extract_features(f)

# saving all our feature vectors in pickled file
# 将特征向量存于pickled 文件
with open(pickled_db_path, 'w') as fp:
pickle.dump(result, fp)

OpenCV中的大多数特征提取算法的python接口都相同，所以如果你想要使用SIFT特征，只需要用SIFT_create替换KAZE_create就行。

首先，程序会用extract_features检测图像上的关键点（局部模式的中心点）。因为关键点数量随图像的不同有所不同，因此我们需要添加一些规则，以确保所得到的特征向量大小始终相同（这是因为在计算时，我们无法对维度不同的向量进行比较，所以必须保证相同的大小）。

然后是根据关键点构建向量描述符，每个描述符的大小为64，我们有32个这样的描述符，所以我们的特征向量是2048维。

batch_extractor是在所有的图像中批量运行特征提取器，并将特征向量保存在pickled文件中以供后续使用。

现在我们来建立类Matcher，它会将待搜索图像和数据库中的图像进行匹配。

class Matcher(object):

def __init__(self, pickled_db_path="features.pck"):
with open(pickled_db_path) as fp:
self.data = pickle.load(fp)
self.names = []
self.matrix = []
for k, v in self.data.iteritems():
self.names.append(k)
self.matrix.append(v)
self.matrix = np.array(self.matrix)
self.names = np.array(self.names)

def cos_cdist(self, vector):
# getting cosine distance between search image and images database
#计算待搜索图像与数据库图像的余弦距离
v = vector.reshape(1, -1)
return scipy.spatial.distance.cdist(self.matrix, v, 'cosine').reshape(-1)
def match(self, image_path, topn=5):
features = extract_features(image_path)
img_distances = self.cos_cdist(features)
# getting top 5 records
# 获得前5个记录
nearest_ids = np.argsort(img_distances)[:topn].tolist()

nearest_img_paths = self.names[nearest_ids].tolist()
return nearest_img_paths, img_distances[nearest_ids].tolist()

这里要加载前一步得到的特征向量，并从它们中创建一个大矩阵，然后计算待搜索图像的特征向量和特征向量数据库之间的余弦距离，然后输出最近的前N个结果。

当然，这仅仅是一个demo，在实际计算中，还可以用一些算法来快速计算数百万图像间的余弦距离。你可以使用简单且运行速度相当快的Annoy Index（在1M图像中搜索约需2ms）。

现在把它们放在一起运行一下：

def show_img(path):
img = imread(path, mode="RGB")
plt.imshow(img)
plt.show()

def run():
images_path = 'resources/images/'
files = [os.path.join(images_path, p) for p in sorted(os.listdir(images_path))]
# getting 3 random images
# 随机获取3张图

sample = random.sample(files, 3)

batch_extractor(images_path)

ma = Matcher('features.pck')

for s in sample:
print 'Query image =========================================='
show_img(s)
names, match = ma.match(s, topn=3)
print 'Result images ========================================'
for i in range(3):
# we got cosine distance, less cosine distance between vectors
# more they similar, thus we subtruct it from 1 to get match value

#我们得到了余弦距离，向量之间的余弦距离越小表示它们越相似，因此我们从1中减去它以得到匹配值
print 'Match %s' % (1-match[i])
show_img(os.path.join(images_path, names[i]))
run()

大家可以在我的 github上下载源码，或者在Google Colab上运行（Google Colab是一种提供GPU在线计算的免费服务）：

https://colab.research.google.com/drive/1BwdSConGugBlGzPLLkXHTz2ahkdzEhQ9

总结

在运行上述代码的过程中，你可能会发现搜索到的相似图像并不总能达到我们想象中的那种相似程度。这是因为我们所用的这种算法是上下文无关（context-unaware）的，所以该算法在寻找相同（即使是被修改过的）图像方面表现更好，而不是在相似图像方面。如果是要寻找上下文相关的相似图像，那就要使用卷积神经网络了，我的下一篇文章会对这方面的知识进行详细介绍。

原文链接：

https://towardsdatascience.com/feature-extraction-and-similar-image-search-with-opencv-for-newbies-3c59796bf774

（本文为AI科技大本营转载文章，转载请联系原作者。）

◆

精彩推荐

◆

5月25-27日，由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开。首届CTA核心技术及应用峰会将围绕人工智能，邀请技术领航者，与开发者共同探讨机器学习和知识图谱的前沿研究及应用。

同时，我们推出会议双日开发者盲定票，仅售299元（原票价1099元），限量30张。请扫描下方二维码，或添加小助手微信1731967109，备注【CTA】，了解大会详情以及票务问题。

640?wx_fmt=png

推荐阅读：

开什么玩笑？股票价格如何经得起AI的推敲？| 技术头条
深入卷积神经网络背后的数学原理 | 技术头条
用Python实现OpenCV特征提取与图像检索demo
Python基础入门——简介和环境配置，超实用！
云计算之基，一文带你速懂虚拟化KVM和XEN
Erlang 之父去世，他留给程序员两点忠告
程序员逆袭为美国最佳 CEO，他说因为爱情
用一枚比特币环游世界? 他是不是疯了...
程序员如何向女友解释：为啥软件都要装C盘？

640?wx_fmt=png

❤点击“阅读原文”，直接参与大会报名。

https://www.dkcj.cn/info/35088.html

用Python实现OpenCV特征提取与图像检索 | Demo

图像特征

如何从图像中获取特征？

总结

相关文章：

【ffmpeg】编译时报错：error: undefined reference to `av...

Spring Initializr 构建Spring Boot/Cloud工程

linux下用phpize给PHP动态添加扩展

“996 是福利，007 才是常态”？！千万程序员怒怼每日优鲜！

亚太信息安全领袖成就表彰计划：阿里成中国互联网公司唯一代表

【C++】clipp 一个命令行参数解析器

Oracle 聚合函数（Aggregate Functions）说明

【OpenCV】正确创建用于保存YUV420P格式的cv::Mat

特斯拉全新自动驾驶芯片最强？英伟达回怼，投资者用脚投票

2012年我的十大工程9——形象工程

【MySQL】ubuntu16.04安装mysql，然后源码编译Qt5.12.4版本的libqsqlmysql.so

A* 算法之父、人工智能先驱Nils Nilsson逝世 | 缅怀

类执行方法的过程与运行时

NandFlash系列之一：NorFlash与NandFlash对比

机器学习萌新必备的三种优化算法 | 选型指南

【MySQL】缩略语PK NN UQ BIN UN ZF AI G、基本操作语句

C#（WPF）去除事件中注册的事件处理方法！

memcached图形界面的监控

薅百度GPU羊毛！PaddlePaddle大升级，比Google更懂中文，打响AI开发者争夺战

vue中axios如何实现token验证

【视频】视频方面大神博客总结

IHttpHandler 在SharePoint中的应用

普通人也能用AI拍出3D大片？这位清华博士后这么做

[asp.net core]SignalR一个例子

【FFmpeg】截至ffmpeg4.2不推荐（Deprecate）继续使用的接口，以及代替它的接口汇总

Asp.net开发过程中，我们会遇到很多Exception

【经验】对一个合格C++高级工程师（音视频方向）的要求

马云：腾讯不是阿里要打败的对手，是同为社会创造价值的伴侣

Win10 | Mac 在server上统一办公

JDK5.0新特性系列---目录