人工智能和机器学习系列(五) OpenCV库

简介

OpenCV 是一个用于（实时）图像处理的库，该模块简要介绍了 OpenCV 并演示了其对象检测功能。这是我们学习 Python 及其在机器学习和 AI 中的应用系列中的第五个模块。在上一个模块中，我们认识了许多ML和AI中相关的Python库，下面就一起来深入研究一下这些库的使用，我们先开始学习OpenCV的使用。

安装

OpenCV 可以通过 pip 安装，方法是在 Jupyter Notebook 单元中运行以下命令：

!pip install --upgrade opencv-python

pip 是 Python 的默认包管理器和独立的可执行文件，但以这种方式运行它可确保将包安装到 Anaconda 环境中。

如果软件包安装正确，此 Python 代码应该可以正常运行：

import cv2

因为我们要在我们的 Jupyter Notebook 中显示图像，我们还应该确保matplotlib已安装：

!pip install --upgrade matplotlib

读取和绘制图像

读取 OpenCV 可以处理的图像很简单：

import cv2
im = cv2.imread("path/to/image.jpg")

OpenCV 支持多种图像格式，当解析图像失败时，结果imread将是None. 请注意，如果未找到图像文件，则不会引发错误 - 结果也会如此None。

假设找到了图像，然后我们可以使用matplotlib. 为此，我们将使用此辅助函数：

from matplotlib import pyplot
def plot_img(img):
    rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    pyplot.imshow(rgb)

OpenCV 读取 BGR 颜色格式的图像，但matplotlib希望它们是 RGB，所以首先我们必须转换图像。然后就可以绘制了。

您可以按如下方式使用此功能：

plot_img(im)

OpenCV 和matplotlib集成如此干净是因为 OpenCV 图像实际上只是一个包含像素值的多维 NumPy 数组，并且matplotlib可以使用它。

图 1

物体检测

有很多是OpenCV的可以做。我们将特别关注对象检测。

对象检测与所谓的级联分类器一起工作。这种方法使用机器学习：分类器在包含所需对象的图像（正图像）和不包含它的图像（负图像）上进行训练。您可以训练自己的分类器，但 OpenCV 还提供了几个可从其 GitHub 下载的预训练模型。

让我们试试俄罗斯车牌的预训练分类器haarcascade_russian_plate_number.xml。如果您想要测试图像，可以使用Sergey Rodovnichenko 的 Lada Vesta 图像。

我们可以读取图像并绘制它以查看是否一切顺利，就像以前一样：

car = cv2.imread("Pictures/lada-vesta.jpg")
plot_img(car)

图 2

接下来，我们创建分类器：

蟒蛇复制代码

classifier = cv2.CascadeClassifier()
classifier.load("path/to/haarcascade_russian_plate_number.xml")

图 3

检测工作是通过以下detectMultiScale方法完成的：

plates = classifier.detectMultiScale(car)

这将返回一个 NumPy 数组。它实际上是一个数组数组，每个内部数组都是检测到的板的矩形边界，格式为[ x, y, width, height ]. 为了直观地显示它们，我们可以在图像上绘制矩形，然后绘制结果：

with_indicators = car
for plate in plates:
    x, y, width, height = plate
    with_indicators = cv2.rectangle(with_indicators, (x, y), 
                                    (x + width, y + height), 
                                    (0, 0, 255), 5)

矩形函数采用图像、左上角坐标、右下角坐标、颜色和厚度。它返回一个带有矩形的新图像。我们可以绘制结果：

plot_img(with_indicators)

图 4

这个例子展示了 OpenCV 的针对俄罗斯车牌的预训练分类器，但这并不是唯一可用的分类器。还有用于面部、眼睛等的预训练分类器，它们的使用方式与该分类器完全相同。

结论

我们只是触及了 OpenCV 功能的皮毛。OpenCV 具有更多处理功能（转换、过滤器、2D 特征检测等），并且可以实时处理视频帧。互联网上有很多关于 OpenCV 的资料。该官方教程是一个良好的开端，但你也可以找到很多的帮助，如果你想与OpenCV的解决问题专门进行搜索。