当前位置:网站首页>OpenCv人脸识别开发实战
OpenCv人脸识别开发实战
2022-07-13 17:48:00 【梦里逆天】
一、OpenCV简介
OpenCV(全称:Open Source Computer Vision Library),是一个跨平台的计算机视觉库。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。
OpenCV用C++语言编写,它的主要接口也是C++语言,但是依然保留了大量的C语言接口。该库也有大量的Python、Java和MATLAB/OCTAVE(2.5)的接口。如今也提供对于C#、Ch、Ruby、GO的支持。
二、OpenCV的基本使用
1.安装OpenCV模块
pip install opencv-python
2.读取图片
显示图像是OpenCV最基本的操作之一,imshow()函数可以实现该操作。imshow()函数有两个参数:显示图像的帧名称以及要显示的图像本身。
如果直接调用imshow()函数,只能短暂地显示图像。要保证图像一直在窗口上显示,要通过waitKey()函数。waitKey()函数的参数为等待键盘触发的时间,单位为毫秒,返回值为-1(表示没有键被按下)。
示例代码:
# 导入模块
import cv2 as cv
# 读取图片
image = cv.imread('test.png') # 路径中不能有中文,否则加载图片失败
# 显示图片
cv.imshow('read_img', image)
# 等待键盘输入 单位毫秒 传入0则是无限等待
cv.waitKey(0)
# 由于OpenCV底层是C++编写的,需要释放内存
cv.destroyAllWindows()
测试图片:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vkdwYgoD-1657533164863)(assets/20220711163742.png)]](/img/61/ae88c18cf38d0a0aca0f38c3c92480.jpg)
测试效果:![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ae3Aakip-1657533164865)(assets/20220711164020.png)]](/img/d9/ecd31c39c73f84683e458ea515328d.jpg)
3.图片灰度转换
OpenCV中有数百种关于在不同色彩空间之间转换的方法。当前,在计算机视觉中有三种常用的色彩空间:灰度、BGR以及HSV(Hue,Saturation,Value)。
- 灰度色彩空间是通过去除彩色信息来将其转换成灰阶,灰度色彩空间对中间处理特别有效,比如人脸识别。
- BGR即蓝、绿、红色彩空间,每一个像素点都由一个三元数组来表示,分别代表蓝、绿、红三种颜色。网页开发者可能熟悉另一个与之相似的颜色空间——RGB,它们只是颜色顺序不同。
- HSV,H(Hue)是色调,S(Saturation)是饱和度,V(Value)表示黑暗的程度(或光谱另一端的明亮程度)。
- 灰度转换的作用是:转换成灰度的图片的计算强度得以降低。
示例代码:
import cv2 as cv
# 加载图片
img = cv.imread('test.png')
# 显示图片
cv.imshow('BGR image', img)
# cv2读取图片的通道是BGR(蓝绿红)
# PIL读取图片的通道是RGB
# 将图片灰度转换
gray_img = cv.cvtColor(img, code=cv.COLOR_BGR2GRAY)
# 显示转换后的图片
cv.imshow('gray_image', gray_img)
# 保存图片
cv.imwrite('gray_test.png', gray_img)
# 等待键盘输入
cv.waitKey(0)
# 释放内存
cv.destroyAllWindows()
效果:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ITsuMXuI-1657533164866)(assets/20220711164214.png)]](/img/44/8afad6ef7e058d6a1f970c86fa5256.jpg)
4.修改图片尺寸
示例代码:
import cv2 as cv
# 加载图片
img = cv.imread('test.png')
# 显示图片
# cv.imshow('input image', img)
print("原图片的形状", img.shape)
# 修改图片尺寸
# resize_img = cv.resize(img, dsize=(110, 160))
resize_img = cv.resize(img, dsize=(400, 360))
print("修改后图片的形状", resize_img.shape)
cv.imshow('resize_img', resize_img)
# 键盘输入q的时候,退出
while True:
if ord('q') == cv.waitKey(0):
break
# 释放内存
cv.destroyAllWindows()
效果:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4VfcjlTI-1657533164868)(assets/20220711164753.png)]](/img/2b/23f91be3477316b5d4bd7a51e5d7b9.png)
5.绘制矩形、圆
OpenCV可以对图片进行任意编辑、处理。
示例代码
import cv2 as cv
img = cv.imread('test.png')
# 左上角的坐标是(x,y),矩形的宽度为w,高度为h
x, y, w, h = 50, 50, 80, 80
# 画矩形
cv.rectangle(img, (x, y, x+w, y+h), color=(0, 255, 255), thickness=2) # color=BGR,thickness参数表示画笔的粗细/线条宽度
# 画圆
# center元组指原点的坐标,radius为半径
cv.circle(img, center=(x+w//2, y+h//2), radius=w//2, color=(0, 0, 255), thickness=2)
resize_img = cv.resize(img, dsize=(420, 360))
# 显示图片
cv.imshow('result_image', resize_img)
cv.waitKey(0)
# 释放内存
cv.destroyAllWindows()
效果:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JC8j8C9T-1657533164869)(assets/20220711165258.png)]](/img/f0/188e5fde4dadc646c136952e5d1ca9.png)
6.人脸检测
6.1Haar级联的概念
由于灯光、视角、视距、摄像头抖动以及数字噪声的变化,图像细节变得不稳定。因此,提取出图像的细节对产生稳定分类结果和跟踪结果很有用。这些提取的结果被称为特征,专业的表述为:从图像数据中提取特征。两个图像的相似程度可以通过它们对应特征的欧氏距离来度量。
Haar特征是一种用于实现人脸跟踪的特征。每一个Haar特征都描述了相邻图像区域的对比模式。例如,边、顶点和细线都能生成具有判别性的特征。
6.2获取Haar级联数据
OpenCV提供了人脸检测所需的XML文件,可用于检测静止图像、视频和摄像头所得到图像中的人脸。
- 人脸检测器(默认):haarcascade_frontalface_default.xml
- 人脸检测器(快速Harr):haarcascade_frontalface_alt2.xml
- 人脸检测器(侧视):haarcascade_profileface.xml
- 眼部检测器(左眼):haarcascade_lefteye_2splits.xml
- 眼部检测器(右眼):haarcascade_righteye_2splits.xml
- 嘴部检测器:haarcascade_mcs_mouth.xml
- 鼻子检测器:haarcascade_mcs_nose.xml
- 身体检测器:haarcascade_fullbody.xml
- 人脸检测器(快速LBP):lbpcascade_frontalface.xml
6.3使用OpenCV进行人脸检测
6.3.1静态图像中人脸检测
6.3.1.1检测人脸
示例代码:
import cv2 as cv
def face_detect_demo():
# 将图片转换为灰度
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
# 加载特征数据
face_detector = cv.CascadeClassifier('D:\software\Python\Lib\site-packages\cv2\data\haarcascade_frontalface_default.xml')
# faces为检测区域
faces = face_detector.detectMultiScale(gray)
for x, y, w, h in faces:
# 绘制矩形
cv.rectangle(img, (x, y), (x+w, y+h), color=(0, 255, 0), thickness=2)
# 显示图片
cv.imshow('result', img)
# 加载图片
img = cv.imread('huge.jpeg')
face_detect_demo()
# cv.imshow('input image', img)
cv.waitKey(0)
cv.destroyAllWindows()
效果:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UJKYaVVJ-1657533164870)(assets/20220711104954.png)]](/img/cf/82d133fb3484226ffe150befb964b6.jpg)
6.3.1.2检测多张人脸
示例代码:
import cv2 as cv
# 定义人脸检测方法
def face_detect_demo():
# 将图片灰度
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
# 加载特征数据
face_detector = cv.CascadeClassifier(
'D:\software\Python\Lib\site-packages\cv2\data\haarcascade_frontalface_default.xml')
# faces为检测区域
# 发现有一些没检测出来
faces = face_detector.detectMultiScale(gray, scaleFactor=1.01, minNeighbors=3, maxSize=(40, 40), minSize=(35, 35))
for x, y, w, h in faces:
print(x, y, w, h)
cv.rectangle(img, (x, y), (x+w, y+h), color=(0, 0, 255), thickness=2)
cv.circle(img, center=(x+w//2, y+h//2), radius=w//2, color=(0, 255, 0), thickness=2)
# 显示图片
cv.imshow('result', img)
# 加载图片
img = cv.imread('2.jpeg')
# 调用人脸检测方法
face_detect_demo()
cv.waitKey(0)
cv.destroyAllWindows()
测试图片:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QhDsacfc-1657533164871)(assets/2.jpeg)]](/img/11/80e10f96719d67df851cd9b42f464d.jpg)
效果:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XdVlQGyl-1657533164872)(assets/20220711171924.jpg)]](/img/30/b505f428940b5d19d9b5979b3f0e55.jpg)
6.3.2视频中的人脸检测
视频是一张张图片组成的,在视频的帧上重复这个过程就能完成视频中的人脸检测。
示例代码:
import cv2 as cv
def face_detect_demo(img):
# 将图片转换为灰度
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
# 加载特征数据
face_detector = cv.CascadeClassifier(
'D:\software\Python\Lib\site-packages\cv2\data\haarcascade_frontalface_default.xml')
# faces为检测区域
faces = face_detector.detectMultiScale(gray, flags=cv.CASCADE_SCALE_IMAGE)
for x, y, w, h in faces:
# 绘制矩形
cv.rectangle(img, (x, y), (x + w, y + h), color=(0, 0, 255), thickness=2)
cv.circle(img, center=(x+w//2, y+h//2), radius=w//2, color=(0, 255, 0), thickness=2)
# 可调整窗口大小
cv.namedWindow('result', 0)
# 调整窗口大小
cv.resizeWindow('result', 500, 500)
# 显示图片
cv.imshow('result', img)
# 读取视频
cap = cv.VideoCapture('test.mp4')
while True:
# frame就是每一帧的图像,是个三维矩阵(按帧读取)
flag, frame = cap.read()
print(f'flag:{
flag}, frame.shape:{
frame.shape}')
if not flag:
# 视频播放结束,退出
break
face_detect_demo(frame)
if ord('q') == cv.waitKey(0):
break
# 释放内存
cv.destroyAllWindows()
cap.release()
效果:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-idqVVKkC-1657533164872)(assets/20220711172317.jpg)]](/img/d0/fb7eba19115d93106aca682970d0d7.jpg)
6.3.3人脸识别
人脸识别其实就是一个程序能识别给定图像或视频中的人脸。实现这一目标的方法之一是用一系列分好类的图像来”训练“程序,并基于这些图像来进行识别。这就是OpenCV及其人脸识别模块进行人脸识别的过程。
人脸识别模块的另一个重要特征是:每个识别都具有转置信评分,因此可在实际应用中通过对其设置阈值来进行筛选。
人脸识别所需要的人脸可以通过两种方式来得到:自己获得图像或从人脸数据库免费获得可用的人脸图像。
6.3.3.1训练数据
有了数据,需要将这些样本图像加载到人脸识别算法中。所有的人脸识别算法在它们的train()函数都有两个参数:图像数组和标签数组。这些标签表示进行识别时某人人脸的ID,因此根据ID可以知道被识别的人是谁。要做到这一点,将在”trainer/“目录中保存为.yml文件。
在使用Python 3&OpenCV 3.0.0进行人脸识别训练时发现异常:AttributeError:'module' object has no attribute 'LBPHFaceRecognizer_create' OpenCV ,需要安装opencv-contrib-python模块:
pip install opencv-contrib-python
示例代码:
import os
import cv2
import numpy as np
from PIL import Image
def getImageAndLabels(path):
facesSamples = []
ids = []
imagePaths = [os.path.join(path, f) for f in os.listdir(path)]
# 检测人脸
face_detector = cv2.CascadeClassifier(
'D:\software\Python\Lib\site-packages\cv2\data\haarcascade_frontalface_default.xml')
# 遍历列表中的图片
for imagePath in imagePaths:
# 打开图片
PIL_img = Image.open(imagePath).convert('L')
# 将图像转换为数组
img_numpy = np.array(PIL_img, 'uint8')
# faces为检测区域
faces = face_detector.detectMultiScale(img_numpy)
# 获取每张图片的id
id = int(os.path.split(imagePath)[1].split('.')[0])
for x, y, w, h in faces:
facesSamples.append(img_numpy[y:y+h, x:x+w])
ids.append(id)
return facesSamples, ids
if __name__ == '__main__':
# 图片路径
path = './data/jm/'
# 获取图像数组和id标签数组
faces, ids = getImageAndLabels(path)
# 获取循环对象
""" AttributeError: module 'cv2' has no attribute 'face' """
recognizer = cv2.face.LBPHFaceRecognizer_create()
recognizer.train(faces, np.array(ids))
# 保存文件
recognizer.write('trainer/trainer.yml')
训练部分图像:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LVOKHwTR-1657533164873)(assets/20220711172816.jpg)]](/img/74/a131e2bff4c9398422614afba99076.jpg)
6.3.3.2基于LBPH的人脸识别
LBPH(Local Binary Pattern Histogram)将检测到的人脸分为小单元,并将其与模型中的对应单位进行比较,对每个区域的匹配值产生一个直方图。由于这种方法的灵活性,LBPH是唯一允许模型样本人脸和检测到的人脸在形状、大小上可以不同的人脸识别算法。
调整后的区域中调用predict()函数,该函数返回两个元素的数组:第一个元素是所识别个体的标签,第二个是置信度评分。所有的算法都有一个置信度评分阈值,置信度评分用来衡量所识别人脸与原模型的差距,0表示完全匹配。
有时不想保留所有的识别结果,则需要进一步处理,因此可用自己的算法来估算识别的置信度评分。LBPH一个好的识别参考值要低于50,任何一个高于80的参考值都会被认为是低的置信度评分。
示例代码:
import cv2
# 加载训练数据集文件
recognizer = cv2.face.LBPHFaceRecognizer_create()
recognizer.read('trainer/trainer.yml')
# 准备识别的图片
img = cv2.imread('7.bmp')
# 将图片转换为灰度
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 加载特征数据
face_detector = cv2.CascadeClassifier(
'D:\software\Python\Lib\site-packages\cv2\data\haarcascade_frontalface_default.xml')
# faces为检测区域
faces = face_detector.detectMultiScale(gray)
for x, y, w, h in faces:
# 绘制矩形
cv2.rectangle(img, (x, y), (x + w, y + h), color=(0, 255, 0), thickness=2)
# 人脸识别
id,confidence = recognizer.predict(gray[y:y+h, x:x+w])
print(f"标签id:{
id},置信评分:{
confidence}")
# 显示图片
cv2.imshow('result', img)
cv2.waitKey(0)
# 释放内存
cv2.destroyAllWindows()
测试图像:
测试效果:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lPYiqfXL-1657533164874)(assets/20220711173412.jpg)]](/img/25/fc199b9ab6c9f024d7e842e43f4cc3.jpg)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7NY7Vmpx-1657533164875)(assets/20220711173445.jpg)]](/img/b9/2f4224fdcfc8aacf34eeb75f45ff88.jpg)
因为上面这个图像不在训练数据中,所以置信评分高于80。
换成下面这个图像(jim文件夹下的11.bmp)进行测试:
测试效果:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SfYek7M2-1657533164876)(assets/20220711174034.jpg)]](/img/e9/440c1b1964d48c1d97db6954e00e75.jpg)
在训练数据中,置信评分为0。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3kzoF2Mw-1657533164877)(assets/20220711174126.jpg)]](/img/7d/5f569d5dc5d83102a05c1758869c49.jpg)
参考文章及其它:
边栏推荐
- Class loader + reflection +properties
- Unity experiment - simulating the motion of stars in the solar system
- Experimental report on using spark to predict repeat customers
- ES6 -- Interview Questions
- unity实验-重力撞墙
- Some small problems encountered in using Baidu lightweight server LS
- 如何导出微信聊天记录
- It's 5 days late to convert the string to time. Pit avoidance Guide
- ES6 -- array
- NFTScan 开发者平台推出多链 NFT 数据 Pro API 服务
猜你喜欢

MSF利用永恒之蓝渗透win2003

DVA data flow

曾入选顶会的技术完成产品化 蚂蚁链推出版权AI计算引擎

37.js -- member operation of object and operation of prototype object (mainly related program examples)

ES6 -- arrow function

JS downloads files according to binary data

基础设施 NFTScan 正式发布 Solana 网络 NFT 浏览器

Ant group open source large-scale video infringement positioning data set

录音、上传、播放音频微信小程序实践

Some small problems encountered in using Baidu lightweight server LS
随机推荐
ES6 -- object
El button display and disable
Analysis, capture and simulation attack of Sniffer Pro on ARP Protocol
MySQL-DQL-条件查询/聚合函数/分组查询/排序查询/分页查询
【论文翻译】Issues and Challenges of Aspect-based Sentiment Analysis: A Comprehensive Survey
Some small problems encountered in using Baidu lightweight server LS
网络通信安全部分笔记一
利用Spark预测回头客实验报告
MySQL function string function / numeric function / date function / process control function
Notes 2 of network communication security
Compilation principle - parser design
Unity experiment - control the movement of game objects
File upload parsing vulnerability
[Huang ah code] redis realizes fuzzy query and deletes | redis obtains the key according to the prefix
40.js -- the same name identifier promotion problem
Math object in JS
将String转为Date,方便快捷
antd setFieldsValue警告问题 Cannot use `setFieldsValue` until you use `getFieldDecorator` or
使用base64对图片进行编码、对byte[]进行编码
Convert bufferedimage into byte[] array, and the pro test is available