咱们将分为以下几个过程完结这个项目:

目录

1. 装置必要的库

2. 加载和显现视频

3. 运用预练习的人物检测模型

4. 在检测到的人物周围制作鸿沟框

5. 保存和显现成果

总结:


1. 装置必要的库

首要,确保您已装置以下库:

  • OpenCV: 用于图画处理和计算机视觉使命
  • imutils: 供给一些有用函数,如图画旋转、裁剪等

装置方法如下:

pip install opencv-python
pip install imutils

用Python和OpenCV库实现识别人物出现并锁定

2. 加载和显现视频

首要,咱们需求导入所需的库,并加载一个视频文件。咱们将运用OpenCV的VideoCapture类来加载视频。

import cv2
import imutils
video_path = "path/to/your/video.mp4"
# 翻开视频
cap = cv2.VideoCapture(video_path)
while True:
    ret, frame = cap.read()
    if not ret:
        break
    # 缩放以提高处理速度
    frame = imutils.resize(frame, width=600)
    cv2.imshow("Input Video", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break
cap.release()
cv2.destroyAllWindows()

用Python和OpenCV库实现识别人物出现并锁定

3. 运用预练习的人物检测模型

接下来,咱们将运用OpenCV中供给的预练习模型。这里咱们运用MobileNet-SSD模型,因为它在速度和准确性之间达到了很好的平衡。

prototxt_path = "path/to/your/MobileNetSSD_deploy.prototxt"
model_path = "path/to/your/MobileNetSSD_deploy.caffemodel"
# 加载预练习模型
net = cv2.dnn.readNetFromCaffe(prototxt_path, model_path)

用Python和OpenCV库实现识别人物出现并锁定

4. 在检测到的人物周围制作鸿沟框

现在,咱们将运用预练习的模型来检测视频中的人物,并在检测到的人物周围制作鸿沟框。

# 设置置信度阈值
confidence_threshold = 0.5
while True:
    ret, frame = cap.read()
    if not ret:
        break
    frame = imutils.resize(frame, width=600)
    (h, w) = frame.shape[:2]
    # 将图画转换为blob
    blob = cv2.dnn.blobFromImage(frame, 0.007843, (w, h), 127.5)
    net.setInput(blob)
    detections = net.forward()
    for i in range(detections.shape[2]):
        confidence = detections[0, 0, i, 2]
        if confidence > confidence_threshold:
            idx = int(detections[0, 0, i, 1])
            if idx == 15:  # 15 代表人类
                box = detections[0, 0, i, 3:7] * np.array([w, h, w, h])
                (startX, startY, endX, endY) = box.astype("int")
                # 在检测到的人物周围制作鸿沟框
                cv2.rectangle(frame, (startX, startY), (endX, endY), (0, 255, 0), 2)
    cv2.imshow("Input Video", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break

用Python和OpenCV库实现识别人物出现并锁定

5. 保存和显现成果

最后,咱们将处理后的视频保存到磁盘,并在程序完结后关闭所有窗口。

# 创立 VideoWriter 目标以保存处理后的视频
fourcc = cv2.VideoWriter_fourcc(*"mp4v")
out = cv2.VideoWriter("output.mp4", fourcc, 30, (w, h))
while True:
    ret, frame = cap.read()
    if not ret:
        break
    frame = imutils.resize(frame, width=600)
    (h, w) = frame.shape[:2]
    blob = cv2.dnn.blobFromImage(frame, 0.007843, (w, h), 127.5)
    net.setInput(blob)
    detections = net.forward()
    for i in range(detections.shape[2]):
        confidence = detections[0, 0, i, 2]
        if confidence > confidence_threshold:
            idx = int(detections[0, 0, i, 1])
            if idx == 15:
                box = detections[0, 0, i, 3:7] * np.array([w, h, w, h])
                (startX, startY, endX, endY) = box.astype("int")
                cv2.rectangle(frame, (startX, startY), (endX, endY), (0, 255, 0), 2)
    # 将帧写入输出视频
    out.write(frame)
    cv2.imshow("Input Video", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break
cap.release()
out.release()
cv2.destroyAllWindows()

用Python和OpenCV库实现识别人物出现并锁定

总结:

现在,您应该现已成功地创立了一个能够识别人物呈现并将其确定的项目。经过运行此代码,您将能够在给定的视频中检测到人物,并在检测到的人物周围制作鸿沟框。此外,该程序将处理后的视频保存到磁盘,以便您以后查看。

教程展现了如何运用Python和OpenCV库构建一个简单的人物识别和确定项目。您能够在此基础上进行扩展,以满意您的特定需求。例如,您能够测验:

  1. 运用其他预练习模型,以提高识别准确性或下降计算复杂性。
  2. 为检测到的人物添加标签,例如显现置信度分数或人物ID。
  3. 跟踪检测到的人物在视频中的移动轨迹。
  4. 将此项目扩展为实时人物识别系统,经过摄像头实时监控人物呈现。