代码实战：YOLOv5实现钢材表面缺陷检测

前言目前，根据机器视觉的外表缺点已经在各个工业范畴广泛取代人工视觉检测，包括3C、汽车、家电、机械制造、半导体电子、化工、制药、航空航天、轻工等职业。许多根据深度学习的缺点检测办法也被广泛应用于各种工业场景。
本文的代码实战，是根据YOLOv5目标检测算法，在NEU外表缺点数据集上完成钢材外表缺点检测。要求Python>=3.7.0，PyTorch>=1.7。

本文转载自笑傲算法江湖

作者 | Ctrl CV

欢迎关注大众号CV技能攻略，专心于计算机视觉的技能总结、最新技能跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

一、YOLOv5

选取YOLOv5，一方面是因为从终究效果来看YOLOv5已经相当优秀，是发展的比较完备、运用比较广泛的一个版别；而更重要的是YOLOv5的调用、练习和猜测都十分方便，为初学者供给了杰出的练手工具。YOLOv5的另一个特色便是它为不同的设备需求和不同的应用场景供给了巨细和参数数量不同的网络。

如图所示，大一点的模型比方YOLOv5l和YOLOv5x参数更多，在大规模的COCO数据集上有更高的猜测准确率；而小模型比方YOLOv5n或YOLOv5s占空间更小，合适布置在移动设备上，且推理速度更快，合适于高帧率视频的实时检测。

参考代码：github.com/ultralytics…

二、钢材外表缺点数据集

东北大学(NEU)外表缺点数据集，收集了热轧带钢6种典型的外表缺点，即轧内垢(RS)、斑块(Pa)、裂纹(Cr)、点蚀面(PS)、夹杂物(In)和划痕(Sc)。该数据库包括1800张灰度图画：6种不同类型的典型外表缺点各300个样本。

下图为6种典型外表缺点的样本图画，每张图画的原始分辨率为200200像素。从图中，咱们能够清楚地观察到类内缺点在外观上存在较大差异，例如划痕(终究一列)可能是水平划痕、垂直划痕和歪斜划痕等。与此一起，类间缺点也具有类似的特征，如滚积垢、裂纹和坑状外表。此外，由于光照和资料改变的影响，类内缺点图画的灰度会发生改变。总归，NEU外表缺点数据库包括两个难题，即类内缺点存在较大外观差异，类间缺点具有类似方面，缺点图画受到光照和资料改变的影响。

对于缺点检测任务，数据集供给了标示，标示了每个图画中缺点的类别和位置。下图展现了数据集上的一些检测成果示例。对于每个缺点，黄色框是表明其位置的边界框，绿色标签是类分数。

数据地址：faculty.neu.edu.cn/songkechen/…

三、YOLOv5数据格局

YOLOv5标签文件中每一行的数据为class, x, y, w, h，其间class是该物体的类别，x,y是检测框中心坐标，w,h是检测框的宽和高。

四、格局转化voc2yolo

从网上获取一些目标检测的数据集资源标签的格局都是VOC(xml格局)的，而YOLOv5练习所需求的文件格局是YOLO(txt格局)的，这儿就需求对xml格局的标签文件转化为txt文件。一起练习自己的YOLOv5检测模型的时分，数据集需求划分为练习集和验证集。这儿供给了一份代码将xml格局的标示文件转化为txt格局的标示文件，并按比例划分为练习集和验证集。

import xml.etree.ElementTree as ET
import os
from os import getcwd
from tqdm import tqdm
classes = ["crazing", "inclusion", "patches", "pitted_surface", "rolled-in_scale", "scratches"]
def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)
def convert_annotation(image_id):
    in_file = './xml/%s.xml' % (image_id)
    out_file = open('./labels/%s.txt' % (image_id), 'w')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):
        difficult = obj.find('Difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
if __name__ == "__main__":
    wd = getcwd()
    print(wd)
    if not os.path.exists('./labels/'):
        os.makedirs('./labels/')
    image_ids = os.listdir('./datasets')
    for image_id in tqdm(image_ids):
        convert_annotation(image_id.split('.')[0])

五、练习

YOLOv5是经过yaml格局的装备文件来找到对应的练习测验数据，因此在练习前需求对该文件进行简单装备。咱们能够经过修正YOLOv5的装备文件来完成，需求修正的装备文件有两个，咱们先仿制一份data/coco.yaml，这儿将其重命名为my_coco.yaml

在download前加上一个#注释掉这段代码
将train、val、test修正为自己的途径，以train为例，NEU-DET/train/images/
将nc修正为数据的类别数，如钢材外表缺点，故修正为6
将names修正自己数据的类名，如names: [“crazing”, “inclusion”, “patches”, “pitted_surface”, “rolled-in_scale”, “scratches”]

下一个需求修正的文件为模型装备文件，在models文件夹中有四个模型的装备文件：yolov5s.yaml、yolov5m.yaml、yolov5l.yaml和yolov5x.yaml，能够根据需求选择相应的模型，这儿以yolo5s.yaml为例，翻开文件，修正文件中的nc为自己的类别数即可。

python train.py --weights weights/yolov5s.pt --cfg models/yolov5s.yaml --data data/my_coco.yaml --epoch 30 --batch-size 32

六、测验

练习结束后，在runs/exp0文件夹下会自动生成练习成果，其间包括模型权重、混淆矩阵、PR曲线等。

进行测验时，翻开detect.py文件，修正source为检测图片的文件夹，运行之后，在run->detect中输出检测成果；或者经过如下办法进行测验。

python detect.py --source ./data/images/example.jpg --weights runs/exp0/weights/best.pt --conf-thres 0.25

终究猜测的成果如下，能够看出模型缺点检测效果。

本文仅做学术共享，如有侵权，请联系删文。

欢迎关注大众号CV技能攻略，专心于计算机视觉的技能总结、最新技能跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技能文档】《从零建立pytorch模型教程》122页PDF下载

QQ沟通群：444129970。群内有大佬担任回答我们的日常学习、科研、代码问题。

其它文章

深度了解变分自编码器(VAE) | 从入门到通晓

计算机视觉入门1v3辅导班

计算机视觉沟通群

用于超大图画的练习战略：Patch Gradient Descent

CV小常识评论与分析（5）究竟什么是Latent Space?

【免费送书活动】关于语义切割的亿点考虑

新方案：从过错中学习，点云切割中的自我规范化层次语义表明

Transformer沟通群

经典文章：Transformer是怎么进军点云学习范畴的？

CVPR 2023 Workshop | 首个大规模视频全景切割比赛

怎么更好地应对下流小样本图画数据？不平衡数据集的建模的技巧和策

U-Net在2022年相关研究的论文推荐

用少于256KB内存完成边缘练习，开支不到PyTorch千分之一

PyTorch 2.0 重磅发布：一行代码提速 30%

Hinton 最新研究：神经网络的未来是前向-前向算法

聊聊计算机视觉入门

FRNet：上下文感知的特征强化模块

DAMO-YOLO | 超越所有YOLO，兼顾模型速度与精度

《医学图画切割》综述，胪陈六大类100多个算法

怎么高效完成矩阵乘？万文长字带你从CUDA初学者的视点入门

近似乘法对卷积神经网络的影响

BT-Unet:医学图画切割的自监督学习框架

语义切割该怎么走下去？

轻量级模型设计与布置总结

从CVPR22动身，聊聊CAM是怎么激活咱们文章的热度！

入门必读系列（十六）经典CNN设计演变的要害总结：从VGGNet到EfficientNet

入门必读系列（十五）神经网络不work的原因总结

入门必读系列（十四）CV论文常见英语单词总结

入门必读系列（十三）高效阅览论文的办法

入门必读系列（十二）池化各要点与各办法总结

TensorRT教程（三）TensorRT的装置教程

TensorRT教程（一）初度介绍TensorRT

TensorRT教程（二）TensorRT进阶介绍

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

代码实战：YOLOv5实现钢材表面缺陷检测

一、YOLOv5

二、钢材外表缺点数据集

三、YOLOv5数据格局

四、格局转化voc2yolo

五、练习

六、测验

近期文章

近期评论