在实践了解并掌握PaddleOCR的模型训练,模型评价,模型导出实操之前,我觉得有必要先下载他们现已训练好的推理模型,直接进行模型预测,感触下实践推理模型的运用。

因为PaddleOCR的文档内容比较杂乱,实践期间发现了许多问题,包含PaddleOCR的版别不同,目录结构的差异等。所以我记录下我自己的实战经验。

安装环境

机器环境:Mac M1芯片 ARM64架构

PaddleOCR版别:2.6

Python版别:3.9

PaddleOCR的推理模型库

PaddleOCR现已帮你整理好了对应算法的模型列表,包含推理模型,训练模型,预训练模型以及nb模型,网址如下:

github.com/PaddlePaddl…

本次咱们需求下载的便是对应算法:文本检测,文本辨认,文本方向分类器对应的推理模型。

如何使用PaddleOCR训练好的推理模型快速进行推理实战

在运用PaddleOCR现已发布的推理模型之前,咱们需求先将PaddleOCR的代码下载到本地:

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR

具体操作能够参阅 /post/718961…

文本检测

咱们能够直接参阅Paddle的官方文档:github.com/PaddlePaddl…

我的操作步骤如下:

  • 首要下载推理模型,我挑选了原始超轻量模型,下载到了PaddleOCR/pretrained_models文件夹下

如何使用PaddleOCR训练好的推理模型快速进行推理实战

cd PaddleOCR
mkdir pretrained_models
cd pretrained_models
## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar
tar -xf ch_PP-OCRv3_det_infer.tar && rm -rf ch_PP-OCRv3_det_infer.tar

这样就能够看到解压出来的推理模型文件夹下有对应的模型文件

如何使用PaddleOCR训练好的推理模型快速进行推理实战

  • 这样就能够经过命令行的方式履行推理模型了,因为我在MAC上进行CPU运转,需求将—use_gpu参数设置为False
cd PaddleOCR
python3 tools/infer/predict_det.py --det_algorithm="DB" --det_model_dir="./pretrained_models/ch_PP-OCRv3_det_infer" --image_dir="./doc/imgs/" --use_gpu=False

成果运转如下:

如何使用PaddleOCR训练好的推理模型快速进行推理实战

文本辨认

相同参阅的文档如下:github.com/PaddlePaddl…

相同的操作步骤如下:

  • 首要下载推理模型,我挑选了原始超轻量模型,下载到了PaddleOCR/pretrained_models文件夹下

如何使用PaddleOCR训练好的推理模型快速进行推理实战

cd PaddleOCR
mkdir pretrained_models
cd pretrained_models
## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar
tar -xf ch_PP-OCRv3_rec_infer.tar && rm -rf ch_PP-OCRv3_rec_infer.tar
  • 这样就能够经过命令行的方式履行推理模型了,因为我在MAC上进行运转,需求将—use_gpu参数设置为False
cd PaddleOCR
python3 tools/infer/predict_rec.py --image_dir="/Users/shaoshuai.shao/Desktop/WechatIMG189.jpeg" --rec_model_dir="./pretrained_models/ch_PP-OCRv3_rec_infer" --rec_char_dict_path='./ppocr/utils/ppocr_keys_v1.txt' --use_gpu=False

–image_dir 参数设置为需求辨认的图片路径

–rec_model_dir 参数设置为刚刚下载的推理模型的文件夹地址

–rec_char_dict_path 这个参数需求设置为推理模型运用的字符字典,这个字典的地址取值有点绕。因为咱们当时下载的是现已打包好的推理模型,需求查看下生成推理模型的对应装备,查询看下图

如何使用PaddleOCR训练好的推理模型快速进行推理实战

如何使用PaddleOCR训练好的推理模型快速进行推理实战

能够看到推演模型生成时分的装备挑选的字典目录路径便是 ppocr/utils/ppocr_keys_v1.txt。

  • 履行成果如下

如何使用PaddleOCR训练好的推理模型快速进行推理实战

文本方向分类器

相同参阅的文档如下:github.com/PaddlePaddl…

相同的操作步骤如下:

  • 首要下载推理模型,我挑选了原始分类器模型,下载到了PaddleOCR/pretrained_models文件夹下

如何使用PaddleOCR训练好的推理模型快速进行推理实战

cd PaddleOCR
mkdir pretrained_models
cd pretrained_models
## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
tar -xf ch_ppocr_mobile_v2.0_cls_infer.tar && rm -rf ch_ppocr_mobile_v2.0_cls_infer.tar
  • 这样就能够经过命令行的方式履行推理模型了,因为我在MAC上进行运转,需求将—use_gpu参数设置为False
cd PaddleOCR
python3 tools/infer/predict_cls.py --image_dir="/Users/shaoshuai.shao/Desktop/WechatIMG189.jpeg" --cls_model_dir="./pretrained_models/ch_ppocr_mobile_v2.0_cls_infer" --use_gpu=False

注:PaddleOCR内置的 文本方向分类器只支撑了0和180度的分类。如果想支撑更多角度,能够自己修改算法进行支撑。

文本检测、方向分类和文字辨认串联

cd PaddleOCR
python3 tools/infer/predict_system.py --image_dir="/Users/shaoshuai.shao/Desktop/WechatIMG190.jpeg" --det_model_dir="./pretrained_models/ch_PP-OCRv3_det_infer" --cls_model_dir="./pretrained_models/ch_ppocr_mobile_v2.0_cls_infer" --rec_model_dir="./pretrained_models/ch_PP-OCRv3_rec_infer" --use_angle_cls=true --use_gpu=False

–image_dir 带扫描的图像地址

–det_model_dir 上面文档中下载文本检测推演模型的地址

–rec_model_dir 上面文档中下载文本辨认推演模型的地址

–cls_model_dir 上面文档中下载方向分类推演模型的地址

引证

github.com/PaddlePaddl…

github.com/PaddlePaddl…