使用Python和LabelMe实现图片验证码的自动标注功能_F11

本站首页收藏本站

广告位联系

APP正在开发中...

返回顶部

分享到

使用Python和LabelMe实现图片验证码的自动标注功能

python 来源：互联网作者：佚名发布时间：2025-01-01 17:09:49 人浏览

摘要

使用 Python 和 LabelMe 实现图片验证码的自动标注在处理图片验证码时，手动标注是一项耗时且枯燥的工作。本文将介绍如何使用 Python 和 LabelMe 实现图片验证码的自动标注。通过结合 PaddleOCR 实

使用 Python 和 LabelMe 实现图片验证码的自动标注

在处理图片验证码时，手动标注是一项耗时且枯燥的工作。本文将介绍如何使用 Python 和 LabelMe 实现图片验证码的自动标注。通过结合 PaddleOCR 实现自动识别，再生成 LabelMe 格式的标注文件，大幅提升工作效率。

环境准备

必备工具

Python 3.7+
PaddleOCR（支持文字识别）
OpenCV（图像处理）
LabelMe（标注工具）

安装依赖

使用以下命令安装所需库：

1	pip install paddleocr labelme opencv-python

实现自动标注

自动标注分为以下几个步骤：

加载图片：读取图片文件，确保格式正确。
图像预处理：对验证码图片进行灰度化和二值化处理，优化识别效果。
OCR 识别：使用 PaddleOCR 获取验证码中的文字和位置。
生成标注文件：根据 OCR 结果创建符合 LabelMe 格式的 JSON 文件。

核心代码实现

以下是完整的自动标注脚本：

import os

import cv2

from paddleocr import PaddleOCR

def auto_label_image(image_path, output_path):

# 检查文件是否存在

if not os.path.exists(image_path):

print(f"Error: File not found: {image_path}")

return

# 加载图像

image = cv2.imread(image_path)

if image is None:

print(f"Error: Failed to load image. Check the file path or format: {image_path}")

return

# 图像预处理

gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

_, binary_image = cv2.threshold(gray_image, 128, 255, cv2.THRESH_BINARY)

# 保存预处理后的图片（可选，用于调试）

preprocessed_path = os.path.join(output_path, "processed_image.jpg")

cv2.imwrite(preprocessed_path, binary_image)

# 初始化 OCR

ocr = PaddleOCR(use_angle_cls=True, lang='en')

# OCR 识别

results = ocr.ocr(preprocessed_path)

if not results or not results[0]:

print(f"No text detected in the image: {image_path}")

return

# 获取图像尺寸

image_height, image_width, _ = image.shape

# 构建标注 JSON

label_data = {

"version": "4.5.7",

"flags": {},

"shapes": [],

"imagePath": os.path.basename(image_path),

"imageData": None,

"imageHeight": image_height,

"imageWidth": image_width,

}

# 遍历 OCR 结果

for line in results[0]:

points = line[0] # 字符位置 [左上, 右上, 右下, 左下]

text = line[1][0] # 识别的文本

shape = {

"label": text,

"points": [points[0], points[2]], # 左上角和右下角

"group_id": None,

"shape_type": "rectangle",

"flags": {}

}

label_data["shapes"].append(shape)

# 保存标注 JSON

json_path = os.path.join(output_path, os.path.basename(image_path).replace('.jpg', '.json'))

with open(json_path, 'w') as f:

import json

json.dump(label_data, f, indent=4)

print(f"Saved LabelMe annotation: {json_path}")

# 示例

image_path = r"C:\Users\wangzq\Desktop\images\captcha.jpg"

output_path = "./annotations"

os.makedirs(output_path, exist_ok=True)

auto_label_image(image_path, output_path)

核心逻辑解析

图像预处理

为了提高 OCR 的识别精度，对验证码图片进行灰度化和二值化处理：

1 2	gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) _, binary_image = cv2.threshold(gray_image, 128, 255, cv2.THRESH_BINARY)

二值化处理可以去除背景噪声，使字符更加清晰。

OCR 识别

使用 PaddleOCR 对图片进行文字检测和识别，返回检测框和文字内容：

1 2	ocr = PaddleOCR(use_angle_cls=True, lang='en') results = ocr.ocr(preprocessed_path)

如果 results 为空，说明 OCR 未检测到任何文本。

生成标注文件

根据 OCR 结果，生成 LabelMe 格式的标注文件，关键字段包括：

shapes：标注框信息，包括位置和对应文字。
imageHeight 和 imageWidth：图像的尺寸。

运行结果

输出预处理图片：在指定路径下保存经过预处理的图片（processed_image.jpg）。
生成标注文件：在 output_path 目录下生成与图片同名的 .json 文件。
无文本检测提示：如果未检测到任何文本，提示 No text detected in the image。

扩展与优化

模型适配

如果验证码中的字符种类较复杂，可以考虑训练一个专用模型，替代通用的 PaddleOCR。

批量处理

针对多张图片验证码，可以将脚本扩展为批量处理模式：

for image_file in os.listdir(input_folder):

image_path = os.path.join(input_folder, image_file)

auto_label_image(image_path, output_path)

标注类型扩展

目前代码仅支持矩形框标注。如果需要支持多边形标注，可以调整 shape_type 为 polygon 并提供相应点坐标。

总结

本文介绍了如何使用 Python 和 LabelMe 自动标注图片验证码，从图像预处理到生成标注文件的完整流程。通过 PaddleOCR 的结合，可以快速实现验证码字符的自动标注，节省大量时间和精力。

测试

运行完脚本，出来json

{

"version": "4.5.7",

"flags": {},

"shapes": [

{

"label": "OZLQ",

"points": [

[

6.0,

1.0

[

68.0,

21.0

]

"group_id": null,

"shape_type": "rectangle",

"flags": {}

}

"imagePath": "captcha.png",

"imageData": null,

"imageHeight": 22,

"imageWidth": 76

}

{

"version": "4.5.7",

"flags": {},

"shapes": [

{

"label": "3081",

"points": [

[

6.0,

1.0

[

63.0,

21.0

]

"group_id": null,

"shape_type": "rectangle",

"flags": {}

}

"imagePath": "captcha.png",

"imageData": null,

"imageHeight": 22,

"imageWidth": 76

}

目前较为复杂还需要深度研究

您可能感兴趣的文章 :

原文链接 :

Tag : python(1048)验证码(31)

Python调用JavaScript代码的几种方法

1. 使用PyExecJS执行JavaScript代码 PyExecJS是一个流行的Python库，它可以用来在Python中运行JavaScript代码。通过这个库，Python代码可以调用JS函数，
python中json.dumps和json.dump区别

1、json.dumps和json.dump的区别 json.dumps()是将 Python 对象序列化为 JSON 格式的字符串。如果你想将 JSON 数据写入文件，可以将json.dumps()生成的字符
使用Python和LabelMe实现图片验证码的自动标注功能

使用 Python 和 LabelMe 实现图片验证码的自动标注在处理图片验证码时，手动标注是一项耗时且枯燥的工作。本文将介绍如何使用 Python 和 L
Python Pandas轻松实现数据清理

在当今的数据驱动时代，数据清理是数据分析、机器学习项目中至关重要的一步。脏数据、缺失值、重复记录等问题都可能严重影响结果的
基于Python搭建局域网大文件分享传输工具

1.简介由于单位不让用优盘、禁止用飞秋、也不准使共享，禁用FTP，也禁止搭建网站，且目前局域网内用的IM不支持1G以上文件传输，于是在
Python中如何判断是否为AJAX请求

在Web开发中，AJAX（Asynchronous JavaScript and XML）请求是一种非常常见的与服务器进行数据交互的方式。它允许在不重新加载整个页面的情况下，
一文带你深入了解Python中的多进程编程

在 Python 中，多进程编程是一种提高程序运行效率的有效手段。相比于多线程编程，多进程编程可以充分利用多核 CPU 的优势，实现真正的并
基于Python实现web网页内容爬取的方法

在日常学习和工作中，我们经常会遇到需要爬取网页内容的需求，今天就如何基于Python实现web网页内容爬取进行讲解。 1. 网页分析用Chrom
使用Python实现屏幕录制与键盘监听功能

在Python中，我们可以借助多个强大的库来实现丰富的功能，比如屏幕录制和键盘监听。今天，我们将通过结合PIL（Python Imaging Library的分支
python中pathlib面向对象的文件系统路径

pathlib:面向对象的文件系统路径 pathlib官方介绍: Python3.4+内置的标准库，Object-oriented filesystem paths（面向对象的文件系统路径） 1. 使用示例

使用Python和LabelMe实现图片验证码的自动标注功能

使用 Python 和 LabelMe 实现图片验证码的自动标注

环境准备

必备工具

安装依赖

实现自动标注

核心代码实现

核心逻辑解析

图像预处理

OCR 识别

生成标注文件

运行结果

扩展与优化

模型适配

批量处理

标注类型扩展

总结

您可能感兴趣的文章 :

Python调用JavaScript代码的几种方法

python中json.dumps和json.dump区别

使用Python和LabelMe实现图片验证码的自动标注功能

Python Pandas轻松实现数据清理

基于Python搭建局域网大文件分享传输工具

Python中如何判断是否为AJAX请求

一文带你深入了解Python中的多进程编程

基于Python实现web网页内容爬取的方法

使用Python实现屏幕录制与键盘监听功能

python中pathlib面向对象的文件系统路径

python批量下载抖音视频

利用Pyecharts可视化微信好友的方法

python爬取豆瓣电影TOP250数据

基于tensorflow权重文件的解读

解决Python字典查找报Keyerror的问题