图像文本检测半自动标注方法、系统、计算机设备及介质

2025年6月20日

数园网络

998

申请号：CN202110906651.7

申请人：华南理工大学 | 人工智能与数字经济广东省实验室(广州)

专利权人：华南理工大学 | 人工智能与数字经济广东省实验室(广州)

申请日：2021-08-09

授权日：2023-06-30

专利类型：发明

法律状态：授权

发明人：黄双萍 | 刘宗昊 | 王庆丰

摘要：本发明公开了一种图像文本检测半自动标注方法、系统、计算机设备及介质，所述方法包括：获取文本图像；从文本图像中获取文本中心线；生成N个围绕文本中心线的候选边界框；将N个候选文本区域同时输入宽松识别器和严苛识别器，通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容，通过严苛识别器预测每个候选文本区域的内容识别结果；将N个内容识别结果与估计的文本内容相比，分别计算识别损失，得到N个识别损失；通过确定所有识别损失中最小损失的索引，获得最准确候选边界框的索引，进而得到最终的文本框标注；将文本框标注以识别损失为引导进行优化，最终得到紧致的文本框标注。本发明能够提高文本检测标注效率和标注效果。

摘要附图：

50-CN202110906651.7-图像文本检测半自动标注方法、系统、计算机设备及介质

许可范围：全国

合作方式：先用后付

开放许可期限：以协商为准

联系人：司老师

联系电话：020-88322793

邮箱：ip@pazhoulab.cn