图像文本检测半自动标注方法、系统、计算机设备及介质

2025年6月20日
数园网络
31

申请号:CN202110906651.7

申请人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

专利权人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

申请日:2021-08-09

授权日:2023-06-30

专利类型:发明

法律状态:授权

发明人:黄双萍 | 刘宗昊 | 王庆丰

摘要:本发明公开了一种图像文本检测半自动标注方法、系统、计算机设备及介质,所述方法包括:获取文本图像;从文本图像中获取文本中心线;生成N个围绕文本中心线的候选边界框;将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。本发明能够提高文本检测标注效率和标注效果。

摘要附图: