申请号:CN202110906651.7
申请人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)
专利权人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)
申请日:2021-08-09
授权日:2023-06-30
专利类型:发明
法律状态:授权
发明人:黄双萍 | 刘宗昊 | 王庆丰
摘要:本发明公开了一种图像文本检测半自动标注方法、系统、计算机设备及介质,所述方法包括:获取文本图像;从文本图像中获取文本中心线;生成N个围绕文本中心线的候选边界框;将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。本发明能够提高文本检测标注效率和标注效果。
摘要附图: