基于全局追踪解码的文字图像书写轨迹恢复方法

2025年6月20日
数园网络
32

申请号:CN202210363417.9

申请人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

专利权人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

申请日:2022-04-08

授权日:2023-04-07

专利类型:发明

法律状态:授权

发明人:黄双萍 | 陈洲楠 | 杨代辉 | 梁景麟 | 彭政华

摘要:本发明公开了基于全局追踪解码的文字图像书写轨迹恢复方法,包括以下步骤:将文字图像调整为预设尺寸并进行二值化处理;构建卷积循环神经编码网络;构建全局追踪解码网络,所述的全局追踪解码网络的输入为编码特征Z,输出为预测文字书写轨迹序列;联合训练卷积循环神经编码网络和全局追踪解码网络,获得文字图像书写轨迹恢复网络模型;利用训练完成的文字图像书写轨迹恢复网络模型进行书写轨迹恢复。本发明方法在解码的过程中,设置全局追踪解码机制,在每个解码时刻,加入编码特征作为RNN解码器的输入,有助于解码器在整个轨迹序列的预测过程中都能对全局文字特征进行持续追踪,缓解轨迹序列偏移问题,有效提升文字图像书写轨迹的恢复性能。

摘要附图: