一种联合卷积与图神经网络的表格结构识别方法

2025年6月20日
数园网络
16

申请号:CN202210293274.9

申请人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

专利权人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

申请日:2022-03-24

授权日:2022-06-21

专利类型:发明

法律状态:授权

发明人:黄双萍 | 杨帆

摘要:本发明公开了一种联合卷积与图神经网络的表格结构识别方法,其特征在于,所述方法包括:构建联合卷积图神经网络,所述的联合卷积图神经网络包括深度二维卷积神经网络、二维卷积神经网络和图神经网络;利用不确定度加权的多任务学习损失函数训练所述的联合卷积图神经网络;使用二维卷积神经网络预测表格各单元格中心点坐标,基于中心点构建表格结构的图,利用所述的图神经网络对图的每条边进行分类;后处理算法处理分好类的表格结构的图,得到各单元格的结构属性,并转换为描述表格结构的标记语言。本发明方法提供一种端到端可训练的基于图神经网络显示建模表格结构的方法来高效识别表格结构。

摘要附图: