申请号:CN202210425844.5
申请人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)
专利权人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)
申请日:2022-04-22
授权日:2022-07-15
专利类型:发明
法律状态:授权
发明人:黄双萍 | 彭政华 | 杨帆
摘要:本发明公开了一种全线表表格结构识别方法,包括:采用实例分割算法对文档图像进行单元格分割,得到每一个单元格对应于文档图像中单元格所在区域的二值化掩码图像;将每一个单元格的二值化掩码图像进行或运算和形态学闭操作,得到表格整体区域图像及表格整体区域图像的二值化掩码图像;采用矫正算法,在获得表格整体区域图像中表格区域的四个顶点后,利用TPS变换以这四个顶点为基准将弯曲表格修正为以这四个顶点为顶点的近似四边形表格区域,并使用透视变换将近似四边形表格区域转换成水平矩形的正表格图像;进行单元格目标检测获得每一个单元格的边界框;利用基于规则化排序算法进行排序以识别表格结构,将表格结构表达成对应的标记语言描述。
摘要附图: