授权公布号:CN113297975B
表格结构识别的方法、装置、存储介质及电子设备
有效
申请
2021-05-25
申请公布
2021-08-24
授权
2024-03-26
预估到期
2041-05-25
| 申请号 | CN202110573789.X |
| 申请日 | 2021-05-25 |
| 申请公布号 | CN113297975A |
| 申请公布日 | 2021-08-24 |
| 授权公布号 | CN113297975B |
| 授权公告日 | 2024-03-26 |
| 分类号 | G06V30/414;G06V30/14;G06V30/19;G06V10/82;G06N3/0464;G06N3/09 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 新东方教育科技集团有限公司 |
| 申请人地址 | 北京市海淀区海淀中街6号9层 |
专利法律状态
2024-03-26
授权
状态信息
授权
2021-08-24
公布
状态信息
公布
摘要
本公开涉及一种表格结构识别的方法、装置、存储介质及电子设备,可以将待识别表格对应的表格图像作为目标检测模型的输入,得到待识别表格中每个表格元素的位置特征和元素类别,元素类别包括文字行;通过文字识别模型对文字行进行文字识别,得到每个文字行的文本语义特征;通过图像特征提取模型对表格图像进行特征提取,得到图像特征图,并对图像特征图进行采样,得到每个表格元素分别对应的目标图像特征;根据位置特征、文本语义特征以及目标图像特征,通过预设关系提取模型得到用于表征待识别表格中每两个表格元素之间的拓扑关系的目标关系特征,根据目标关系特征通过预设分类模型确定用于表征待识别表格的表格结构的图邻接矩阵。


