授权公布号:CN113641746B
文档结构化方法、装置、电子设备和存储介质
有效
申请
2021-08-20
申请公布
2021-11-12
授权
2024-02-20
预估到期
2041-08-20
| 申请号 | CN202110961595.7 |
| 申请日 | 2021-08-20 |
| 申请公布号 | CN113641746A |
| 申请公布日 | 2021-11-12 |
| 授权公布号 | CN113641746B |
| 授权公告日 | 2024-02-20 |
| 分类号 | G06F16/25;G06F16/35;G06V30/40;G06V30/18;G06V30/19;G06V10/82;G06N3/0455;G06N3/0464;G06N3/084 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 科大讯飞股份有限公司 |
| 申请人地址 | 安徽省合肥市高新开发区望江西路666号 |
专利法律状态
2024-02-20
授权
状态信息
授权
2021-11-30
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F16/25;申请日:20210820
2021-11-12
公布
状态信息
公布
摘要
本发明提供一种文档结构化方法、装置、电子设备和存储介质,所述方法包括:提取目标文档中各文本行的视觉特征;基于各文本行的视觉特征,对各文本行逐行进行结构关系解码和基于结构关系的结构化类型解码,得到各文本行之间的结构关系,以及各文本行的结构化类型;基于各文本行之间的结构关系,以及各文本行的结构化类型,对目标文档进行结构化处理。本发明基于目标文档中各文本行的视觉特征,确定各文本行之间的结构关系以及各文本行的结构化类型,并基于各文本行之间的结构关系,以及各文本行的结构化类型,对目标文档进行结构化处理,使得结构化处理后的目标文档能够准确表征有各文本行之间的空间结构信息,鲁棒性较高。


