授权公布号:CN113642291B
上市公司报告的逻辑结构树构建方法、系统、存储介质及终端
有效
申请
2021-08-10
申请公布
2021-11-12
授权
2022-10-18
预估到期
2041-08-10
| 申请号 | CN202110915112.X |
| 申请日 | 2021-08-10 |
| 申请公布号 | CN113642291A |
| 申请公布日 | 2021-11-12 |
| 授权公布号 | CN113642291B |
| 授权公告日 | 2022-10-18 |
| 分类号 | G06F40/14;G06F40/154 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 东方财富信息股份有限公司 |
| 申请人地址 | 上海市嘉定区宝安公路2999号1幢 |
专利法律状态
2022-10-18
授权
状态信息
授权
2021-11-12
公布
状态信息
公布
摘要
本发明提供一种上市公司报告的逻辑结构树构建方法、系统、存储介质及终端,包括以下步骤:将上市公司报告转换为html格式文档;对所述html格式文档进行预处理,获取html层级结构文档;获取逻辑结构树的预设结构,在所述html层级结构文档中抽取所述预设结构的各级节点;基于所述各级节点,基于文本匹配的方式提取匹配内容以获取所述逻辑结构树。本发明的上市公司报告的逻辑结构树构建方法、系统、存储介质及终端基于上市公司报告的层级结构,提取特定节点信息来构建逻辑结构树,实现了上市公司报告信息的有效处理。


