授权公布号:CN110414319B
一种公式相似度计算方法和科技文档检索方法及装置
有效
申请
2019-06-13
申请公布
2019-11-05
授权
2021-08-31
预估到期
2039-06-13
| 申请号 | CN201910510665.X |
| 申请日 | 2019-06-13 |
| 申请公布号 | CN110414319A |
| 申请公布日 | 2019-11-05 |
| 授权公布号 | CN110414319B |
| 授权公告日 | 2021-08-31 |
| 分类号 | G06K9/00;G06F16/332;G06F16/338 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 中国软件与技术服务股份有限公司 |
| 申请人地址 | 北京市海淀区学院南路55号(中软大厦) |
专利法律状态
2021-08-31
授权
状态信息
授权
2019-11-29
实质审查的生效
状态信息
实质审查的生效
2019-11-05
公布
状态信息
公布
摘要
本发明涉及一种基于有效匹配子树的公式相似度计算方法和科技文档检索方法及装置。该公式相似度计算方法包括:1)将数学公式解析为树结构,并从树结构中提取有效子树信息;2)利用提取的有效子树信息,将数学公式表示为有效子树的有序多重集;3)根据有效子树找到有效匹配子树,并计算有效匹配子树的权重加和,得到权重和相似度;4)对权重和相似度进行标准化处理,得到最终的公式相似度。进一步可基于该公式相似度计算方法进行科技文档检索。本发明能够解决现有技术中公式子树不独立而产生的无效匹配问题,能够使公式相似度计算的准确性得到明显提升。


