授权公布号:CN111553140B
数据处理方法、数据处理设备及计算机存储介质
有效
申请
2020-05-13
申请公布
2020-08-18
授权
2024-03-19
预估到期
2040-05-13
| 申请号 | CN202010402612.9 |
| 申请日 | 2020-05-13 |
| 申请公布号 | CN111553140A |
| 申请公布日 | 2020-08-18 |
| 授权公布号 | CN111553140B |
| 授权公告日 | 2024-03-19 |
| 分类号 | G06F40/20;G06F40/35;G06F18/22;G06F18/214;G06F16/35;G06F16/36 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 金蝶软件(中国)有限公司 |
| 申请人地址 | 广东省深圳市南山区科技园科技南十二路2号金蝶软件园A座1-8层 |
专利法律状态
2024-03-19
授权
状态信息
授权
2020-09-11
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F40/20;申请日:20200513
2020-08-18
公布
状态信息
公布
摘要
本申请实施例公开了一种数据处理方法、数据处理设备及计算机存储介质,用于解决单一的文本相似度算法难以准确地匹配到高相似度文本的问题。本申请实施例方法包括:第一训练样本和第二训练样本经过n种文本相似度算法计算得到n个第一初始相似度得分,获取标准相似度得分,将n个第一初始相似度得分作为相似度计算模型的变量的取值,并将标准相似度得分作为因变量的取值,对相似度计算模型进行训练,得到相似度计算模型的参数,从而变量、因变量及参数构成训练完成的相似度计算模型,该训练完成的相似度计算模型对多种文本相似度算法的计算结果与相似度得分的真实值进行了拟合,综合了多种文本相似度算法的优点,可以得到更准确的相似度得分。


