授权公布号:CN115221857B
一种含数值类型的数据相似性检测方法及装置
有效
申请
2022-09-21
申请公布
2022-10-21
授权
2023-01-13
预估到期
2042-09-21
| 申请号 | CN202211146625.X |
| 申请日 | 2022-09-21 |
| 申请公布号 | CN115221857A |
| 申请公布日 | 2022-10-21 |
| 授权公布号 | CN115221857B |
| 授权公告日 | 2023-01-13 |
| 分类号 | G06F40/194;G06F40/151;G06F40/279 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 中国电子信息产业集团有限公司 |
| 申请人地址 | 北京市海淀区中关村东路66号院甲1号(世纪科贸大厦A座) |
专利法律状态
2023-01-13
授权
状态信息
授权
2022-10-21
公布
状态信息
公布
摘要
本申请公开了一种含数值类型的数据相似性检测方法及装置,所述相似性检测方法包括如下步骤:统一原始数据资源和数据元件结果中的数值类型数据的基线,并在统一基线后进行数值标准化变换;对数值标准化变换之后的原始数据资源和数据元件结果分别进行字符串转换;利用不同的距离判据计算原始数据资源以及数据元件结果对应的字符串之间的相似度。本申请实施例设计了数值标准化变换过程、数据资源和数据元件结果分别进行字符串转化过程,并利用利用不同的距离判据来计算两者的相似性,解决了传统文本相似性检测和哈希算法所存在不能检测数值变换相似性、漏检、低效等问题。


