授权公布号:CN113723070B
文本相似度模型训练方法、文本相似度检测方法及装置
有效
申请
2021-08-20
申请公布
2021-11-30
授权
2024-01-23
预估到期
2041-08-20
| 申请号 | CN202110958349.6 |
| 申请日 | 2021-08-20 |
| 申请公布号 | CN113723070A |
| 申请公布日 | 2021-11-30 |
| 授权公布号 | CN113723070B |
| 授权公告日 | 2024-01-23 |
| 分类号 | G06F40/194;G06F40/126;G06F40/279;G06N3/045;G06N3/0442;G06N3/0464 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 上海浦东发展银行股份有限公司 |
| 申请人地址 | 上海市黄浦区中山东一路12号 |
专利法律状态
2024-01-23
授权
状态信息
授权
2021-12-17
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F40/194;申请日:20210820
2021-11-30
公布
状态信息
公布
摘要
本申请涉及一种文本相似度模型训练方法、文本相似度检测方法及装置。其中方法通过分别对第一文本样本和第二文本样本进行编码处理,得到对应的第一特征编码和第二特征编码,通过第一特征编码和第二特征编码对孪生神经网络进行训练,并获取孪生神经网络训练后的损失,基于损失确定第一特征编码的第一扰动特征以及第二特征编码的第二扰动特征,进而对孪生神经网络进行迭代训练,从而得到用于文本相似度检测的文本相似度检测模型。由于本公开基于训练过程中的损失可以通过计算而产生新的训练数据,从而使得模型能够使用更多的数据进行训练,不仅可以提高模型的鲁棒性,还可以提升模型的泛化能力以及准确率。


