授权公布号:CN111008266B
文本分析模型的训练方法及装置、文本分析方法及装置
有效
申请
2019-12-06
申请公布
2020-04-14
授权
2023-09-26
预估到期
2039-12-06
| 申请号 | CN201911244168.6 |
| 申请日 | 2019-12-06 |
| 申请公布号 | CN111008266A |
| 申请公布日 | 2020-04-14 |
| 授权公布号 | CN111008266B |
| 授权公告日 | 2023-09-26 |
| 分类号 | G06F16/33;G06F16/35;G06F40/289;G06F40/30 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 北京金山数字娱乐科技有限公司 |
| 申请人地址 | 北京市海淀区小营西路33号金山软件大厦2层西区 |
专利法律状态
2023-09-26
授权
状态信息
授权
2020-05-08
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F16/33;申请日:20191206
2020-04-14
公布
状态信息
公布
摘要
本申请提供一种文本分析模型的训练方法及装置、文本分析方法及装置。其中,所述文本分析模型的训练方法,包括:获取训练样本,并输入至文本分析模型中,生成线性矩阵;基于所述线性矩阵进行处理,生成分数矩阵;基于所述分数矩阵与预先设置有掩盖位置的掩盖矩阵生成分数更新矩阵,以掩盖所述训练样本中的至少一个词单元;基于所述分数更新矩阵和所述线性矩阵进行自注意力处理,预测所述训练样本中掩盖的词单元,并基于预测结果与真实结果确定损失值;基于所述损失值对所述文本分析模型进行训练,直至达到训练停止条件。本申请提供的方法及装置,可以有效提高模型训练效果,有效提高文本分析的准确率。


