授权公布号:CN112417093B
一种模型训练的方法及装置
有效
申请
2020-11-11
申请公布
2021-02-26
授权
2024-03-08
预估到期
2040-11-11
| 申请号 | CN202011252398.X |
| 申请日 | 2020-11-11 |
| 申请公布号 | CN112417093A |
| 申请公布日 | 2021-02-26 |
| 授权公布号 | CN112417093B |
| 授权公告日 | 2024-03-08 |
| 分类号 | G06F16/33;G06F16/35;G06F40/295;G06F18/214 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 北京三快在线科技有限公司 |
| 申请人地址 | 北京市海淀区北四环西路9号2106-030 |
专利法律状态
2024-03-08
授权
状态信息
授权
2021-04-27
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F16/33;申请日:20201111
2021-02-26
公布
状态信息
公布
摘要
本说明书公开了一种模型训练的方法及装置,可基于获取的样本文本数据,确定若干个频繁序列,将各频繁序列组成的集合作为第一集合,并从数据库中获取若干个词汇,将各词汇组成的集合作为第二集合,根据第一集合以及第二集合,确定第一集合中每个频繁序列的标注结果,根据第一集合中每个频繁序列的标注结果,对待训练的挖掘模型进行迭代训练。本说明书可对样本文本数据中的各频繁序列进行自动标注,并根据带有标注的各频繁序列,对挖掘模型进行训练,在对挖掘模型训练的过程中不断更新各频繁序列的标注,从而基于更新标注的频繁序列训练得到的挖掘模型的精确率与召回率得到平衡。


