授权公布号:CN111768761B
一种语音识别模型的训练方法和装置
有效
申请
2019-03-14
申请公布
2020-10-13
授权
2024-03-01
预估到期
2039-03-14
| 申请号 | CN201910193085.2 |
| 申请日 | 2019-03-14 |
| 申请公布号 | CN111768761A |
| 申请公布日 | 2020-10-13 |
| 授权公布号 | CN111768761B |
| 授权公告日 | 2024-03-01 |
| 分类号 | G10L15/06;G10L15/22;G10L15/26;G10L25/45 |
| 分类 | 乐器;声学; |
| 申请人名称 | 京东科技控股股份有限公司 |
| 申请人地址 | 北京市大兴区北京经济技术开发区科创十一街18号C座2层221室 |
专利法律状态
2024-03-01
授权
状态信息
授权
2022-01-07
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L15/06;申请日:20190314
2021-12-24
著录事项变更
状态信息
著录事项变更;IPC(主分类):G10L15/06;变更事项:申请人;变更前:京东数字科技控股有限公司;变更后:京东科技控股股份有限公司;变更事项:地址;变更前:100176 北京市经济技术开发区科创十一街18号C座2层221室;变更后:100176 北京市大兴区北京经济技术开发区科创十一街18号C座2层221室
2020-10-13
公布
状态信息
公布
摘要
本发明提供了一种语音识别模型的训练方法和装置,该方法中,按照各建模项在语音样本中的出现频率从高到低排序构成频率表,利用滑动窗口在频率表上滑动,对每个滑动窗口进行适用于第一训练阶段或第二训练阶段的判断,将语音识别模型的训练过程分为两个训练阶段,在第一训练阶段以高频建模项为学习目标实施简单的语音识别模型训练,在第二训练阶段以低频建模项为学习目标,对出现频率较低的建模项通过重用相关低频语音数据来增加被学习的次数。本发明能够在参与训练的语音数据不充足或语音数据类别不均衡的情况下,提高训练得到的语音识别模型的语音识别准确率。


