一种语音识别模型的训练方法和装置

授权公布号：CN111768761B

一种语音识别模型的训练方法和装置

有效

申请

2019-03-14

申请公布

2020-10-13

授权

2024-03-01

预估到期

2039-03-14

申请号	CN201910193085.2
申请日	2019-03-14
申请公布号	CN111768761A
申请公布日	2020-10-13
授权公布号	CN111768761B
授权公告日	2024-03-01
分类号	G10L15/06;G10L15/22;G10L15/26;G10L25/45
分类	乐器；声学;
申请人名称	京东科技控股股份有限公司
申请人地址	北京市大兴区北京经济技术开发区科创十一街18号C座2层221室

专利法律状态

2024-03-01 授权

状态信息

授权

2022-01-07 实质审查的生效

状态信息

实质审查的生效；IPC(主分类):G10L15/06；申请日:20190314

2021-12-24 著录事项变更

状态信息

著录事项变更；IPC(主分类):G10L15/06；变更事项:申请人；变更前:京东数字科技控股有限公司；变更后:京东科技控股股份有限公司；变更事项:地址；变更前:100176 北京市经济技术开发区科创十一街18号C座2层221室；变更后:100176 北京市大兴区北京经济技术开发区科创十一街18号C座2层221室

2020-10-13 公布

状态信息

公布

摘要

本发明提供了一种语音识别模型的训练方法和装置，该方法中，按照各建模项在语音样本中的出现频率从高到低排序构成频率表，利用滑动窗口在频率表上滑动，对每个滑动窗口进行适用于第一训练阶段或第二训练阶段的判断，将语音识别模型的训练过程分为两个训练阶段，在第一训练阶段以高频建模项为学习目标实施简单的语音识别模型训练，在第二训练阶段以低频建模项为学习目标，对出现频率较低的建模项通过重用相关低频语音数据来增加被学习的次数。本发明能够在参与训练的语音数据不充足或语音数据类别不均衡的情况下，提高训练得到的语音识别模型的语音识别准确率。