授权公布号:CN116631379B
语音识别方法、装置、设备及存储介质
有效
申请
2023-07-20
申请公布
2023-08-22
授权
2023-09-26
预估到期
2043-07-20
| 申请号 | CN202310889848.3 |
| 申请日 | 2023-07-20 |
| 申请公布号 | CN116631379A |
| 申请公布日 | 2023-08-22 |
| 授权公布号 | CN116631379B |
| 授权公告日 | 2023-09-26 |
| 分类号 | G10L15/02;G10L15/06;G10L15/16;G10L15/26 |
| 分类 | 乐器;声学; |
| 申请人名称 | 中邮消费金融有限公司 |
| 申请人地址 | 广东省广州市南沙区海滨路171号南沙金融大厦11楼1101之一J30 |
专利法律状态
2023-09-26
授权
状态信息
授权
2023-09-08
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L15/02;申请日:20230720
2023-08-22
公布
状态信息
公布
摘要
本发明涉及人工智能技术领域,并公开了一种语音识别方法、装置、设备及存储介质,该方法包括:采集用户原始语音,并对用户原始语音进行预处理,得到声学特征序列;将声学特征序列输入至预设语音识别模型中,以使预设语音识别模型对声学特征序列进行解码,得到文本序列,预设语音识别模型为基于CTC损失和AED损失对初始大语音模型进行训练后得到的模型;基于文本序列完成对用户原始语音的语音识别。由于本发明通过预设语音识别模型来完成语音识别,该预设语音识别模型基于CTC损失和AED损失训练、并在训练过程中选择局部损失最小的模型进行多批次平均后构建,从而在训练样本数据较少的情况下也能够准确地进行语音识别。


