品牌网
公司信息商标信息专利信息
授权公布号:CN116631379B
语音识别方法、装置、设备及存储介质
有效
申请
2023-07-20
申请公布
2023-08-22
授权
2023-09-26
预估到期
2043-07-20
申请号 CN202310889848.3
申请日 2023-07-20
申请公布号 CN116631379A
申请公布日 2023-08-22
授权公布号 CN116631379B
授权公告日 2023-09-26
分类号 G10L15/02;G10L15/06;G10L15/16;G10L15/26
分类 乐器;声学;
申请人名称 中邮消费金融有限公司
申请人地址 广东省广州市南沙区海滨路171号南沙金融大厦11楼1101之一J30

专利法律状态

2023-09-26 授权
状态信息
授权
2023-09-08 实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L15/02;申请日:20230720
2023-08-22 公布
状态信息
公布

摘要

本发明涉及人工智能技术领域,并公开了一种语音识别方法、装置、设备及存储介质,该方法包括:采集用户原始语音,并对用户原始语音进行预处理,得到声学特征序列;将声学特征序列输入至预设语音识别模型中,以使预设语音识别模型对声学特征序列进行解码,得到文本序列,预设语音识别模型为基于CTC损失和AED损失对初始大语音模型进行训练后得到的模型;基于文本序列完成对用户原始语音的语音识别。由于本发明通过预设语音识别模型来完成语音识别,该预设语音识别模型基于CTC损失和AED损失训练、并在训练过程中选择局部损失最小的模型进行多批次平均后构建,从而在训练样本数据较少的情况下也能够准确地进行语音识别。