授权公布号:CN115954019B
一种融合自注意力和卷积操作的环境噪声识别方法及系统
有效
申请
2023-03-03
申请公布
2023-04-11
授权
2023-05-30
预估到期
2043-03-03
| 申请号 | CN202310196580.5 |
| 申请日 | 2023-03-03 |
| 申请公布号 | CN115954019A |
| 申请公布日 | 2023-04-11 |
| 授权公布号 | CN115954019B |
| 授权公告日 | 2023-05-30 |
| 分类号 | G10L25/51;G10L25/30;G06N3/0442;G06N3/0464;G06N3/08;G01H17/00 |
| 分类 | 乐器;声学; |
| 申请人名称 | 广州声博士声学技术有限公司 |
| 申请人地址 | 广东省广州市番禺区石楼镇华山路12号 |
专利法律状态
2023-05-30
授权
状态信息
授权
2023-04-28
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L 25/51;专利申请号:2023101965805;申请日:20230303
2023-04-11
公布
状态信息
公布
摘要
本发明提供了一种融合自注意力和卷积操作的环境噪声识别方法及系统,所述方法包括:获取待分析环境噪声数据;对所述待分析环境噪声数据进行预处理,得到对应的声音频谱图;将所述声音频谱图输入至预先构建的环境噪声识别网络模型进行分类预测,得到对应的声纹识别结果;所述环境噪声识别网络模型包括依次连接的声纹特征提取模块、奇异值分解特征精炼模块、上下文特征提取模块和MLP分类器。本发明通过设计采用自注意力机制和卷积操作融合对声谱图进行特征提取,采用奇异值分解对声谱图特征进行个性特征筛选,以及结合基于注意力的双向门控循环单元网络进一步提取时序特征的全新声纹识别模型,能有效提高环境噪音识别的鲁棒性、精准性和高效性。


