授权公布号:CN115376518B
一种实时噪声大数据的声纹识别方法、系统、设备和介质
有效
申请
2022-10-26
申请公布
2022-11-22
授权
2023-01-20
预估到期
2042-10-26
| 申请号 | CN202211314627.5 |
| 申请日 | 2022-10-26 |
| 申请公布号 | CN115376518A |
| 申请公布日 | 2022-11-22 |
| 授权公布号 | CN115376518B |
| 授权公告日 | 2023-01-20 |
| 分类号 | G10L17/02;G10L17/04;G10L17/18;G10L17/26;G06F16/65;G06N3/0464;G06N3/047;G06N3/048;G06N3/084;G06F18/241;G06F18/2415 |
| 分类 | 乐器;声学; |
| 申请人名称 | 广州声博士声学技术有限公司 |
| 申请人地址 | 广东省广州市番禺区石楼镇华山路12号 |
专利法律状态
2023-01-20
授权
状态信息
授权
2022-11-22
公布
状态信息
公布
摘要
本发明提供了一种实时噪声大数据的声纹识别方法、系统、设备及介质,所述方法包括:获取环境噪声数据,并生成环境噪声数据的对数γ频谱图;将对数γ频谱图进行预处理,得到对应的三维对数γ频谱图;将三维对数γ频谱图输入至预先构建的包括依次连接的双重域特征提取模块、有效特征融合模块、下采样模块、全连接层和softmax分类器的高区分度双重域学习网络模型进行分类预测,得到对应的声纹识别结果。本发明通过使用门控循环单元网络和反事实因果注意力学习层并行提取时间结构特征和频率特征,并采用相似性矩阵与注意力机制结合的方式进行特征融合,有效提高了环境噪音分类模型的鲁棒性、运行效率以及分类精准性。


