一种实时噪声大数据的声纹识别方法、系统、设备和介质

授权公布号：CN115376518B

有效

申请

2022-10-26

申请公布

2022-11-22

授权

2023-01-20

预估到期

2042-10-26

申请号	CN202211314627.5
申请日	2022-10-26
申请公布号	CN115376518A
申请公布日	2022-11-22
授权公布号	CN115376518B
授权公告日	2023-01-20
分类号	G10L17/02;G10L17/04;G10L17/18;G10L17/26;G06F16/65;G06N3/0464;G06N3/047;G06N3/048;G06N3/084;G06F18/241;G06F18/2415
分类	乐器；声学;
申请人名称	广州声博士声学技术有限公司
申请人地址	广东省广州市番禺区石楼镇华山路12号

专利法律状态

2023-01-20 授权

状态信息

授权

2022-11-22 公布

状态信息

公布

摘要

本发明提供了一种实时噪声大数据的声纹识别方法、系统、设备及介质，所述方法包括：获取环境噪声数据，并生成环境噪声数据的对数γ频谱图；将对数γ频谱图进行预处理，得到对应的三维对数γ频谱图；将三维对数γ频谱图输入至预先构建的包括依次连接的双重域特征提取模块、有效特征融合模块、下采样模块、全连接层和softmax分类器的高区分度双重域学习网络模型进行分类预测，得到对应的声纹识别结果。本发明通过使用门控循环单元网络和反事实因果注意力学习层并行提取时间结构特征和频率特征，并采用相似性矩阵与注意力机制结合的方式进行特征融合，有效提高了环境噪音分类模型的鲁棒性、运行效率以及分类精准性。