授权公布号:CN112562649B
一种音频处理的方法、装置、可读存储介质和电子设备
有效
申请
2020-12-07
申请公布
2021-03-26
授权
2024-01-30
预估到期
2040-12-07
| 申请号 | CN202011435851.0 |
| 申请日 | 2020-12-07 |
| 申请公布号 | CN112562649A |
| 申请公布日 | 2021-03-26 |
| 授权公布号 | CN112562649B |
| 授权公告日 | 2024-01-30 |
| 分类号 | G10L15/06;G10L15/16;G10L15/26;G10L17/00;G10L21/0208 |
| 分类 | 乐器;声学; |
| 申请人名称 | 北京大米科技有限公司 |
| 申请人地址 | 北京市海淀区清河安宁庄东路18号23号楼二层2223 |
专利法律状态
2024-01-30
授权
状态信息
授权
2021-04-13
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L15/06;申请日:20201207
2021-03-26
公布
状态信息
公布
摘要
本发明实施例公开了一种音频处理的方法、装置、可读存储介质和电子设备。本发明实施例通过获取设定时长的第一音频;将所述第一音频输入到预先训练的音频检测模型,确定所述第一音频中的包括的至少一种语音类型,并确定所述至少一种语音类型中至少一种候选语音类型,其中,所述语音类型包括目标语音、非目标语音、干扰语音或背景噪声中的至少一项;在所述第一音频中通过预先训练的音频处理模型分离所述候选语音类型对应的至少一个音频流;根据所述至少一个音频流确定第二音频。通过上述方法,可以将目标语音对应的音频流从第一音频中分离出来,消除了非目标语音、干扰语音或背景噪声对目标语音的干扰。


