授权公布号:CN113823300B
语音处理方法及装置、存储介质、电子设备
有效
申请
2021-09-18
申请公布
2021-12-21
授权
2024-03-22
预估到期
2041-09-18
| 申请号 | CN202111098086.2 |
| 申请日 | 2021-09-18 |
| 申请公布号 | CN113823300A |
| 申请公布日 | 2021-12-21 |
| 授权公布号 | CN113823300B |
| 授权公告日 | 2024-03-22 |
| 分类号 | G10L21/013;G10L25/03;G10L13/08;G10L13/027;G10L13/02 |
| 分类 | 乐器;声学; |
| 申请人名称 | 京东方科技集团股份有限公司 |
| 申请人地址 | 北京市朝阳区酒仙桥路10号 |
专利法律状态
2024-03-22
授权
状态信息
授权
2022-01-07
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L21/013;申请日:20210918
2021-12-21
公布
状态信息
公布
摘要
本公开属于语音克隆技术领域,涉及一种语音处理方法及装置、存储介质、电子设备。该方法包括:对目标视频进行分离得到音频轨道和视频轨道,并采集被模仿者的第一语音;提取第一语音的第一语音特征,并将第一语音特征和音频轨道中的第二语音输入音色转换模型,以将音频轨道中第二语音的音色从第二音色转换至第一音色;其中,第一音色与第一语音对应,第二音色与第二语音对应;将音色转换后的音频轨道与视频轨道合并,以得到具有被模仿者音色的目标视频。在本公开中,通过识别第二语音的音素,实现了任意第二语音的音色的转换。


