授权公布号:CN112365878B
语音合成方法、装置、设备及计算机可读存储介质
有效
申请
2020-10-30
申请公布
2021-02-12
授权
2024-01-23
预估到期
2040-10-30
| 申请号 | CN202011191060.8 |
| 申请日 | 2020-10-30 |
| 申请公布号 | CN112365878A |
| 申请公布日 | 2021-02-12 |
| 授权公布号 | CN112365878B |
| 授权公告日 | 2024-01-23 |
| 分类号 | G10L13/08;G10L13/047;G10L13/04;G10L25/30 |
| 分类 | 乐器;声学; |
| 申请人名称 | 广州华多网络科技有限公司 |
| 申请人地址 | 广东省广州市番禺区南村镇万博商务区万达广场B-1栋29层 |
专利法律状态
2024-01-23
授权
状态信息
授权
2021-03-05
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L13/08;申请日:20201030
2021-02-12
公布
状态信息
公布
摘要
本申请提供了语音合成方法、装置、设备及计算机可读存储介质,涉及语音处理技术领域。该方法通过获取输入的多语言混合的文本信息,将文本信息转换为混合音素文本,利用预先编制的多语言混合音素字典查找混合音素文本中各音素对应的音素编号得到音素编号序列,基于音素编号序列预测生成频谱参数序列;其中,多语言混合音素字典依据多种语言的基础音素进行编写;利用声码器将频谱参数序列转换为对应的时序语音信号,合成混合语音,本技术方案实现了利用同一融合有多种语言的基础音素的多语言混合字典,能够合成具有同一音色的混合语音,自然流畅,降低混合语音的合成成本。


