授权公布号:CN112599113B
方言语音合成方法、装置、电子设备和可读存储介质
有效
申请
2020-12-30
申请公布
2021-04-02
授权
2024-01-30
预估到期
2040-12-30
| 申请号 | CN202011611428.1 |
| 申请日 | 2020-12-30 |
| 申请公布号 | CN112599113A |
| 申请公布日 | 2021-04-02 |
| 授权公布号 | CN112599113B |
| 授权公告日 | 2024-01-30 |
| 分类号 | G10L13/08;G10L13/10;G10L13/033;G10L25/27;G10L25/90 |
| 分类 | 乐器;声学; |
| 申请人名称 | 北京大米科技有限公司 |
| 申请人地址 | 北京市海淀区清河安宁庄东路18号23号楼二层2223 |
专利法律状态
2024-01-30
授权
状态信息
授权
2021-04-23
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L13/08;申请日:20201230
2021-04-02
公布
状态信息
公布
摘要
本发明实施例提供了一种方言语音合成方法、装置、电子设备和可读存储介质,涉及计算机技术领域,通过本发明实施例,可以基于发音向量中的韵律信息以及发音向量对应的发音时长,使得合成语音可以具有停顿、延长音等人类常用的说话形式,然后,还可以基于方言音调为合成语音附加方言独有的音高(也即方言独有的发音方式),使得合成语音更加贴近人类的说话方式,最终,基于发音向量、发音时长以及方言音调确定的合成语音可以与人声具有较高的相似度。


