授权公布号:CN112927677B
语音合成方法和装置
有效
申请
2021-03-29
申请公布
2021-06-08
授权
2023-07-25
预估到期
2041-03-29
| 申请号 | CN202110335308.1 |
| 申请日 | 2021-03-29 |
| 申请公布号 | CN112927677A |
| 申请公布日 | 2021-06-08 |
| 授权公布号 | CN112927677B |
| 授权公告日 | 2023-07-25 |
| 分类号 | G10L13/08;G10L13/02 |
| 分类 | 乐器;声学; |
| 申请人名称 | 北京大米科技有限公司 |
| 申请人地址 | 北京市海淀区清河安宁庄东路18号23号楼二层2223 |
专利法律状态
2023-07-25
授权
状态信息
授权
2021-06-25
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G10L13/08;申请日:20210329
2021-06-08
公布
状态信息
公布
摘要
本发明实施例公开了一种语音合成方法和装置,通过文本信息对应的音素序列、音频信息对应的音频特征向量序列以及目标场景对应的场景特征向量,根据音素序列、音频特征向量序列和场景特征向量进行语音合成,以确定对应的语音信息。本发明实施例通过在语音合成过程中直接引入场景特征,使得通过同一语音合成方式在不同场景合成情感、语气不同的语音,实现了语音信息与场景的自动匹配。


