授权公布号:CN108899009B
一种基于音素的中文语音合成系统
有效
申请
2018-08-17
申请公布
2018-11-27
授权
2020-07-03
预估到期
2038-08-17
| 申请号 | CN201810938392.4 |
| 申请日 | 2018-08-17 |
| 申请公布号 | CN108899009A |
| 申请公布日 | 2018-11-27 |
| 授权公布号 | CN108899009B |
| 授权公告日 | 2020-07-03 |
| 分类号 | G10L13/08;G10L13/10;G10L13/047 |
| 分类 | 乐器;声学; |
| 申请人名称 | 百卓网络科技有限公司 |
| 申请人地址 | 江苏省南京市江北新区惠达路6号北斗大厦2号楼70室 |
专利法律状态
2020-07-03
授权
状态信息
授权
2018-12-21
实质审查的生效
状态信息
实质审查的生效IPC(主分类):G10L 13/08
2018-11-27
公布
状态信息
公开
摘要
本发明公开了一种基于音素的中文语音合成方法,其特征在于,包括如下步骤:步骤1,对文本与音频进行预处理;步骤2,构造音素集;步骤3,利用one‑hot将音素序列转化为字ID,训练生成转词向量,通过基于encoder‑decoder的Seq2Seq的结构生成频谱序列特征;步骤4,结合频谱序列与音频的语音信息,由声码器合成语音;步骤5,合成的音频分别去除尾部静音,按一定顺序将音频进行拼接。本方法合成的语音更加贴近于真人发音,以及在区分多音字与确定停顿位置上较传统的都有很大提升,最主要的是合成的准确率可以达到95%以上。


