品牌网
公司信息商标信息专利信息
授权公布号:CN108899009B
一种基于音素的中文语音合成系统
有效
申请
2018-08-17
申请公布
2018-11-27
授权
2020-07-03
预估到期
2038-08-17
申请号 CN201810938392.4
申请日 2018-08-17
申请公布号 CN108899009A
申请公布日 2018-11-27
授权公布号 CN108899009B
授权公告日 2020-07-03
分类号 G10L13/08;G10L13/10;G10L13/047
分类 乐器;声学;
申请人名称 百卓网络科技有限公司
申请人地址 江苏省南京市江北新区惠达路6号北斗大厦2号楼70室

专利法律状态

2020-07-03 授权
状态信息
授权
2018-12-21 实质审查的生效
状态信息
实质审查的生效IPC(主分类):G10L 13/08
2018-11-27 公布
状态信息
公开

摘要

本发明公开了一种基于音素的中文语音合成方法,其特征在于,包括如下步骤:步骤1,对文本与音频进行预处理;步骤2,构造音素集;步骤3,利用one‑hot将音素序列转化为字ID,训练生成转词向量,通过基于encoder‑decoder的Seq2Seq的结构生成频谱序列特征;步骤4,结合频谱序列与音频的语音信息,由声码器合成语音;步骤5,合成的音频分别去除尾部静音,按一定顺序将音频进行拼接。本方法合成的语音更加贴近于真人发音,以及在区分多音字与确定停顿位置上较传统的都有很大提升,最主要的是合成的准确率可以达到95%以上。