授权公布号:CN113225612B
字幕生成方法、装置、计算机可读存储介质及电子设备
有效
申请
2021-04-14
申请公布
2021-08-06
授权
2022-10-11
预估到期
2041-04-14
| 申请号 | CN202110402433.X |
| 申请日 | 2021-04-14 |
| 申请公布号 | CN113225612A |
| 申请公布日 | 2021-08-06 |
| 授权公布号 | CN113225612B |
| 授权公告日 | 2022-10-11 |
| 分类号 | H04N21/439;H04N21/4402;H04N21/488;G10L15/26;G10L15/04;G10L15/02;G10L15/06;G06F40/30;G06F40/216;G06F16/35 |
| 分类 | 电通信技术; |
| 申请人名称 | 新东方教育科技集团有限公司 |
| 申请人地址 | 北京市海淀区海淀中街6号9层 |
专利法律状态
2022-10-11
授权
状态信息
授权
2021-08-06
公布
状态信息
公布
摘要
本公开涉及一种字幕生成方法、装置、计算机可读存储介质及电子设备。方法包括:获取待生成字幕的目标视频的音频数据;将音频数据进行切分,得到多个音频片段;针对各音频片段,提取音频片段对应的第一文本数据;提取第一文本数据的字符语义特征、短语语义特征及音素特征;根据字符语义特征、短语语义特征及音素特征,对第一文本数据进行修正,得到音频片段对应的第二文本数据;将每一音频片段对应的第二文本数据合并,得到目标视频的字幕信息。这样,利用第一文本数据的字符语义特征、短语语义特征及音素特征对其进行修正,可保证第一文本数据和视频字幕的准确性。另外,各音频片段可并行进行文本数据的提取以及修正操作,从而提升字幕生成效率。


