品牌网
公司信息商标信息专利信息
授权公布号:CN113225612B
字幕生成方法、装置、计算机可读存储介质及电子设备
有效
申请
2021-04-14
申请公布
2021-08-06
授权
2022-10-11
预估到期
2041-04-14
申请号 CN202110402433.X
申请日 2021-04-14
申请公布号 CN113225612A
申请公布日 2021-08-06
授权公布号 CN113225612B
授权公告日 2022-10-11
分类号 H04N21/439;H04N21/4402;H04N21/488;G10L15/26;G10L15/04;G10L15/02;G10L15/06;G06F40/30;G06F40/216;G06F16/35
分类 电通信技术;
申请人名称 新东方教育科技集团有限公司
申请人地址 北京市海淀区海淀中街6号9层

专利法律状态

2022-10-11 授权
状态信息
授权
2021-08-06 公布
状态信息
公布

摘要

本公开涉及一种字幕生成方法、装置、计算机可读存储介质及电子设备。方法包括:获取待生成字幕的目标视频的音频数据;将音频数据进行切分,得到多个音频片段;针对各音频片段,提取音频片段对应的第一文本数据;提取第一文本数据的字符语义特征、短语语义特征及音素特征;根据字符语义特征、短语语义特征及音素特征,对第一文本数据进行修正,得到音频片段对应的第二文本数据;将每一音频片段对应的第二文本数据合并,得到目标视频的字幕信息。这样,利用第一文本数据的字符语义特征、短语语义特征及音素特征对其进行修正,可保证第一文本数据和视频字幕的准确性。另外,各音频片段可并行进行文本数据的提取以及修正操作,从而提升字幕生成效率。