基于视频的实时文本生成方法、装置及计算设备

授权公布号：CN113810730B

有效

申请

2021-09-17

申请公布

2021-12-17

授权

2023-08-01

预估到期

2041-09-17

申请号	CN202111091882.3
申请日	2021-09-17
申请公布号	CN113810730A
申请公布日	2021-12-17
授权公布号	CN113810730B
授权公告日	2023-08-01
分类号	H04N21/2187;H04N21/234;H04N21/266;H04N21/44;H04N21/466;H04N21/84
分类	电通信技术;
申请人名称	咪咕数字传媒有限公司
申请人地址	浙江省杭州市西湖区西溪银座1幢1层101室

专利法律状态

2023-08-01 授权

状态信息

授权

2022-01-04 实质审查的生效

状态信息

实质审查的生效；IPC(主分类):H04N21/2187；申请日:20210917

2021-12-17 公布

状态信息

公布

摘要

本发明公开了一种基于视频的实时文本生成方法、装置及计算设备，该方法包括：对视频的当前播放视频图像和已播放视频图像进行特征处理，得到第一视频帧特征向量、第二视频帧特征向量；根据第一视频帧特征向量、第二视频帧特征向量确定当前播放视频图像和已播放视频图像的关联关系，基于关联关系提取当前播放视频图像对应的关键特征向量，根据关键特征向量对第一视频帧特征向量进行修正，得到当前播放视频图像对应的编码特征向量；获取与视频关联的衍生数据，对衍生数据进行向量化处理，得到衍生数据特征向量；对编码特征向量、衍生数据特征向量进行解码处理，得到当前播放视频图像对应的实时视频文本，由此实现了生成生动、灵活和准确的视频文本。