用于生成字幕器以及输出字幕的方法和装置

授权公布号：CN113052090B

用于生成字幕器以及输出字幕的方法和装置

有效

申请

2021-03-30

申请公布

2021-06-29

授权

2024-03-05

预估到期

2041-03-30

申请号	CN202110338045.X
申请日	2021-03-30
申请公布号	CN113052090A
申请公布日	2021-06-29
授权公布号	CN113052090B
授权公告日	2024-03-05
分类号	G06V20/40;G06V20/00;G06V10/774;G06V10/82;G06N3/0442;G06F40/30
分类	计算；推算；计数;
申请人名称	京东科技控股股份有限公司
申请人地址	北京市大兴区北京经济技术开发区科创十一街18号C座2层221室

专利法律状态

2024-03-05 授权

状态信息

授权

2021-12-14 著录事项变更

状态信息

著录事项变更；IPC(主分类):G06K9/00；变更事项:申请人；变更前:京东数字科技控股股份有限公司；变更后:京东科技控股股份有限公司；变更事项:地址；变更前:100176 北京市大兴区北京经济技术开发区科创十一街18号C座2层221室；变更后:100176 北京市大兴区北京经济技术开发区科创十一街18号C座2层221室

2021-07-16 实质审查的生效

状态信息

实质审查的生效；IPC(主分类):G06K9/00；申请日:20210330

2021-06-29 公布

状态信息

公布

摘要

本公开的实施例公开了用于生成字幕器的方法和装置和用于输出字幕的方法和装置。该方法的具体实施方式包括：获取样本图像集；将样本图像集输入句子生成器的图像编码器，输出对象集；将对象集分组成第一对象集和第二对象集，其中，第一对象集为被包含在预定对象集内的对象集，第二对象集为被排除在预定对象集外的对象集；将图像编码器输出的对象集输入句子生成器的句子解码器，在解码步骤中以第一对象集、第二对象集为约束条件进行波束搜索，生成伪图像句子对集；将伪图像句子对集作为样本集训练句子生成器，得到字幕器。该实施方式通过基于语义约束的自学习框架生成了字幕器，提高了字幕生成的质量。