品牌网
公司信息商标信息专利信息
授权公布号:CN110084250B
一种图像描述的方法及系统
有效
申请
2019-04-26
申请公布
2019-08-02
授权
2024-03-12
预估到期
2039-04-26
申请号 CN201910346442.4
申请日 2019-04-26
申请公布号 CN110084250A
申请公布日 2019-08-02
授权公布号 CN110084250B
授权公告日 2024-03-12
分类号 G06V20/70;G06V10/25;G06V10/46;G06V10/764;G06V10/82;G06N3/0442;G06N3/09;G06T9/00
分类 计算;推算;计数;
申请人名称 北京金山数字娱乐科技有限公司
申请人地址 北京市海淀区小营西路33号金山软件大厦2层西区

专利法律状态

2024-03-12 授权
状态信息
授权
2019-08-27 实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06K9/46;申请日:20190426
2019-08-02 公布
状态信息
公布

摘要

本申请提供一种图像描述的方法及系统,所述方法包括:将目标图像进行编码,得到对应的编码特征和全局池化特征;根据编码特征、全局池化特征和第一语言模型的初始参考特征,得到初始聚合特征,将初始聚合特征输入至第二语言模型生成第二语言模型的初始参考特征,并生成第1个输出词语;根据编码特征、全局池化特征以及第t个输出词语得到第t个聚合特征,将第t个聚合特征输入至第二语言模型生成第t个参考特征,直至满足迭代终止条件,得到第t+1个输出词语;根据第1至第t+1个输出词语生成目标图像对应的描述语句,可以根据聚合特征的生成实现对图像的感兴趣区域的灵活选取,更完整地保留图像的局部信息,更灵活地选取图像信息。