授权公布号:CN110163285B
票证识别训练样本合成方法和计算机存储介质
有效
申请
2019-05-23
申请公布
2019-08-23
授权
2021-03-02
预估到期
2039-05-23
| 申请号 | CN201910435628.7 |
| 申请日 | 2019-05-23 |
| 申请公布号 | CN110163285A |
| 申请公布日 | 2019-08-23 |
| 授权公布号 | CN110163285B |
| 授权公告日 | 2021-03-02 |
| 分类号 | G06K9/62;G06K9/00 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 阳光保险集团股份有限公司 |
| 申请人地址 | 广东省深圳市福田区红荔西路7002号第一世界广场A座17层 |
专利法律状态
2021-03-02
授权
状态信息
授权
2019-09-17
实质审查的生效
状态信息
实质审查的生效
2019-08-23
公布
状态信息
公布
摘要
本发明公开了一种票证识别训练样本合成方法和计算机存储介质,该方法包括:按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合;对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像;将各前景文字掩码图像与对应选取的票证背景图像进行二次图像融合,以得到用于票证识别的合成训练样本集合。根据本发明的技术方案,可以实现人工合成票证文本识别所需的训练样本,以用于替代真实样本来进行模型训练,进而还可以解决真实样本的样本数量不可控等难题。


