品牌网
公司信息商标信息专利信息
授权公布号:CN114299528B
一种针对扫描文档的信息提取和结构化方法
有效
申请
2021-12-27
申请公布
2022-04-08
授权
2024-03-22
预估到期
2041-12-27
申请号 CN202111610235.9
申请日 2021-12-27
申请公布号 CN114299528A
申请公布日 2022-04-08
授权公布号 CN114299528B
授权公告日 2024-03-22
分类号 G06V30/413;G06V10/764;G06V10/82;G06V30/414
分类 计算;推算;计数;
申请人名称 万达信息股份有限公司
申请人地址 上海市徐汇区桂平路481号20号楼5层

专利法律状态

2024-03-22 授权
状态信息
授权
2022-04-26 实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06V30/413;申请日:20211227
2022-04-08 公布
状态信息
公布

摘要

本发明公开了一种针对扫描文档的信息提取和结构化方法,用于实现基于图像识别算法的非结构化文档处理和图片区域信息的文本结构化处理,其特征在于,包括图像监测;图像分类;图像预处理;文本检测;文本识别;版式识别;表格线检测;表格线生成;结构化处理;结构化输出。本发明通过将人工智能的图像识别技术与业务需求深度融合,利用图像识别中的OCR技术及文本结构处理技术,实现了申请材料自动化识别和校验,构建了全流程无人化服务运营模式,减轻工作人员的人工机械化工作,实现泛在的、全天候的无人化服务。