授权公布号:CN109726400B
实体词识别结果评价方法、装置、设备及实体词提取系统
有效
申请
2018-12-29
申请公布
2019-05-07
授权
2023-10-20
预估到期
2038-12-29
| 申请号 | CN201811644155.3 |
| 申请日 | 2018-12-29 |
| 申请公布号 | CN109726400A |
| 申请公布日 | 2019-05-07 |
| 授权公布号 | CN109726400B |
| 授权公告日 | 2023-10-20 |
| 分类号 | G06F40/216;G06F40/295;G06F16/182 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 新华网股份有限公司 |
| 申请人地址 | 北京市大兴区北兴路(东段)2号院12号楼1-5层101 |
专利法律状态
2023-10-20
授权
状态信息
授权
2019-05-31
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F17/27;申请日:20181229
2019-05-07
公布
状态信息
公布
摘要
本申请实施例提供了一种实体词识别结果评价方法、装置、设备及实体词提取系统。该方法包括:获取待识别文档集的实体词识别结果,其中,实体词识别结果是基于至少一种实体词识别方法,分别对待识别文档集进行实体词识别,确定出的任一实体词识别方法对应的实体词识别结果;确定至少一个实体词识别方法分别对应的实体词识别结果中的任一待评价实体词在待识别文档集的第一权值;基于任一待评价实体词的第一权值、至少一个实体词识别方法的准确率以及至少一个实体词识别方法的惩罚项系数,确定任一待评价实体词的第二权值,第二权值用于评价任一待评价实体词。本实施例的方案,通过第二权值判断实体词识别结果的正确性,有效提升实体词的识别效果。


