授权公布号:CN111611452B
搜索文本的歧义识别方法、系统、设备及存储介质
有效
申请
2020-05-22
申请公布
2020-09-01
授权
2023-05-02
预估到期
2040-05-22
| 申请号 | CN202010440030.X |
| 申请日 | 2020-05-22 |
| 申请公布号 | CN111611452A |
| 申请公布日 | 2020-09-01 |
| 授权公布号 | CN111611452B |
| 授权公告日 | 2023-05-02 |
| 分类号 | G06F16/903;G06F16/9032;G06Q30/0601;G06Q50/14 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 上海携程商务有限公司 |
| 申请人地址 | 上海市长宁区金钟路968号12号楼203室 |
专利法律状态
2023-05-02
授权
状态信息
授权
2020-09-01
公布
状态信息
公布
摘要
本发明提供了一种搜索文本的歧义识别方法、系统、设备及存储介质,所述方法包括步骤:基于字符串匹配算法对待识别的搜索文本进行歧义性识别,获得第一识别结果;基于关联待识别的搜索文本的历史搜索数据库,对待识别的搜索文本进行歧义性识别,获得第二识别结果;获取搜索引擎关于待识别的搜索文本的前N个搜索结果,并从每一个搜索结果中提取出第一关键词,依据不相同的第一关键词的个数,确定第三识别结果;构建文本语义匹配模型,依据训练后的文本语义匹配模型,获得第四识别结果;基于上述识别结果,对待识别的搜索文本进行歧义识别;本申请实现了对搜索文本歧义性的多角度识别,提高了识别的准确性。


