授权公布号:CN109101479B
一种用于中文语句的聚类方法及装置
有效
申请
2018-06-07
申请公布
2018-12-28
授权
2023-12-05
预估到期
2038-06-07
| 申请号 | CN201810579083.2 |
| 申请日 | 2018-06-07 |
| 申请公布号 | CN109101479A |
| 申请公布日 | 2018-12-28 |
| 授权公布号 | CN109101479B |
| 授权公告日 | 2023-12-05 |
| 分类号 | G06F16/35;G06F40/30;G06F40/289;G06F40/216;G06F18/22 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 苏宁易购集团股份有限公司 |
| 申请人地址 | 江苏省南京市玄武区苏宁大道1号 |
专利法律状态
2023-12-05
授权
状态信息
授权
2019-11-29
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F17/27;申请日:20180607
2018-12-28
公布
状态信息
公布
摘要
本发明实施例公开了一种用于中文语句的聚类方法及装置,涉及互联网技术领域,能够缓减针对汉语句子的分析结果不佳的问题。本发明包括:建立训练集,所述训练集包括了用于进行聚类处理的候选语句;利用由词向量模型计算得到的词向量,获取所述训练集中各个候选语句的相似度;根据所得到的词向量和所述各个候选语句的相似度,对所述训练集中的候选语句进行聚类处理。本发明适用于针对中文语句的聚类处理。


