授权公布号:CN111274798B
一种文本主题词确定方法、装置、存储介质及终端
有效
申请
2020-01-06
申请公布
2020-06-12
授权
2023-08-18
预估到期
2040-01-06
| 申请号 | CN202010010680.0 |
| 申请日 | 2020-01-06 |
| 申请公布号 | CN111274798A |
| 申请公布日 | 2020-06-12 |
| 授权公布号 | CN111274798B |
| 授权公告日 | 2023-08-18 |
| 分类号 | G06F40/258;G06F40/284;G06F40/289 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 北京大米科技有限公司 |
| 申请人地址 | 北京市朝阳区青年路7号院达美中心T4-27层 |
专利法律状态
2023-08-18
授权
状态信息
授权
2020-07-07
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F40/258;申请日:20200106
2020-06-12
公布
状态信息
公布
摘要
本申请实施例公开了一种文本主题词确定方法、装置、存储介质及终端,包括:对至少一个输入文本进行预处理,得到至少一个目标文本;根据预先训练得到的词语集合,构建所述至少一个目标文本与所述词语集合中至少一个词语之间的第一映射关系;基于预先训练得到的主题类型与所述词语集合中至少一个词语之间的第二映射关系,确定所述至少一个目标文本与至少一个主题类型之间的第三映射关系;根据所述第三映射关系确定所述至少一个目标文本对应的至少一个主题类型,进而基于所述第二映射关系,确定所述至少一个目标文本对应的至少一个主题词。运用本申请实施例能够准确挖掘短文本的主题词。


