授权公布号:CN108536868B
社交网络上短文本数据的数据处理方法及装置
有效
申请
2018-04-24
申请公布
2018-09-14
授权
2022-04-15
预估到期
2038-04-24
| 申请号 | CN201810372364.0 |
| 申请日 | 2018-04-24 |
| 申请公布号 | CN108536868A |
| 申请公布日 | 2018-09-14 |
| 授权公布号 | CN108536868B |
| 授权公告日 | 2022-04-15 |
| 分类号 | G06F16/33;G06F16/9532;G06F40/284 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 北京慧闻科技(集团)有限公司 |
| 申请人地址 | 北京市朝阳区高碑店惠河南街1132号通惠大厦A201 |
专利法律状态
2022-04-15
授权
状态信息
授权
2022-04-05
著录事项变更
状态信息
著录事项变更;IPC(主分类):G06F 16/33;专利申请号:2018103723640;变更事项:申请人;变更前:北京慧闻科技发展有限公司;变更后:北京慧闻科技(集团)有限公司;变更事项:地址;变更前:100000 北京市西城区西外大街辛137号宝蓝金融创新中心203室;变更后:100124 北京市朝阳区高碑店惠河南街1132号通惠大厦A201
2018-10-16
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F 17/30;专利申请号:2018103723640;申请日:20180424
2018-09-14
发明专利申请公布
状态信息
公布
摘要
社交网络上短文本数据的数据处理方法、数据处理装置和电子设备。该数据处理方法包括:获取社交网络上用户的短文本数据;结合短文本数据以形成长文档;获得所述长文档中与主题相关的关键词、与主题相关的关键词对和用户真实意图信息;将与主题相关的关键词和用户真实意图信息输入LDA主题模型,以获得第一文档‑主题分布和第一主题‑关键词分布;将所述与主题相关的关键词对和所述真实意图信息输入IBTM主题模型,以获得第二文档‑主题分布和第二主题‑关键词分布;以及,基于所述第一文档‑主题分布与所述第二文档‑主题分布之间的判定,确定所述长文档的主题。这样,可以通过处理短文本数据获得与用户相关的主题信息,准确地确定用户兴趣。


