品牌网
公司信息商标信息专利信息
授权公布号:CN108536868B
社交网络上短文本数据的数据处理方法及装置
有效
申请
2018-04-24
申请公布
2018-09-14
授权
2022-04-15
预估到期
2038-04-24
申请号 CN201810372364.0
申请日 2018-04-24
申请公布号 CN108536868A
申请公布日 2018-09-14
授权公布号 CN108536868B
授权公告日 2022-04-15
分类号 G06F16/33;G06F16/9532;G06F40/284
分类 计算;推算;计数;
申请人名称 北京慧闻科技(集团)有限公司
申请人地址 北京市朝阳区高碑店惠河南街1132号通惠大厦A201

专利法律状态

2022-04-15 授权
状态信息
授权
2022-04-05 著录事项变更
状态信息
著录事项变更;IPC(主分类):G06F 16/33;专利申请号:2018103723640;变更事项:申请人;变更前:北京慧闻科技发展有限公司;变更后:北京慧闻科技(集团)有限公司;变更事项:地址;变更前:100000 北京市西城区西外大街辛137号宝蓝金融创新中心203室;变更后:100124 北京市朝阳区高碑店惠河南街1132号通惠大厦A201
2018-10-16 实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F 17/30;专利申请号:2018103723640;申请日:20180424
2018-09-14 发明专利申请公布
状态信息
公布

摘要

社交网络上短文本数据的数据处理方法、数据处理装置和电子设备。该数据处理方法包括:获取社交网络上用户的短文本数据;结合短文本数据以形成长文档;获得所述长文档中与主题相关的关键词、与主题相关的关键词对和用户真实意图信息;将与主题相关的关键词和用户真实意图信息输入LDA主题模型,以获得第一文档‑主题分布和第一主题‑关键词分布;将所述与主题相关的关键词对和所述真实意图信息输入IBTM主题模型,以获得第二文档‑主题分布和第二主题‑关键词分布;以及,基于所述第一文档‑主题分布与所述第二文档‑主题分布之间的判定,确定所述长文档的主题。这样,可以通过处理短文本数据获得与用户相关的主题信息,准确地确定用户兴趣。