品牌网
公司信息专利信息
授权公布号:CN105786782B
一种词向量的训练方法和装置
有效
申请
2016-03-25
申请公布
2016-07-20
授权
2018-10-19
预估到期
2036-03-25
申请号 CN201610179115.0
申请日 2016-03-25
申请公布号 CN105786782A
申请公布日 2016-07-20
授权公布号 CN105786782B
授权公告日 2018-10-19
分类号 G06F17/22;G06F17/27;G06F17/30
分类 计算;推算;计数;
申请人名称 北京搜狗信息服务有限公司
申请人地址 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层02房间

专利法律状态

2018-10-19 授权
状态信息
授权
2017-09-08 专利申请权、专利权的转移
状态信息
专利申请权的转移;IPC(主分类):G06F17/22;登记生效日:20170821;变更事项:申请人;变更前:北京搜狗科技发展有限公司;变更后:北京搜狗信息服务有限公司;变更事项:地址;变更前:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间;变更后:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层02房间
2016-08-17 实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F17/22;申请日:20160325
2016-07-20 公布
状态信息
公布

摘要

本发明提供了一种词向量的训练方法和装置,其中,所述方法包括:抓取互联网网页,获取训练语料,保存在语料库中;对语料库中的每个训练语料分别作分词处理,得到每个训练语料对应的有序词集合;根据预先收集的用户查询日志构建词表;将所述语料库中保存的各训练语料分发至分布式词向量学习模型中的各节点;配置所述分布式词向量学习模型对所述词表中的各词进行周期性的词向量训练,得到所述词表中各词对应的词向量。本发明提供了一种词向量的训练方法和装置,使得训练得到的词向量能够很好地适用于搜索业务中,并且能够实现快速迭代的高质量词向量的训练。