授权公布号:CN111680476B
一种用于智能生成类文本的业务热词识别转换的方法
有效
申请
2020-05-26
申请公布
2020-09-18
授权
2024-01-30
预估到期
2040-05-26
| 申请号 | CN202010457472.5 |
| 申请日 | 2020-05-26 |
| 申请公布号 | CN111680476A |
| 申请公布日 | 2020-09-18 |
| 授权公布号 | CN111680476B |
| 授权公告日 | 2024-01-30 |
| 分类号 | G06F40/151;G06F16/335;G06F40/216;G06F40/289;G06F40/205 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 广州多益网络股份有限公司 |
| 申请人地址 | 广东省广州市萝岗区伴河路90号自编一栋301房 |
专利法律状态
2024-01-30
授权
状态信息
授权
2020-10-20
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F40/151;申请日:20200526
2020-09-18
公布
状态信息
公布
摘要
本发明公开了一种用于智能生成类文本的业务热词识别转换的方法,收集语料并构建业务热词库;将智能生成得到的文本按业务热词的长度进行划分,并分别与热词进行一次简要快速的相似度匹配计算,过滤掉绝大部分相似度较低的划分词;对保留的相似度较高的划分词,再进行一次具体的相似度匹配计算,保留相似度高的划分词;使用语料训练统计语言模型,将保留的相似度高的划分词,采用热词对其进行替换形成新的句子文本,用预训练好的语言模型对替换前与替换后两个句子进行打分;根据语言模型打分结果,判定替换是否保留。可以快速和智能地为智能生成的文本进行识别匹配,在文本中的词汇与热词相似度较高及替换后语句流畅度较高的情况下实现智能替换。


