授权公布号:CN116204642B
数字阅读中角色隐式属性智能识别分析方法、系统和应用
有效
申请
2023-03-06
申请公布
2023-06-02
授权
2023-10-27
预估到期
2043-03-06
| 申请号 | CN202310205617.6 |
| 申请日 | 2023-03-06 |
| 申请公布号 | CN116204642A |
| 申请公布日 | 2023-06-02 |
| 授权公布号 | CN116204642B |
| 授权公告日 | 2023-10-27 |
| 分类号 | G06F16/35;G06F16/33;G06F40/30;G06N3/096;G06N3/0464 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 上海阅文信息技术有限公司 |
| 申请人地址 | 上海市浦东新区滨江大道5169号陆家嘴滨江中心N3座 |
专利法律状态
2023-10-27
授权
状态信息
授权
2023-06-20
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F16/35;申请日:20230306
2023-06-02
公布
状态信息
公布
摘要
本发明公开了一种角色隐式属性智能识别分析方法,包括:使用小说领域的语料对基于BERT的预训练模型进行迁移学习,获得MLM调整过的BERT的预训练模型;获取包含有角色及其属性的角色属性小说文本数据集,预处理获得带角色属性标注的文本;将正常文本的内容使用提示学习Prompt的建模方式转为新的文本序列,并将文本序列转换为文本向量InputEmbedding;将提示学习中获得的PromptText字符序列使用对比学习的建模方式构建同一文本序列中不同角色的属性特征集合,并针对角色属性特征集合构建属性类型对特征矩阵;使用主动学习对数据质量进行提纯;进行新文本的角色属性预测,自动化产出角色属性结果,再对结果作聚合投票产出最终角色属性类型。本发明还公开了实现上述方法的系统。


