授权公布号:CN109543038B
一种应用于文本数据的情感分析方法
有效
申请
2018-11-22
申请公布
2019-03-29
授权
2023-06-30
预估到期
2038-11-22
| 申请号 | CN201811400464.6 |
| 申请日 | 2018-11-22 |
| 申请公布号 | CN109543038A |
| 申请公布日 | 2019-03-29 |
| 授权公布号 | CN109543038B |
| 授权公告日 | 2023-06-30 |
| 分类号 | G06F16/35;G06F18/2415;G06F18/214;G06N3/0464;G06F40/284;CN106599933A,2017.04.26;US2018/0174071A1,2018.06.21张越等.基于弱监督预训练CNN模型的情感分析方法.《计算机工程与应用》.华北计算技术研究所,2018,第54卷(第13期),第27-33页.;AlexanderRatner等.DataProgramming:CreatingLargeTrainingSets,Quickly.《30thConfer |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 华西证券股份有限公司 |
| 申请人地址 | 四川省成都市天府二街198号 |
专利法律状态
2023-06-30
授权
状态信息
授权
2019-04-23
实质审查的生效
状态信息
实质审查的生效;IPC(主分类):G06F16/35;申请日:20181122
2019-03-29
公布
状态信息
公布
摘要
本发明公开了一种应用于文本数据的情感分析方法,其特征在于,所述方法包括如下步骤:S1:构造若干标记函数,对每条输入文本数据进行情感类别的标注,情感类别分为被划分为三类即负面情感数据类、中性情感数据类、正面情感数据类;S2:定义标记函数的先验概率以及相互关系,标记函数的先验概率用于表示该标记函数输出的情感类别标注的置信度;S3:令待标记的文本数据条数为D,步骤S1中的标记函数综述为N,对每一条文本数据都采用N个标记函数进行标记,得到D*N的标记矩阵Λ;S4:将步骤S2中定义的标记函数先验概率与相互关系,以及步骤S3中得到的标记矩阵Λ作为输入导入到Data Programing算法框架中进行学习,得到输出为文本数据的分类概率。


