授权公布号:CN112906348B
对文本自动添加标点符号的方法、系统、设备及介质
有效
申请
2021-02-04
申请公布
2021-06-04
授权
2022-04-26
预估到期
2041-02-04
| 申请号 | CN202110171377.3 |
| 申请日 | 2021-02-04 |
| 申请公布号 | CN112906348A |
| 申请公布日 | 2021-06-04 |
| 授权公布号 | CN112906348B |
| 授权公告日 | 2022-04-26 |
| 分类号 | G06F40/117;G06F16/31;G06F16/33;G06N3/04;G06N3/08;G06F40/295 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 云从科技集团股份有限公司 |
| 申请人地址 | 广东省广州市南沙区南沙街金隆路37号501房(仅限办公) |
专利法律状态
2022-04-26
授权
状态信息
授权
2021-06-04
公布
状态信息
公布
摘要
一种对文本自动添加标点符号的方法、系统、设备及介质,通过识别音频获取文本;将对应文本转化为多个索引值序列,并将这多个索引值序列输入至深度神经网络模型中,获取每个索引值序列的概率分布;基于每个索引值序列的概率分布确定该索引值序列中每个字对应的最大概率分布值,作为该字后面要添加的标点符号的索引;通过该索引从预先确定的标点符号索引表中获取相应的标点符号,并自动添加到文本序列中,完成对文本的标点符号添加;若索引对应的是空白标签,则跳过当前字,不对当前字添加标点符号。本发明可以实现自动标点符号、跨领域迁移学习和激进程度调整等功能,还可以改变深度神经网络模型的激进度,满足不同场景下对准确率和召回率的要求。


