授权公布号:CN113468305B
一种识别口语冗余成分的方法及装置
有效
申请
2021-06-29
申请公布
2021-10-01
授权
2023-04-28
预估到期
2041-06-29
| 申请号 | CN202110727309.0 |
| 申请日 | 2021-06-29 |
| 申请公布号 | CN113468305A |
| 申请公布日 | 2021-10-01 |
| 授权公布号 | CN113468305B |
| 授权公告日 | 2023-04-28 |
| 分类号 | G06F16/332;G06F16/33;G06F16/35;G06F40/242;G06N20/00 |
| 分类 | 计算;推算;计数; |
| 申请人名称 | 竹间智能科技(上海)有限公司 |
| 申请人地址 | 上海市徐汇区宜山路700号B2幢楼18层整层 |
专利法律状态
2023-04-28
授权
状态信息
授权
2021-10-01
公布
状态信息
公布
摘要
本发明公开了一种识别口语冗余成分的方法及装置,方法包括:接收口语语料库和训练语料;将所述口语语料库中的冗余成分进行分类,获得多余成分和重复成分;根据预设场景以及所述多余成分,对所述训练语料进行训练,获得多余成分识别模型;根据所述重复成分,对所述训练语料进行训练,获得重复成分识别模型;利用多余成分识别模型和重复成分识别模型对口语文本进行识别,获得标识有冗余成分的口语文本。本发明能够解决现有技术中口语冗余成分界定不清以及误识别的问题。


