授权公布号:CN109410957B
基于计算机视觉辅助的正面人机交互语音识别方法及系统
有效
申请
2018-11-30
申请公布
2019-03-01
授权
2023-05-23
预估到期
2038-11-30
| 申请号 | CN201811448360.2 |
| 申请日 | 2018-11-30 |
| 申请公布号 | CN109410957A |
| 申请公布日 | 2019-03-01 |
| 授权公布号 | CN109410957B |
| 授权公告日 | 2023-05-23 |
| 分类号 | G10L17/22;G10L15/22;G06V40/16;G06V40/20;G10L21/02 |
| 分类 | 乐器;声学; |
| 申请人名称 | 福建实达电脑设备有限公司 |
| 申请人地址 | 福建省福州市马尾区君竹路(自贸试验区内) |
专利法律状态
2023-05-23
授权
状态信息
授权
2019-03-01
公布
状态信息
公布
摘要
本发明涉及基于计算机视觉辅助的正面人机交互语音识别方法及系统,通过在传统语音识别流程中加入视频信号输入,与语音信号一同识别;在人脸识别和人脸唇部运动识别中进行语音辅助,判断是否所要识别的目标正在说话;同时,通过人脸识别和辅助定位,判断说话人方位,并利用相应方位,对指定方向声源信号进行增强处理。本发明可以有效增强在特定环境下,例如自助零售终端、银行自助终端、保险自助终端等需要客户正面面对设备的人机交互使用场景,对客户语音命令和语音输入信息识别的准确率。


