4月20日,北京灵隆科技有限公司《第三方平台接入叮咚语音交互系统用户体验标准》(以下简称《标准》),这也是我国首份在智能语音领域针对第三方服务和内容接入语音交互系统的开发标准。该《标准》将对语音交互产品体验有重要的指导性意义,让语音交互更符合用户的使用习惯。同时对于未来将接入语音交互接口的第三方服务和内容行业来说,能够帮助他们以比较快的速度和比较简洁的方法接入语音交互接口,以达到比较优用户体验。
语音交互被视为人机交互的下一代入口
两会期间,人工智能被写入了2017年政府工作报告。而在人工智能领域,智能语音交互被作为人机交互的入口。未来与智能家居、可穿戴设备、机器人等沟通,语音将是比较佳人机交互模式。
目前,智能音箱、智能电视等智能硬件都开始尝试锲入语音交互系统。在此方面,科大讯飞作为中国语音产业的拓荒者到世界语音产业的领军者。叮咚智能音箱作为国内首款智能音箱,充分发挥科大讯飞出色的语音技术及人工智能技术优势和京东在智能产业链方面的优势,一直致力于智能家庭场景下智能语音交互系统的研究和发展,本次《标准》基于叮咚用户常年的体验反馈和技术积累所得。
语音交互的核心:识别用户的语义和意图
《第三方平台接入叮咚语音交互系统用户体验标准》是国内首份第三方服务和内容接入语音交互系统的详细介绍。《标准》进一步明确了人机交互的反馈流程和设计标准,其中定义了两个智能语音交互的关键指标,即“语义”和“意图”,通过语义和意图的转化来完成交互的核心步骤。
当前,人机主要交互模式是界面交互,通过“一对一”的指令沟通。而语音交互则不同,由于不同地域、不同文化、不同表达习惯,在人机交互过程中往往是“多对一”的指令沟通。也就是说同一种意图,在用户那里会有多种形式的提问方式,这就要求语音交互必须大量学习人们的日常语言习惯,甚至做到理解用户的语义的“弦外之音”。这对机器来说无疑是巨大的挑战。
在语音交互流程设计及体验中,叮咚主要研究的是识别用户语义意图、反馈用户语音需求,处理人机对话错误三个方面。对于研究成果,在《标准》的第三部分做了进一步阐述,从如何更好的获得用户意图、如何将信息更好的展现给用户和如何更好的处理对话中的错误进行解释,并通过实例和讲解相配合的模式整个报告内容清晰易读易懂,为第三方服务接入提供了切实可遵循的规范标准。
灵隆科技研发中心负责人周正友在会上以游戏接入为例,说明《标准》里是如何明确地告诉用户需要怎样的回答。
用户:“叮咚叮咚,我想玩一下音乐游戏厅”
较好的回答:“您好,欢迎来到音乐游戏厅,我们现在有:我爱记歌词、猜猜大明星,趣味哼唱,您想玩哪一个?”
不好的回答:“您好,欢迎来到音乐游戏厅,我们现在有:我爱记歌词、猜猜大明星,趣味哼唱,请您在以上三个选项中选择?”
叮咚智能音箱捅破智能语音交互时代的窗户纸
“叮咚智能音箱捅破智能语音交互时代的窗户纸。”叮咚智能音箱灵隆科技营销副总裁方律表示。“对于智能语音交互在家庭场景中的应用来说,行业大规模爆发的核心在于,第一,产品接入的服务足够全面和丰富,可以满足用户在该场景下的各种需求。这个目前叮咚已经做到了。第二是,用户体验可以突破可用这层窗户纸,达到易用和好用的状态。本次我们发布的用户体验优化标准就是出于‘让所有的第三方服务语音交互更好用’的目的。目前,我们对于所有第三方应用的合作方,都采取开放的态度,希望越来越多的服务/功能的开发者,能够接入叮咚的平台,为用户输出更多的更丰富的内容和服务。”
结语
“伟大的产品往往不是由巨大的技术进步驱动的,而是技术综合产品恰如其分的一小步,驱动用户体验一大步的飞跃。”《第三方平台接入叮咚语音交互系统用户体验标准》是叮咚智能音箱在追求提升用户每一份体验上的努力,《标准》发布后或将成为用户体验升级和行业大规模爆发的推动力。