您的当前位置:首页正文

基于深度学习的人机语音交互平台

来源:个人技术集锦
EXCHANGE OF EXPERIENCE 经验交流

基于深度学习的人机语音交互平台

◆ 赵 涛 张 羿 王永和 张海娇

摘要:当今时代,人工智能以及各种各样的语音识别系统在不断的发展,语音识别慢慢地走进了人们日常生活的各个方面,并凭借语音识别的准确度和识别的新颖化,让广大的用户的从习惯变成了喜爱, 也成为了人工智能领域的主要研究方向。为了提高客服系统的使用满意度,基于语音识别的人工智能客服系统被引入,论文将探讨如何引入这种客服系统并实现其广泛推广。

关键词:人工智能;深度学习;语音识别

一、前言

(一)项目研究的背景及意义

随着社会经济的飞速发展及电力体制的不断改革,电网企业的核心价值正在由“以电力生产为中心”向“以客户为中心”转变,并将最终落脚在“如何更好地服务于全社会”与“以客户为中心的营销理念”这一根本任务及营销理念上。电网公司需要开启“自助+人工”帮助的新模式。

面对如今电力服务人员工作量大,不能实现实时及时的为用电客户及电力企业员工提供服务的现状,营销业务应答服务包括用电查询、停电公告、网点查询、用电知识、用电业务办理须知等问题,对电力企业员工来说,包含内部消息通知,业务知识查询,业务接口推送,运维服务工单查询等问题,在实际生产环境中是一项工作量非常庞大的业务,全部都靠人工来解决不能做到及时处理,会产生很多的问题

[1-2]

语音作为人类最自然,最快捷的信息传递方式,智能语音的研究出现在了世界国的各行各业中,而且越来越多的进入了人们的日常生活中。作为业务量如此庞大的电力服务行业,为了提升用户感知,降低人工成本,实现服务质量的持续优化,所以使用深度学习人机交互的模式来自动的给客户提供常见问题的解决方案

[3-4]

(二)传统客服模式与AI智能客服对比分析

传统客服模式即人工操作模式,AI客服模式是通过智能语音进行交互的模式。通过两种模式的对比分析(见表1)和OA问题处理的示例(见图1),得出如下结论:针对占客服热线业务量70%以上的用户自助查询办理服务,由智能语音交互模式实现是最优选择

[5-6]

表1传统客服模式与AI客服模式对比人工客服模式AI客服模式

定义用户打1000号与客服代表通话用户用自认语言与机器对话

解析了用户问题中的关键

优点

人与人的直接交流,容易理词,快速找到解决方案反馈

解,亲切给用户,分担了人工客服的

压力

人工成本高,客服人员有限

缺点

会出现用户多次打不通人工

语音的识别率会被说话人的普

服务的情况,简单相同的问

通话标准影响,而且需要在深

题多次解决

度学习的过程中逐渐提升

OA问题处理:点击“不归档”OA问题处理:点击“不归档”测试提示:“归档回调出错”,提示:“归档回调出错”,论证人工需要查询并告诉用户解直接反馈解决方案给用户,决方案,需要点时间速度快

结论

选择优先级2选择优先级1

102

信息系统工程 │ 2019.1.20

图1 OA问题处理的示例图

二、人机语音交互技术

(一)人机交互技术

人机交互是人指通过自然语言与机器进行某种特定的沟通方式,其具体技术表现在机器通过各种设备或方式向人提供信息或者人反过来通过输入设备向机器传达自身的思维想法等等,通过机器完成一些人力很难完成或无法完成的工作[7-8]。

(二)人机交互模型

GOMS (goals operatorsmethods selectors )模型,是一个较早提出的有一定影响力的模型,它描述了任务之间的关系。主要分为四个阶段。

a)目标(goal),用户执行任务想要实现的系统状态;b)操作( operator),为了完成目标而执行的一系列基本活动,操作的类型有感知操作、认知操作、动机行为或者这几种操作的结合,每个操作都有一个预定的执行时间;

c)方法(method),是描述如何完成目标的过程,一个方法本质上来说是一个内部算法,用来确定子目标序列及完成目标所需要的操作;

d)选择规则( selection rule) ,当完成同一目标有多种方法时,需要设置一种规则标准来判断在何种使用情境中应该选择什么样的方法。

GOMS 模型是一种用户的认知模型,主要用来描述任务在实践过程中 执行的。它的基本思想是,首先确定目标,将目标进行分解,当完成同一目标的方法多于一种时,根据使用情境,通过选择规则来选择合适的方法,每种方法是通过一系列的操作序列集合来实现的[9-10]。

人机交互系统整个流程分为用户、输入、系统、输出四个步骤。首先把用户的语音识别成机器可以理解的语言传送给系统,系统根据规则完成流程,用户和系统之间就有了沟通的机制和渠道;流程完成后系统结果反馈给用户。如图 2所示。

图2人机交互模型

(三)人机交互的基本实现流程

人机交互的基本流程主要包含四个阶段,其中还有一个循环,具体流程如图3所示。

(1)用户需求:以用户的要求作为标准,建立交互需求;(2)需求分析:在一定条件下,分析用户提供的信息,重点联系后期工作;

(3)系统设计:在标准设计规则的基础上,重点增强系统的可交互性,最大化系统的实用性;

(4)迭代和原型化:对设计的交互式系统进行测试和评估,重点关注该系统的可用性、功能性、可接受性等,发现其中可能存在的问题并对此提出解决方案;

(5)系统实现和系统推广:按照设计流程进行安全制造,并向市场推广系统[11]

图3人机交互基本流程

(四)人机语音交互技术研究

从受广泛关注的苹果语音Siri出现开始,语音识别在商业迅速地推广开,重点推广领域包括搜索,通信和手机等服务上。同时,由于成本等因素,这种语音交互技术已经成为各类公司客服中心的首选。

1.语音识别技术

语音识别技术是语音人机交互平台的核心技术,客服中心的语音识别系统的技术路线包括一下几个部分:

(1)命令词的识别:开发人员设定专用的命令词,与用户语音进行匹配;

(2)关键词检出:检索出客户语音里的关键词;(3)自由说语音识别:把用户的语音识别成文字,然后对文本进行语义理解。

2.自由说式导航技术要求

声学模型建模、语言模型建模和分类算法是实现自由说式

EXCHANGE OF EXPERIENCE 经验交流

导航技术地重要手段。

在声学模型方面,使用声学模型建模方法,这种方法是语音识别领域中的主流,同时结合上下文相关的建模单元、区分性特征、区分性模型训练等技术,实现在随意说环境下的声学模型[12]。

在语言模型方面,目前最主流算法是语言模型建模算法,通过对文本数据进行数据设计、收集、清洗、分类及质检等开展语义训练,不断提升语言模型的适应性。

在分类算法方面,分类目标必然是主要业务选项,通过对主流的分类算法进行实现与分析,比对多种算法如文本分类器的区分性训练、支持向量机、最大熵、神经网络、集成学习等优秀分类算法, 通过数据研究出可解决当前复杂任务的分类算

法;根据实际分类技术的使用情况,以多分类器实现为目标,用以解决实际业务中可能的路由问题。

三、智能语音技术的具体应用

主要实现目标是以新颖的智能交互模式代替传统的人工交流,使得用户能够以自然语言(未来的工作包括各国外语与各地方言)和机器进行交流,传达用户的思想,为客户提供便利的同时使得整个服务过程变得轻松、愉快,极大的提高用户的满意度和客服工作的效率。这种新颖的智能技术必将推进业界产业链的发展。

(一) 交互平台分析1.业务流程的设计

用户使用1000号智能语音客服,当用户说出其问题如“使用OA系统时,点击‘不归档’提示:‘归档回调出错’”,系统识别出关键词“OA”、“归档”和“归档回调出错”对应到OA里的归档节点,找出里面关于“归档回调出错”相关的解决方案,然后反馈给用户,用户可继续说出其他诉求或退出,完成一次智能语音服务[13]。

当无法识别或是问题无法找到解决办法时,系统会自己询问用户该问题无法解决是否转人工或智能客服无法解决必须由人工解决、无法识别用户提出的问题等场景。

2.业务范围的选择

人机语音交互平台能实现1000号里的业务查询,业务办理,业务咨询和问题反馈与投诉等问题。

四、智能语音客服平台架构

在深度学习人工智能的大趋势下,互联网已经介入人类生活的各方各面,1000号人机语音交互平台的建设势在必行,只有这样才能既可实现云南电网公司在人工智能方面的需求,也可满足电网公司其他业务的客服中心的需求,代替人工,降低成本,可以做到24小时全时段工作,无需投入人力,提高运维支撑效率,技术更新、部署更加高效。

(一)系统架构

人机语音交互平台接入到1000号客服中心。作为云南电网里的主要系统,平台主要由3 个模块来构成:语音接入控制;

信息系统工程 │ 2019.1.20

103

EXCHANGE OF EXPERIENCE 经验交流

语音识别、合成和语义理解;对接业务支撑系统,实现用户的业务查询、业务办理、业务咨询。

参考文献

[1] 孟祥旭,李学庆.人机交互技术—原理与应用[M]. 北京:清华大学出版社,2004.

[2] 龚媛,雄于然.语言处现的语音识别后文本处理[D].硕士学位论文,北京:北京邮电大学,2008,03.

[3] P. Zhou and F. Xing. Analysis of cognitive behavior in software interactive interface [A]. In: Proceedings of the 9th International Conference on Computer- Aided Industrial Design and Conceptual-Des ign [C]. Kunming, China,Nov. 2008.

[4] 王秀景.语音识别技术研究与实现[D]. 硕士学位论文,山东科技大学,2011,05.

[5] 高新涛, 陈乖丽. 语音识别技术的发展现状及应用前景[J].甘肃科技纵横, 2007 ,36,04.

[6] 龚媛,基于然语言处理的语音识别后文本处理[D]. 硕士学位论文,北京:北京邮电大学,2008,03.

[7] 陈志刚,中文语音合成系统中文本分析的若干关键技术[D]. 合肥:中国科学技术大学,2003.

[8] 李波,王成友. 语音转换及相关技术综述[J].通信学报,2004,5. [9] 王聪修.语音转换及其相关问题的研究[D]. 中国科学院声学研究所博士学位论文,2001.

[10] 刘幺和,宋庭新. 语音识别与控制应用技术[M].北京:科学出版社,2008,02:2-3.

[11] 朱维彬,王士楠。基于语义的语音合成- 语音合成技术的现状及展望[J]. 北京理工大学学报,2007.

[12] 王登峰,曹晓琳,于吉龙.智慧语音语音识别系统设计与实验[J]. 农业机械学报,2010.

[13] 维基百科. 自然语言处理[EB/OL].[2016-07-25]

五、人机语音交互平台未来部署展望

智能语音客服核心功能是提供自然语音对话服务,在此基础上可以在业务拓展和语音数据的深度挖掘方面取得更加深入的研究。

(一)在语音资源、知识库方面:依赖多年沉淀的丰富客服知识库,和语音音频资源,配置电力行业专业的术语,即可能更好的融入云南电网公司的各个业务域。

(二)在语音能力、业务能力方面:从多方面入手提升语音合成能力和语音转文本能力,提高识别率,更好的服务于电网行业。

(三)在语音数据的挖掘方面:通过对整个电网公司用户的语音数据进行分析,挖掘出用户潜在的需求,对发展业务的建议等。

六、结语

本文人机语音交互系统集成了百度语音的语音识别、语音合成技术,系统主要由语料知识库管理模块、语音识别、语音合成,人机交互等模块组成,用户只需说出自己的命令,系统即可完成指定的操作。语音交互系统以移动平台为基础,识别率达85%以上,单次语音交互时间小于 3 秒,使语音技术的使用与移动设备系统很好的结合在一起。H(基金项目:中国南方电网项目RD_2017(W)_101)(作者单位:赵涛、张羿,云南电网有限责任公司;王永和、张海娇,云南云电同方科技有限公司)

(上接第101页)

三、高校教育人工智能化问题的解决路径

(一)完善教师在职培训,构建复合型人才队伍。人工智能与各行业的深度融合实际上意味着传统工作岗位的转型升级。工作在教学一线的教师是教育问题的提出者和解决者。这就要求教师不断提升自身的综合知识素养。在教师培训中,应当增加人工智能的培训,帮助教师系统了解人工智能的知识。人工智能技术在不断进步,学校需要将这种综合素质培训常态化和终身化。

(二)政府推动教育人工智能的研究。政府应通过政策引导和资金投入促进人工智能在教育中的发展。第一,政府应投入资金,成立关于教育的人工智能应用性研究项目。第二,加大政府主导的其它基础性和应用性研究项目与教育项目的有效沟通,使人工智能关键技术的与具体教学有机结合。第三,通过优惠政策和政府采购的方式,鼓励和引导市场中的企业教育的研发。第四,政府严格监管教育人工智能产品的研发。教育具有特殊性,具有较强的隐私性和政治敏感性,这需要政府的合理监管。

(三)规范教育数据,构建分权限等级数据库。首先,政府教育管理部门应该制定适合教育数据的统一标准,使得人工智能能够获取高质量的数据。其次,学校和政府教育管理部门要尽可能使教师的教学过程和学生的学习过程数据化。教师的教案、讲

104

信息系统工程 │ 2019.1.20

义、教材和参考书目等教学资源可以通过统一标准存储入教育数据库,而学生的作业、考试和调查问卷等学生学习状况可通过在线作业考试和问卷系统完成。再次,涉及学生个人各个层面的隐私数据和安全数据,人工智能使用这些数据会产生伦理和法律问题,因此必须在伦理和法律层面进行规范。同时,学校和政府管理部门内部应该严格管理数据的使用,对于不同层次的研究和研究者,授予不同权限的数据使用权。

尽管人工智能技术还处在起步阶段,存在着许多问题,但人工智能是未来教育发展的方向,能推动教育在新时代的发展。在未来,通过人工智可以真正建立起以学生为中心教育体系。H参考文献

[1] 闫志明,唐夏夏,秦旋,等. 教育人工智能(EAI)的内涵、关键技术与应用趋势——美国《为人工智能的未来做好准备》和《人工智能研发战略规划》报告解析[J]. 远程教育杂志,2017,(1):26—35.

[2] 俞明华,冯翔, 祝智庭. 人工智能视域下机器学习的教育应用与创新探索[J]. 大数据时代,2018,(1):64—73.

[3] 北京师范大学智慧学习研究所.2016 全球教育机器人发展白皮书—— 摘要版[EB/OL].[2016-09-07].http://sli.bnu.edu.cn/a/yanjiuchengguo/ yanjiubaogao/2016/0907/200.html

(作者单位:南开大学马克思主义学院)

因篇幅问题不能全部显示,请点此查看更多更全内容