刍议智能语音技术的应用与风险防范

时间：2024-04-24

关键词智能语音识别技术应用风险防范

作者简介：王懿，东北大学文法学院，研究方向：公共管理与公共政策。

中图分类号：D920.4 文献标识码：A DOI：10.19387/j.cnki.1009-0592.2020.05.225

智能语音作为最早落地成型的人工智能技术，也是市场上应用最为广泛的人工智能技术，它在使人们生活得到便利的同时，在法律与道德层面都带来一定风险。是否能正确认识智能语音技术、是否明确风险、如何应对风险成为现阶段需要探讨的问题。

一、智能语音技术的原理与应用

智能语音技术是在弱人工智能时代，依托人工智能算法实现人机交互的关键技术。取代了传统语音交换技术，使一个简单的机器具备了“能听会说”的特征，赋予智能终端更高的能力。

（一）智能语音技术的原理

语音识别，就是将使用者的语音内容准确转化为文字的技术。面临着“同音多字”、口音差异、地域方言等问题，需要智能语音通过不断的试验，准确判断。接近于过去的语音文字转换技术，经过反复训练，得到搜索出的候选结果作为语音识别阶段的结果。

语音理解，通过各种机器学习建模方法，将特定文本内容准确理解，包含对词汇、句子、篇章的理解，从而使机器可作出正确的反应。智能语音技术中的“词义理解”与日常交流对特定词语意思的理解过程一样是根据上下文理解，根据学习训练中词语之间的关联程度来确定词语，实现“词义消歧”。

语音合成，就是将文本回答转换为语音流畅输出。对语音合成最基本的要求就是语法正确、表达精准、语音流畅，其次是语音合成内容尽可能人性化，符合用户需求。

这些功能是支撑智能语音技术运行的基础，也是实现智能语音技术应用的关键，了解其基本原理，明确智能语音技术实现的各个环节，才能准确的与现代生活需求对接，防范未来智能语音技术各种风险的出现。

（二）智能语音技术的应用

智能语音助手是国内外电商巨头在人工智能领域的主要布局方向。通过将智能语音技术与移动客户端连接，语音实现操控智能设备、获取网络信息、预定服务及购买产品等服务功能。国际上比较成功的智能语音识别系统各有优势，尤其是苹果的Siri和谷歌的Google Assistant，大范围通过与其产业下游移动通信产品结合，实现了全球性的推广（见图2）。

智能语音医疗因公共卫生领域所需的大量人力资源，成为当下热门研究领域。目前，智能语音医疗建设主要集中在语音录入文本方面，在普遍提倡“无纸化办公”的情况下，大量节约记录电子病历的时间，使医生更专注于与患者的沟通交流，避免了手写病历难以辨认，人工录入电子病历信息不全面的问题。此外，智能语音技术供应商与公共卫生部门合作正在积极进行智能语音医疗机器人的研发，可与患者交流，提供信息采集、自我诊断、医疗咨询、导诊、紧急呼救等服务。

图 2：2017年全球语音助手市场份额

智能语音家居产品将现代家居与智能语音技术合二为一，服务于智能家居的控制系统，用于远程化、非触摸式的操纵控制。方便对现代电子设备不够了解的老人儿童使用，避免触电、错误操作的问题。其可与用户进行沟通交流的特点，一定程度上起到看护陪伴的作用，并对可能出现的危险进行预警，在遇到危险时也可通过语音进行紧急呼救。

智能语音客服是指将智能语音技术应用于电信呼叫服务领域，代替人工客服进行基础性服务，适用于电信公司、机场等呼叫中心，但不适用急救、消防中心等紧急求救呼叫服务。同时，智能语音客服相对于传统人工客服拥有二十四小时不间断、服务效率高、服务水平稳定等特点，可以有效规避降低因人工客服所造成的问题。

二、智能语音技术的风险

目前，智能语音技术已渗透到人们日常生活的各个领域，随之而来的就是其可能造成的风险，尤其是一些无具体法律可依，却对人民群众的生命财产安全造成情况。

（一）破坏连接设备的风险

智能语音技术可以将用户语音转换为操作控制的电信号，然而这一系列这种“声音与电”的转换是不能被用户看见的，过程中一旦出现失误也不能阻止甚至来不及阻止。智能语音技术有意或无意的错误操作，轻则仅是本次操作失败需要重新输入指令或人工操作;重则则是因不恰当操作引起的家用电器损坏，引发火灾，造成人员伤亡的情况。

在法律上，訴讼的主体应该是人，而不能是智能语音技术或相关的产品等物质化的东西。判定的罪名、索取的赔偿都不能由智能语音技术承担提供。但用户的语音命令正确，未存在操作不当的现象;供应商在设计时也未设置让其错误操作的程序。就事实上来看确实双方都没有为智能语音技术操作失误而承担责任的法律依据。但已经确定由智能语音技术造成的损失及伤害又应由谁来承担呢？用户又应该向谁索求赔偿你？由此看来，人工智能方面法律缺失造成可能的风险不断。

（二）信息泄露的风险

智能语音技术在窃听通话内容上面临信息泄露风险，其可能造成的危害可以以智能手机信息泄露为例子参考，最典型的例子就是苹果手机窃听事件。通过手机内置程序，监听用户通话内容，造成个人信息甚至与国家利益相关的机密信息被泄露，对个人及国家都造成了巨大危害。

与智能语音技术相连接的设配普遍配有摄像头或其他影像识别设备，以使进行语音識别时，可通过对用户的微表情识别，更加准确的判断语句内容。但摄像头与智能语音技术的连接给予不法分子操作，监控他人生活甚至将其扩散的可能。造成用户使用智能语音技术的负担。

（三）违规表达的风险

当前智能语音技术所给予的反馈具有人性化，极度贴近生活，并存在日常交流的“玩笑”。但是针对心理情绪状态不佳的用户，给予消极的、“玩笑的”甚至无情感回复，就可能引起用户异常的情感波动，造成不可控的风险，这在法律上是没有问题的，但在道德上恐怕是不被接受的。

错误引导提示可能带来的风险：一是用户有意或无意表达的不恰当言论是否应该由智能语音设备进行提醒或者制止。面临客户体验和语言道德两难的情况，智能语音技术是否能作出最恰当的抉择，能否保持最基本的道德评判标准。二是因年龄层、国家、民族文化差异造成语言习惯，是否能进行准确判断，并给出合理提示，尤其是在国家、民族不同的情况下，是否可作出特定的语音提醒设置，以免冒犯用户。

三、应对智能语音技术风险的建议

应对其所带来各种形式的风险，即不能仅从用户的角度一味的批判，也不能仅从设计者和销售方的角度一味的推诿，而道德伦理或是立法方式也不能完全应对这些可能出现的风险，作出合理防范。需要将双方利益统一在一个合理的范围内，提出可行的解决建议。

（一）多管齐下，有限风险

“多管齐下”是指通过多种可变通、协商、调节的方式解决智能语音技术可能面临的法律风险问题。比如针对智能语音技术在智能家居领域可能造成家用电器损坏或人身安全隐患的风险，可以通过购买保险或购买售后服务的方式解决。智能语音技术提供商、智能家居厂商、用户三方达成购买协议，用户额外支付一定费用获得保障，一旦出现某些风险可以获得保修、赔偿等服务;或者与保险公司合作，达成协议提供理赔保障。

“有限风险”在这里是对智能语音技术应用可能造成的风险进行责任承担的有限划分。首先，用户应该对风险有一定的可接受性。任何一种新兴事物在初次应用时，都会受到各种质疑，但随着其便利性的凸显逐渐流行，同时也接受了其可能带来的风险。其次，制造方和销售方应尽风险说明的义务，进行一定范围内财产损失的有限风险承担，给予客户合理补偿。

（二）法律辅助，数据阻隔

“法律辅助”则是出于智能语音技术应用现状的考虑，其商用未造成影响严重的事故，未对人民生命财产安全造成巨大损害，针对其进行立法为时尚早，行业内协同制定了相应的行业规范，限制某些有违法律的人工智能形态规范生产。就其目前可能出现法律风险而言，可以根据之前在飞机自动驾驶、手机窃听等相似案例作为依据进行处理。智能语音技术供应商也应有统一的行业规范，禁止通过后台私自传输信息的行为，维护用户个人隐私安全，限制自我学习中可能侵犯用户利益的行为发生。

“数据阻隔”是指对智能语音设备记录的数据进行单项阻隔，即在设计时就阻止将数据传输至云端或其他设备。将智能语音技术与网络的关联，局限在信息索取这条单项路径上，仅允许通过网络学习搜索，以反馈用户;通过技术手段，完全禁止反向的数据传输。尤其是一些配备摄像头的设备，允许用户自行设置是否开启，并严禁数据记录上传。

（三）技术为主，自我调节

“技术为主”指的是在智能语音技术设计时，通过内置“敏感词”限制的功能使其在深度学习中避免接触到不恰当言论内容，保证进行的是内容积极健康的对话。同时“敏感词”也应设置一定可接受范围，并允许根据国家和民族的进行不同调整。对某些过激，或者有损国家荣誉利益的言论进行提醒警示，达到一定的道德引导目的。其次是注重对使用者情感上的，交流中要给予乐观向上的情感导向。根据用户表达的语音语气进行内容判断的同时注重情感性的分析，并据此调整回复内容。

“自我调节”是指用户在使用智能语音技术相关产品时注意自我言论及情绪心理。当心理情绪处于一个消极状态时尽量避免与智能语音交流消极话题，可以选择情绪开导。此外，针对个人言论是否合理问题要有一个自我判断，理性对待智能语音技术所设定的敏感话语提示，不要迁怒或者恶意投诉，也是积极配合国家净网工作的开展。

四、结语

智能语音技术以其灵活、便捷、高效的特点已成为商业合作的重要对象，与相关设备结合普遍应用于现实生活。面对可能出现的风险，应理性看待，接受“风险与便利”并存的事实。供应商也应积极应对，在内加强技术优化，在外制定行业规范，逐渐解决问题。共同营造良好的使用环境，保障用户安全及利益，为日后人工智能的普遍商用提供有效借鉴。

参考文献：

[1]甘玉珏，苏军根，林健，洪博宇，鲁维.智能语音产品现状及展望[J].广东通信技术，2017，37（12）：66-68.

[2]李玮，朱岩.AI语音交互技术及测评研究[J].信息通信技术与政策，2019（12）：83-87.

[3]王飞，胡川，罗浩，汪鹏.医疗场景智能语音识别技术的应用研究[J].中国数字医学，2019，14（12）：19-21.

[4]张秀瑞，李树新，葛文珍，张昭.基于自动化的智能家居系统探究[J].电子测试，2020（3）：58-59+7.

[5]李琛.论人工智能的法学分析方法——以著作权为例[J].知识产权，2019（7）：14-22.