当前位置:首页 期刊杂志

监狱工作中智能语音技术的应用

时间:2024-08-31

吴和生

(江苏省司法警官高等职业学校,江苏 镇江 212000)

语音是人类交流中最为方便有效的方式。随着科学技术的不断发展,语音不仅是人与人之间的交流工具,也成为人与机器之间的交流工具。人类可以通过语言与机器进行沟通,并传达自己的指令,使得机器根据指令去执行相应的工作。随着人工智能的飞速发展,智能语音技术可以使得终端设备具有“能听会说”的本领。政府更是发布了一系列关于人工智能的政策,为智能语音的发展创造了良好的环境。2017 年7 月,国务院印发《新一代人工智能发展规划》,国家科技部宣布科技公司科大讯飞成为国家新一代人工智能开放创新平台之一,智能语音技术上升至国家发展战略。

近年来,监狱信息化工作取得了快速的发展,各核心业务的信息化应用水平不断提升,逐步实现了全流程、高覆盖、信息化应用体系。但在监狱工作的特定场景,如会见、亲情电话场景、谈话笔录、网络教改场景、监区医院诊疗场景、行政管理场景等业务场景,仍然采用人工处理方式为主。智能语音技术的发展,能够提供强大的技术服务能力,较好地解决问题,优化程序,减少监狱工作的潜在风险,为基层监狱工作提供强大推力[1]。

1 智能语音技术的基本内涵

1.1 智能语音技术发展现状

人工智能技术的高速发展,给智能语音技术的发展提供了广阔的平台。目前,国内领先的智能语音技术已经在电信业务、教育、医疗、法院等多个领域中取得了先进应用。例如,在电信业务中,智能语音技术为电信运营商的炫铃/彩铃以及各种音乐和实用信息业务提供语音搜索软件技术平台;在教育领域中,智能语音技术应用于机器阅卷、口语评测及融入语音交互的智慧课堂设备;在医疗领域中,智能语音技术应用于实时听写、医学影像、基于认知计算的辅助诊疗系统。例如,美国智能语音技术公司可以实现在5 min 内将10 h 的语音病历转录成文字,其医疗解决方案已经覆盖全美国72%的医疗机构,每年为超过50 万名医生、1 万个医疗机构提供服务。2017 年2 月,最高人民法院修订发布《关于人民法院庭审录音录像的若干规定》,将智能语音识别技术引入法院庭审记录,并赋予这一新技术成果的法律效力[2]。

1.2 智能语音技术模块分析

目前,基于人工智能的主流语音技术包括3 大模块,即语音识别系统、语义理解系统和语音合成系统。人声语音信号经过语音识别系统进行数字信号转化、降噪处理、断点检测、反馈中断等操作,将原始语音信号转变为标准文本信息;文本信息通过语义理解系统,经过自然语言处理,使得文本信息“翻译”成机器理解的计算机信号,通过语义理解系统中特定语音数据库进行学习比对,生成标准文本或命令来反馈执行,主要进行语义识别、置信度输出的操作;最后,执行结果文本经过语音合成系统进行文本规范、音调确定等操作,通过语法分析和韵律分析转变成语音,输出到屏幕、扬声器等语音输出系统,完成整个过程[3]。

1.3 智能语音技术的特点及监狱应用智能语音技术的现实意义

智能语音技术的特点:一是便捷性,在语音获取方面非常简便,手机、录音笔等设备可以高效方便地完成语音采集;二是准确性,语音是每个人都具有的生理特征,具备唯一性和稳定性,通过专业采音设备获取的语音可以准确识别,目前在相对安静的环境内,语音采集准确性可以达到98%以上;三是实时性,目前最新的语音识别设备可以实时记录说话人说的每个字,实时记录速度在每分钟300字以上,而录音文稿可以做到记录速度在每分钟2 000 字以上,差错率已降到2%,在不同语言之间也可以无缝切换。在监狱工作中,罪犯的亲情电话、会见电话、狱内侦查、谈话笔录、语言服务产生的大量语音数据,需要花费大量时间精力进行管理。利用智能语音技术中的声纹识别、语音识别与合成、自然语言处理、声学事件监测、语音控制技术及时处理,从海量的语音数据中筛选有价值的信息,通过智能分析及时发现线索,从而提高工作精确度。

近年来,江西省重视茶产业发展,在政策方面,出台了《关于推进全省茶叶品牌整合的实施意见》等一系列政策文件;在经济方面,政府每年整合一亿元资金集中扶持江西的特色茶叶发展,即“四绿一红”,分别是浮梁茶、婺源绿茶、狗牯脑茶、庐山云雾茶和宁红茶五个省级重点茶叶品牌;在文化方面,积极开展江西茶叶博览会,邀请世界各国各地区的人们来参加,更加深入了解江西茶叶的各个方面,推动茶叶文化的交流从而促进茶叶出口。

2.3.4 监区医院诊疗

2 智能语音技术在监狱工作中的框架结构及应用需求

2.1 基本框架

(3)钻井液处理剂加量的数字化。对每种药品的性能及配伍性进行深入研究,实现每个井段加入量的数字化。避免处理剂不配伍,反复加入处理剂等问题的出现,节省成本,降低劳动强度。

硬件基础层。硬件基础层为整体框架的底层,架构计算机基础硬件,如计算服务器、数据服务器、硬件存储资源、网络备份存储、交换机、网络拓扑架构等,保障系统的正常运行。

1932年,Binham提出黏度的倒数具有加和性,并经过实验验证,如式(2)。可以看出,该模型预测精度会随着组分油品的黏度比增大而显著降低,特别不适合两种组分油黏度相差大的油品混合后黏度的预测[4]。1992年,李闯文通过13组实验结果对该模型进行预测,发现结果并不理想,在此基础上提出一种改进模型,如式(3)。

2.2.1 电话语音场景

在监狱内,每天有大量的罪犯需要就医诊疗。在医院监区看到长队候诊是常见现象,究其根本原因在于监区医院警力不足,常规的医疗诊断流程繁琐,智能语音技术可以记录患者口述的病情,转成文字形成罪犯电子病历存档,同时将医生口述的诊断语音转换成初步文件,再快速加以核对、编辑,不需要医生将资料逐字键入电脑,能便捷地把资料转换成电子档案。智能语音识别技术的运用降低了医生的工作强度和医院监区日常运作成本,从总体上提高了医院监区收容病人的能力,缩短了无效等待时间,便于监狱提高管理效率。

2.2 监狱狱务应用场景

在智能语音的系统架构中,智能语音可以代替原来人工交流的模式。替代之前由民警承担的人工操作,存在一定重复性和规律性的工作。

数据资源层。数据资源层主要涉及监狱狱务数据信息,如亲情电话、会见电话语音数据、狱内侦查语音数据、笔录谈话语音数据、指挥调度语音数据、敏感数据等。

这一年多的时间里,设计方案、技术方案中每个细节的优化,都要经过专家论证拍板。工程建设中遇到的每一个技术难题,随时请教专家现场讨论决定。盐环定扬水工程的高质量来自高标准,来自建设中的一丝不苟。

在监狱中引入智能语音技术,其架构基本与智能语音系统的通用架构一致,在现有的“智慧监狱”中引入主要功能模块,并嵌入具体工作流程。监狱常用的框架在逻辑结构上分为上中下3 层,下层是硬件基础层,中层是数据资源层,上层是智能应用层,保证各业务子系统的独立性,使得系统具备较强的语音数据接收能力、数据信息分析能力和基础存储能力,同时兼顾业务功能的可扩展性,满足新形势下变化的应用需求。

2.2 酒糟有机肥不同用量对烤烟生长的影响 由表2可知,不同酒糟有机肥处理对烤烟生长有一定差异。在团棵期,株高和有效叶片数各处理差异不显著,D2处理的株高稍高于对照,而就最大叶面积而言,D1和D3处理稍低于对照,D2处理高于对照,达325.80 cm2。至旺长期,各处理的株高和有效叶片数均稍高于对照,但无显著差异,最大叶面积表现为D2>D1>D3>CK。在成熟期,各处理的株高、有效叶片数和最大叶面积均稍高于对照,说明一定量的酒糟有机肥配施化肥能够提供烤烟对养分的需求,有利于烤烟正常生长。

2.2.2 谈话笔录

基于监狱管理工作的相关要求,监狱民警需要定期开展各类谈话教育活动,对谈话内容进行记录并以文本提交。同时,在一些特殊场合,如干警与受到禁闭处罚的罪犯谈话时必须在固定场所进行,且需按照监狱管理要求对谈话内容进行录音,并及时形成笔录。智能语音技术直接将录音转成文本,甚至可以按照固定格式形成规范内容。目前,在法院中,智能语音技术已经能够在庭审后直接生成合规的法律文书。这样的应用同样适用于监狱工作的谈话笔录场景,能够极大地减少记录和整理文字的时间,简化办事流程,提高办事效率,从而有效释放警力。

2.2.3 网络教改

2018 年以来,为了落实“五大改造”新格局,司法部指出各地监狱要开通罪犯教育改造专网。当前,许多监狱内部教改网站已经建立,以罪犯易于接受的形式开展教育改造,将起到事半功倍的效果。但基于罪犯整体文化程度和认知水平不高,在网站上进行搜索信息、查阅资料较为困难。通过智能语音系统,罪犯以说话的形式进行查询检索,可以精准找到所需内容。同时,罪犯也可以通过语音聆听的方式,完成教改网站上特定的专题学习。这种对文字要求低门槛的方式能够激发罪犯的学习兴趣,从而达到预定的教育改造效果。

㉗㉜Avishai Margalit,The Ethics of Memory,Cambridge:Harvard University Press,2004,pp.51 ~58,pp.81 ~82.

智能应用层。智能应用层主要完成具体的监狱工作,如在罪犯监听、声学报警、狱务办理、信息公开、监狱会议、网络帮教、辅助诊疗、智能行政各类场景下的业务功能[4-5]。

目前,服刑人员的会见电话、亲情电话,是服刑人员与外界交流的重要渠道,了解服刑人员的电话交谈内容,能从一定程度上了解罪犯的思想动态。现阶段,由于各监狱亲情电话、会见电话产生了大量的语音数据,无论是实时监听还是录音整理,通过传统人工监听的方式受限于警力规模,导致无法及时对通话内容进行分析研判,且人工复听既做不到全覆盖,也无法快速发现问题。智能语音技术能实现对亲情电话、会见电话进行语种方言分类、谈话内容转写、关键词识别等功能,能够帮助民警及时、高效地发现敏感和违规信息,切实提升监狱在全面信息化背景下的战斗力,更好地做好监狱管理工作。

2.3.5 监狱行政管理

在罪犯家属或会见人员询问民警大量监狱狱务问题时,智能语音系统能够提供高质量的语音交互,可以运用人工智能技术在后台分析相关人员的诉求,分析问题因果,会见人员只需要对终端设备进行语音输入,就可以得到交互式的答复和建议。监狱对公电话,对普通群众提出的大多数重复高频的问题也可以应用智能语音设备完成,进行语音识别与合成,减少重复劳动。监狱内的警力流动、岗位培训的问题迎刃而解,效率显著提高[6]。

重庆江津至习水高速公路笋溪河特大桥作为渝南地区新的对外通道中的关键控制性工程之一,其桥梁跨越了笋溪河,桥梁全长约为1578m,承台14座,设置承台的墩7个,主塔塔座2座,承台采用C20混凝土作为土垫层,厚度为20cm。习水岸主塔的桥墩承台尺寸为22.4m×20m×6m,主引桥的承台尺寸为13m×12m×4m,除了主桥与主引桥之外,引桥承台有4个墩,一个桥墩承台尺寸为12.74m×10.2m×2m,一个为7.7m×7.7m×3m,两个为8.2m×8.2m×3m。塔座与承台都属于大体积混凝土。

3 智能语音技术应用于监狱存在的问题

3.1 顶层设计理念落后

在顶层设计方面,司法行政部门政策导向力度不够。随着监狱工作的发展和信息化工作的逐渐深入,虽然国家关于人工智能各类会议和政策文件都在强调其重要性,但总体来看,政府工作推进的力度还有待提高,在顶层设计上并没有完善的政策细则,在监狱狱务的智能语音应用建设上标准不够细化,更多的是笼统的指导性意见。基层监狱在实施时,对于信息化发展的新技术、新模式认识不足,设计应用理念落后,理解也出现了一定的偏差,只是形式化地为了满足智慧建设的文件要求,导致与合作企业的衔接不流畅,缺乏可持续应用。

3.2 监狱应用能力欠缺

监狱在智能语音系统建设之初的设想是推动大面积应用,然而在实际的操作中,操作者存在一系列问题。一是部分民警年级偏大,对新生事物的接受能力不足,存在畏难情绪;二是部分民警思想重视程度不够,没有充分利用新技术提高效率,导致系统并没有显著提高监狱工作的层次和水平,智能语音系统停留在初级应用,大部分是语音录入和文件整理。对于技术含量更高、附加值更大的中高端应用,如语音指挥调度、情报分析研判、咨询交互服务、智能语音提醒、法律文书生成却涉及较少,不能将智能语音技术与监狱工作实战有效结合。

3.3 监狱专业警力不足

专业工作应该由专业的人员开展,有利于提高工作实效。无论是专业性较强的情报分析研判、文书生成,还是操作简单的会议记录、电话记录等,都对民警的信息化技术水平提出了要求。前者需要专业技术能力,后者需要定期专业培训。目前,从事此项技术工作的民警较少,大多数没有经过系统的培训,对专业知识、应用操作流程、质量标准以及相关法律法规了解得不全面,岗位培训时间短、项目少,往往流于形式,不能适应现代化监狱工作的高要求。这就导致民警在具体工作中边学边做,有时由于工作的高负荷也会出现疲于应付的现象。专业警力的不足严重制约了智能语音技术的扩展应用。

3.4 监狱技术装备落后

受地区经济发展和财政收入影响,政府划拨给监狱发展建设资金有限,且大多数放在硬件建设与信息化基础建设上,投入到智能语音系统建设的经费相对较少。因此,监狱单位普遍存在智能语音技术装备落后的问题,相应的语音设备服务器、终端设备、存储设备、网络设备多数处于破旧缺乏维护的状态,需要不断更新升级的软件只能完成基础功能,现代社会运用成熟的功能模块没有有效利用,缺乏可持续性和可扩展性。

4 结语

人工智能技术的快速发展,使得智能语音技术在社会的各个领域都取得了长远发展。虽然智能语音技术在监狱应用还未成熟,在技术应用场景的深度和广度上有待进一步细化、提升,但智能语音技术应用确实能够解决监狱工作中的文字录入、语音分析、行政管理、指挥调度等实际困难,为监狱工作实战提供高水平的质量保证。相信在不久的将来,监狱工作者必将解决困扰发展的瓶颈,推动智能语音技术在监狱发挥更大的作用。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!