当前位置:首页 期刊杂志

基于标准数字化的标准智能编制系统设计与实现*

时间:2024-05-18

黄军凯,吕黔苏,林正平,王志明

(1.贵州电网有限责任公司电力科学研究院,贵州贵阳 550002;2.南方电网科学研究院,广东广州 510663)

标准是为在既定范围内获得最佳秩序,促进共同效益,按照规定的程序经协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件,是一种标准化文件[1]。作为技术传播和成果呈现的重要载体,标准文件具有严格的规范和格式,为标准的检索、阅读、推广应用奠定基础,极大程度减少不同背景、不同单位甚至不同文化技术人员对标准内容的理解歧义。然而,这种严苛格式给标准带来统一、便捷的同时,也提高了标准的编制、校审的难度,增加了标准技术内容外的工作量。随着数字技术的发展,对标准编制工作进行数字化改造和升级的需求越来越迫切。《国家标准化发展纲要》也适时提出“推动标准化工作向数字化、网络化、智能化转型”,提升标准数字化水平。

1 标准编制数字化需求现状

长期以来,标准文件的编制都有严格的格式规定,相关的用语和用词也有严格的要求,如表示肯定的用词有必须、应当、宜、可等,表示否定的用语有禁止、严禁、不得、不应、不宜等。这些规定和要求,一般通过正式的标准、文件或规范进行规定和约束,成为标准编制人员必须遵循的基准。如GB/T 1.1—2020《标准化工作导则第1 部分:标准化文件的结构和起草规则》对标准化文件的结构及文件起草的总体原则和要求进行了明确,并对文件名称、层次、要素的编制和表述规则以及编排格式进行规定,是标准编制工作最基础的文件之一。

传统标准等技术文件主要是靠编制人员人工依据有关要求对标准内容进行编排,然后由标准审查人员按照相关标准编制规定进行人工审查,工作量大、任务机械,普遍存在以下几方面问题:①格式呈现不规范。大部分标准化文件,是通过文字描述对有关内容进行规范,技术人员经验和水平参差不齐,文件编制存在很大的随意性,大大降低了标准化文件的规范性。②技术要素不协调。虽然相关标准中规定每类文件的典型技术要素,但由于每个人的理解不一样,执行程度也不一致,导致同类标准的技术要素差异非常大,内容不协调。③标准知识查询引用不便捷。标准规范性引用文件、标准条款内容知识的引用等,大部分需要依靠专家的经验,通过人工查找阅读确定。由于专家水平不一,容易造成遗漏和错误。④标准校审任务重。标准化文件有其特殊的格式要求,如标题、列项、注、示例、图、表、公式、引用等,审查人员既要保证标准的格式符合要求,又要保证内容清晰准确,还要保证不同标准中的技术协调一致,难度大、任务重。为了缓解上述问题,标准化业界也通过编制word 文档模板、开发标准化文件编制工具(如Standardizing document Editing Tool,简称SET 2020)等达到一定效果,但也仅解决了文件草案的要素和层次样式问题,并且工具不够灵活、无法实现格式校验,更无法满足知识查询、嵌入式引用等数据时代的新需求[2]。

2 系统建设目标与功能

2.1 总体目标

在企业层面,随着机构的发展和壮大,以标准为代表的技术文件编制越来多。尤其是大型企业、集团型企业,下属成员单位多,技术文件编制和管理成为一项繁重的工作。且大部分技术文件的编制如同标准编制一样,具有必需的要求和格式,如《南方电网科学研究院有限责任公司技术报告管理办法》,对技术报告的格式进行了严格的规范,以保证标准等技术文件编制质量。

基于标准数字化的标准智能编制系统针对上述情况,主要定位于企业,尤其是大型企业、集团型企业,通过将标准模式定义技术与标准数字化技术有机结合,一方面实现标准免格式内容填写,另一方面实现相关标准内容知识随查随用、关联引用,有效解决标准编制过程中面临的格式烦琐和知识查询引用不便捷等问题。系统的总体建设目标是实现在企业生产运作的不同阶段、各类型设备的不同生命周期,通过标准模式定义、结合标准数字化形成的碎片化标准数据库和素材库,辅助业务专家和技术专家高效、便捷、准确地编制各类标准化文件。

2.2 功能要求

标准模式定义。标准模式类似于标准文档模板,是实现标准文献结构化编制和免格式填写的核心技术,一般包括基本信息、内容信息和表述信息3 个方面,分别定义了标准的共性元素(包括标准号、中文名称、起草人、发布日期、批准单位等)、标准的个性元素(包括范围、引用文件、术语和定义、代号和缩略语、章条、附录等)、内容信息的描述方式(包括公式、图、表、段落、列项和示例等)[3]。传统标准编制工具(如SET 2020)通过植入定义完成的标准模板,固化标准文件结构和内容要素格式,不灵活、增减删改不便捷。为此,系统需要对标准模式定义进行优化升级,达到标准固化模板与灵活定义之间的合理平衡,既实现模板、要素元素的结构和格式的规范,又可以根据需求进行灵活调整编辑。

标准智能填写、动态关联。现行常用标准模式定义(包括基于word 的文档模板、基于Schema 文件生成的XML 格式的结构化文档等)能从一定程度上规范标准的封面、层次结构和内容格式等问题,实现标准内容填写式编制,但无法解决引用文件、术语指标等关联更新。基于标准数字化的标准智能编制系统,通过对标准素材库的维护,实现标准编制过程中对内容联想推荐,并实现标准引用文件、术语等内容的动态关联、同步更新。

标准内容智能纠错。一方面实现对标准层次结构、基本要素、格式内容的自动识别和纠正,另一方面实现对常见文字错误和表达错误的自动识别和纠正。对于识别出来的问题,系统可指出错误类型、错误位置,提出修改建议,并允许专业技术人员或审核人员作出采纳或忽略操作。

标准知识推荐、搜索与调用。该功能是基于标准数字化的标准智能编制系统的核心功能之一,是在标准编制过程中,通过提供知识查询和调用接口,对数字化的标准碎片知识(包括公式、图、表、术语、条款、指标体系等)进行搜索查询和复制粘贴,实现即查即用。同时,通过知识图谱构建[4],在标准编制过程中,系统可根据编制的标准推荐相关标准、术语指标或章条内容。

3 标准智能编制系统设计

3.1 总体思路

系统以数字化、碎片化标准知识库为核心,通过标准模式定义技术、标准知识图谱构建、智能推荐、智能搜索等技术综合运用,辅助业务人员、技术人员实现标准结构化编制、智能化填写、格式自动校验,同时实现标准知识的自动推荐、智能查询、关联引用,等等。

系统主要逻辑如图1 所示。

图1 标准智能编制系统逻辑示意图

3.2 功能架构

基于标准数字化的标准智能编制系统是一个基于网络的B/S 信息化集成系统,可部署在企事业单位内网或外网。系统主要由前端使用人员标准文件编辑模块、后台模板与信息的管理维护模块两方面构成。

标准文件编辑模块:主要包括标准模板结构编辑、标准内容编辑、知识助手。标准模板结构编辑功能可以对选择的标准模板结构进行修改调整。标准内容编辑功能是对模版生成的标准文本进行内容填写,包括术语联想、元素编辑、更新引用文件和术语、保存预览等功能。知识助手可根据选择的模板、章节为标准编制人员提供查询、推荐相关文档、章节内容、碎片化标注知识等。

后台管理模块:主要包括标准模式定义、标准模板管理、人员角色管理、基本信息维护等。标准模式定义主要按照有关标准、规范要求(如GB/T 1.1—2020等),对标准文件,既包括国际标准、国家标准、行业标准等不同层级标准,也包括企业里有特定各执元素要求的技术规范书、技术文档等标准化文件,定义数据模式(Schema)文件,作为标准全文结构化的母板文件[2]。标准模板管理是对有关模板进行导入、增添、删除等操作。人员角色管理主要对后台管理人员和前端使用人员权限进行管理。基本信息维护包括系统相关的元数据信息、日志信息等相关信息的管理。

4 软件实现

基于标准数字化的标准智能编制系统的使用包括标准模板选择、结构与内容编辑、格式与文字校验、标准文本导出(word 和pdf 两种格式)等流程环节,同时提供标准文档和碎片化知识智能推荐、自主查询、粘贴引用等功能。其中,用户主界面主要包括模板结构、内容编辑、知识助手3 个版块区域。

模版结构区用于编辑标准文件的章节结构内容,可调整标准层次结构(包括新增、删除和拖拉移动不同层级的章条)、编辑章节名称内容等。另外模板结构版块还作为标题导航,用于点击定位标准章条内容。

内容编辑区用于编制标准各部分具体条款内容,并可以根据需求插入术语、图、表、公式等各类标准元素,实现免格式填写和编辑。此外,由于整个标准智能编制系统构建在标准数字化知识库和知识图谱技术基础之上,在编辑引用文件、标准术语、关键指标等内容过程中,系统会从知识库根据数据自动联想相应内容,编制人员可以根据推荐选择符合要求的知识内容。

知识助手用于相关知识的搜索查询和推荐。系统可根据标准编制过程中所选的标准模板和章条,自动推荐相似的其他标准和章条,并可通过点击“粘贴至文章”将相应内容粘贴至内容编辑区。当点击“粘贴至文章”后,系统会自动引用该标准,并将标准信息更新到引用标准文件中。在推荐的标准文档中,点击文档标准,系统将展示文档全文内容,可选择文档中的碎片内容进行粘贴至文章中。除此之外,还可在搜索框中搜索标准编制过程所需的公式、图、表、术语、条款等内容,并将需要的内容粘贴至内容编辑区中。

5 结束语

在数字化时代,随着各行各业数字化转型的推进,标准自身的数字化势在必行。标准编制的数字化转型是标准数字化转型的重要内容之一。基于标准数字化的标准智能编制系统,从层次结构、元素格式等方面对标准进行规范,实现了标准的免格式填写,极大地解放了标准编制人员和审查人员的工作量。更重要的是,系统基于数字化、碎片化的标准知识库,能为标准编制人员提供专业、高效、权威的标准知识服务,有力支撑标准内容质量。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!