当前位置:首页 期刊杂志

基于关联规则的数据统计管理系统设计

时间:2024-05-04

陈丽丽

(吉林建筑科技学院 发展规划处,吉林 长春 130000)

0 引言

当前信息技术快速发展,各行业对各项业务数据的抽取、统计等技术应用逐渐成熟,但在实际开展对数据的统计管理过程中,常常会因为各种原因无法实现对数据的准确分析。针对业务数据的统计和管理,主要涉及的数据类型包括设备数据、资产数据、客户数据等[1]。若进行数据统计、管理时,没有足够的支撑条件,常会由于操作失误,需要进行二次管理[2-3]。关联规则是为查询提供更可靠依据的规则,通过关联规则给出的决策结果,能够实现对用户所需内容更精准的查询。因此,结合关联规则的应用特点,本文在关联规则的基础上,开展对数据统计管理系统的设计研究。

1 系统硬件设计

考虑到对数据统计管理需要,本文在对系统硬件结构进行设计时,按照图1的设计思路实现对系统硬件结构基本组成的设计。

图1 管理系统硬件结构

从图1中可以看出,本文硬件部分主要涉及界面显示、维护器以及管理器。为了解决以往数据统计管理系统在运行过程中存在的问题,本文在传统管理系统硬件结构基础上,重点针对上述3种硬件进行详细的设计说明。

1.1 界面显示设备选型

在本文系统的数据显示界面,利用Tableau作为系统显示载体,选用TBS2000B型号显示器作为本文管理系统的界面显示设备,以此实现对数据在后台数据库中处理具体情况的展示。TBS2000B型号显示器显示屏为9英寸,具备15个水平规格,可提供更长的每屏幕时间以及5 M记录长度,通道数多达20条,其中4条为模拟通道,16条为数字通道。通过数字显示器和125种触发组合,能够实现对数据的快速查询,并通过Wave Inspector在显示屏上实现各项指令动作。在TBS2000B型号显示器中还引入了FilterVu ,可以有效降低数据在传输过程中周围的噪声,为后续管理提供精度需要[4]。

1.2 运行维护设备选型

在系统运行过程中,一旦出现故障问题,应当在第一时间对其进行排查,并找出解决方案。针对系统运行过程中的维护设备主要包括数据维护和页面维护两种[5]。在系统运行中,将数据统计更新时间设置为一个月1次,在Excel当中实现对数据模板的更新,并对导入的数据进行相应的更新。为了确保上述运行需要,选用ELC-18-98640型号运行维护芯片。将该芯片应用到本文统计管理系统的服务器当中,利用该型号芯片的维护功能实现对系统的运行维护。为了确保系统运行稳定,在芯片当中引入了低压差稳压器,实现系统低噪声、高波纹抑制比以及低电流消耗的运行效果。

1.3 管理器设计

在对管理器的选择时,选用TUVA4958-49870型号管理器。该型号管理器包含了一个智能TUVA芯片,采用交互型的CANnet通信协议,波特率为1 200~38 400可调,接口为RS232串口,延时为通道1~500 s可调,可支持无线WiFi云智能网关网络环境通信传输。TUVA4958-49870型号管理器,在研发阶段引入了loT物联网技术,适用于各项业务数据的管理系统,可充分满足用户对管理学通提出的各项应用需要。通过该型号管理器中具备的通道延时管理、模式管理以及定时管理等,实现对数据统计以及系统整体运行的自动化管理,解决以往由于人为操作失误造成的损失[6]。

2 系统软件设计

2.1 数据抽取

在对各类业务数据进行统计和管理时,可将数据大致划分为已执行数据和未执行数据两种,利用SQLPLUS工具软件完成对数据的抽取,并生成相应的SQL语句,将其导入系统中的数据报表,并结合脚本实现对被抽取数据的性能分析。针对不同类型的数据,由系统将其调用到相应的应用程序中,并在各个应用程序内完成对数据的统计和管理。针对不同应用程序中的数据,为了确保后续数据统计和管理的便利,需要合并和清除定义问题步骤中的数据,通过对抽取数据的进一步整合提升数据的质量。

2.2 基于关联规则的数据统计

假设两种强关联规则分别为A和B,当A≥B时,则对应的项目集合存在A∪B的关系,并且在数据集合当中必定存在频繁项目集,而频繁项目集A∪B能够进一步推导出关联规则A≥B的置信度支持率。由于在海量数据中存在着多层结果,因此需要通过多层关联实现对数据的统计。结合概念层次树,在多个抽象空间中完成对多层抽象知识的描述,以此解决数据统计时由于多维数据空间中数据稀少而造成统计效率低的问题。结合上述关联规则在从海量数据当中获取到有效的数据后,对数据进行统计。在系统当利用Excel工具软件进行数据处理,在管理过程中用户可在对应的数据上贴上相应的属性标签,以此完成数据统计。

2.3 数据挖掘结果分析与管理

在挖掘过程中,针对数据和数据集的支持度和置信度进行计算,实现对数据的有效描述。其中,支持度的计算公式为:

φ=x/m

(1)

公式(1)中,φ表示为数据的支持度,即在某项业务中该数据出现的概率;x表示为存在多组该数据同时出现的次数;m表示为所有业务数据出现的次数。通过上述公式,得到数据的支持度后,利用该数据实现对管理过程中动态特性的描述。再针对数据的置信度进行计算,计算公式为:

(2)

公式(2)中,c(X->Y)表示为置信度;n′表示为某项业务数据在数据集合中出现的总次数。根据数据的置信度,实现对管理过程中数据安全性的评价。

3 对比实验

3.1 实验准备

为了实现对本文上述提出的统计管理系统的验证,选择将本文系统与传统基于微服务架构的统计管理系统应用到相同的数据业务中,在相同运行环境中对比两种系统的运行效果。对于两种管理系统客户端的选择,均选用CPU P4 1.7 G128 MB内存、40 GB硬盘的服务器。为了实现对两种系统统计效果的对比,选择将统计结果可靠性作为评价指标,利用统计效率作为量化评价结果。为了实现对两种系统管理效果的对比,选择将管控时长作为量化评价指标。

3.2 统计效果对比

综合上述论述,为实现对实验组和对照组两种系统统计效果的验证,记录在系统运行不同时间条件下统计结果的效率,其计算公式为:

(3)

公式(3)中,β表示为系统统计效率;W表示为需要进行统计的业务数据总量;w表示为在规定时间中未正确完成统计的数据量;t表示为规定系统运行时间。根据上述计算公式(3)将实验组和对照组管理系统的统计效率纪录,如表1所示。

表1 实验组与对照组统计效果对比

从表1可以看出,本文提出的基于关联规则的统计管理系统具备更高的统计效率,统计结果可靠性更高。

3.3 管理效果对比

在完成对两种系统的统计效果对比后,在上述实验准备基础上,针对两种系统的管理效果进行对比。两种系统在上述相同的运行环境当中完成5次管理,分别对其达到预期管控效果时的管控时长进行记录,如图2所示。

图2 实验组与对照组系统管理效果对比

从图2可以看出,实验组和对照组在对相同业务数据进行统计管理时,其管控时长大致变化幅度相同,但明显每次管理中实验组的管控时长更短。证明本文提出的基于关联规则的数据统计管理系统在实际应用中,确保统计结果可靠性更高的同时,缩短管控时长,提高管理效率。

4 结语

为实现对各项业务数据的统计与管理,在传统系统基础上,总结其存在的问题,并通过引入关联规则实现对其优化。在实际应用中,利用本文提出的管理系统除了能够对日常业务数据进行统计和管理外,还能够实现对数据的进一步分析和挖掘,提升数据的利用价值。但由于研究能力有限,在研究过程中并没有考虑到关联规则对数据挖掘时原始数据的广泛性和丰富性,因此应用结果欠深入和全面。针对这一问题,在后续的研究中还将进行深入研究,从而实现对本文系统应用性能的进一步提升。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!