时间:2024-05-04
童 星
(青岛理工大学,山东 临沂 273400)
数据采集是计算机应用的重要领域,通过数据处理与采集能够改善复杂信息量激增的问题。常见的数据采集方法为利用ADC多通道系统实现采集过程,但该方法无法确保数据同步采集的时间间隔合理性,会对后续数据分析造成影响,并且对计算机系统的运行速度利用不够充分,占用大量CPU时间,采集效率较低,不能实现高速采集。因此,如何实现多通道通信网络数据跨层高速采集,已经成为该领域急需解决的问题。
为满足通信数据采集的精准性与实时性,相关学者提出如下研究。文献[1]提出基于FPGA的多通道实时高速数据采集方法。对采集系统的信号监测、前端数据处理、核心控制与数据显示等结构进行设计,并分析该系统的工作原理;把获取的数据储存到FPGA储存器中等待处理,此时设计信号调制电路,使调整后的电路能够确保电压信号的平稳;另外设置软件功能,降低数据与时钟之间的偏斜程度,待系统判读生效后,将上述待处理的数据传输到控制器进行处理,从而实现了数据的采集功能。文献[2]针对现有方法无法有效匹配事件序列的不足,提出基于TCN的量化时序约束表示模型,运用该模型将事件转化为简单的时序约束问题,使复杂事件检测方法更加高效,从而实现数据采集的有效控制。
上述采集方法在一定程度上减少了数据冲突,达到了延长系统使用寿命的目的,但不能实现采集精度与效率之间的平衡。因此,本文在时序控制的基础上,对多通道通信网络数据跨层采集方法进行研究。在许多领域中存在按照时间顺序发生的具有概率特征的随机事件,根据先后顺序将发生的事件记录下来,就形成了时间序列。本文通过对多层数据的挖掘,确定数据采集原理,根据该原理对时序进行设计,实现对时序的控制,最后通过对比实验验证了所提方法的优越性能。
在多通道跨层冗余通信网络数据挖掘过程中,不同通道与层次的取值和阈值存在密切关系,取值数量和阈值大小存在反比关系,将通道最底层的不同数值当作先验知识,在此基础上对所有通道中最底层的阈值进行定义,每个通道的高层阈值根据对比所在层中的不同取值产生,并对其阈值上限进行限定,确保阈值小于等于1。因此获取第i个通信到最底层最小支持度与最低可信度[3,4]的表达式分别为
(1)
(2)
因此第i个通道j层的阈值表达式为
(3)
(4)
式中,n表示多通道多层数据的通道数量,dij代表第i通道j层具有的不同取值数量;X表示集合规则结构。
利用免疫遗传算法[5],将关联原则作为依据对跨层数据进行挖掘,挖掘过程包括最小支持向量的频繁规则选择与强度关联原则的发生两部分。
假设一个多通道跨层数据集合{Ai,Bj},Ai与Bj分别代表决策与任务属性,集合规则结构生成一串编码X={b1…bm.x1…xn},b1…bm与跨层数据的任务属性相对应,x1…xn与决策属性相对应,则适应度函数表达式为
(5)
对式(5)进行遗传操作,将免疫原则选取策略作为基础,结合浓度概率[6]Pd与适应度概率Pf确定跨层数据的选取机率P,个体浓度d通过群体中相同个体数目q与数据群体规模M之比获得,因此,Pd与Pf可以通过以下描述进行表示
(6)
(7)
式中,fij表示多通道跨层群体中个体的适应值;ftotal表示群体中全部个体适应值之和。
根据上述公式获得跨层数据的选择机率P的表达式为
P=aPf+(1-a)Pd
(8)
式中,a为一个常数,满足a∈(0,1)的条件。
由于会产生浓度较高的抗体,因此必须对浓度群体进行更新,确保适应度较好的个体被选择出来的机率更高,假设抗体浓度为W,它代表群体中适应度最强的抗体数量和全部抗体数量的比值,则调控个体的选择机率p(i)的表达式为
(9)
式中,β表示可以调整的参数,并且β∈[0,1]。通过上述分析得出抗体最大程度的适应性,因此完成多通道数据无冗余跨层挖掘[7]。
根据数据挖掘结果,依据最短路径原则对数据进行跨层采集。在对通信网络数据采集的过程中,获取通信网络实际传输数据的总数量,并取得数据采集总数量最大化的限制条件和全部网络节点接收信息总量与跳数存在的关系。将通信网络数据采集问题转变成最大数据量采集的最优路径选择问题,确定通信数据采集的目标函数,在此基础上实现对通信网络数据的采集。具体过程如下:
(10)
(11)
(12)
(13)
(14)
(15)
根据上述通信网络数据采集原理实现对多通道通信网络数据的跨层采集,但是采集过程耗能较高,容易出现延时现象,下面结合时序控制方法对其进行改善。
结合上述对数据采集原理的描述,时序控制应该提供和接收下述时序信号内容:
主机系统存在的启动脉冲TTR;信息缓冲带发生器原始脉冲TRS;定时脉冲TSH;转换器的启动脉冲TST;转换器的结束信号EOC;通道地址的统计数量脉冲TCA;信息缓冲带脉冲TWE,地址记录脉冲TBA,采集结束脉冲TCE。
结合采集原理,上述信号的时序关系图如图1所示。
图1 数据采集工作时序图
定时采集脉冲TSH的时间间隔Δt可以根据具体程序设置,从上图中可以看出Δt不能小于ΔT。ΔT由采集系统的工作速度决定,它可以体现采集系统的时序关系操控采集过程所达到的最快速度,根据图1的工作时序图实现通信网络数据采集。
根据图1中显示的工作时序,获取多通道通信网络数据跨层采集的控制原理图,如图2所示。
图2 时序控制原理实现图
图2中,主系统利用一条输出命令就可以触动启发器脉冲TTR,它将主系统数据总线DBO中的数据“1”传输到触发器D1的Q端,因此能够启动系统中的定时器与计数器的控制信号GATE,表明此时这两个程序开始工作,触发器D1的Q端启动了单稳3,令其出现一个初始归零脉冲TRS,此时脉冲信息缓冲带地址发生器为清零状态,并将DMA请求信号同时清零。
采集系统启动后,定时器发生的定时脉冲TSH控制每个通道数据的自动采集过程。每条通道地址发生器是通过一个3bit的二进制计数工具完成的,在被定时脉冲每进行一次清零时,所有的统计数量脉冲都会加1,此时输出的计数情况可以当作每条通道地址。按照上述过程,每个定时脉冲实现一个时间段的数据采集,同时定时脉冲还会触发单稳2,经过与单稳2的联通,产生ADC的启动脉冲,此时该通道的A/D转换也被启动。在转换结束后,ADC将产生转换结束信号EOC,该信号不但出现各通道地址的统计数量脉冲,使通道地址加1,并连接下一通道,而且启动单稳1出现数据缓冲带的脉冲信号,将转换结果记录在缓冲带中。信息缓冲带脉冲结束时出现的地址记录脉冲信号会使缓冲带的地址启动器加1,并指向下一个缓冲区。此时,缓冲区地址启动器同样通过二进制计数器实现,它的计数位数和缓冲区的容量相对,将计数状态当作缓冲带地址,并利用信息缓冲区启动器的原始脉冲将其清零,再由地址记录脉冲令其加1。
同时,地址记录脉冲触发单稳2,获取下一通道的转换启动信号。按照上述过程,实现高速通信网络数据采集的信号转换与结果储存。当每层数据的最后通道采集结束后,地址计数器输出Q2变为“1”,此时结束信号TGE,禁止产生转换启动信号,直到下一个定时脉冲启动下一通道的数据采集。此时实现了时序控制的多通道通信网络数据采集的全部过程。
在实验过程中,为更好验证基于时序控制的通信网络数据采集方法的可行性,进行对比实验。选取模拟数据集My-Sea作为基础数据集,并通过在线数据分析软件MOA进行数据处理。
由于多通道跨层数据采集是基于计算机网络实现的,因此,会造成网络拥塞现象,降低计算机运行效率,所以,首先利用所提方法与文献[1]、文献[2]方法对网络运行的拥塞率进行对比实验,计算公式如下所示
(16)
式中,v表示数据采集过程中计算机运行速度;v0表示原始计算机运行速度。
三种方法实验结果对比图如图3所示。
图3 不同方法的拥塞率对比图
从上图可以看出,所提方法在进行数据采集时,拥塞率保持在25%以下,而文献[1]方法的拥塞率最高值达到了47%,文献[2]方法的拥塞率最高值达到了36%,从上述数据可以看出,现有方法的拥塞率明显高于所提方法,说明该方法对网络的依赖程度不高,运行速度较快。这是由于所提方法在进行数据采集时序控制之前,采用免疫遗传算法对通信数据中的冗余数据进行了剔除,实现了跨层无冗余数据挖掘,因此拥塞率较低。
为了突出所提方法的全面性与合理性,将数据采集延时作为评价指标,进行对比实验,实验对比图如图4所示。
图4 不同方法数据采集延时对比图
根据图4可以看出,随着数据采集量的不断增多,与其它两种方法相比,所提方法的数据采集延时更短,说明该方法具有很好的采集效率,能够满足对数据采集的要求。这是由于所提方法在数据挖掘的基础上,参考最短路径原则,将数据采集问题进行了转变,转换为最优路径选择问题,并通过设计时序控制逻辑,绘制工作时序图,设计时序控制方案等步骤实现对多通道通信网络数据跨层采集的时序控制。
为提升通信数据采集能力,本文对多通道通信网络数据跨层采集时序控制方法进行研究。首先通过免疫遗传算法去除大量的冗余数据,完成跨层信息挖掘;其次将最短路径理论与数据采集相结合,分析采集原理;最后在该原理基础上对时序进行设计,并实现高速采集通信数据的目的。测试结果表明,所提方法可以在保证数据安全的基础上,大幅度提升多通道通信网络数据跨层采集的能力,可以实现对整个采集程序的有效管理。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!