时间:2024-08-31
杨建兵,肖 丹,郭 霞
(1.装甲兵学院,安徽,233013;2.江南计算技术研究所,江苏,214083;3.南京炮兵学院,江苏,211132)
数据挖掘,是从有噪声、数量庞大(通常数兆兆字节或更多)、随机的、不完全数据中,通过特定的算法,自动地抽取事先未知的、隐含的、具有潜在价值的规则和知识。数据挖掘是一个多学科的交叉领域,吸纳了模式识别、机器学习、可视化、数据库和数据仓库、统计学、信息检索、高性能计算和许多应用领域的大量技术。数据挖掘的过程一般分为:数据选取、预处理、转换、数据开采、模式解释和知识评估等阶段。
图1.数据挖掘的基本过程
信息化战争带来了瞬变的战场态势、复杂的战场环境、多元的作战元素,海量战场数据对作战指挥系统的数据处理能力提出了更高的挑战。
信息化战争时代,对情报数据的处理能力已经成为决定作战指挥决策优势的关键因素。如何从多类、大量的信息中提取出对作战指挥及时、有用、准确的情报,并能使指战员从海量信息分析处理的繁琐中解脱出来,而又不损失情报中的有效信息,已成为军事情报领域的一个关键课题。美军在伊拉克战争中依靠网络中心战的作战环境,通过数量链将高度分散的作战力量链接在一起,一旦发现敌情,作战指挥中心便可通过“漫游者”软件和Link-16 等数据链,实时快速地分析与评估作战对手的实力和规模,优化配置作战力量,实施有效打击。
信息化战场的数据库极易受不一致数据、噪声和缺失值侵扰,这是由于数据库太大,并且来自多个异种数据源。数据挖掘在获取分析军事情报的过程中,先要针对指挥系统及指战员的需求对情报系统的目的意义、环境问题、目标、范围进行具体的分析,通过数据变换、数据清理、数据归纳、数据集成等方法对数据进行预处理,为进一步搜集资料做好前期工作。同时对整个过程要有时间上的控制,以确保情报搜集的时效性。数据挖掘在获取分析军事情报的应用见图2.
图2.数据挖掘在获取分析军事情报应用示意图
作战仿真是提供模拟软硬件操作、满足武器装备认知、论证装备体系、验证战法训法的有效方法和手段,而仿真数据是完成作战仿真目标的主要凭据。由于信息化战争的涌现性、复杂性、非线性,致使仿真数据海量增加,作战仿真已进入大数据时代。数据挖掘可高效地对作战仿真中收集的数据进行分析,发现仿真数据间未知的关系,用新颖的、可理解的、实用的方式来归纳数据,为部队训练、装备论证和作战等提供支持。通过数据挖掘技术,在海量仿真信息中挖掘实用的信息规律,使战场信息资源在整个作战范围内实现最佳配置,为指战员提供全面、可靠的数据分析结果,协助指战员作出决策。
图3.数据挖掘算法体系
信息化战争中的作战指挥网络一直处于危险中。随着作战指挥网络规模的增长,多种敌方入侵和攻击网络手段和工具的出现,使得维护作战指挥网络安全成为网络战的关键组成部分。敌方网络入侵可以定义为威胁战场网络资源可用性、完整性或机密性的行为。入侵检测系统和预防系统都监测作战指挥网络系统运行和流量,及时发现恶意活动。入侵防御系统的主要效能是识别恶意行为,同时把这些行为的信息写入日志,以阻止恶意活动并上报这些活动。数据挖掘可以通过使用分类算法、关联规则挖掘、代价敏感建模、流数据分析、提供可视化和查询工具等方法,开发强大的敌方入侵检测和防御系统,以维护作战指挥网络的安全。一般来说不存在一个普遍使用的数据挖掘算法,一个算法在特定领域非常有效,但在另一个领域却可能不太适合。对瞬息万变的信息化战场数据而言,应根据具体的需求来选择合适的数据挖掘方法。在信息化战争的大背景下,寻找最适用维护作战指挥网络安全的数据挖掘算法,并对相关的具体算法进行改进是十分必要的。
美军曾明确提出,通过数据挖掘将战场数据分析能力提高100 倍以上。如果这一目标实现,那在这一领域别国与美军的差距就不能用简单的代差来衡量。通过多年发展,美军已经拥有全球最先进的情报侦察系统。如何处理海量战场数据,一直是美军战场侦察的短板,而数据挖掘能够帮助美军突破瓶颈。目前,美国国防部以约每年2.5 亿美元建设经费的投入,将数据挖掘建设提升为美军战略重点推进。2012 年3 月,美国国防部高级研究计划局(Defense Advanced Research Projects Agency, DARPA)启动了“X DATA”计划,将数据挖掘视为大数据战略在国防安全领域贯彻的核心功能加以重点发展。不可否认的是,美军依靠其技术优势,正将与别国在战场数据分析技术上的差距进一步拉大。
目前,国内数据挖掘产业还不成熟,从事该方面研究的人员主要集中在高校,只有少数分布在公司或研究所,且大部分研究项目均是由政府资助,主要研究方向集中在数据挖掘的学习算法等理论方面,但对其实际应用问题的研究较少。如何进行数据挖掘技术在信息化战争中的系统利用是一个值得关注的重要问题。
信息化战场复杂多变,在敌我对抗日趋激烈,指战员需要随时处理、解决复杂情况。只有在复杂纷繁的海量战场数据中发现内在的规则,有效快速地形成战场数据支援和战场态势分析,才能把握信息化战争的主动权。对于当前军队信息化建设,数据挖掘技术具有很大的牵引和拉动作用。
[1] 朱小宁.数据挖掘:信息化战争的基础工程[J].解放军报,2005:0830(006).
[2] 范明,孟小峰.数据挖掘概念与技术[M].北京,机械工业出版社,2012.
[3] 王惠中,彭安群.数据挖掘研究现状及发展趋势[J].工矿自动化,2011(2):29-32.
[4] 许辉辉,许荣荣.云计算在军事情报融合中的应用研究[J].西安文理学院学报,2014(1):97-100.
[5] 吕正卿,许德斌.“云计算”技术影响下的新军事变革[J].中国国防报,2011:0407(003).
[6] 成亮星.数据挖掘技术在军事情报管理系统中的应用[J].科技情报开发与经济,2010(7):90-92.
[7] 薛青等.面向作战仿真的数据挖掘[J].四川兵工学报,2013(8):93-95.
[8] Qing XUE. Discussion on Data Mining for the M&S Technique in Armored Equipment Support. System Simulation Technology & Application(Volume 13).
[9]Xue Huifeng. The Intelligence Data Mining[M].Xi’an:The Northwest Technology University Press.2005.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!