当前位置:首页 期刊杂志

计算机文本信息挖掘技术在网络安全中的应用

时间:2024-05-04

文/刘树飞

我国的经济社会不断发展,科学技术水平不断提升,在数据时代背景下,信息呈现爆炸增长趋势,需要对数据信息进行高效处理,不断提高工作效率。信息技术加快了数据传播的速度,优化了信息交流的方式,但也存在安全隐患问题。为了保障网络安全,可以应用计算机文本信息挖掘技术。

1 计算机文本信息挖掘技术概述

计算机文本信息挖掘技术类属于数据处理技术的范畴,被应用在数据处理之中,主要面向文本信息。应用计算机文本信息挖掘技术可以从海量文本信息中提取有效信息,并概括这些信息数据的特点等,对这些信息进行分类和识别。计算机文本信息挖掘技术具有复杂性特征,其应用流程如下所示:

(1)计算机文本信息挖掘技术会对文本对象进行选取,文本对象大多是来自期刊、网页和其他数据库中的文本信息。

(2)计算机文本信息挖掘技术对文本对象进行了预处理,包括对文本对象进行去噪处理、分词处理等等。在预处理过程中,计算机文本信息挖掘技术提取了文本对象的特征,并将文本对象特征表示出来。

(3)计算机文本信息挖掘技术对文本信息进行了深入挖掘,对具有统一特征的文本对象进行了分类,并考察了信息数据之间的关联性,预测了文本对象的发展趋势。

以上三步是计算机文本信息挖掘技术应用的重要流程,也是文本挖掘的主要步骤。

在应用计算机文本信息挖掘技术时,还需要经常应用邻近分类算法。邻近分类算法类属于文本分类方法的范畴,在应用邻近分类算法的过程中,需要先制定分类方案,并对数据、分类方案进行比对,看文本属性最接近哪一个分类方案,可以被归入到哪一个分类方案之中。为了确保分类的准确性,需要明确分类方案的描述特征,并对文本进行设置。通过计算文本和分类方案的邻近性,可以对文本进行初步分类。

2 计算机文本信息挖掘技术在网络安全中的应用

2.1 应用必要性

当前信息数据越来越多,如何剔除无效数据,保留有效数据,成为各行各业关注的重点问题。信息技术改变了人们的生活方式,改变了社会的生产方式,人们依靠手机、电脑进行线上交流,通过微博、微信等进行线上互通;社会通过网络系统进行生产控制,通过信息技术进行运营监督。信息技术在一定程度上便捷了人们的生活,推动了社会的发展,需要进一步推动信息技术创新,扩大信息技术的应用范围。

在发展的同时,也需要看到信息技术存在的问题。伴随信息量的不断增加,网络中的虚假信息、诈骗信息等越来越多,只有对这些垃圾信息进行有效拦截,才能保证网络安全,保障用户的个人权益。计算机文本信息挖掘技术有着重要的应用价值,其可以对海量信息进行有效分类,识别网络中的真实信息、虚假信息,并对广告信息等进行剔除。计算机文本信息挖掘技术对信息数据进行有效判断,能够保障网络安全。

实际应用条件上,针对网络化的信息形式,需要对其中的基础文本信息进行分析,尤其是与系统内容相关联的信息内容上,务必要进行必要的调整,并通过相应的技术条件,保证网络信息内容的安全性。例如,在当前的技术应用条件下,通过手机系统程序,就可以完成对与手机接收信息的文本分析,并在大数据系统的基础上,通过文本内容的捕捉,确定此类信息的状态。由此,定位可能存在的垃圾信息,并在手机使用设定中,将此类信息规整到统一的存储格式中,由使用者进行二次确认,并保证信息管理的有效性状态。

2.2 应用路径

为了发挥计算机文本信息挖掘技术的作用,应该改进邻近分类方法。计算机文本信息挖掘技术通过邻近分类方法对互联网信息进行分类,只有优化邻近分类方法,才能提升文本信息分类的准确性。传统的邻近分类方法存在弊端,不同分类特征可能存在共线,文本信息分类可能会出现讹误情况。在技术改进过程中,需要坚持将传统方法作为依托,并对文本特征进行细化描述。技术人员需要合并共性属性比较明显的文本特征,并考察特征向量的维度,对其进行有效压缩。通过上述方法,文本信息分类将更加高效。

为了验证计算机文本信息挖掘技术的有效性,需要开展实验,考察计算机文本信息挖掘技术与网络安全检测之间的关系。技术人员首先要确定实验对象,包括文本信息预测库等,并尽量扩充其中的文本信息,确保其中有正常文本信息、广告信息、诈骗信息等等。根据语料库设定原则,需要对文本中的数据信息特征进行有效概括,看哪一种信息类属于文本信息、哪一种信息类属于广告信息和诈骗信息。技术人员也可以对广告信息、诈骗信息等进行合并,将其命名为危害信息。技术人员需要采用邻近分类方法,测试计算机文本信息挖掘技术的应用效果。在设置评价参数的过程中,应该采用算法判定方式和专家判定方式。

上述实验将会出现四种可能性:

(1)算法、专家判定安全信息;

(2)算法、专家判定危害信息;

(3)算法判定安全、专家判定危害信息;

(4)算法判定危害、专家判定安全信息。

技术人员需要对评价精度、评价误差等进行计算,并设计信息检测平台,为计算机文本信息挖掘技术的应用提供支撑。网络信息检测平台应该分成一级功能、二级功能,一级功能应该包括首页、用户管理等,而二级功能应该包括分类方法、参数评价等。

2.3 文本挖掘主要技术方向

文本挖掘技术,是计算机网络化的应用技术手段,也是具体系统开发的方向性技术,在与具体产业进行结合的过程中,可以凭借自身的技术又是条件,适应到多种类型的技术空间中,展示自身科技型价值,适应知识经济发展环境。

(1)基于网络文本分析的技术条件,可以在网络新闻与舆情发掘的过程中,发挥自身的技术优势,对构筑安全的网路环境,贡献出基础性技术内容。在网络化的舆情环境中,个人信息、商业机密等内容的传播,都会造成严重损失,威胁到企业与个人的信息与财产安全。而在这一内容的管理中,需要对客观的网络舆情状态进行分析,在过滤文内容的同时,过滤具体的信息数据,通过关联性分析、网络溯源、舆情评价等内容,保证对于整体信息的管理状态。尤其在舆情的推演中,可以形成完整的模型系统,并在模型的综合作用下,保证技术的完整性与成长性,针对实际工作环境做出必要的基础性保证。

(2)专利信息的安全管理中,应用文本数据挖掘的工作模式,也可以起到积极作用。专利信息,大多是企业核心科技的关键内容,与企业的经济收益与市场竞争条件息息相关,需要在技术内容上,形成系统性的防护条件,并在执行过程中,针对专利系统的管理流程,设置具体的文本挖掘工作方案,在程序的规范性状态下,保证管理的有效性。方法上,需要针对专利权登记资料、专利所有权挖掘、专利使用权调查等内容,维护整体技术管理体系的建设状体,实现同步化的专利技术分析。

(3)在文本挖掘技术的应用开发中,表现出了明显的技术成长性,在多种专业领域展现技术应用条件的同时,也在综合性、管理性的内容中,呈现出了明显的应用价值特征。例如,在医疗领域,文本分析可以被应用在医学健康分析的工作中,通过在中药成分分析、西药用药规律总结等多种信息化内容的安全数据整理,利用各种敏感词汇与数据,保证了整体信息化系统的建设条件。又如,在企业的市场管理中,可以凭借这技术应用条件,对市场环境中的相关信息进行提取与分析。并在综合相关市场人员掌握数据的同时,结合企业实际发展状态,形成指导性的参考数据材料,保证整体信息系统的建设状态,并使相应网络资料为实际运行策略的制定提供参考,维护了发展信息综合性分析执行效果。

3 结论

综上所述,我国的信息技术不断发展,互联网范围进一步拓展,网络安全问题屡见不鲜,在一定程度上损害了网民权益。为了保障网络安全,需要采用计算机文本信息挖掘技术,对网络中的信息数据进行科学分类,有效剔除其中的广告数据、诈骗数据、虚假数据等。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!