时间:2024-07-28
张新华
(太原学院 山西 太原 030012)
现如今互联网信息技术发展迅速,人们对信息保护的要求也在不断提高,国家也出台了多项法律法规及相关文件,保护广大用户的合法权益。目前大数据技术得到了各行各业的广泛应用,但是对一些敏感数据的保护仍不完善,需要不断进行优化。因此对大数据安全与敏感数据保护技术的应用进行研究十分重要。
现如今大数据技术得到了企业的广泛应用,取得了明显的成效,Hdaoop属于一种高效的分布式处理系统,应用十分广泛。大数据平台中涵盖着海量资源数据,基于平台体系的安全性,平台安全防护技术需要满足信任性、可靠性、追溯性、保密性等要求,将安全基线控制点、基线描述情况及检测作为评估标准,有效提高安全性能[1]。
大数据平台构件源于开源体系,企业版的安全防护性能较强,但是相较于传统数据库安全管理要求,需要重点管理开源构件安全防护的脆弱性,不断强化安全技术保障工作。
大数据平台安全防护需要收集的数据较多,并且数据类型丰富多样,例如文件数据、库表数据等。需要根据数据类型选择不同的收集方式。数据进入大数据安全平台需要通过多项措施确保其安全性,并且整个收集流程均需要通过4A系统加以监管。
2.2.1 数据收集认证健全
工作人员在对数据进行收集的过程中,需要根据不同的收集方法选择不同的鉴权,主要包括下述几点。第一,落实Kerberos认证服务对用户身份认证。第二,使用账号密码、短信及口令等认证方法对收集过程的身份进行有效认证。第三,对收集系统的IP地址和端口号进行限制,保证IP和端口的规范性和合格性。
2.2.2 HDFS平台安全
HDFS平台应用较为广泛,具有认证功能和授权功能。认证主要指确保某个用户为自己的用户,授权主要指用户能够操作全新实体,如果不具备则无法进行操作。在这一前提下增设一些其他方法,例如HDFS透明加密、HDFS快照等,提高安全防护的水平。
2.2.3 多租户安全
大数据安全平台在使用过程中不但需要符合内部使用的要求,并且还要符合外部相关要求,提高对不同类型数据存储的实效性,使用户和用户间数据隔离开,并且保证租户运行不同作业不会互相影响,确保不同业务在平台的安全运转。除此之外,还需要为租户创设或者提供资源,其主要范围为大数据管理Hadoop集群资源,建立Hadoop用户,对存储容量进行分配。
根据外部应用和环境,可以将敏感数据分为以下四大类。第一,A类主要指用户身份数据,其主要内容包括身份显示、网络身份、相关基本资料和身份证明等。第二,B类,主要指的服务及内容相关数据,内容多为订购内容相关数据信息。第三,C类,通常指服务和衍生数据,其内容多为服务记录、消费信息及账单明细等。第四,D类,主要指管理数据。其内容丰富,多为企业管理数据、运维数据以及合作企业数据等。
大数据平台中体现的数据形式也属于类别规定的一种,例如原始数据以及脱敏数据等。前者不具有开放性的特点,安全等级较高。脱敏数据具有一定的复杂性,主要指则是将网络身份标识等一系列敏感特性进行相应处理后,产生无法识别。推算的全新数据,具有一定的安全性。在工作人员匿名化操作或者脱敏数据时,需要严格遵守分级安全防护的具体规范,在此前提下结合使用环境,做好准备工作,对敏感风险数据进行全面分析[2]。
3.2.1 动态数据脱敏
动态数据脱敏较为常用,主要指在对敏感数据访问时进行脱敏,符合生产环境相关要求,同时需要注意,如果需要对同一敏感数据在读取时进行不同等级的脱敏,对于解决身份访问问题、静态数据屏蔽等相关问题具有积极作用。
数据脱敏环境的类型丰富,根据其性质可以对其类型进行合理划分,主要包括前端展示、外部接口调用以及投诉处理查询后台等。对不同的用户来说,能够直观地看到不同敏感数据经过脱敏处理后得到的具体结果。在进行开发测试的过程中,对报表取数的结果进修分析,分析人员可以得到不同的脱敏结果。主要方法包括下述两点。第一,动态脱敏能够根据数据访问用户名、IP信息等实现脱敏的访问管控。第二,工作人员还需要加强对生产数据库中的返回数据的重视,采取动态脱敏的方法效果理想,有助于保证屏蔽、加密等措施的有效实施。
3.2.2 数据匿名处理及敏感信息保护
该项技术的主要内容为分析敏感数据存在的风险,K匿名、等价匿名是较为常用的匿名处理方法,对其进行合理应用能够在数据分析时减少安全隐患风险问题发生。其中K匿名算法具有实用性,属于新型算法的一种,能够在应用过程中强化对用户位置信息的保护,效果确切。通过对该算法的有效应用对于预防数据脱敏严重致使数据价值下滑问题具有积极作用。同时还能够有效解决敏感数据在准标识符分析环节攻击链数据遗失以及泄露等问题,具有一定的安全性[3]。
综上所述,目前大数据平台安全及敏感数据保护已经得到了广泛的应用,通过实践证明其作用明显、效果理想,得到了诸多企业的广泛应用。万物连接物联网未来安全的重心在于基础设施安全保护和敏感数据保护。随着科技的飞速发展,大数据安全的内容也会变得愈发丰富多样,未来发展过程中还需要提高对人工智能等技术的应用水平,加强对大数据海量信息数据的应用,保证安全态势感知的。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!