时间:2024-06-01
赵旭
摘要:云存储:一种大数据时代下的产物,为海量数据提供了有效存储和计算能力。随着云存储技术的不断发展和成熟,在校园内部部署云存储成为各高校的一项建设任务。从实际需求出发,针对私有云的特点,从硬件规划部署到软件平台开发层进行整体规划,提供一个开放、安全、高效、稳定和界面新颖美观的数字化教学资源管理平台。同时,对所涉及的相关应用技术进行介绍和研究。
关键词:云存储;云内部通信;双机热备;教学资源管理
中图分类号:TP333 文献标识码:A 文章编号:1007-9416(2017)09-0032-03
1 绪论
近些年随着云计算技术的兴起,部分高校率先进行了云计算方面的建設尝试,提出在云计算项目上将云主机部署、云操作桌面平台开发以及云存储架构设计三种技术结合,力求解决学校在传统的集中式管理与集中式存储的资源组织模式下信息基础设施建设滞后、优质数字化资源短缺、服务器资源短缺等问题。
1.1 背景与意义
随着高等院校教学信息化与数字化建设的完善与发展,高等院校的信息化与数字化建设一般以数字化的资源管理为主要目的,而信息化的服务保障为辅助手段,同时,由于数字化和信息化建设是需要不断的管理与完善,其建设周期较为漫长,只有通过长时间的积累与沉淀,才能逐渐形成一个具有数据资源量大、内容丰富的教学资源库。
目前,高等院校数字化教学资源的种类与来源较为繁琐与复杂,其资源文件类型包括文本、图形图像、动画、声音和视频等类型;而资源内容更为繁杂,有学生的学习资料和教师的教学资料,还有校管理和行政人员的办公资料等,还涉及到社会所需要的一些公众资源以及大量的图书馆藏书所转换而成的数字化图书资源等。如何能有效的将这些数字化教学资源收集、存储、管理并应用,实现教学资源的共享,提高精品课程、示范特色专业等优秀教学成果的辐射作用,这是在学校内部信息化建设中首要且又艰巨的任务。 因此,需要架设一个开放式共享、数字化教学资源管理清晰易用且安全等级高;同时,还能提高数字化教学资源的录用量和使用率。
1.2 国内外研究现状
云计算(Cloud Computing)作为一个全新的概念被明确提出,而云存储则是在云计算发展的过程成中所必须解决的一个核心问题——存储问题,可以说云存储是在云计算的基础上发展而来的。
云存储技术得到飞速发展,目前在国外有一些较为成熟的云存储产品为用户开放,如: Dropbox作为一家创业公司,在2007年就开始提供网络云存储同步服务,到目前已经有1.75亿用户;Google Drive是谷歌公司推出的一项在线云存储服务,Google Drive目前的活跃用户已经达到了2.5亿人;较为典型的还有:Amazon 公司的 Amazon Cloud Drive,提供廉价且大容量的存储空间,还具备有很强的安全性及可靠性。
国外云存储成功的同时也带动了国内网络公司对云存储的关注以及建设,华为云服务作为中国网络公司领路人,雄厚的资金实力和完备的硬件支持是其挺近云存储领域的根本,在云存储技术领域中华为具备先天优势;360云盘以“安全”和“免费”为核心,市场占有量不断在提升;还有在国内比较知名的百度云盘,百度虽然做云存储时间较短,但是其凭借着强大的经济实力也在不断的完善和改进。阿里云存储服务对外提供的海量的云存储服务。
但是,对于在高等院校在教育领域中运用云计算和云存储的案例还非常有限,目前,国内高等院校运用云计算和云存储建设的项目中较为典型的案例:
(1)中国科技大学的“瀚海星云”校园云服务平台:由4台2路PC服务器和48TB存储服务器组成,主要用于定制科学计算平台和平行计算等。同时,也在逐步对校内师生提供云存储等相关服务。
(2)台湾大学的台大“筋斗云”:整个平台由大型计算机和高级网络基础设施组成,以 IBM BladerCenter服务器为基础运作平台,以普桦科技的容错磁盘阵列产品为存储服务节点,到目前为止项目已经完成第一期的基础环境建设与部署,后期会逐步对校内师生提供桌面服务、存储资源共享平台等。
经过调查和分析,高等院校在教育领域中运用云计算和云存储的案例比较有限,相关文献资料占据比例也比较少,说明教育领域运用云计算和云存储还处于起步和探索阶段。
1.3 研究的主要内容
具体的研究工作主要有以下几方面内容:
(1)从云计算技术到云存储架构的领域入手,通过对国内外关于云计算技术以及云存储技术的相关文献和书籍进行详细的调查和研究,分析在国内外高等院校中采用云存储技术架设数字化教学资源管理平台的应用现状和取得的成果;总结出云计算技术与云存储系统的特性与特征,同时,还对课题所涉及到的一些相关技术进行研究。
(2)针对校园内部用户的实际需求,设计出了数字化教学资源平台的主要功能模块,为校内用户提供个人存储、应用和管理空间,同时,对群组共享和管理空间的权限功能进行设计和完善,使各功能间的逻辑更加合理。
(3)对校园内部私有云存储的架构进行详细的分析与设计,从技术上结合并利用云内部通信简单安全通信模型(SSCMIC)、双机热备全冗余技术等相关技术对云系统架构进行改造,形成一种具有特色的云通信安全模型和级联与备用双向复制模式,解决资源管理平台底层云存储系统的可靠性、可扩展性以及并发性等架构问题,从架构的角度解决大规模数据的弹性存储、海量多元数据的高效管理以及云存储系统的安全等问题,提高云存储系统的可靠性与安全性,建立一个高性能HDFS云存储系统,为数字化教学资源管理平台的基础设施提供服务。
(4)结合PHP、jQuery、HTML5等技术开发和实现数字化教学资源管理平台的界面操作系统桌面化,提供一个在网页上实现类似操作系统桌面和资源管理器界面的数字化教学资源管理平台的WEB门户网站。endprint
2 相关理论及技术
2.1 云计算与云存储
(1)云计算:一种大数据时代下的产物,为海量数据提供了有效存储和计算能力。云的特征主要有超大规模、虚拟化、提高设备计算能力、高可靠性、减少设备依赖性、高可扩展性、弹性服务和极其廉价等特性。“云”具有相当的规模,理论上可无限延伸与扩展,这些设备可以是高级的服务器,也可以是廉价的计算机,甚至可以是性能早已经过时被淘汰的计算机或服务器,当这些大量的服务器、计算机等计算设备被集中在一个虚拟资源池中,用户可以在不同时间和地点随时随地就可以接入云端。
(2)云存储:是在云计算基础上延伸和发展出来的分布式文件存储系统, 云存储某种角度上来说与云计算是有共性的,云存储也具备“云”的超大规模、虚拟化、提高设备计算能力、高可靠性、减少设备依赖性、高可扩展性、弹性服务和极其廉价等特性;在規模划分上也依然使用云计算相同的划分方式;就连标准定义也和云计算一样,到目前为止依然也没有明确的标准定义。有人认为云存储是云计算的一个分支,但云存储与云计算依然还是有所差异的,云存储的服务模式改变了云计算服务模式对各层的单独定义,而是将PaaS、IaaS和IaaS融合成一个有机的整体,形成一种新型的服务模式。同时,云计算侧重计算处理,而云存储则侧重存储,某种角度上来说,云存储的发展将更好的为云计算提供服务,云存储帮助云计算解决了一个重要的核心问题——大容量资源存储和处理的问题。
2.2 分布式文件系统
分布式文件系统是支撑云计算海量存储环境的重要技术之一,分布式文件系统从20 世纪70 年代发展至今,其技术依然还在不断被改进与完善。分布式文件系统通过协同多个节点消除单点故障和性能瓶颈,并在设计上满足高可用、高性能、高负载等基本特性。
通过服务端搭建根目录、分支节点等,客户端依据约定的存取协议,获取相对应的操作权限,对相对应的文件和目录进行操作,其操作模式就像操作本地磁盘上文件和目录一样。
HDFS(Hadoop Distributed File System),是Hadoop的核心子项目,是整个Hadoop平台数据存储与访问的基础。
HDFS架构采用主从模式,由名字节点(Namenode)和数据节点(Datanode)组成。名字节点为主点(Master),数据节点为从节点(Slave),在架构上,名字节点是整个HDFS的核心,为了安全考虑通常名字节点有两个,一个主名字节点和一个备用名字节点组成。而数据节点的规模理论上可无限扩展,并无特殊限制。
通过研究分布式文件云存储系统,以全面整合校内数字化建设中整合的多种应用服务器与计算机上的软件与硬件资源,实现各应用服务器与计算机上的优质资源共享为目标,将分布式文件系统储存中的HDFS架构进行修改,使其更适用于高等院校内部云存储资源管理平台的建设,为确立云存储架构和数字化教学资源管理平台的建设与实现提供可靠且完善的架构设计思路。由于数字化教学资源平台的建设需要考虑较为长期建设周期,因此,数字化教学资源管理平台拟采用HDFS作为底层系统架构。
2.3 云内部简单安全通信模型(SSCMIC)
云内部通信简单安全通信模型(SSCMIC)是一种简单而又轻型云内部通信安全协议,部署在中小型云存储系统上,无需特殊硬件支持,只需要将云内部通信协议分别安装在云存储内部的元数据服务器、应用服务器和服务/存储节点上就能实现云存储内部的安全通信。目前,国内外对云内部通信安全问题的解决方案走入两个极端化,大型云存储系统对云内部的通信安全一般十分重视,其中,安全协议种类也异常繁杂,安全协议内部构造也较为复杂;而中小型云存储则一般直接忽略了云内部通信安全,因为中小型云存储的安全协议无法使用大型云存储的安全协议,但重新开发一种轻型的安全协议又是一个很大的课题,所以,目前中小型云存储内部通信安全还较为薄弱。
通过研究云内部简单安全通信模型(SSCMIC),并将其应用和部署在云存储系统上的各个云存储节点与云存储应用服务器上,并与数字证书认证技术相结合,从而保护用户敏感信息和其他数据,保障和提高数字化教学资源管理平台的信息安全。
2.4 开发工具及语言
HTML5的本地存储特性是让基于HTML5开发的网页APP拥有更短的启动时间,更快的联网速度。PHP(超文本预处理器)是一种通用开源脚本语言,源代码完全公开,促进了PHP的快速发展。JQuery是继Prototype之后又一个优秀的JavaScript库,jQuery也是开放源代码并免费提供服务的, JQuery的语法设计可以使开发更加便捷。ExtJs开发工具最开始基于YUI技术,并为开发者屏蔽了大量跨浏览器方面的处理, 是一个前端AJAX框架并与后台技术无关的开发工具软件。
通过研究将HTML5、PHP、JQuery等技术并与ExtJs开发工具结合使用,利用这些技术使数字化教学资源管理平台的界面实现操作系统化(类似Windows、Linux的桌面和资源管理器界面)成为可能。实现数字化教学资源管理平台的各种操作(包括文档的存储,编辑,媒体播放等)能够像操作系统一样简洁方便,打造一个简洁且美观的WEB操作平台界面。
2.5 双机热备全冗余技术
受早期技术和理念的影响,还无法实现存储的计划性停机与非计划性宕机带来的服务器停机,后来,随着科学技术的不断进步,特别是云计算和云存储技术的发展,为了解决单服务器有计划或非计划停机的问题,提出了全冗余方式就是双机双存储,存储设备之间使用重复数据删除技术,完成增量同步工作,就是双机热备全冗余技术。
通过研究双机热备全冗余技术,并对双机热备全冗余技术进行改造,形成一种新型的级联与备用双向复制技术,并在云存储架构底层利用级联与备用双向复制技术来解决HDFS架构中的伸缩性差以及单点依赖等缺陷。利用首尾相连并成部分对等关系的多个数据服务器改变了集中式架构中的单点依赖,克服了HDFS中当数据服务器失效时,整个系统将陷入瘫痪状态的情况。
本文的研究内容在资源管理平台设计与实现过程中属于前期的准备工作,后续还将对资源管理平台进行系统需求分析、系统架构设计、系统功能性设计、系统测试与总结等工作,最终实现对基于云存储的数字化教学资源管理平台的设计及部署。
参考文献
[1]蔡斌,陈湘萍.Hadoop技术内幕[M].北京:机械工业出版社,2013.
[2]刘丽,米振强,熊曾刚.深入理解云计算[M].北京:机械工业出版社,2015.
[3]王鹏.云计算的关键技术与应用实例[M].北京:人民邮电出版社,2010.
[4]The Age of Big Data. The New York Times,2012.
[5]Kapil Bakshi.Considerations for Big Data:Architecture and Approach. 2012IEEE Aerospace Conference,2012.endprint
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!