当前位置:首页 期刊杂志

浅谈大数据环境下的信息组织

时间:2024-06-05

李玲

【摘 要】随着移动互联网、物联网、云计算等技术的快速发展和广泛应用,大数据成为了当今时代信息技术的必然产物。简单分析了大数据环境下信息组织面临的困难和挑战,总结出信息组织发展的趋势。

【关键词】大数据;信息组织;发展趋势

Abstract: With the rapid development and wide application of mobile Internet, Internet of things, cloud computing and other technologies, big data has become an inevitable product of information technology in today's era. This paper analyzes the difficulties and challenges that faced by information organizations in the big data environment and summarizes the development trend of the information organization.

Keywords: big data; information organization; development tendency

一、引言

信息组织是采用各种方法和手段使信息有序化的过程。它通过揭示信息间内在的逻辑关系,对信息进行加工、整理、提炼,使之系统化、浓缩化,从而达到便于信息传递和交流的目的。今天,国际互联网的飞速发展和普及,使其成为当今最大的信息资源库,如何对这分布式的、异构的、多格式的、海量的、高动态的信息,进行快速的整序,以最方便用户、最人性化、最智能化的形式提供给信息的使用者,成了检验信息组织水平和效率,促进信息组织理论和技术深刻变革的强大动力。大数据环境给信息组织带来了巨大的影响,正确地识别这些影响,对于凝练信息组织的研究方向、使其适应当前的发展环境、与国家的重大需求对接、为国家大数据战略的实施提供智力支持,具有非常重大的意义[1]。

本文通过探析面临的困难和挑战,并针对这些困难和挑战,总结出信息组织在大数据环境下的发展趋势。

二、大数据环境信息组织面临的困难及挑战

海量、异构、动态变化的数据使得信息组织的任务变得更为复杂,具体体现在数据本身的复杂性、计算的复杂性和信息系统的复杂性等方面。这也是大数据处理任务面临的普遍问题,有赖于大数据存储、大数据计算、大数据挖掘与分析等基础性技术的突破和迭代。大数据环境信息组织面临的困难及挑战表现在以下三方面:

(1)信息组织的作用极易被忽视。在大数据环境下的某些场景中,数据经过挖掘可以直接生成情报(解决方案),无需经过组织的便可直接服务于决策。另外,某些大数据在一定程度上强调实时性,很多数据还没有被存储和组织,就已经失去了效用。在这种情况下,信息组织的作用也很难显性化,再加上大数据时代人们在思想上对数据挖掘和分析的重视与推崇,信息组织在从数据到解决方案这个过程中的作用往往被隐藏或忽略了。

(2)信息描述标准的建立存在困难。在文献组织阶段,MARC,FRBR,DTD是文献信息资源描述的标准;在网络信息组织阶段,Dublin Core等元数据是网络信息资源描述的标准;在知识组织阶段,RDF,OWL等形式化语言使得数据可以被机器读取并理解。而在大数据环境下,无论是数据类型还是数据载体,其表现形式正变得更加多样化,越来越多的大数据来源于科学观察中的实验数据、生命科学中的基因组数据、物联网中的传感器数据、互联网中的社交媒体数据等等。所以,建立跨领域和跨数据类型的统一描述标准、实现不同领域的大数据描述标准的关联和互操作存在较大因难。

(3)信息组织的学科边界逐渐模糊。近现代的信息组织最早起源于图书情报领域,以应对文献信息资源的急剧增长[2],分类法、标题法、编目、文摘索引等文献组织的方法是早期的主要方法,《杜威十进制分类法》、《美国图书馆协会标题表》、《化学文摘》等是信息组织早期的重要成果。随着时代的发展和技术的进步,计算机技术被广泛应用于信息组织,自动分类、自动标引、联机检索、自然语言检索技术得到快速发展,随之而来的是计算机科学对传统信息组织研究的巨大冲击。大数据环境下的元数据标准制定等信息组织研究内容与信息技术标准化等领域有重合,大数据组织等研究内容与数据科学、数据管理等领域产生了联系与交叉。可见,在计算机技术、网络技术、语义技术、大数据技术的冲击下,信息组织的学科边界逐渐模糊。

三、大数据环境信息组织的发展趋势

为了应对大数据环境提出的挑战,信息组织未来应该朝着自动化、语义化、标准化、开放化的方面迈进。其发展趋势和任务可以总结为以下几个方面:

(1)借助存量语义资源,对大数据进行语义化组织。语义化是信息组织的重要发展方向,无论是语义网的提出,还是关联数据、知识图谱的蓬勃发展,都是在朝着语义化的方向迈进。对于大数据来说,可以通过信息组织的方法、工具对大数据进行一定程度的语义化,进而通过实体的关联对各类大数据进行連接、整合。要利用存量语义资源,必须对可用的存量语义资源进行清查与摸底,掌握现有存量语义资源的数量、种类和分布.并对存量语义资源进行集成.关联开放数据[3]和中文开放知识图谱[4]在这方面已经取得了较大的进展。同时,由于大数据涉及的领域广泛、数据类型多样,难以直接为大数据标注指定相应的知识库,所以,还要研究存量语义资源的发现与更新机制、算法和模型,研究大数据与存量语义资源中知识库进行匹配的方法等等。

(2)依托大数据技术,提升信息组织的自动化水平和效率。具体体现在:

第一,大数据环境下,机器学习、人工智能、数据挖掘与分析等领域取得了长足的进步,将为大数据组织提供有力的技术支撑[5]。

第二,大数据处理需求催生的新型计算模式,有利于数据的整合,比如查询分析计算模式可用于结构化数据的整合,图计算模式可应用于社交媒体中的知识整合,等等。

第三,大数据可视化技术进一步丰富了信息组织的表达和展示方式。长期以来,可视化是信息组织成果展示的重要渠道和方式,大数据环境使人们对可视化的需求呈现爆发式增长,催生了一系列新的可视化工具、技术和方法,其中的一些工具、技术和方法也同样适用于展示信息组织的成果。

信息组织研究需要充分引入大数据处理的新范式、新技术和新工具,提高信息组织的自动化水平和效率。

四、结语

信息组织作为图书情报学的核心研究领域,是信息存储、信息检索、信息利用与服务的基础和前提。现阶段,虽然信息组织在大数据环境下面临严峻的挑战,但我们始终相信在相关学者的坚持不懈、艰苦深入的研究下,我们定能创新出新的信息组织工具,应对大数据环境带来的影响与挑战。

【参考文献】

[1]赵一鸣,马费成.大数据环境对信息组织的影响[J].博士论坛,2017(1):4-10.

[2]叶继元.信息组织[M].北京:电子工业出版社,2010:5-6,18-26,170.

[3]The Linking Open Data Community. The linking open data cloud diagram[EB/OL]. [2016-03-20]. http://lod-cloud.net/

[4]CKAN联盟.中文开放知识图谱[EB/OL].[2016-09-01 ].http: //openkg.cn/

[5]冯芷艳,郭迅华,曾大军,等.大数据背景下商务管理研究若干前沿课题[J].管理科学学报,2013,16(1):1-9.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!