时间:2024-05-04
李立睿 邓仲华
摘要:文章从生态系统理论的角度总结了“互联网+”与科学数据生态的内涵及其契合关系,据此分析了科学数据生态系统的内涵及其要素之间的相互关系,在此基础上,进一步阐述了科学数据生态系统的特征。最后探讨了科学数据生态系统的动力形成机制、平衡调节机制以及互利耦合机制。
关键词:互联网+;科学数据;数据生态;生态系统;运行机制
中图分类号:G250.73 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2016033
在大数据环境下,数据已经成为企业创新的重要战略资源,对于企业的持续性创新具有突出作用。科学数据更是如此,其作为研究活动的重要成果产出,是推动国家科技创新的重要驱动力。当前,互联网技术的迅猛发展,不仅推动了信息环境的泛在化,而且加速了学科的交融以及科学数据的产生,并且引起了科研过程中对数据的需求变得更加复杂化和多样化。但是“互联网+”相关思维模式和技术应用的发展与成熟,在很大程度上进一步加速了科学数据的协同与创新,有利于数据开放共享及知识持续创新。本文从“互联网+”的视角对科学数据生态系统的关联和影响进行了分析,并进一步构建了基于“互联网+”的科学数据生态系统。
1.“互联网+”与科学数据生态系统的概念
“互联网+”实质上是通过依托互联网与其他领域或产业进行深度化跨界融合,推动其效率提升和组织变革,以此实现创新发展。在这一过程中,“互联网+”极大促进了产业数据的在线化、互联化和融合化,进而形成了一个完整的产业化数据集合体。此外,互联网具有开放、平等、透明等特性,这也促使数据能够在产业内部进行最大限度的流动、共享、融合以及创造性的应用,提升了产业的数据增值和增效。从系统的角度来看,“互联网+”作为一种新型的创新理念,能够以泛在互联、跨界融合的方式,有效的将整个产业构建成一个开放化的数据生态体,进而实现产业的技术创新、结构优化和服务转型。
生态系统是指生物有机体与其无机自然环境系统的结合,一方面,生物有机体是各种生态种群的集合,既能够适应无机环境,又能够对无机环境进行一定的改造;另一方面,无机环境是生物有机体存在的物质基础,其条件状态直接影响生物有机体的分布特性和种群多样性。因此,生物有机体与自然环境之间相互联系、相互制约、有规律地组合在一起,并保持不断运动和变化。通过能量流动、物质循环和信息流动,在自然界中构成一个相对稳定的自然体。科学数据生态系统是以科学数据为中心,通过数据库、信息库和知识库等形式,作为科学数据流动的物质基础,在特定科研环境下,由系统中的科研人员、团队和组织等知识载体作为该生态系统基本骨架,以知识创新为目标,借助相应的研究方法或工具,促进科学数据在不同科研人员之间的流动、再生、利用和增值。
2.“互联网+”与科学数据生态系统的契合性
科学数据生态系统主要涵盖了不同层次(单个科研人员、科研小组、科研组织)的数据主体和不同性质(科研成果数据、科研过程描述数据、科研原始数据)的科学数据。这些数据主体通过利用不同的工具,采用不同的交流形式,对数据进行融合和创新,而“互联网+”作为一种新型的思维模式和技术变革,能够有效促进科学数据生态系统的协同演化。
(1)“互联网+”加速了科学数据生态系统的互联化。一方面,互联网能够有效加强科学数据的互联化,有利于科学数据之间关联化的形成,从而促进了科学数据的开放共享;另一方面,互联网的不断发展,使科研人员之问的交流与合作能够跨越时空,极大的克服了时间和地域的限制,这样,不同物理位置的科研团队能够根据各自的科研需求,有效地进行交流,提升自身科学数据的运用与分析能力,促进科研资源的高效配置。
(2)“互联网+”加速了科学数据生态系统的融合化。科学数据生态系统是一个典型的开放化耗散系统,需要不断与系统外部环境保持数据、信息和知识等物质交换活动。在交换过程中,从外界输入的物质形成系统的负熵流,抵消系统本身因熵过度增加而呈现的无序状态,从而维持系统新的有序状态。因此,互联网为科学数据生态系统与外界的互联互通提供保障的同时,极大促进了系统与外部科学数据的融合,加快了以科研人员为载体的知识输入,从而能够迅速形成负熵流,使科学数据生态系统快速向有序化方向演化。
(3)“互联网+”加速了科学数据生态系统的协同化。科学数据生态系统是系统结构中各组成要素之间相互作用,相互协调的结果。当前,学科知识的交融使得科研人员和科研资源的协作变得更加重要,“互联网+”充分将互联网与各种资源相结合,使这些资源能够在系统内部和外部进行快速的流动和交换,促进了科研过程中的人员和资源的协同,加速了知识的创新进度。
“互联网+”不仅是一种技术的变革,更是一种思维模式的转变,对于科学数据生态系统的发展和进化具有不可替代的作用。此外,“互联网+”也强调了以系统的观点看待关联化科学数据的变化,从整个科学数据生态来分析其在整个科研过程中的演变过程。因此,“互联网+”与科学数据生态系统具有相当紧密的契合性。
3.“互联网+”视角下科学数据生态系统
3.1“互联网+”视角下科学数据生态系统的内涵
与自然生态系统类似,科学数据生态系统是一个具有完整结构的开放化动态系统,根据不同的研究项目和研究问题,可以形成规模不同、形态各异的生态系统。“互联网+”理念和技术的发展,进一步促进了科学数据的产生、管理、分析、共享和服务等一系列相关形态的转型。因此,“互联网+”视角下科学数据生态系统是在充分发挥互联网技术优势的同时,利用互联网思维,以生态化的系统观来分析科学数据整个生命周期的演化过程,以此将科学数据生态系统中各要素(如科研人员、科研工具、科研设备、组织文化、政策制度等)及其相互关系进行优化配置,促使科学数据价值的最大化,从而提升知识的发现和创新效率(见图1)。
科学研究的过程实质上是围绕科学数据生命周期,对数据进行收集、整合、挖掘、可视化以及再利用的过程。但是在不同科研个体、科研种群以及科研群落之间,科学数据的交换、互动、竞争和演化又是贯穿于整个科学数据生命周期的。如,一个科研个体所产生的结果化科学数据既可能作为其它种群或群落开展研究的原始化数据,又可以成为自身所属种群或群落内部的派生化数据。
科学数据生态系统就是利用生态学的理论与方法,借助“互联网+”思维及其相关技术的优势,最大化地发挥科学数据价值的生态化系统。通过不同层面之间的相互影响、相互作用,协调整个科学数据生态系统内部的各要素,促使其不断演进和优化,同时作用于科学数据、数据主体以及数据环境。进而促进知识的发现和创新,推动科学数据资源的利用更趋于生态化、有序化和高效化,在一定程度上赋予科学数据以生命体的特征,即形成有机科学数据体、自组织科学数据体和进化科学数据体。
科研人员作为科学数据生态系统的主体,既表现出人本化的生态系统特征,同时也具有其特殊性质。作为一个开放的系统,科学数据生态系统的构建应当以研究问题的差异化为导向,进而确立各要素的分布和关联状态,形成形态各异的科学数据生态系统。因此,科学数据生态系统是整个涉及科学研究过程及其与之相关的内外部环境的有序集合系统,尽管不同层面的构成要素、运行机制各有区别,但是核心要素主要包括科学数据,数据主体和数据环境。
(1)科学数据。从科学数据资源的利用角度来看,在科研人员的研究过程中,科学数据主要包括原始化科学数据、派生化科学数据和结果化科学数据。其中原始化科学数据是科研人员在开展研究活动时所收集,并即将用于分析处理的科学数据:派生化科学数据是科研人员在研究过程中,对原始化数据进行处理之后,所产生的中间数据:结果化科学数据主要是指直接支持知识描述、知识发现和知识创新的科学数据。就如能量需要某种物质作为载体一样,科学数据也是依附于不同的数据载体之上的。而这三类科学数据通过借助互联网,相互作用、紧密关联,形成了科学数据的三层金字塔,共同构成了科学数据生态系统的物质基础,这也体现了“互联网+”的核心特征,将这些科学数据视为新的生产要素,并利用物联网、云计算等新的技术和基础实施,形成整个科学数据资源的泛在互联。以生态系统中食物链层次的视角来进行分析,此三层金字塔如同食物链结构,底层的科学数据(即原始化科学数据)类似于食物链中最底层的绿色植物,中间层的数据(即派生化科学数据)可类比为这条链上的植食性动物,顶层的数据(即结果化科学数据)可类比为链上的肉食性动物,而这三层科学数据之间底层数据向高层数据的转化率可类比为食物链中各级的传递效率。而在不考虑科学数据的增值,单从数据量的角度来看,当顶层结果化科学数据增加一个数量级时,在中间层的数据会增加几倍或者几十倍,甚至上百倍的数量级,而在最底层支持上层的原始化科学数据则会增加得更多。
(2)数据主体。在一定程度上,科学数据生态系统是一个人工控制的生态化系统。科研人员是科学数据的主体。根据生态系统中生物成分的划分规则,可以将以知识载体为核心的科研人员划分为科研个体、科研种群和科研群落。科研个体是科学数据收集、分析和利用的基本单位,是拥有特定科学数据能力的单一科研人员。科研人员的知识水平、学习能力、认知能力等指标是影响科学数据能力的重要因素。不同的科研个体之间通过组建不同规模的科研群体,能够有利于最大化发挥科学数据的价值,便形成了科研种群。科研种群通常只是具有共同目标的科研个体组成的集合体。而科研群落是围绕重大科研问题或难题,由多个科研种群组成的具有特定功能的种群集合,是完成某类特定复杂功能的高级生态单位。此外,任何一个科学数据生态系统中的科研种群不是孤立存在的,可以与其他数据种群一起形成数据群落,并通过合作竞争的方式,担任特定功能的角色。因此,通过依托互联网,根据不同数据主体的数据需求,可以将不同层次的数据主体进行全面感知,形成互联互通的社会网络关系,真正实现跨时空、跨平台的立体化融合与协同。如随着传感器和个人智能化设备的运用,可以实时化发现和追踪数据主体的偏好、心理、行为等情景知识,为全面、系统、准确实现人人互联提供基础。
(3)数据环境。对于科学数据生态系统而言,数据环境是科研个体、科研种群和科研群落所处的环境。“互联网+”已经作为国家的一项重要行动战略,并成为了一种新的经济形态,在这一重要背景下,对整个科研环境产生了深刻的变化,促使数据环境逐渐转向基于互联网思维来制定新体制、新机制和新政策。其中主要涵盖了三个层面,即微观环境、中观环境和宏观环境。在微观环境层面,科学数据生态系统是以科研个体所处环境为核心,比如针对科研个体的直接化的激励措施、个性化的保障制度、定制化的技术支持等专门为其营造的私人环境,如通过为科研个体定制云、网、端一体化的数字化、智能化的研究环境(如移动互联网、云计算、物联网等),为科研工作的顺利推进提供支撑:在中观环境层面,是以科研种群为基本单位,针对整个科研种群的团队文化、组织制度、硬件平台等环境,例如在为科研团队提供以“互联网+”为基础设施的跨平台服务的同时,积极营造一种基于互联网思维的协同合作模式,同时为保障这一模式的形式提供政策支持。中观环境更为关注以科研团队为基础的整体科学数据能力的环境支持:在宏观环境层面,主要涉及对规模庞大和关系复杂的数据群落所处环境,如社会经济环境、国家政策环境、社会网络环境等。如今,“互联网+”作为一种经济社会发展的新常态,对于经济结构战略性的调整和实施具有重要的推动作业,这也影响着全部科研活动的研究方向和研究进程。
在数据环境的支持下,各层级的数据主体可以形成完整的科学数据生态链和生态网络。在不同类型的生态网络中,尽管不同层级的数据主体进行科学数据交换、共享和融合的内容和目标不尽相同,但是通过借助“互联网+”技术,以互动协同的方式进行相互作用,最终协调不同的科研个体实现科学数据价值的最大化。在科学数据生态系统中,数据主体与数据环境通过互联网不断进行资源的交换。一方面,数据环境为数据主体提供了成长、成熟与创新所需的各项资源:另一方面,数据主体通过知识创造活动来影响数据环境。与此同时,科研群落在科学数据环境中,通过平衡自身数据能力和数据需求,进行不断的调整和控制,从而动态化寻求新的系统生态位。
3.2“互联网+”视角下科学数据生态系统的特征
在自然界中,生态系统能够稳定运行的关键是能量在系统不同层级问的循环更迭。通过新陈代谢的方式,将旧物质转化为新物质,实现系统的进化。对于科学数据,知识发现和创新的过程实质上也是科学数据的不断进化、动态演变的结果,而“互联网+”进一步加速和优化了这种以科学数据为基础的新陈代谢过程,因此,科学数据生态系统具有自身显著的特征。
(1)科学数据生态系统的开放多样性。在自然生态系统中,物种的多样性是环境选择和物种进化的前提。科学数据的开放多样是知识创新的前提,也是生态系统不断演化的必要条件。一方面,生态系统对外具有一定的开放性,通过互联网技术的运用,数据主体能够快速的与外界环境和其他系统建立联系,在以科学数据为基础的交流过程中,通过对外部数据进行理解、吸收和融合,能够将自身系统内部的科学数据进一步丰富化,从而体现出系统内部的科学数据多样化:另一方面,与自然界的食物链类似,不同的数据主体之间通过基于互联网的科学数据链的连接来实现知识价值的转化,而数据主体由于分工不同、职责各异,对于科学数据链中的处理方法和过程不同,因此,这样导致了科学数据生态系统的多样化。
(2)科学数据生态系统的竞争协同性。在自然生态系统中,外界环境的变化以及生存资源的不足迫使物种之间产生不断的竞争。但是这种竞争机制是对物种的一种选择过程,有利于生态系统的进化。在一定程度上,较高程度的科学数据多样性可能触发生态系统的不确定性因素,因为不同的数据主体(包括科研个体、科研种群和科研群落)掌握着各自的科学数据资源,然而不同类别、来源和特征的科学数据(包括原始化科学数据、派生化科学数据和结果化科学数据)可能存在冗余,甚至冲突,需要数据主体通过互联网技术的应用,对其进行反复的对比、判断、分析、融合和拓展,才能确定最终科学数据,而这一过程就是数据主体之间为所拥有的科学数据进行竞争优化的过程。另外,在泛在互联网的影响下,不同的数据主体即使在应对同一研究问题,为了能够获得更多的科学数据主动权,这些数据主体之间也会产生以互联互通的科学数据为基础的竞争形式。与自然生态系统一样,有竞争就有合作,由于数据主体具有个体异质性,使得数据主体之间的互动合作成为可能。在协同过程中,数据主体通过达成合作联盟,形成具有特定功能的有机整体,通过利用互联网将不同的科学数据进行融合,进而优势互补,提升科学数据的变异速率,从而达到数据主体的共同进化。
4.“互联网+”视角下科学数据生态系统的运行机制
运行机制是指在系统有规律的运行过程中,影响这种运行的各因素结构、功能及其相互关系,以及这些因素产生影响、发挥功能的作用过程和作用原理及其运行方式。因此,科学数据生态系统的运行机制就是要研究系统的各要素关系及其具体的运行方式。从“互联网+”的视角充分理解和掌握系统中的各类运行机制,能够引导科学数据主体发现系统中存在的缺陷,有的放矢地对其内部运行机制进行逐步完善,最终解决科学数据生态系统的失衡问题。
4.1动力形成机制
科学数据生态系统是在不断地维持系统平衡发展过程中逐步形成的。随着学科间不断的交融,科学研究第四范式研究模式的发展日趋成熟,科学数据的增长已经随着数据主体的活跃而迅速扩散,首先是数据种群或数据群落内部的互动,相对杂乱无序、复杂多样的数据在不断生成,当原始数据量达到一定程度,数据主体便利用相应的工具进行数据的清洗、关联和融合。在研究过程中,通过以科学数据驱动的方式进行知识发现,而此时对于科学数据的共享与层级交流是知识创新的转折点,因为数据主体在不同的学科视角,对于初步的知识发现具有不同的认知。随着科学数据分析挖掘的逐步深入,更多的数据主体通过借助互联网进行数据的整合,引导其进入生态系统之中,由于组织制度或团队文化等因素,不同的数据主体可能在围绕科学数据的分析处理过程中发生分歧,甚至冲突,进而导致科学数据生态系统的失衡,但是在系统演化过程中,主导科学数据的一些宏观、中观或微观的安全机制、监督机制和制约机制的不断完善,其能动性的发挥将引导生态系统转向平衡,向积极的方向发展。
4.2平衡调节机制
科学数据生态系统是一个开放的、复杂的系统,其系统内部及系统之间通过科学数据交流共享发生联系,其运行的能量来自于各组成要素之间的数据互联互动,其中不仅是科学数据主体之间,还包括数据主体和数据环境之间的互联互动。在对某一科学问题进行研究的过程中,不同的数据主体通过互动沟通,甚至争论,以此促进科学数据的演化和变异,其中不同类型的数据主体之间可以围绕各自不同层次的科学数据,进行数据的协同和拓展,以此促进知识发现,例如,一个科研种群所产生的结果化数据。可以通过互联网进行广泛的推送,既能够作为其他数据种群的派生化数据,又可作为其他数据种群的原始化数据,从而促进科学数据的发展和创新,这样数据循环机制充分保证了种群内部和种群之间的合作和数据共享,也是对各数据主体关系进行调控的主要方法和手段,因此,基于“互联网+”的科学数据交叉循环互动机制是科学数据生态系统存在和平衡运行的基础。
科学数据生态系统内某一数据主体的进入或退出、外部环境的不确定性均能破坏系统自身的稳定与平衡。因此,从生态学视角,科学数据生态系统在发展过程中通常出现关于系统构成要素变化的变异和重组现象。而此时可以依靠系统由变异机制与重组机制组成的平衡调节机制,对科学数据生态系统进行动态平衡调节。在变异机制层面,数据主体和数据环境因素的共同作用是导致科学数据生态系统变异的主因,促进和制约着生态系统变异的进一步发生。而重组机制有助于生态系统结构的升级与优化,适应能力与竞争力的整体提升。此外,“互联网+”使得虚拟世界与现实世界的边界越来越模糊,这样重组机制可以将规模较小的数据主体以实体或虚拟化方式嵌入到更大规模的数据主体中,以此弥补大规模数据主体功能的不完备性,进而发挥小规模数据主体灵活机动的优势,这有助于优化科学数据生态系统整体结构。
4.3互利耦合机制
互利耦合机制是数据主体内部或主体之间进行沟通的一种方式,数据主体为了实现自身科学数据价值最大化而形成的一种相互依赖、共同生存的协同运行状态。以“互联网+”为基础,面向科学数据的共享互联,不仅能够促进数据主体创新能力的提升,而且还有助于数据主体从单一生存模式向群体协作式的研究联盟模式转型。在科学数据生态系统中。不同的科研人员之间通过合作共赢的方式,提升其环境的适应能力。尤其在对科学数据的处理和应用过程中,由于数据量巨大,关系复杂,而“互联网+”能够快速促进科学数据的泛在互联和动态融合,可以在短期内构建一个面向科学数据知识特征的连通空间,从而形成数据主体间的互利合作、协同创新的耦合关系,而这些连通空间的关联性节点可能是科学数据属性、科学数据需求、科学数据特征,甚至是数据主体的知识储备和技能。因此,在科学数据生态系统中,面向数据主体的共生耦合机制主要体现在以下方面:(1)不同科研个体之间产生的耦合关系;(2)同一数据种群内部科研人员之间产生的耦合关系;(3)不同数据种群之间科研人员之间产生的耦合关系;(4)不同科学数据生态系统之间,由于环境变化,科研人员产生的临时耦合关系。这种耦合关系是建立在双方需求匹配的基础之上,通过协作来完成科学数据分析和处理。
5.结语
“互联网+”技术的发展,改变了科学数据产生、分析、管理和交流的方式,给科学研究带来了机遇与挑战。如今,知识发现与知识创新是以科学数据为基础,科学数据的演化和竞合,催生了科学数据生态系统的产生。本文从生态学的视角,对科学数据生态系统的结构进行了分析,通过对科学数据生态系统中各要素相互关系进行梳理,得出了科学数据生态系统的运行机制,以此为科学数据生态系统的发展提供支持。“互联网+”通过与科学数据结合,为各数据主体之间的互相合作、互相协调提供了方便,同时对科学生态系统全方位、多角度的优化提供了有效的解决方案,在整个产学研过程中,促使科学数据价值的最大化发挥提供了新的研究思路。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!