时间:2024-09-03
宾建伟,相里朋,欧翔翔
(工业和信息化部电子第五研究所,广东 广州 511370)
数据作为一种新型的生产要素,已经成为重要的、非消耗性的,能够起到洞察、优化和支配作用的绿色人造战略资源。同样的数据在不同场景下可以发挥不同的价值,不同的但相互关联的数据放在一起又能够碰撞出异样的火花,这些价值在广泛的传播和持续的积累中被逐渐地放大并加以利用,创造出更多的社会价值和财富,成为推动经济高质量发展的重要动能[1]。随着区块链[2]等新一代信息技术加速融合发展,并与各行各业广泛融通,使得数据爆发式增长和汇聚,信息流增速远超商品流、贸易流和资金流,新技术、新产业、新业态、新模式竞相涌现。海量数据收集汇聚的过程中,也带来了数据滥用、隐私泄漏等问题,并呈现出数据垄断困境,进而阻碍市场竞争和行业技术创新,直接影响到数据合理分配与使用,对传统的数据治理提出了新的挑战[3]。尤其是数据所有权与使用权如何界定,数据价值如何评估,数据隐私如何保护,数据交易如何可信,数据共享如何安全,数据滥用如何监管等问题,推动数据治理进入深度变革调整期,也是当前数据治理迫切地需要解决的问题。
数据作为一种可变现交易的资产,因可复制、可重用的特性,又不同于传统财务资产。相较于土地、劳动力、资本和技术等传统要素,数据的采集、存储、处理和使用都具有一定特殊性,还涉及隐私保护、定价模型、价值评估和交易安全等问题。根据国际数据管理协会的定义,数据治理是对数据资产管理行使权力和控制的活动集合,即通过具体的机制对数据的全生命周期进行管理,使得数据价值最大化[4]。简单来说,其是通过分析和依赖数据来驱动业务实现增值的。所有为提高数据质量而开展的业务、技术和管理活动都属于数据治理范畴,合理地开展数据治理评价、指导和控制,有助于进一步地提升数据治理质量[5]。
数据治理的关键环节如图1所示,数据治理的关键内容如下所述。
图1 数据治理的关键环节
数据是决策的基本依据,数据价值的实现依赖于多源异构数据的有效融合,但因数据来源广泛且涉及主体众多、数据源的标准和类型不尽相同、数据采集的真实性难以保障、数据存在被篡改的可能性等问题,都会直接影响到数据质量,进而影响到数据使用者[6]。因此,数据治理需要在数据全生命周期加强质量管理,制定一套数据质量的评价模型,从数据准确性、完整性、及时性、唯一性和有效性等方面,协助提升数据服务决策能力。
实现数据作为生产要素的价值最大化的前提,在于促进数据的有序流动、开放共享和安全可信,但由于多方参与者并非完全信任彼此,为了满足合作关系的稳定、随机密集交互和业务流程衔接紧密等数据共享需求,数据共享需实现“内部可控”的数据“价值共享” (是数据价值共享,不涉及数据相互提供),又能满足外部“数据合规”要求的安全多方计算技术和相应的系统[7]。因此,数据治理需要兼顾隐私、垄断与公平,在权衡各方参与主体利益的前提下,促进数据安全共享,实现数据价值最大化。
数据作为新型生产要素,充分发挥价值的关键在于数据流通,即通过社会化的数据交易来实现大规模的数据共享,使数据这一边际效益递增的重要生产要素发挥更大的作用。然而,数据的流通性和知情权的缺失,使得数据生产方无法获知哪些数据最终流向哪里,以及如何使用。因垄断性所形成的一个个数据孤岛,面临着不受监管的数据滥用和严峻的隐私泄露风险。隐私数据不能仅作为少数拥有者攫取高额垄断利润的武器,或者被束之高阁,尘封在不得不严加看守的“宝库”中,而更应成为提高社会生活品质,提高社会创造财富整体效率的公共资源。因此,数据治理需要面向隐私数据使用的评估与监督,在数据开放和数据安全之间寻找平衡。
数据治理是一个过程,是逐步实现数据价值的过程,是一种持续性服务。数据的价值也只有在数据治理得到良好改善的时候才会发挥出来,评估数据资产的运营和应用能力,支持数据价值转化实现,指导数据价值体系治理方案的实施,满足数据资产的运营和应用要求,监督数据价值实现绩效的符合性,并持续地改进和优化[8]。以地理位置数据为例,通过数据采集形成数据沉淀,这时候的数据质量要做到一致统一,并经过分析处理的地理数据才能成为数据资产;这时候的数据资产要进行确权存证才能保障其资产权利,然后再对数据资产进行分析提取,成为测绘分析的服务;这时候的服务就可以构建信任模式共享给其他参与方,服务再经过价值提取成为具体的地图业务;这时候就要考虑如何做好流动的数据价值的监管。
除上述关键内容外,需认知到数据治理将会是一个持续且长久的服务,是逐步实现数据价值的过程,涉及多个关键技术领域。要做好数据治理实现数据价值,不仅要从一开始介入顶层规划,还要尽早设定统一标准、统一流程、统一管理体系,以及解决好数据采集、数据清洗、数据对接和应用集成等问题[9]。只有在数据治理得到良好改善的时候,进一步地做好数据价值评估和监管,数据的变现能力才会逐渐地增强,真正地成为与劳动力、土地和资本并驾齐驱的新型生产要素和驱动经济社会发展的战略资源。然而,国内外对数据价值的评估模型仍处于探索阶段,主要有3类方法:1)市场法,即通过衡量数据企业或市场交易价格的市场溢价;2)收益法,即评估因数据资产所产生的增量收益;3)成本法,即实现数据价值所需的成本。国内外对数据价值的评估问题并没有达成统一的认识,但无论采用何种方法,都需要考虑用户隐私保护和数据安全共享来综合地衡量数据的社会价值。数据价值评估模型如图2所示。
图2 数据价值评估模型
基于区块链的可信数据是高质量数字化转型的关键,要牵住区块链“数据治理”的牛鼻子,应从以下几个方面持续地推进,严把区块链入口,防止大量的垃圾数据和低价值数据上链,加强链上和链下的数据治理,建立有效的区块链“数据治理”体系。
利用区块链的智能合约技术,制定多源异构数据的类型和标准规则,自动地验证并执行数据存储与处理智能合约,规范数据采集、存储与处理流程,将数据存储及使用记录通过共识网络传播至所有的利益主体。由于智能合约公开透明,共识过程多方参与,使其过程和结果可审计,防止数据在存储与流通中被伪造篡改,保证数据共享流通的真实性。同时,设立超级权限节点,及时地监管和记录网络交易和账目信息,录入的审计数据无法被篡改,修改则需通过多数节点确认方能实现,使得审计数据造假和欺诈变得极为困难,进一步地保障了数据存储和处理的真实性。
利用区块链的对称加密、非对称加密和哈希散列等密码学技术,保证数据的保密性、完整性、可用性和不可否认性,实现数据的安全共享和流通,也对数据隐私具有一定的保护作用,但还不足以应对日趋严峻的隐私泄漏风险,满足安全合规要求。面对数据治理的敏感数据保护、用户隐私保护和数字身份认证等需求,在区块链系统中,综合地采用匿名隐式证书、标识密码、数字签名和标识广播加密等多种前沿密码技术,实现基于国产密码的区块链隐私保护,既满足数据治理的隐私数据保护、身份匿名和安全监管等要求,又能有效地保障数据安全可信[10]。
数据治理是一个持续且长久的服务,分布式协作作为数据治理的未来方向,其基础是分布式业务共识,即在共识算法的支配下借助分布式智能系统来完成每个节点的特定任务,可以通过借助基于区块链实现的分布式机器学习,参与者包括数据生产方、数据中间方、数据使用方和算力节点集群,以及验证节点集群等,借助云计算、大数据挖掘和机器学习等技术作为支撑,以逐步地实现数据价值。数据生产方提供多方数据源,数据中间方保障数据安全共享,数据使用方完成数据应用,算力节点集群执行加密数据计算,验证节点集群对算力节点的计算结果进行验证。在结合通证经济、密码学承诺与零知识证明,激励数据治理的各个参与方,对恶意参与者进行惩罚,保障数据治理分布式协助机制的稳定运行[11]。
数据权属问题一直是横亘在数据流通中的一座危险的大山,也是一个极具技术性和政策性的问题。由于区块链的不可抵赖特性,使已确定的侵权行为不敢在该体系内“侥幸实施”,在一定程度上解决了数据确权问题,推动了数据资产的交易和数据价值的实现。通过区块链的多方参与共识网络,建立相对完善的数据要素交易市场,对数据资产进行确权并达成共识。基于智能合约形成复杂的数据定价模型,在多方撮合交易下完成数据资产交易,记录和验证交易数据,实现安全高效的多方利益分配机制。并支持数据按次数或授权计费使用,约束数据共享的有限范围,规避数据盗用、滥用及挪作他用,促进数据治理后的数据实现价值最大化。
行业发展推动着传统数据治理需进入深度变革调整期,区块链为此带来了新的发展思路,但具体的实现过程也将面临诸多问题和挑战,尤其是面对现有的监管机制和业务模式变化,都提出了新的挑战。
一方面,严把区块链入口,防止大量的垃圾数据和低价值数据上链,加强链上和链下的数据治理,虽可在一定程度上防止数据被篡改,对数据进行有效的追踪溯源,但如何保证数据上链前的准确性、完整性、及时性、唯一性和有效性,如何厘清数据的所有权、使用权和收益权,仍需要多方参与共同探索[12]。另一方面,依托大数据、人工智能和机器学习等技术,对数据主体、数据行为分析日趋成熟,虽有助于对数据共享流通开展溯源问责,但也带来了严峻的隐私泄漏问题,如何在隐私保护的基础上实现跨平台、跨领域的溯源问责,仍存在诸多技术性和政策性的挑战。
当前区块链技术仍处在高速发展期,其可扩展性、可靠性、互操作性、性能效率、隐私与安全等方面还存在不少的质量问题,市场上现有的区块链产品所提供的功能诸多,并不是最适宜数据治理的需要。有必要根据数据治理的需要,对现有的区块链技术进行裁剪并结合其他技术,在数据开放和数据安全之间寻找平衡,设计出满足实际需要的、最适宜的“数据治理”区块链,以及评价标准规范与评估工具,保障“数据治理”区块链的建设质量。
随着新一代信息技术的飞速发展,企业的生产和经营模式都在发生变化, “数据治理”区块链虽有助于多方参与,共同保障数据安全和保密,但也无法清晰地厘清和界定责任。尤其是面对现有的监管机制和业务模式变化,对现行的企业数据管理模式、行业监管制度和手段、法律法规和政策都提出了新的要求。
数据治理已成为社会治理现代化的重要内容和客观要求,以及经济高质量发展的引擎和数字经济社会发展的重要因素。随着数据作为一种新型生产要素,数据源源不断地产生并开放共享,数据治理对数据确权、数据共享、隐私保护、安全交易和监管审计等方面提出了更高的要求。然而,受法规、市场机制、技术和能力失配等诸多因素的影响,传统的数据治理机制已不能满足要求。尤其是数据所有权与使用权、数据价值评估、数据隐私保护、数据可信交易与安全共享、数据滥用等问题,对传统的数据治理提出了新的挑战,推动数据治理进入深度变革调整期。本文从数据治理的关键内容及挑战出发,结合区块链技术优势,探索数据治理+区块链的应用研究,对于推动数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护、培育数据要素市场具有一定的积极意义。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!