当前位置:首页 期刊杂志

数字经济中的数权体系与数据法院

时间:2024-04-24

张文魁

在数字经济发展中,数据将越来越成为关键投入品。在实际当中,数字企业那些比较突出的策略性行为,包括自我优待,“二选一”及其他形式的拒绝交易,大数据杀熟及各种花样的差别性定价,以及屏蔽、封禁和拒绝链接等等,都与数据利用及算法设计密切相关。尽管传统行业也有一些类似的现象,但对数据的利用和基于数据的各种算法,可以将这些行为升级为系统性的竞争和反竞争手段,并能够以自动化、隐秘化的方法实施,从而使事情发生性质上的变化。因此,数字经济领域的反垄断与反不正当竞争政策,以及其他一些重要规制政策,应该聚焦于对数据和算法进行科学合理规制,并将之纳入法治轨道。本文主张,在数字经济迅猛发展的过程中,应该有意识地推动一个基于场景、嵌入未来的数权(property rights)体系,以及相应的算责(algorithmic responsibilities)制度的建立,其意义不亚于工业革命时代产权(property rights)体系的建立。而设立专门的数据法院,有助于这一进程的提速。

数字经济领域的反垄断执法,已成为当下的全球关注点。数字市场中受到高度关注、易被归于不正当竞争和垄断的一些典型行为,其实在传统行业中也不鲜见。例如,拒绝交易在传统经济活动中被认为是企业的一项正当权利;差别化定价在传统营销活动中广泛存在,而且人们习以为常;自我优待行为,譬如将自营商铺置于人员流量最大的通道,在兼有自营和招商店铺的商场,也屡见不鲜;而阻碍互联互通和统一标准,在非数字化的通信服务业、视听产品制造业、软件设计业,都或多或少存在。不过在数字市场,通过数字技术手段,数据可以被自动采集和处理,算法程序可以快速地、有目的地将大数据分析的结果与特定群体进行关联,因而具有数据和算法优势的企业,就可以系统性地实施一些策略性行為,而且常常以隐秘的方式进行。这些系统性、自动化的策略性行为,的确容易起到强化企业的市场地位甚至不当排斥竞争的作用,的确可能造成垄断性市场,当然还可能带来其他问题,譬如对非成年人造成不当诱导、刺激吸引注意力的行为、造成致瘾性,等等。所以,建立数据和算法的规制政策,具有较强的必要性和紧迫性。

数字市场那些典型的策略性行为,既然主要是基于数据和算法,那么必然存在规制上的空白区和灰色区,因为数字技术、数字经济毕竟尚处于快速兴起和不断迭代的阶段,还远未稳定和成熟,立法、司法和执法机构,乃至学术界,不但缺乏现成的经验,甚至缺乏必要的知识储备和认识积累。事实上,在过去几年里,已经出现了一些涉及数据和算法的重大分歧,例如美国的数字巨头GAFA(即Google, Amazon, Facebook, Apple)都遭遇过一些涉及数据与算法的重要指控和起诉,后来要么以罚款及和解了结,要么检方起诉被法官驳回。因此,对数据和算法的规制,一方面存在巨大的必要性,另一方面又存在巨大的复杂性,需要注入足够的探求精神和谨慎态度。这是政府不得不面对的艰难平衡。

掌握这个艰难平衡,很可能需要从数据入手,即对数据的采集、流转、加工与利用,采取有效的具体政策。这是因为,数据是算法的基础。因为无论有多么大的算力、多么新的算法,都需要大数据作原料,都是对大数据进行挖掘、开发与利用。数据从本质上来看,并不是什么新东西。数据是客观世界在人类认知上的投射,早已伴随着人类对客观世界的主动认识和改造欲望而出现。但当人类有了身体器官之外的器具和方法去采集客观世界的状态信息,数据体量就可以无穷无尽地膨胀。人类对数据进行加工和分析的方法也在不断发展之中,使得原始数据和加工数据有了各种各样的用途,这些用途在很多时候并不是数据投射物,或者数据投射物的拥有者所愿意接受的。甚至,数据投射物或投射物的拥有者,很可能并没有同意,甚至并不知晓数据被采集。数字技术不断获得突破,数字经济持续快速发展,使得数据采集、流转、开发与利用活动成为有目的性的大规模牟利活动,大数据和算法以及智能科技结合在一起,把数据带到了前所未有的关键位置。因此,在数字经济领域,数据规制属于基础性规制。数据规制即是要建立一套关于数据采集、流转、加工与利用的规则。

毫无疑问,数据采集规则是初级规则(primary rules),而关于数据流转、加工、利用以及拥有等方面的规则,都是次级规则(secondary rule),因为没有采集,就没有此后的一切。而数据采集规则的基石,是与数据相关的权利的确定与保护,以及利益的分配和责任的承担。欧盟于2016年颁布实施了《通用数据保护条例》(General Data Protection Regulation ,GDPR),是全球范围内关于数据权利的颇具标杆意义的政策文件。这个条例大量涉及到数据权利问题,特别强调了对个人隐私数据的保护。我国于2021年颁布实施了《个人信息保护法》,也体现了类似的政策思路。不过这些政策性文件无疑只是初始步骤,远远不能涵盖、更不能预见数据权利所涉的各种复杂场景。当然,即使数据场景得到清晰辨认,数据采集权利得到明确授予,也还需要建立数据流转、加工与利用等方面的次级规则。数据次级规则的权、利、责界定,与数据采集不尽相同。譬如,数据流转不但涉及到数据在不同主体之间流转,还涉及到在不同国家之间的流转,这就把公共意志、公共权力引入到数据规则当中。我国出台了《数据安全法》,从而将数据的主权问题,以及数据的跨境储存、流动与使用的安全问题,提上了议事日程,这不但使数据跨境流转面临严厉的政策环境,也使整个数据规则更加复杂。此外,数据有可能形成一些独特的数字资产和数字产品,包括非同质化代品(non fungible token, NFT),以及虚拟世界的艺术品,等等,都面临价值评估与分配的问题。目前的法律和规制政策,还无法应对这些问题。

而算法规则的建立,一点都不比数据规则的建立更容易。算法规制的最大难点,在于算法的非人工性和不透明性,因为许多算法决定,是由通过处理大数据而进行深度学习的智能化机器所作出的,有时连算法的设计者也很难搞清智能化机器为什么会作出某项决定,以及什么时候作出这样的决定。算法程序还可以进行不断地快速更新,从而很难进行事前监管。对算法进行规制的另一个难点在于,基于大数据的算法,是人类的一项重要创新,有力地促进了经济效率的提升和人们生活的改善,因此规制政策一方面应该可以有效应对算法的阴暗面,特别是社会公认的阴暗面,譬如利用数据和算法来系统性调动、刺激、利用人性弱点的那些经营行为,来系统性实施明显违背良知的欺诈性和垄断性经营行为,等等;另一方面也应该避免扼杀科技和经济创新。由于存在这些难点,国际、国内对算法进行规制,目前还处于初始阶段,并引发了很多争论。欧盟有关机构在2019年提出了《算法问责及透明度治理框架》(A Governance Framework for Algorithmic Accountability and Transparency),美国国会一些议员也于2019年提出了《算法问责法(草案)》(Proposal on Algorithmic Accountability Act),要么具有很强的原则性,要么陷入激烈的讨论中。我国虽然于2021年颁布实施了《互联网信息服务算法推荐管理规定》,但可操作性有待提高,特别是如何纳入法治框架,还需很长时日。而在全球范围内,对基于算法的一些新生事物,譬如智能合约,应该如何建立规制,更是政策空白。

基于上述必要性和复杂性分析,可以认为,从长远来看,在数字革命浪潮中,在全世界范围内,将需要随着实践的不断发展,而建立一个能够嵌入未来的、基于场景的数权(data rights)体系,就如过去几百年里,在工业革命浪潮中,建立了一个包括物权、债权、股权等权利主张在内的产权(property rights)体系一样。这无疑将花费较长的时间,并将经历较多的纠葛。世界上最早、最完备地建立产权体系的国家是英国,这个过程经历了诉讼与判决互动、普通法与衡平法交织的数百年的漫长时间。比较完备的数权体系的建立,尽管不需要上百年时间,但至少需要几十年时间。与数权体系相配套,还需要建立算责(algorithmic responsibilities)制度。可嵌入未来的数权和算责体系应该告诉人类社会:数据的权利如何分配、如何确定、如何保护、如何重置、如何获利,算法和其他此类的自动化、智能化程序所产生的行动,应该如何界定责任、追究责任。尽管这是人类历史上一个前所未有的新范畴,不可能一蹴而就,但重要的是,应该树立这样的意识,并以这个意识引导人们迈出第一步和后续的坚定步伐。

数权不但涉及到个人权利,也涉及到所有个体,包括厂商个体、机构个体的权利。众多个体的信息,从来都客观存在,因为这些个体永远都处于某种状态之中。在农业和工业经济时代,几乎无人有兴趣去采集状态信息,或者缺乏相应的采集技术,而且采集到的状态信息也没有什么利用价值。数字经济改变了这一切。数权体系需要告诉社会,状态信息在什么情况下可以被采集和加工,在哪些用途上可以被利用,被采集和加工后所形成的数据应该如何分配权利和利益,当遇到纠纷时应该如何获得救济。不过,关于这些事项,在可預见的将来,并不容易达成社会一致,很有可能的是,会在“对场景的尊重”(respect for context)中,也即在各式各样的具体场景中,细致地分清责权利关系,实现隐私保护与信息采集和流转、加工、使用的合理平衡。这与工业革命时代的产权体系建立,是一样的路径,英国的法庭体系在这个过程中发挥了至关重要的作用。经济合作与发展组织(OECD)曾于2019年发布了《加强数据访问与分享》的报告,对数据进行了分类,并努力根据场景对数据权利和利益进行界定,可以算是“对场景的尊重”的初步尝试,不过其中许多定义从可操作层面来看仍然是含混的,并不能覆盖现实场景的复杂情形。正是数字经济现实场景的复杂性和不可预见性,决定了人类社会需要从大量和长期的诉讼与判决中积累智慧与共识。

对数据进行挖掘和利用,才使数据有价值,算法技术则是挖掘和利用的集中体现。因此,需要建立一个数字经济时代的算责制度。在实际当中也可以看到,至今为止,算法是数字经济领域最强大的竞争武器之一,例如,精准匹配可以极大地节约搜寻成本、提高配置效率;算法也是最强大的限制竞争、追求垄断的武器之一,例如,大数据杀熟就是基于算法,对链接的控制也是基于算法。算法可以突破用户的自主权、自由选择权屏障,通过人的心理弱点和习惯特点,实质性地引诱甚至强加、胁迫用户进行交易或者不交易,形成严重的算法滥用。而人工智能的快速发展和越来越强的渗透式使用,使得算法的威力更加强大,这种威力已经而且必将进一步超越经济领域。算责制度的要点,是应该确定人的责任,而不是自动程序、智能机器的责任。美国国会一些议员提出的《算法问责法(草案)》(Proposal on Algorithmic Accountability Act),对算法的自动化决策作了清晰界定,要求数字企业必须评估其使用自动化决策程序时,是否导致偏见、歧视等问题,是否存在侵犯个人隐私、侵害个人安全等隐患。2021年,美国一些议员还提出了一项被称为《过滤气泡透明度法》(Filter Bubble Transparency Act)的草案,要求数字企业必须让用户有打开或者关闭算法功能的选择权。我国于2021年颁布实施的《互联网信息服务算法推荐管理规定》,也有类似内容。不过在实际当中,涉及算法的纠纷与案件,往往难以追究人的责任,这不但因为算法的使用以无人化的高科技手段来实现,也因为算法贯穿于海量数据处理之中,导致证据搜集的困难。

数权与算责体系的建立,尽管面临许多认识上的分歧和技术上的困难,并需要花费很长的时间,但只要人类社会保持对规则追求的信任,并与时俱进地推动法治的发展,终究可以成型。与工业经济时代产权体系的最终建立与完善一样,数权与算责体系的建立,应该由大量的法庭诉讼来推动。如果没有足够多的诉讼,如果不积累足够多的法庭判决,而只由政府规制机构单方面对企业和个人实施惩罚,就会导致对质的缺失、证据的贫乏、理由的单调,那么再多的政策文件和规制条文也未必能带来科学合理的规则,并使这些规则得到社会普遍的认同和遵循。

概而言之,至今为止,随着全球数字经济的快速发展,涉及数据和算法的纠纷已经纷至沓来,建立数权和算责体系的紧迫性日益凸显。而设立专门的数据法院,应该非常有助于加快数权和算责体系的建立进程。

一个值得注意的最新努力,就是美国与欧盟于2022年3月宣布原则上达成的《跨大西洋数据隐私框架》(Trans-Atlantic Data Privacy Framework)。美国和欧盟长期在数据治理方面存在分歧与争执。而达成这个数据隐私框架,不但会为美欧数字经济一体化发展消除重要障碍,也将为全球数字经济治理确立一些重要的基本规则。特别是这个文件提出,要设立数据法院来应对数字经济迅速发展中的各种新型纠葛,预示着数据法院将在不久的将来,在数字经济发展的实际进程中,发挥重要作用,并创立重要规则。

美国是数字经济的开拓者和最大受益者,美国企业对数据和算法的利用非常娴熟。而欧盟企业在这方面弱得多,并与美国在数据采集和跨境流动与利用方面存在较大分歧。美欧在2000年签订了关于数据流动和利用的《安全港框架》(Safe Harbor Framework),后来由于“斯诺登事件”爆发而导致欧盟对这个框架失去信心,双方遂于2016年达成《隐私盾框架》(Privacy Shield Framework),但欧盟法院于2020年认为美国的数据保护措施没有达到欧盟水平,又导致这个框架失效。而达成《跨大西洋数据隐私框架》,意味着双方建立了数据保护新机制。这个隐私框架在保护个体权利和鼓励数据流动、促进数字经济发展之间建立了一种高标准平衡。在这个高标准的平衡性框架中,数据隐私和安全得到可信的保障,同时大中小企业又能充分利用数据跨境流动而开展数字化商业活动。该框架规定,美国政府的情报活动不得侵犯数据隐私和公民自由,有关企业和组织应继续遵守隐私盾各项规则,欧盟居民可通过各种途径对涉嫌犯规的企业和组织进行投诉。该框架特别指出,欧盟将设立一个独立的数据保护审查法院(an independent data protection review court),来审理数据流动和利用中的诉讼并提供救济。

欧盟考虑设立数据保护审查法院,可视为数字经济发展进程中一个具有战略意义的重大步骤。在过去十几年里,已经出现了一些重要的涉及数据的诉讼,但法律和法院却缺乏与时俱进的专业性,绝大部分此类诉讼也没有现成判例可供借鉴,在如何判定上常常存在很大争议。美国的脸书(Facebook)就曾遭遇集体诉讼,案由是其收集用户面容特征和其他生物信息等数据,但各方对于案情的争论也非常激烈,美国的法院遂于2021年批准对诉讼进行和解,脸书向数以百万计的用户支付了6.5亿美元的赔偿金,并删除了相关数据。不过,脸书也曾于2020年向法院起诉一家名叫壹听众(OneAudiance)的公司,指控后者利用内嵌软件从前者平台上收集用户姓名、性别、电邮等数据,后者在法院干预下停止了这样的行为。在英国,谷歌(Google)曾遭遇由一家消费者权益组织牵头发起的集体诉讼,被索赔数十亿英镑,案由是其秘密收集数百万iPhone用户的个人数据,不过被告律师辩称,谷歌未泄露用户数据并给他们带来损失,英国最高法院的法官采纳了辩护,认为采集数据的不正当行为尚未触发英国《数据保护法》(Data Protection Act)定义的损失,遂于2021年驳回了起诉。美国的亚马逊、谷歌等公司也遭遇过类似诉讼,并且也大多以和解、赔偿的方式了结法律争端。在欧洲大陆荷兰,甲骨文(Oracle)在2020年遭遇了由一家用户隐私组织发起的集体诉讼,被索赔百亿美元,案由还是其收集用户数据并将数据加工后出售给其他企业,违反了欧盟《通用数据保护条例》(General Data Protection Regulation,GDPR),但甲骨文提出了强力辩护。我国字节跳动旗下的TikTok,曾遭遇美国用户发起的集体诉讼,一些用户指控其收集他们面容特征、位置等个人数据,前者进行了辩护,但于2021年同意支付9200万美元赔偿金以寻求和解。在我国国内,已经出现了越来越多的涉及数据的纠纷与官司,但由于一方面法律不健全,另一方面缺乏可操作的法律细则和专业化的法官,许多案件遇到判决难题。我国颁布的《个人信息保护法》、《数据安全法》等法律,尚未进入法庭实践阶段。

我国也可考虑尽快设立专门的数据法院。我国已经成为世界上数字经济发展最快的国家之一,一些数字企业具有较强的全球影响力和竞争力。中国信通院发布的《2021年中国数字经济发展白皮书》显示,2020年中国数字经济增加值达到39.2万亿元,占GDP比重为38.6%;中国社科院数量经济与技术经济研究所发布的《2021年数字经济蓝皮书》显示,2020年中国数字经济增加值为19万亿元,占GDP比重为18.8%。尽管不同机构基于不同统计口径,测算出的数据有较大差异,但我国数字经济在整个国民经济中占比不低,应该是事实。而我国网民数量在2020年底已达到近9.9亿人,更是一个其他国家无可比拟的数字。我国还颁布了《数字经济“十四五”发展规划》,不但设定了雄心勃勃的发展目标,也提出要健全数字经济治理体系,规范数据采集、传输、存储、处理、共享、销毁全生命周期管理,强化个人信息保护。显而易见,下一步,我国将面临大量的数据和算法治理方面的工作。而数据和算法治理,具有极强的专业性和新颖性,这个领域的法律细则制定和法官人才培养,应该在司法实践中推进。这也是探寻数据规則、积累数据判例、培养数据法官的好方法。我国已有设立专门法院的经验,譬如已在一些地区设立了金融法院、知识产权法院、互联网法院。杭州、北京、广州等地的互联网法院已进行了一些有意义的审判,但其审理范围其实很少涉及数据问题,而是集中在互联网购物、互联网金融、互联网版权等方面的纠纷,以及网络上一些侵害人身权、财产权的纠纷。在数字经济发展中,处理数据纠纷比处理上述几个方面纠纷更具基础性意义。世界上最早、最完备地建立产权体系的国家是英国。英国也率先设立了一些专门法院,譬如海事法院,从而为英国在这个领域确立全球权威奠定了基础。我国若率先设立数据法院,可以在全球数字经济治理中谋得一定主动权。

数据的采集与挖掘,算法的开发与利用,是十分重要的创新,在促进生产效率提高、改变人类生活方式方面产生了革命性的影响,并推动数字经济不断蓬勃发展。数据和算法,极大地提高了经济活动的精准性,相当于给经济活动带上了一副眼镜,而且随着算力的不断提升、算法的不断改进,眼镜的清晰度会越来越高。而数据,则相当于制造镜片所必需的原料——硅砂。在没有眼镜之前,硅砂到处都有,但没有什么用处。数据也是这样,在没有算法之前,个人、机构的状态与过程,以及人们的思维、想法、念头,不过是天然存在、自生自灭的一种副产品,与汗水挥发没有多大区别,而算法时代才使得这些副产品被采集为大数据,并进行分析和利用。因此,大数据以及算法,对于人类而言是前所未有的新生事物,如何利用并如何规制,以及如何评估与分配价值,只能在实践中进行摸索。而建立这方面的规则,并不是要消灭大数据和算法技术,也不是要抑制这方面的技术进步与各种创新,而是要使这些技术与创新更好地服务于人类社会。建立数据法院,有助于把握这种平衡,并使这种平衡在法治轨道上向前推进。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!