时间:2024-08-31
张文魁
(国务院发展研究中心 企业研究所, 北京 100010)
在数字经济发展中,数据正在成为关键投入品。本文将说明数字经济领域一些比较典型的企业策略性行为,包括自我优待,“二选一”及其他形式的拒绝交易,大数据杀熟及各种花样的差别性定价,屏蔽、封禁以及拒绝链接等等,都与对数据和算法的利用密切相关。尽管传统行业也有一些类似现象,但对数据和算法的利用,可以将这些行为升级为系统性的竞争和反竞争手段,以自动化、隐秘化的方法实施,从而发生性质上的变化。因此,数字经济领域的反垄断与反不正当竞争,应该进一步聚焦于那些策略性行为背后的数据和算法。同时,数据权属以及数据所涉及到的国家安全等问题,虽然已经纳入政策议程,但如何正确认识并把握分寸,也需要认真思考。
事实上,在传统市场中,差别化定价和其他歧视性行为、自我优待、拒绝交易等屡见不鲜,譬如对于“熟客”给予优惠定价。而数字经济领域的“杀熟”,即对这类客户给予更高定价,就显得“离经叛道”了。但是,优惠定价和更高定价,本质上都是差别化定价,或者可以定性为价格歧视。为什么优惠定价不是问题,而更高定价却是问题?优惠定价虽然是让利行为,被视为一种“善意”,可以帮助厂商吸引更多高频次消费的稳定性客户,同样也可以起到压制竞争对手、强化本企业竞争地位的作用,但是也可以视为一种不正当竞争,更何况这样的定价对其他客户是一种不公平行为。
数字经济领域之所以存在较多的大数据杀熟,可能是因为处于快速发展中的数字企业要大量“获客”,即获得更多的新客户,不得不对大量新客户进行补贴,以吸引他们加入数字化场景,并使他们接受、喜爱这样的场景,而对“熟客”的价格则是不含补贴的正常价格。对新客户进行补贴是因为新客户从传统场景转换到数字化场景,存在转换成本,包括操作成本和心理成本。因此,简单地将大数据杀熟定性为不正当竞争行为的确存在一定的问题。当然,还有可能是因为,许多“熟客”对特定数字化服务及其场景形成了习惯性和依赖性,或者他们对价格不敏感以及支付能力更强。这种情况下的大数据杀熟就与“获客”目的差别化定价大不一样。不过更加复杂的是,数字企业可能给予了接受更高定价的客户以更加特殊的增值服务组合。
数字企业对客户数据的广泛采集,普遍是无授权、不知情的采集,而客户并未意识到这些数据及分析结果会用于企业的差别化定价策略,而实际上的结果就是,自己是数据的贡献者,反过来又成为数据贡献后的受害者,这使事情的性质发生了变化。很显然,大数据杀熟的要害不是“杀熟”,而是“大数据”;其他差别化行为的要害也不是差别化,而是数据。数字企业,特别是互联网平台企业,广泛地采集客户和其他参与者的数据,并开发算法模型对这些数据进行有针对性的分析,利用分析结果实施差别化、歧视性的定价行为。而且,数据的采集、分析、使用,一般并不为被采集对象知情和授权。
在数字市场中,其他基于数据和算法的差别化和歧视性行为也有不少。在双边性互联网平台市场中,平台企业对不同的上家和下家进行组合性定价,包括实施不同的组合性优惠措施,从而实现复杂的交叉补贴,使平台可以追求利润最大化。这样的交叉补贴,不借助于数据和算法是不可能实现的。基于数据和算法,可以比较容易地实现对优质客户的筛选,或者对脆弱客户的剔除,以及将那些易受诱导、易受情绪侵染的客户筛选出来并实行针对性高强度营销。同样,可以进行反向操作,即对不合意或者缺乏较好支付能力的客户设法避免交易,这样的做法也可以发生在对上家的选择、对供应链的管理上。大量实施这些系统性行为,无疑可以强化互联网平台企业的谈判地位,弱化入驻平台的厂商和个人的谈判地位。平台企业如果还兼有自营业务,与入驻厂商存在竞争性,也容易实施基于数据和算法的自我优待行为。
基于数据和算法的差别化行为,可以用于精准推送。精准推送大量存在于数字化新闻报道和信息资料的阅读领域,平台企业或者媒体机构对读者的题材偏好、关注点和兴奋点、阅读习惯等进行隐秘的数据收集,然后不断地向其推送同类的文章和资料。精准推送现在越来越普遍地渗透到购物、旅游、出行等订购领域以及短视频观看和娱乐领域,并且伴随着越来越多的广告投放和高频度推销活动。精准推送显然免除了客户的主动搜索环节,实行基于数据和算法的自动匹配,在很多时候是一种可以极大提高效率的良性行为。但是,精准推送本质上也是一种差异化行为,基于数据收集实现对个体差异的识别,从而涉及到隐私问题或者个体信息的非自愿公开等问题,所以可能是不良行为。那么,到底是提高效率的良性维度占上风,还是侵害个人隐私和违背个人意愿的不良维度占上风?这就给规制带来了难题。不过,未经同意的大体量、高频度的广告投放和信息推送,很可能违背了接收者的意愿,从而在较大程度上属于单维度的不良行为。
不仅是差别化、歧视性行为极大地受益于数据和算法,数字经济领域其他的一些典型行为,大致具有同样情形。利用大数据和算法是否容易导致合谋,从而通过定价等手段来损害客户利益,已引起了学术界的讨论。而数字平台企业广泛存在的自我优待和拒绝交易行为无疑是基于数据和算法,因为兼有自营业务的平台,可以系统性地收集其他卖家和买家的数据,从而及时发现畅销商品及其客户群,然后快速推出自营的同样商品并进行算法推荐营销,其他任何卖家都不可能系统性地获得这样的数据。搜索引擎企业也具有同样优势。基于数据和算法的自我优待和拒绝交易不但可以升级为系统性行为,而且可以自动地、隐秘性地实施,即数据的采集、分析、利用并未得到客体的知情和同意,算法的使用并未得到参与人的充分认知与自由选择。
总而言之,数字经济领域那些广受关注、饱受争议的典型策略性行为,其要害在于它们基于数据和算法。不管是业已形成强大市场势力的数字巨头企业,还是新设的中小数字企业,都有可能利用自己独特的数据采集方法和算法模型实施这些行为,也就是说,即使规模较小、市场份额较少的企业也很有可能采取这些行为来加强竞争和排斥竞争。因此,数据和算法可以改变企业规模和市场份额在产业组织中的角色。尽管对数据和算法的利用是极为重要的产业创新,极大地提高了生产和生活效率,但由于它们也隐藏在这些受争议、受关注的策略性行为背后,所以需要引入科学合理的规制,这不会抑制反而会促进创新。
毫无疑问,数据是算法的基础。要对数据和算法进行必要的、合理的规制,首先就要探讨数据规制问题。
数据规制就是要建立并施行一套关于数据采集、流转、开发、利用的规则。数据是客观世界在人类认知上的投射,当人类有了身体器官之外的器具和方法去采集客观世界的状态信息,数据体量就可以无穷无尽地膨胀。对数据进行加工和分析的方法也在不断发展之中,使原始数据和加工数据有了各种各样的用途。欧盟于2016年颁布实施的《通用数据保护条例》(General Data Protection Regulation,GDPR),就是引入数据规制一个重要尝试,这部法律特别强调对个人隐私数据进行严格保护;2022年通过的《数据治理法》(Data Governance Act)初步建立了一个在数据保护基础上促进数据共享和鼓励数据利他主义的法律框架。我国于2021年颁布实施的《个人信息保护法》也包含了许多重要内容。但由于客观世界可采集的数据是无穷无尽的,投射数据的客体以及采集数据的主体各自应该拥有什么权利、享受什么利益、担负什么责任,至少目前来看不可能由几部法律来详尽和准确界定。而且,数据流转会使原始数据投射物与数据的后续加工者、访问者、利用者之间关系越来越模糊,也会使数据的资产属性越来越强。因此,学术界对数据权利及引致的利益分配等问题进行了探讨。汤琪就从数据的交易合法性、安全性角度,探讨了数据产权问题,认为数据已经具有财产性质[1]。苏可依从数据产业发展的角度分析了数据产权不清晰对数字经济发展所造成的掣肘,强调应该加快数据权利方面的立法,进一步明晰数据权利边界[2]。
不过,无论是在欧美,还是在我国,关于数据权、利、责的争论还非常大。我国有法律专家把“数据权属”的主流观点大致概括为4种,即“新型人格权说”“知识产权说”“商业秘密说”“数据财产权说”(1)见中央财经大学法学院党委书记吴韬:法学界四大主流“数据权利与权属”观点,https://wwww.sohu.com/a/117048454_481893,2016年10月24日。。实际上,随着对数据利用的扩展与深化,以及算法模型的不断升级,数据权、利、责关系会越来越复杂。美国学者Nissenbaum曾经将这种复杂关系归之为各种场景(contexts)的复杂性,从而主张,在未来的数字经济发展实际中,基于“对场景的尊重”(Respect for Context),遵循“场景性正直”(Contextual Integrity),在具体场景中实现隐私保护与信息采集和流转的合理平衡[3]。Waldman也强调了具体场景的重要性,从信任的角度来探讨数据授权等问题,认为数据隐私权等问题的本质在于信任,所以在数字化社会,不能完全以个人权利来理解涉及个人信息的数据,而要根据个人对具体场景中数据使用的合理期待来分析权利边界[4]。当然,从各国的实际经验来看,对具体场景的判断以及对场景性正直的把握,应该需要通过大量的法庭诉讼来积累。也就是说,对数据以及对算法的规制,并不是狭义的行政规制,而是包含诉讼与判决的法律规制。因此,需要鼓励这方面的诉讼并培养大量的专业法庭人才,以便在各当事方陈述、争辩并提供证据的过程中逐渐建立科学合理的规制。
只有对数据进行挖掘和利用,数据才有价值,而算法等技术是挖掘和利用的集中体现。在数字经济中,尽管数据是基础,但算法才是利器。正如韩旭至所分析的那样,在数字经济中,数据价值主要来自于算法;在较大程度上,数据经济的实质便是算法定义的经济[5]。姚前进一步分析了算法应用的各种场景,指出随着云计算、区块链、人工智能等新应用的发展,以智能算法为核心的新型经济模式正在出现,从而给数据创造了更新的价值挖掘空间;而算法经济活动也存在算法滥用、算法偏见、算法鸿沟等问题,所以应该对算法以及基础性数据进行合理规制[6]。在数字经济发展的实际中,算法正在成为最强大的竞争武器之一,如精准匹配可以极大地节约搜寻成本、提高配置效率;也是最强大的限制竞争、追求垄断的武器之一,如大数据杀熟、对链接的控制都是基于算法。而根据用户习性和弱点进行高频度推送形成致瘾性,则是算法滥用的典型现象之一。人工智能的快速发展和越来越强的渗透式使用,使得算法的威力更加强大,这种威力已经而且必将进一步超越经济领域。譬如,现在越来越多的人已经注意到了算法合谋问题,这种技术方法可以轻易突破传统反垄断法对共谋卡特尔的禁止。无论从哪方面来看,都需要给算法设立规制。
欧盟有关机构在2019年提出的《算法问责及透明度治理框架》(A Governance Framework for Algorithmic Accountability and Transparency)中,对数字企业利用算法向用户进行内容推送的行为提出了公平、透明方面的要求,要求它们在服务条款中说明算法决策的基本方法,并禁止某些特定决策仅由自动化方式作出。美国国会一些议员于2019年提出了《算法问责法(草案)》(Proposal on Algorithmic Accountability Act),旨在对基于算法的自动化决策所形成的歧视性行为和侵犯隐私行为进行规制。我国于2021年颁布实施的《互联网信息服务算法推荐管理规定》,要求算法推荐服务提供者应当以显著方式告知用户其提供算法推荐服务的情况,并以适当方式公示算法推荐服务的基本原理、目的意图和主要运行机制等;算法推荐应当向用户提供不针对其个人特征的选项,或者向用户提供便捷的关闭算法推荐服务的选项。
欧美的上述政策性文件公布之后,引发了不少争议,反映了算法规制之复杂和困难。算法规制的最大难点在于算法的不透明性和非人工性。因为许多算法决定是由通过处理大数据而进行深度学习的智能化机器所作出的,有时连算法的创造者和设计者也很难搞清智能化机器为什么会作出某项决定,以及什么时候作出决定。算法程序还可以不断地快速更新,从而很难进行事前监管。即使数字企业通过算法实施不当行为,但由于这些行为是通过自动化程序而大规模和隐秘化地实施,监管部门要搜集足够有力的证据也存在很高成本。或许,未来需要通过智能化程序对算法进行科学合理规制。这是一个“以科技之矛攻科技之盾”的方式,需要花费很长的时间来等待。
对数据和算法实行规制还面临一个重要议题,就是对数据采集、流转、开发、利用与国家安全之间的关系如何把握。尤其在我国,不但强调网络主权,而且数据越来越多地被认为涉及产业安全和国家整体安全。我国于2021年颁布实施的《数据安全法》明确指出,对数据实行分类分级保护,关系国家安全、国民经济命脉、重要民生、重大公共利益等数据属于国家核心数据,实行更加严格的管理制度,各地区、各部门应当按照数据分类分级保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护;国家建立数据安全审查制度,对影响或可能影响国家安全的数据处理活动进行国家安全审查。2022年开始实施的《网络安全审查办法》也明确规定,网络平台运营者开展数据处理活动,影响或者可能影响国家安全的,应当按照这个办法进行网络安全审查。而关于工业领域的数据安全,有关部门还在制订《工业和信息化领域数据安全管理办法》等政策性文件。但是,数字经济具有天然的跨越物理隔阂、地理障碍的特点,数据的跨主体、跨地域、跨国界配置,是数字经济发展的强大内在趋势。因此,我国在加强数据安全工作的同时,如何避免出现数据孤岛效应,是一个必须认真对待的问题。对数据的跨境采集、流转、开发、利用应该如何进行规制,远远超出了反垄断、反不正当竞争的范畴,未来将在较大程度上影响一个国家数字经济的全球化发展进程。
上述分析表明,数字经济领域诸多涉及垄断和不正当竞争的企业行为,在工业经济中并不鲜见,但基于数据和算法,使得数字经济中的这些行为可以成为自动性、隐秘性很强的系统性行为。也就是说,这些行为的要害在于它们基于数据和算法。在数字化社会,数据可能被广泛应用于从未有过的各种用途,而算法不断开辟大量的应用空间。但对于大多数普通人和普通企业而言,数据的采集和加工利用,尤其是算法的奥秘与玄妙,简直是黑箱,或者是魔球,他们根本不能意识到、认识到自身所处的环境和所受的影响。因此,对数据和算法进行规制,应该成为数字经济、数字社会中的关键性规制议题。
但应该指出,这并不是说数据和算法注定是一种危害物,恰恰相反,它们不但是新的赋能工具,而且是新的生活方式,更是一个前所未有的创新领域。因此,对数据和算法的规制不应该扼杀创新的推进和社会福利的提高。而技术的革命性与颠覆性,场景的丰富性和复杂性,使得规制在兴利与除弊之间的平衡变得非常困难。
正因为存在这种困难的平衡,才使规制探索更有必要、更有意义。现在,无论政策界还是学术界,都在积极探索数据和算法的规制依据、规制手段、规制尺度,并且取得了初步成果,但也引发了不少争论。从长远来看,在数字革命浪潮中,在全世界范围内可能需要建立一个数权(Data Rights)体系,就如过去几百年里,在工业革命浪潮中建立了一个包括物权、债权、股权等权利主张的产权(Property Rights)体系一样。这将花费较长的时间,并经历较多的纠葛。世界上最早、最完备地建立产权体系的国家是英国,建立过程经历了诉讼与判决互动、普通法与衡平法交织的数百年漫长时间。比较完备的数权体系的建立,尽管不需要上百年时间,但很可能需要几十年时间。与数权体系相配套,可能还需要建立算责(Algorithmic Responsibilities)制度,建立专门的数据法院,非常有利于数权和算责体系的建立。数权和算责体系应该告诉人类社会,数据的权利如何分配、如何确定、如何保护、如何重置、如何获利,算法和其他此类的自动化、智能化程序产生的行动应该如何界定责任、追究责任。尽管这是人类历史上一个前所未有的新范畴,不可能一蹴而就,但重要的是,应该树立这样的意识,并以这个意识引导人们迈出坚定步伐。而广泛讨论和无数回合,正是通向这个目标的正确道路。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!