理解大数据:数字时代的数据和隐私
上QQ阅读APP看书,第一时间看更新

1.3 数据治理问题

1.3.1 数据治理的演进逻辑

我们在报告的第六章讨论数据治理的几个核心问题。

我们的数据权衡框架有助于更好地理解数据隐私监管和治理的演进。上世纪70年代,美国颁布了《公平信息实践》(FIPS),为现代隐私保护的治理法规和监管奠定了基础。《实践》基于五大原则包括:(1)通知/知情;(2)选择/许可;(3)接入/参与;(4)完整/安全;以及(5)执行/纠正(美国联邦交易委员会,1998)。

这5大原则指导美国联邦委员会“鼓励和推动有效的自我监管,作为保护消费者线上隐私的主要方式”(FTC,1998),进而成为后来隐私和数据治理条文和法规的原型,包括欧盟的《数据保护原则指令》(DPPD)、《通用数据保护条例》(GDPR)以及美国的《加利福尼亚消费者隐私法案》(CCPA)。FIPs为基础演化而来的个人数据治理法规有一个关键的共识,那就是不要将数据锁入“保险箱”里或拘泥于数据所有权,而是鼓励安全的数据流动,同时保护消费者隐私。例如,经合组织(OECD)就提出“兼顾平衡的隐私立法,并保护相关人权……同时避免干扰……数据的流动”。让消费者从分享个人数据中受益,这个定位和我们的数据权衡框架中确立的基本原则是一致的。

虽然在大原则上一致,但在数据使用上有不同程度的限制,反映出不同国家和机构对数据治理的实践差异。诺奖得主Elinor Ostrom指出,尽管动机良好,但过于严厉的治理政策会对专利、知识产权、授权、定价甚至“数字经济的存续”带来不利影响。她认为,政策制定应让各参与方都成为利益相关方,从数据分享中受益(Layton,2019)。很多其他学者也得出了相似的发现和结论(Goldfarb and Tucker,2011;Martin and Murphy,2016)。“任何条例都会带来应用的成本,数据隐私法可能会限制宝贵的信息流动,带来隐私和安全风险,提高市场进入障碍,增加创业者的不确定性,以及催生寻租行为”(Layton,2019)。

1.3.2 数据和竞争的关系

数据驱动的商业行为在竞争中会扮演越来越重要的角色,因此我们需要理解数据驱动的市场行为会如何影响竞争。竞争法的核心目标是:“确保消费者可以从竞争的力量中受益”(Shapiro,2018)。要判断竞争是否被扭曲,消费者的利益是否受损,我们要用事实说话,深入理解行业结构、企业的商业行为,并评估其市场表现。

我们先回顾一下交易对竞争以及国家的企业竞争力的正面影响。如上文所述,在中国,线上市场的出现让买卖双方的平均距离从10公里上升至1000公里。在1776年出版的《国富论》中,亚当·斯密指出,垄断力量是“良好管理的大敌”,而交易范围的扩展会打破这种垄断:

“状况良好的公路、运河、船只往来的河流,这些大大降低了货运的开支,将一国偏远的地方与城镇周边置于同一发展水平上。它们都得到了最好的交通改善。这将刺激边远地区——一国最偏远一环的发展。通过打破本地商人的垄断,对城镇的发展多有裨益,也对国家的其他地区有益。尽管交易扩张在旧市场中引入竞争性的商品,但也为旧产品带来了新的市场。此外,垄断是良好管理的大敌。只有在自由和全面的竞争下,市场中的每个人为了自我防御都要遵循规则,好的管理制度才能建立起来。”

如同亚当·斯密时代的“公路和运河”延伸了贸易距离,打破了垄断,提升了偏远地区商家的竞争,21世纪出现的平台数字网络也打破了本地垄断力量,并且如下文所述,建立了一个更健全、更具竞争性的商业环境,只不过两者的速度和效率无法同日而语。

另一方面,数字经济中可能妨碍竞争的商业行为在全球范围内正在引起越来越多的关注和争议。由于篇幅所限,本报告无法为所有相关问题提供答案,我们基于初步证据,聚焦于讨论三个和数据竞争相关的关键问题。

首先,企业在多大程度上利用大数据技术歧视性对待消费者?

商家今天获得关于客户的信息前所未有,无论数据量还是数据种类都远超前人想象。从理论上讲,企业通过数据更懂消费者,是有可能成体系地对消费者采取价格歧视,攫取消费者利益。在实践中,我们也会在不同国家看到“大数据杀熟”的个别案例。但总体而言,和蓬勃发展的大数据运用相比,大数据杀熟的案例要少得多。也没有任何国家的研究发现大数据杀熟的广泛现象,反而免费、普惠成为更加普遍的时代特征。这是为什么呢?

一个可能的解释是,数字技术改变了生产者和消费者的关系。其中一个结果,随着累积这些高颗粒度的数据,商家已经不再追求从单独的产品或服务中获取最大利润,而是追求提供一个以客户需求为中心的综合服务,建立更高的客户忠诚度。普惠性就是尽可能扩大客户的多样性和数量,今天已经成为越来越多企业核心的商业目标。例如Ichihashi在2020年的研究显示,很多数字平台希望向平台上的卖方公开买方的特征信息,而不是将买家隔离开,进行经济学家所谓的“价格歧视”——以不同的价格向不同的群体出售类似的产品,以便从支付意愿最高的消费者身上获取最大的利润。实际上,要成功地进行价格歧视,卖方需要有能力将不同群体的消费者隔绝开。而今天的互联网让信息隔离越来越难,消费者可以在非常广阔的范围内搜索不同的卖家和价格,让竞争越来越激烈。

价格歧视并非唯一的顾虑。美国的消费者保护机构,例如联邦贸易委员会担忧“企业可以使用大数据,让那些低收入、缺乏服务的群体失去获得信用服务和就业的机会”,并表明要对这种不公平的行为进行指控。但现实中数字金融不断增强的普惠特性,将缓解这样的担忧。至少在肯尼亚、中国和其他很多国家,普惠金融取得了突飞猛进的发展。所以,在我们关注大数据杀熟的案例的同时,我们也不应该忘记这样的案例并非多数,也要具体分析其背后的原因。

其次,大数据是否在妨碍竞争,让市场出现赢者通吃的局面?

关于数据竞争的一个普遍担忧是,网络平台的外部性(直接和间接的)和规模经济可能带来市场进入障碍,从而引发赢者通吃的结果。从具体效果看,美国科技产业的一些领域的确出现了市场集中度提升的现象,但中国却上演了一个非常不同的故事。在中国,数据驱动的产业出现了强竞争的特征,潜在的新竞争对手常常让在位的互联网企业夜不能寐。

例如电商行业,尽管在线零售占社会总零售比例已经超过27%,但由于激烈的竞争,阿里巴巴这样的具备先发优势的领先者,面对市场新进入者和原有竞争对手的快速增长。在短短四年内,阿里巴巴在中国电子商务销售额占比从2015年的78%降至2019年的56%[1]。拼多多作为市场新进入者,在3年内吸引了超过4亿用户,销售额增长超过100倍。

中国曾经最典型的大数据企业百度,长期统治中国的搜索引擎市场,并且曾在大数据和人工智能领域遥遥领先,2010年它的市值大于阿里巴巴和腾讯,然而如今却远远落后于这两家公司和很多新进入者。抖音的母公司字节跳动异军突起,只用7年就超越百度成为互联网广告收入领头羊。京东商城占中国电子商务销售额17%,它的投资者包括谷歌和沃尔玛这样的巨头,最近成功“占据家用电器市场全渠道最大市场份额”[2]。在移动支付市场,类似的激烈竞争也在频繁上演。这些证据表明,我们很难得出先发的大数据优势会引发“赢者通吃”的结论。

一个可能的解释是,大数据只是商业竞争的一个要素,并不必然决定行业的格局和企业的命运。首先,在数字经济中,数据的使用只是商业模式运行的一部分。尽管在今天的商业模式中,数据扮演了比以前更加重要的角色,但企业间的竞争仍旧由商业模式及其执行决定。另外,与传统经济不同,数字服务的消费者可以选择多个平台——用户可以选择提供类似服务的不同供应商,从而多方分享自己的个人数据。再次,随着数据的增加,数据的边际效用会随之下降。研究表明,如果一种资源能为企业带来垄断的竞争优势,那么这种资源一定是无法模仿的、稀有的、高价值的且可持续产出的,“然而通常数据并不具备上述任何一种特质”(Lambrecht and Tucker,2017)。

显然,在数字经济的发展过程中,存在妨碍竞争的企业行为,需要通过法规纠正,这也日益成为各国社会关注的一个重点。但这些现象,和所谓的“赢家通吃”,无论在理论和实践中都没有必然的联系。我们对事情性质的判断,应该基于事实,基于不同国家、不同行业的实际情况,而非基于假设的“黑板经济学”,否则会适得其反,妨碍数字经济的发展。

再次,大数据在多大程度上在给创新带来障碍?

从事实上看,数字技术在已经带来深度影响的行业,包括媒体、社交媒体、电子商务、金融、视频、出行和共享单车等等,几乎每一个行业都有新的商业模式和新的市场进入者。在数字技术和数据的帮助下,这些新的商业模式为行业带来了“破坏性创新”,也逼迫那些墨守成规的成熟企业做出改变。在全球几乎所有市场,带来激进创新的企业都是那些资金和资源非常有限,但拥有无限想象力和雄心壮志的初创企业。可以说,创新已深深烙印在科技初创企业的DNA中。

尽管有合理的疑问,但我们认为有几个原因可以说明,为什么大数据天然会推动产品和生产流程的创新。

第一,大数据的三个V已经成为重要的生产模式和商业模式的创新引擎。企业连接和了解客户的能力大大加强,因此可进行更明智的决策,并进行创新试验。这是在数字技术深度改变的行业中,创新层出不穷的重要原因。

第二,大数据的三个V带来了前所未见的大规模、深度合作,这也大大加速了创新在市场中的部署和应用。平台作为连接供给和需求的载体,成为创新扩散的重要推动力量。平台处于竞争压力,会愿意改进商业基础设施,推动平台上企业的创新发展。实际上平台上的创新非常活跃,例如新品牌和小众品牌在各类平台上的爆发式增长,就是显著证据。

本报告的结构安排如下,第一章总结本报告的核心内容。按照逻辑递进的方式,第二章基于消费者在隐私相关决策时的实证分析,推导出不要单维度看待隐私,而需要综合理解消费者和个人数据相关的权益。第三章谈论数据分享的价值源自何处。第四章介绍从行业和企业的角度,做好隐私保护的核心逻辑和方法。第五章提供了一个基于数据本质特征的综合理解数据权衡的框架。第六章运用这个框架理解全球数据治理的相关问题,并且就数据和价格歧视、竞争、创新的关系,基于实证研究进行了讨论。第七章提供了简短的总结思考。


注释

[1] 参见文章Alibaba,JD.com Lead in China,but a Few Others Are Making Dents,too和Retail and Ecommerce Sales in China 2018。

[2] 参见Wikipedia词条"List of largest Internet companies",文章The biggest ecommerce companies in China—a brief guide和JD.com’s Market Share Tops in All Channels of the Home Appliance Market。