第1章 数据驱动是试验本质
1.1 生活处处有试验
日常生活中,每个人每一天都会遇到各种需要选择的情形,例如:
“今天穿黑色还是白色的T恤出门?”
“晚上外出的时候要不要带伞?”
“西红柿炒鸡蛋到底要不要放糖?”
……
当我们为了解决某一个问题而在不同的备选方案中做出选择时,就已经开启了一个个试验,试验的结果就是所谓的经验。因此,归根到底,真正带给我们真知与进步的就是试验,试验能够帮助我们检验假设并从中挑选出可行的方案,这也正是伟大的无产阶级革命家与理论家毛泽东同志所言的“一切从实际出发”。在当今语境下,这个“实际”指的是推动各行各业实现创新和发展的试验。下面我们一起来看看,来自生活与工作中的试验。
1.1.1 “鸟”生浮沉启示录:达尔文雀的自然进化试验
在太平洋中有一群有名的小岛,叫作加拉帕戈斯群岛(Galapagos Is-lands)。加拉帕戈斯群岛位于赤道之上,在南美洲国家厄瓜多尔以西约1 000公里的茫茫大海之中,在漫长的地球和生物演进中,它都只是无名群岛,之所以能够进入人们的视野,是源于进化论之父达尔文的科学研究。
达尔文对此地雀类的研究,奠定了加拉帕戈斯群岛在科学史上独特的地位。究竟该群岛与曾经生活在其中的雀类有什么特别之处呢?
这要从加拉帕戈斯群岛中的一个小岛——达芙妮岛(Daphne)说起(见图1-1、图1-2)。
图1-1 加拉帕戈斯群岛
图1-2 达芙妮岛
170多年前,查尔斯·达尔文(Charles Darwin)乘坐“小猎犬”号科考船航行到加拉帕戈斯群岛,被这些岛上特有的物种所吸引,其中令人瞩目的是岛上的雀鸟。
加拉帕戈斯群岛和附近的科科斯群岛(Cocos Islands)上共住着15种特有的雀鸟,而这15种雀鸟是在短短的150万年间由同一个祖先辐射式进化而来的。达尔文被这些特有的雀鸟迷住,他发现这些鸟在体型、鸟喙等形态上有着巨大的差异,而这些差异能够很好地被不同岛上的地形、气候等因素解释,形态的差异体现了不同的雀鸟对不同的地理环境的适应性。达尔文对这群雀鸟的开创性的观察和研究,也极大激发了他对进化论的宏伟框架的构思,而这些雀鸟也成为“进化论”的经典论据。因此,后人将这些雀鸟亲切地称为“达尔文雀”。
然而,达尔文雀的成名则诞生于1975~2006年间的现实版的进化试验,第一次将进化论的镜头拉到大众的视线中:在达芙妮岛上勇地雀(Geospiza fortis)和大嘴地雀(Geospiza magnirostris)的进化试验中,人们第一次感受到自然环境的变化如何“极速”地选择并塑造了一个鸟类种群中个体的形态(见图1-3)。
图1-3 大嘴地雀和勇地雀等雀种
1—大嘴地雀 2—勇地雀 3—小嘴地雀 4—绿莺雀
在较早的时候,岛上的勇地雀的主要食物是较小的种子。但是在1977年,一场严重的干旱爆发了,导致小种子的食物不够勇地雀食用。因而勇地雀中那些鸟喙较大的成员便开始渐渐去食用大花蒺藜(Tribulus cistoides L.)的种子。
大花蒺藜的种子较大,有着厚厚的外壳和尖锐的刺,只有大的鸟喙才能处理。因此,经过了1977年的干旱,勇地雀中鸟喙较大的成员由于有了更广泛的食物来源,渐渐有了繁殖的优势,带动了整个勇地雀的鸟喙的平均尺寸迅猛增长(见图1-4)。
图1-4 1975~2005年达芙妮岛上勇地雀鸟喙尺寸的变化
注:图中纵轴的正值代表变长,负值代表缩短。
但是好景不长,风调雨顺地过了几年之后,岛上充足的食物吸引了大嘴地雀的光顾。大嘴地雀有着大大的鸟喙,而且体形是勇地雀的两倍,糟糕的是,它们同样喜爱以大花蒺藜的种子为食,因此这和刚刚改变食物的勇地雀形成了竞争。随着大嘴地雀在达芙妮岛上的繁殖,勇地雀受到了压制。大嘴勇地雀无法在食物争夺战中打败大嘴地雀,选择的压力迫使大嘴勇地雀继续回去吃传统的食物——小种子,因此它们平均的鸟喙尺寸开始逐渐回落。噩梦终于在2004~2005年降临:一场持续的干旱使得岛上的大花蒺藜大量减产,干旱的杀伤力体现在这两群鸟的数量上,勇地雀由大约1 300只减少到大约150只,大嘴地雀由大约250只减少到几十只(见图1-5)。
图1-5 1997~2006年达芙妮岛上大嘴地雀和勇地雀的数量变化
可以想象,这场干旱极大地激化了大嘴勇地雀和大嘴地雀的食物争夺战。“战争”的结果也非常惨烈,勇地雀的鸟喙尺寸出现了断崖式的缩减,这暗示着,在这场残酷的食物争夺战中,大量的大嘴勇地雀落败并且饿死,实际上,大量的鸟的尸体解剖结果也支持了这一观点。
对达芙妮岛上的勇地雀来说,这是一个悲伤的故事。在这个故事中,我们肯定注意到了一个非常有趣的点,那就是这群勇地雀为什么有如此神奇的能力,使得它们的鸟喙尺寸在短短30年间“随意”变化,可以适应不同的环境?大自然“设计出”喙大小不同的雀鸟(不同的版本),让它们为生存做斗争。在同样的环境下,喙的大小成为决定雀鸟生死的关键因素,这便是物种进化中大自然所做的试验。
勇地雀正是依靠自然变异来进行大量的试验,才能够应对不同的环境变化,通过改变鸟喙的形状来及时调整自己的食物来源从而生存下去,在达芙妮岛上生生不息。基因时代对鸟类的研究,则将一切揭示得更加清楚了。研究人员比对了不同鸟类种群中大嘴鸟与小嘴鸟的基因组,发现有一个基因组的位点一致性地显示出极强的信号——HMGA2基因。它和人类的颅部发育、牙齿萌出有关,也很可能是引起鸟喙大小发生改变的基因。而勇地雀正是依靠其种群内在这个基因上大量的自然变异,才能够应对不同的环境变化。
“微小的差异决定了谁将生存,谁将毁灭”。达尔文概括了大自然进化试验的精髓:细节的累积最终决定成败。
1.1.2 林德试验:现代医学离不开 A/B 测试
在促进人类医学发展的过程中,“临床试验”有着极为重要的地位。临床试验可以确立新的治疗方法的效果,后人才能享有先进的医疗服务。临床试验是以人体为对象研究新的治疗方法(如新的药物、新的医材),并在外在条件皆受到良好控制的情况下,让志愿参与的受试者接受试验(见图1-6),并观察这个新的治疗方法对疾病的疗效及其进展。
图1-6 受试者接受临床试验
以新药的临床试验为例,新药的效果如何?会有什么副作用?治疗方法能否发挥效用?都必须借由受试者真实的试验结果与反馈才能得知;但同时受试者也有获得潜在利益的机会,受试者因接受新的药物或新的治疗方法,其疾病可能会有缓解,甚至痊愈的可能。这种看似通俗易懂的过程却是药品行业最科学的检验机制,这种试验也是一种A/B测试(也叫对照试验)。
现代医学科学引入A/B测试的方法来进行临床试验以验证新药的疗效,其流程通俗地讲就是:受试者被医生悄悄划分为 A、B 两组(注意受试者并不知道自己被分组而且他们的健康情况是接近一致的),A组受试者将会得到试验新药,B 组受试者将会得到和新药一模一样的安慰剂。如果最终 A 组受试者比 B 组受试者的疗效更好,就能证明新药的药效是真实可靠的。
只有采用科学的临床试验设计方法,来客观观察和判断药物的临床疗效并反复优化,最终才有可能推向市场。A/B 测试也是医药行业对全社会最具影响力的理论之一。
林德试验就是人类历史上第一个医学临床对照试验的故事。
在15 世纪末,人类开启了大航海的伟大时代,然而航海中容易出现坏血病,病人发病以后,症状逐渐噩化,会从牙龈出血发展到全身溃烂而死,病情非常严重。
詹姆斯·林德作为英国皇家海军军医的首要任务就是寻找治疗坏血病的方法。1747年5月20日,为了确定不同的辅食是否有治疗作用,他设计出A/B测试的对照试验方法。
他先是将12位生病的海员分成 6 组;接着,让6组人分别用不同的辅食配方(见图1-7)。
第一组:一升苹果酒;
第二组:25滴硫酸,加入饮用水里;
第三组:6勺醋;
第四组:240毫升海水;
第五组:2个橘子,1个柠檬;
第六组:一种辣酱加大麦茶。
试验进行到第六天就不得不中断,因为到第六天,橘子和柠檬都吃完了,但船上没带足够多的水果。不过到第六天的时候,吃橘子、柠檬的那一组人,其中一个人已经康复,可以正常工作,另一个人也差不多完全康复了。而其他组中只有喝苹果酒的第一组的两个人略有好转。
图1-7 林德喂组员不同的辅食
林德的试验没能马上确定橘子和柠檬是治疗坏血病的最佳辅食配方。当时科学还不够发达,得坏血病背后真实的病因(缺乏维生素C)并没有人知道。但他的试验可能是人类历史上第一次尝试用系统方法检验药物的疗效,并且完整地记录其结果及反馈。后来,直到林德去世之后,后人重新通过试验确认橘子有治疗坏血病的功效,此时,海军才重新注意到林德的发现,坏血病从此被人类战胜。林德因此在去世之后获得了崇高的荣誉。
1.1.3 洁面霜卖点效应:现代广告史就是试验发展史
现代广告从诞生起就埋下了试验的种子——美国著名广告人约翰·卡普斯(John Caples)对广告与试验的关系有一段经典论述:在广告进行科学测试之前不能接受任何经验之谈。卡普斯将他测试广告的实践经验写成了一本经典著作——《测试广告的方法》。
卡普斯在广告业孜孜不倦地工作了35年之久,各种各样的试验让他知道哪一种有效,而哪一种只会让广告人员“自我陶醉”。如果只是做出自认为创意十足而无法卖货的广告,浪费的只会是广告主的金钱。
卡普斯在投身于广告业之前是一名工程师,工程师的工作经历使他倾向于对广告进行分析和测试,他在测试的实践中举了一个例子:在同一本刊物上,一个广告创意比另一个广告创意卖出的同一种商品多19.5倍。
广告界大师,同时也是奥美公司的创始人——大卫·奥格威也崇尚试验和测试。奥格威本人在做广告之前是在盖洛普调查公司工作。
“一切经过测试”。
广告语字典中最重要的词是“测试”。面向用户测试你的产品、测试你的广告,你在市场上就会事半功倍。通常,25种新产品中有24种在测试市场上通不过。厂家不做市场测试就将产品投向市场,如果失败了,就会蒙受巨额经济(以及名誉)损失。
其实,这种产品原可在测试市场上不被人注意地被否定掉,厂家蒙受的经济损失也可以小一些。测试你的产品承诺;测试你的媒体;测试你的标题和插图;测试你的广告尺寸;测试你的媒体投放频率;测试你的广告开支水平;测试你的电视广告。“永不停止测试,你的广告就会不断得到改进”(见图1-8)。
图1-8 奥格威的经典语句“永不停止测试”
奥格威在其著作《一个广告人的自白》中介绍过一种广告试验方法:在同一个日期的同一份报纸的同一个版面上刊登文案不同的广告,在广告中告知可以剪下报纸上的回执,邮寄到指定地址免费领取样品,然后观察两份文案带来的样品索取量的差异,这其实就是今天数字广告中改变单一变量的“A/B测试”。
在广告创作领域,有一个重要的“卖点”概念,它源于罗瑟·里夫斯(Rosser Reeves)提出的独特销售主张(Unique Selling Proposition,USP)理论,该理论要求广告必须向消费者陈述产品的独特的必须能引起销售的特点。对广告创作来说,确定卖点也需要通过调研和试验数据。
有一个经典的确定卖点的案例是,奥格威曾为赫莲娜洁面霜列出多个可能的卖点,但广告应该强调哪一个卖点呢?奥格威于是做了一次小规模的投放试验,试验数据显示用户对“洁净力可深入毛孔”这个卖点的认可程度最高,从奥格威的经典案例(见图1-9)看出,如果不进行试验投放而全凭广告人的设想是很难预知到这一结果的。
图1-9 奥格威的经典案例
今天,互联网与数字技术给广告营销人员带来的礼物之一就是试验门槛大幅降低,试验更廉价,操作更容易,风险也更低。我们已经不需要像奥格威时代那样经过几个星期才能进行一次试验,而是随时随地,用极少的成本、极短的时间、极小的风险、极简单的操作就能完成一次广告测试试验。
就像本章开头说的,我们每天都在进行各种各样的试验,也参与着大大小小的试验。可以这么说,我们的工作、学习与生活就是一个又一个的试验。在进入数字化时代后,试验更是随着移动互联网的普及全面进入到我们线上、线下的生活中。那么试验到底是什么?我们为什么要做试验?怎样做试验才是科学高效的呢?接下来将为您详细介绍。