大数据获得的资讯,最客观吗? —《数字偏见》

让我们从留意遭到忽视的细节开始。我们现在究竟如何使用数据?正如过去的时代发明了平均数和图表,藉此理解过去曾堆积如山的资讯,更为聪明的现代人提出各种方法,驯化数万亿位元组的数据。这种技术—也就是演算法(演算法〔algorithm〕一词衍生於西元九世纪的波斯数学家花拉子米〔Muhammed ibn Musa al-Khwarizmi〕,他写了一本关於代数的书籍)。— 决定我们在谷歌搜寻得到的结果、在脸书上看到的贴文、在约会软体中遇见的对象,与谁能获得塔拉公司的贷款。
事实上,演算法只不过是我们达成特定目标的几个步骤。在电脑萤幕上,演算法看起来非常枯燥乏味:软体开发人员在电脑中输入一行一行的程式语言,藉此设定在特定环境中需要采取的步骤。这种程式语言可能是「若⋯⋯则」指令,举例而言,「若某人已经偿还贷款,则她的信用分数提高10 分。」
演算法如何运作?美国数学家凯西.欧尼尔(Cathy O ’Neil)在着作《数学毁灭武器》(Weapons of Math Destruction)中,使用一个实际的例子来解释:替家人下厨。如果家人(a)吃得够多,(b)喜欢准备的食物,而且(c)获得足够营养,她就会觉得快乐。藉由每天晚上评估这3种因素,她就能理解晚餐的情况,也明白该如何改善晚餐菜色。她的小孩不吃菠菜但喜欢花椰菜的资讯,协助她知道如何让小孩获得更健康的饮食。但为了达成目标,她必须注意几个限制条件。她的先生不喜欢食物加盐,而她的其中一个儿子不喜欢汉堡(但喜欢鸡肉)。除此之外,她的预算、时间以及下厨的心情,都是有限的资源。
经过几年练习之後,欧尼尔已经变得非常善於处理下厨过程。她发展出更紧密的步骤,可替全家人烹饪最佳料理,而且已经有一部分是潜意识的动作。
现在,让我们假设电脑替她执行任务。她如何将晚餐菜色交给机器决定?她可以从思考如何标准化目标开始。举例而言,为判断家人是否吃到好吃又营养的食物,她可以观察(a)热量、(b)满意度以及(c)每日推荐吃下的营养分量。她也应该思考如何量化各种限制条件,如设定预算上限。
厘清如何标准化後,欧尼尔可以开始蒐集数据。她能够先拟出一张可能的食谱清单,内容包括烹饪时间、价格以及营养价值。她以每份餐点为单位,依照分量和健康价值估计分数,并请家人从1到10进行评分。
欧尼尔使用数据撰写了一个程式,可准确说明家人每天应该吃的餐点。但是,欧尼尔也可以设置一个能够自我学习的程式。只要所有条件都能按照数据计算,电脑就能分析餐点和目标之间的相关性。或许,演算法甚至能够发现连欧尼尔本人都没有察觉到的模式。举例而言,如果小孩昨天曾经吃过松饼,今天就能吃更多的球芽甘蓝。电脑使用机器学习,这是一种人工智慧,藉此学习并未预先设定程式步骤的任务。令人毛骨悚然之处在於,由於程式自我学习的能力, 演算法变得如此复杂,没有人(即便是程式设计师)能理解软体采取了何种步骤。
简言之,欧尼尔能够标准化处理烹饪任务,蒐集数据,让软体分析数据。我们曾在何处也看过这种步骤?佛萝伦丝.南丁格尔、阿奇.考科蓝,以及其他人就是采用了完全相同的处理方法。在演算法的例子中,正如我们在前面几章讨论过的内容,三个处理阶段都可能出现严重错误。

1. 测量抽象概念的问题

塔拉这类公司的财务部门使用大数据评估一个人的信用程度。以「热心财务」(ZestFinance)公司为例,这间公司从2009年开始,判断超过3亿人的信用分数。热心财务公司的创办人是过去曾任谷歌资讯长的道格拉斯.麦瑞尔(Douglas Merrill),他主张,传统的信用分数系统受限於「过少的资讯」。费尔和艾萨克在遥远过去设计的传统信用分数,使用「少於50个数据点」,只是「任何一个人公开数据的冰山一角」。相对地,为了评估一个人的信用分数,热心财务公司使用超过3000个变数。
在荷兰,为了测量客户的付款态度,也有无数公司使用大数据。荷兰数据交易商「焦点」(Focum)的制度是从1分至11分。如果还没缴纳帐单费用,则失去10分,而总分可能会影响20欧元至2万欧元的借款金额。信用分数评比公司将分数卖给愿意购买的买家,从保险公司至房屋公司;从维登佛电力公司(Vattenfall)到沃达丰(Vodafone)电信公司。不良的信用分数代表一个人可能无法申办手机,或与电力公司签约时必须缴纳高额保证金。焦点公司宣称,他们拥有1050万荷兰人的数据。对於一个总人口数只有1700万人的国家,这真的是一个庞大的数据资料。
读者可能会思忖,这个现象有何问题?毕竟,信用分数也提供了契机,正如来自肯亚的珍妮佛。但是,信用分数对於你我的生活可以产生的影响,远比我们想像的更大,而且不见得永远都是正面的。
我们曾在稍早的章节探讨,智力测验分数只是对於某些无形事物的评估,例如智力。信用分数也是相同道理。信用分数想要表达一个人在未来偿还贷款的可能性,换言之,信用分数其实是一种预测。
许多大数据的模型想要预测未来。美国的司法体系也建构了一种系统,计算犯人再度犯罪的可能性。这种计算结果造成严重後果:影响了一个人是否可提前出狱的决策。但是,我们在未来将会面对一个局面:某个事物是抽象的,且难以预测。在此种类型的预测背後,统计模型并非永远完美无瑕,必然会有一定程度的不确定性。如果我们忘了预测只是对个人行为的评估,我们对他人的判断,就是基於不充足的数据。
信用分数还有另一个问题。其应用范围经常超过个人行为,用於表达其他至少同样抽象的事物:可信赖程度。信用分数不只是评估贷款的指标。美国的约会网站「信用分数约会」(CreditScoreDating.com)—标榜「在这里,信用分数很性感」—让人可以寻找与自己信用分数相符的对象。
然而,信用资讯还有更进一步的应用。2012年的一份研究报告以人力资源专业人士为调查对象,发现大约47%左右的雇主会调查求职者的信用历史。另外一份调查美国家庭信用和债务历史的研究报告指出,在曾有不良信用纪录的人之中,七分之一曾经被明确告知,他们之所以无法顺利找到工作,是因为过去的不良信用纪录。
上述研究结果虽然都是特殊样本,无法代表美国的整体人口情况。但是,雇主调查应徵者的背景依然是不争事实。只要稍微观察美国线上徵才的趋势,就能发现雇主要求查核应徵者的信用背景,而且应徵工作的类型非常多元,从贩卖烟火至评估保险理赔。
雇主不会看到真正的信用分数,而是收到信用报告,内容是回顾一个人过去的借贷行为。雇主使用这个数据,希望评估潜在员工的性格特质,以及判断应徵者是否会在未来发生诈欺行为。
但是,其实没有任何证据可证明一个人过去的借贷纪录,以及一个人在工作时的表现,两者间确实有相关性。在非常少数的几份研究报告中,也无法证明相关性。学者杰瑞米.伯奈斯(Jeremy Berneth)和同仁针对费克公司的个别信用分数和人格特质进行比较。信用分数较高的人在良知测验中的分数确实比较高;信用分数较低的人,良知测验分数较低。但在其他性格特质方面,没有任何显着差异。
更重要的是,信用分数和诈欺行为无关。简言之,使用一个人的信用历史,来评估其职场可信任程度是种错误行为。美国有11州以充分的理由决定,雇主要求调阅一个人的信用历史是违法行为。
但是,即使你的信用分数只用於评估贷款,我们也应该保持警戒。因为,蒐集资料的过程,可能产生许多或大或小的错误。

2. 大数据的源头,可能大有问题

大数据可协助我们解决蒐集数据的基础问题。正如其名,大数据让样本大小不再是一个问题。几乎每个人都会使用网路,除此之外,各种应用程式和装置—恒温空调装置、汽车以及各种消费型电子产品— 都会追踪我们的行为。杜拜、莫斯科以及纽约等城市自称智慧城市,因为使用新的科技,蒐集市民所有类型的数据,蒐集设备从路灯上的无线网路追踪器至光纤网路的感应器。
既然我们如今已经在日常生活中开始使用更多科技工具,也就没有必要像性学专家阿尔弗雷德.金赛在研究中执行个人采访。现在,我们可以直接观察人的行为。正如数据学者赛斯.史蒂文斯—大卫多维兹(Seth Stephens-Davidowitz)所说:「谷歌就是数位的真理血清。」
举例而言,已婚女性在谷歌上搜寻丈夫是否为同性恋的次数,是询问丈夫是否酗酒的8倍;在印度,「我的丈夫要我给他母奶」是查询最多次的主题;即使在美国的保守州, 如密西西比,虽然调查报告呈现的同性恋人数较少,但在网路上查询同志性爱影片的次数,依然相对等同於如纽约等进步州。如果有机会使用此种数据蒐集方式,阿尔弗雷德. 金赛将宛如置身天堂。
信用分数背後的公司知道,在资讯时代,个人资料随手可得。他们不需经过正式的繁文缛节,而是能在网路上梳理关於你我的资讯。正如热心财务的执行长道格拉斯.麦瑞尔所说:「所有数据都是信用数据。」有时候,他们蒐集的资讯属於公开资讯,例如在商业委员会的登记立案资讯,但在其他时候—通常是在你不清楚的情况下—你已经同意分享自己的资讯。
数据经常来自阴晦不明的角落。2017年10月,《绿色阿姆斯特丹人》(Grone Amsterdammer)周刊以及非营利组织「印凡思提柯」(Investico)平台,发表了由新闻记者卡尔林金.库杰波斯(Karlijn Kuijpers)、汤马斯.慕特斯(Thomas Muntz)以及提姆.史托尔(Tim Staal)所共同完成的详尽调查报告,主题是荷兰的数据交易商。他们发现,有些单位直接从债务蒐集机构获得数据。民众的财务历史储存在资料库,但民众不知情,因而被列为黑名单—而他们在许久以前早已偿还贷款。顺带一提,此种资讯分享是违法行为,如果相关机构想要分享关於你的资讯,就必须通知你。想要知道数据是否按照正确的方式使用,通常是不可能的,因为无法明确知道数据最初被用於何处。
上述3位记者在报告中发现,位於荷兰瓦赫宁恩市的一家房屋公司,拒绝信用分数过低的民众承租社会住宅,但这家公司「不需知道信用评比公司如何计算民众的分数」。为进行实验,3位记者请10位民众向3家数据调查机构要求查阅自己的数据,他们获得的数据几乎毫无价值。但是,3位记者假扮成来自商界的客户,向同样的机构购买数据时,则是收到非常详细的数据调查报告。
毫无疑问地,数据经常有误。美国联邦交易委员会曾在2012年强调,在他们的调查样本中,民众从三大数据调查机构中发现关於自身数据有误的比例,高达惊人的四分之一。在20人中,就有1人的数据差异极为严重,可能导致个人必须为贷款支付更高利息。
其他资料库中也会有相同错误。在2009年至2010年间,英国出现17000名怀孕男性。没错,怀孕的男性,因为他们的医疗登记编码与产科流程的编码混淆了。数据错误出现在各种场合:市政机构的个人纪录资料库登记错误地址、税捐机构和员工保险机构储存不正确的收入数据,或者警方的资料库误将某人登记为罪犯。因此,盲目相信数字不是一个好主意。
有时,错误的发生不是出自失误,而是恶意。2017年,美国最大信用评比机构之一伊奎费克斯(Equifax)宣布公司遭骇。将近1亿5000万名客户—接近美国总人口的一半—资料被偷走了,也就是说,民众的出生日期、地址以及社会安全码,现在都会出现在黑市。此种细节资讯非常重要,因为可以使用相关资讯在美国实际完成所有重要交易。你将能用其他人的名义申办信用卡、填写退税表单,甚至买房。当然,该公司提供的相关声明并未说明哪些人的资讯遭窃。
正如统计学中的一句老箴言:「输入垃圾,就会得到垃圾。」人类可以创造最聪明的机器学习演算法,但如果输入的数据有问题,机器也会毫无用武之地。假设未来的数据瑕疵可完全消除,也就是说我们将可以使用到完美数据,如此一来就能将命运交给演算法吗?

书 名|《数字偏见:不再被操弄与误导,洞悉伪科学的防弹思考》
作 者|桑妮.布劳(Sanne Blauw)
译者|林晓钦
出版社|今周刊
出版日期| 2021 年12 月30 日

有个现象愈来愈显着,那就是数字决定世界的面貌:
从退休年龄到Facebook点击次数,从国内生产总值到我们的收入。
但有没有可能,你愈相信数字,就离真相愈远?
数字、分数、排名、民意测验和大数据,在每个人的生活中变得愈来愈重要。
然而就像美国谚语:「枪不会杀人,但拿枪的人会。」一样,数字不会撒谎,但使用数字的人会。
在这假新闻充斥、制造真相的时代,即使你对数字无感,数字依然深刻影响你的人生。数字让人自以为拥有独立思考,但其实,我们比想像中更容易掉进用理性科学编织而成的思维陷阱。

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论
Back to top
0
希望看到您的想法,请您发表评论x