来源:vox, theguardian.com, PNAS
作者:闻菲、张乾
【新智元导读】一家名叫Cambridge Analytica的数据分析公司成了这两天新闻的焦点,他们使用大数据和AI分析Facebook用户资料,操纵舆论帮助特朗普竞选。研究早已发现,机器能比人类更加精准地掌握人类的性格。AI和大数据正在成为强大的政治武器,假新闻、机器人水军、AI换脸既成为一种技术现象,也是一种社会现象,是我们每个人都需要面对和思考的问题。
消息已经出来了:俄罗斯大选,弗拉基米尔·普京轻松赢得了第四个任期,对70%的得票进行抽查的结果显示,普京得票率为75.91%。
民意调查显示,普京的支持率远远超过其他对手,当选可以说是早成定局。然而,针对俄罗斯的这场大选,舞弊的质疑声不绝于耳。此前俄罗斯非政府研究机构利华达中心的一项调查结果,有58%的选民计划抵制这次选举。普京最有力的竞争对手,也因欺诈罪被送入牢狱,未能参加此次选举。
另一边厢,美国的特朗普也不得安生。关于他2016年操纵舆情当选总统的报道再一次飞满天,其中也包括他与俄罗斯勾结的可能。美国这边的舆论风暴更加猛烈,而位于暴风中心的,是一家数据分析公司,以及这家公司使用的方法——人工智能。
这家叫做Cambridge Analytica的公司是这两天全美关注的焦点。公司内部人士走向前台,主动公开Cambridge Analytica非法获取超过500万Facebook个人账户信息,然后使用这些数据构建算法,分析Facebook用户个性资料,并将这些信息与他们的投票行为关联起来。
算法和大数据两相结合,形成了一种强有力的政治武器,让竞选团队能够准确识别在两位候选人之间摇摆不定的选民,并有针对性地制作和投放广告。
根据这位吹哨人的表述,Cambridge Analytica使用这些非法得来的数据,最终目标是“利用这个训练集,构建一个理解Facebook用户个人资料的‘黄金标准’”。
大数据和AI在竞选中的力量:机器能比人更加精准地掌握人类性格
Cambridge Analytica首席执行官Alexander Nix在2016年的一次演讲中,详细阐述了这家公司的方法论:“我们推出了一个长表(long-form)量化工具来探究人格的基本特征。如果你知道了目标人物的个性,你就可以细化信息,更有效地与这些关键群体产生共鸣。”
Cambrige Analytica CEO 在会上演讲《大数据和心理分析在竞选中的力量》
Cambridge Analytica通过收集到的数据——我们先把数据收集方法放在一边——建立了模型,并将其转化为美国成年人的个性概况。Nix声称,他们“在美国每个成年人身上大约有4000或5000个数据点(data points)”。
他们模型的基础,是Michal Kosinski的心理测量学研究,Kosinski在2013年是剑桥大学的一名博士候选人(这也是Cambridge Analytica公司名字的由来)。Kosinski和他的同事开发了一个模型,将受试者在Facebook上的点赞(like)与他们的OCEAN分数联系起来。OCEAN是心理学家使用的一种调查问卷,描述了五个维度的人格——开放(openness to experience)、自律(conscientiousness)、外向(extraversion)、随和(agreeableness)和神经质(neuroticism)。
Cambridge Analytica公司将这种社会心理与数据分析结合起来。他们从Facebook和Twitter收集数据,并从第三方那里购买一系列其他的数据,比如电视偏好、航空旅行、购物习惯、去教堂的频率、订阅的杂志等等。然后,他们将所有这些信息用于Nix所谓的“行为微观定位”(behavioral microtargeting),简单说就是个性化广告。
Cambridge Analytica使用心理测量学而不是根据人口统计来定制广告,以选民个人的情感内容为目标。换句话说,就是为了激发人类情感上的偏见而设计广告。
这种方法成功与否,或者有多成功,取决于对人心理概况的掌握。我们是否能够根据社交网络上的评论、留言和推文来了解一个人的心理状况?
答案是肯定的。
Kosinski在他2016年接受采访时,谈到了他的模型的预测能力。“70个“喜欢”就足以超过这个人的朋友对他的理解,150个就能超过他的父母,300个超过伴侣,更多的“喜欢”能让模型比这个人本身都更了解他自己。”
或许这是Kosinski在王婆卖瓜,但研究早已证实,机器能比人类更加精确地判断人类的性格特征,这与社交认识能力无关,一切都在大数据。
2015年发表了PNAS的一项研究表明,计算机模型基于数字足迹对人物性格的判断,比亲密的人(朋友,家人,配偶,同事等)所作的判断更准确和有效。研究人员表示,“我们的研究结果强调,人的个性可以自动预测,而不涉及人类的社会认知技能。”
利用AI和大数据控制公众舆论:从假新闻到换脸,初中高三级进阶
将机器的这种预测能力与一群bot结合起来,就成了更加强大的宣传工具。牛津大学互联网研究所计算宣传项目(Computational Propaganda project)负责人Samuel Woolley说:“控制一千个僵尸计算机帐户的一个人,不仅能够影响他们直接圈子中的人,还可能影响他们操作的网站的算法。”
这些技术可以捕捉到人们在某个特定时刻的想法,并一次又一次地向他们提供服务。不仅如此,活跃在网络中的bot能够对Twitter和Facebook上的热门话题做出迅速的反应,生成有针对性的帖子、图像,甚至YouTube视频。
随着大数据和人工智能的发展,利用相关技术开展社会学研究已经成为一种趋势。然而,就如上文所说,利用这些技术同时也能影响甚至操控人和社会本身。
牛津大学互联网研究所计算宣传研究项目(Computational Propaganda Research Project,COMPROP)就专门针对这种新的现象,调查算法、自动化和政治的相互作用。研究人员的工作包括分析如何利用社交媒体机器人等工具,通过放大或压制政治内容、假情报、仇恨言论和垃圾新闻来操纵公众舆论。
项目官网介绍:“我们使用组织社会学,人机交互,沟通,信息科学和政治科学的观点来解释和分析收集到的证据。 ”
新智元也简单梳理了AI和大数据在总统竞选中的应用。
初级篇:Fake News,制造假新闻在Facebook上传播
2016年,特朗普当选总统,假新闻可谓助了一臂之力。
在整个竞选期间,美国的充斥着大量的假新闻。BuzzFeed在2016年12月做的一项调查显示,75%的美国人看到过假新闻。以其中一条假新闻为例,“调查希拉里邮件泄露门的FBI特工自杀-FBI Agent Suspected in Hillary Email Leaks Found Dead in Apparent Murder-Suicide (Fake)”这则新闻,有52%的希拉里支持者和85%的特朗普支持者认为是真的。
而假新闻的制造也有规律可循。
纽约时报曾披露,格鲁吉亚一名22岁的计算机专业的学生,发现特朗普的新闻能够为自己的网站带来流量,于是他频繁发布有关赞美特朗普、反希拉里的故事,做法常常只是简单地剪裁和粘贴,有时会篡改标题,但主要是复制其他地方的材料,就是通常所说的“洗稿”。最终,使网站广告销量飙升。
当时,一些分析人士认为,美国假新闻可能跟外国情报机构干预美国政治影响选举有关。不过《自然》最近发布的研究认为,2012年和2016年美国总统选举期间,政治类假新闻的数量明显增多,但假新闻主要由公众分享,而非“机器人”账户自动传播。公众之所以更喜欢分享假新闻,是因为它更加耸人听闻。
尽管如此,在传播的过程中,Facebook成为重要的渠道,对假新闻的处置力度不够,这也是马克·扎克伯格年初放话“整顿”公司的原因。现在,Facebook改变了信息流的呈现方式,优先为用户推荐好友的新闻。
除了假新闻外,机器人水军也是为总统选举造势的一股力量。
2017年1月17日,Girl 4 Trump USA加入注册了Twitter账户。一个星期之后的1月24日,她突然忙碌起来,每天平均发布1289条推文,其中许多是在支持总统特朗普的内容。当Twitter发现Girl 4 Trump USA是一个机器人的时候,“她”已经发布了34800次推特。
后来,Twitter发现了大量此类的用户,这就是我们熟悉的“水军”,在国内社交平台上也经常见到。但Twitter无法阻止其平台上的水军机器人,而且后者的手段也越来越隐蔽。
中级篇:Fake Video,以假乱真,AI换脸变声
去年,华盛顿大学的研究人员用神经网络来观看视频,并将不同的音频声音转换为基本的嘴形,根据音频剪辑生成逼真的视频,让嘴巴的运动和音频同步。
不过,这还不是最厉害的。
不久前,Reddit上一名叫deepfakes的用户,创造一种机器学习算法,可以允许人们用简单的视频和开源代码制作出一条假的色情视频,并将原视频的女主角“换脸”。
后来,deepfakes还开发出一款Fake APP,进一步把技术门槛降低到C端。
特朗普的脸换到希拉里身上
最后,由于技术太逆天以及违反道德,Reddit就把相应的社区封了。
除了制造假视频,音频也是AI技术不放过的领域。
听听奥巴马说的这段话。
奥巴马当然不会说中文,音频后面的话并非奥巴马自己说的,而是利用科大讯飞的语音技术合成而来。
高级篇:见微知著,看车能预测政治倾向
无论是假新闻也好,假视频也好,都是下三滥的手段。真正把人工智能玩儿的炉火纯青的,还是要实打实的能力。
2017年,李飞飞曾领导斯坦福研究人员,将人工智能的研究成果应用到人口统计学中:他们使用具有视觉和学习能力的算法分析了Google街景视图上的数百万个公开可用的图像。研究人员说,只要看看街上的汽车,他们就可以利用这些知识来确定某个社区的政治倾向。
具体步骤是:
算法进行自我训练,识别谷歌街景中来自200个美国城市的5000多万份图像中,自1990年以来生产的每辆汽车的样式、型号和年份。
然后将有关汽车类型和位置的数据与当前最全面的人口数据库、美国社区调查和总统选举投票数据进行比较,以预测种族、教育、收入和选民偏好等人口因素。
最终,李飞飞及团队发现了汽车、人口统计学和政治劝说之间存在着简单的线性关系。简单而言,如果一个社区的轿车数量大于皮卡的数量,那么该地区有88%的可能性会投票给民主党。如果皮卡的数量大于轿车,则该选区投票给共和党的可能性是82%。
人工智能改变政治生态:研究人员立场最关键
现在,这种机器人水军、AI换脸既成为一种技术现象,也是一种社会现象。
如果仅仅从技术角度来看待用技术进行的宣传,它就会被那些创造它的人、服务于它的平台以及从中获利的公司所掌控,也削弱了为改变社会价值和意义的程度,因此,大数据与人工智能研究对于理解技术宣传对政治的影响是必要的。
与此同时,研究人员必须对正在使用和分析的数据保持一个关键的立场,以确保我们在描述、预测或推荐时进行能够批评。如果对技术宣传和政治大数据的研究不涉及到权力,那么提高社交媒体平台在公共生活中的作用的可能性就会消失。
如果真的是那样,那就到了终极篇——普京当总统之路了。
1、牛津计算宣传项目官网:http://comprop.oii.ox.ac.uk/
2、Vox报道:https://www.vox.com/policy-and-politics/2017/10/16/15657512/cambridge-analytica-mccabe-facebook-aleksandr-kogan-trump-russia
3、卫报报道:https://www.theguardian.com/news/2018/mar/18/what-is-cambridge-analytica-firm-at-centre-of-facebook-data-breach
评论留言