发表于2024-12-14
算法时代 [The Formula] pdf epub mobi txt 电子书 下载
李克强总理在2016年的政府工作报告中首提“新经济”,提出十三五期间将促进大数据、算法、物联网广泛应用。无疑,算法、大数据产业是新经济的代表,将在十三五期间迎来爆发增长期。近年来随着大数据技术的快速发展,我们正在进入“算法经济时代”。每天,算法都会对展示在我们眼前的信息进行分类、筛选与取舍。我们看到的谷歌搜索结果,脸谱网上显示的好友信息,以及网站给我们提供的个性化购买建议等,都是算法作用的结果。算法正在以各种各样的方式,影响着企业创新、产业变革、经济发展。
同时,算法也正在不断深入我们的生活。在我们浏览网页时,数据分析程序会推断该如何回答我们提出的问题,为我们展示针对性极强的广告,在向我们发送营销邮件时也会根据我们上一次的反应做出相应的调整。有时,它们甚至还会完成令人目瞪口呆的预测,例如,在顾客知道自己怀孕之前就能预测出这个结果。
总之,从在线相亲、电影票房到产品定价,从网站购物到企业创新和经济发展,算法正在影响和改变这个世界上的一切事物!
世界上的一切事物都可以被简化成一个公式吗?数字可以告诉我们谁是适合我们的另一半,而且能和我们白头偕老吗?算法可以准确预测电影的票房收入,并且让电影更卖座吗?程序软件能预知谁将要实施犯罪,并且精确到案发时间吗?这些事听起来都像是科幻小说中的情节,但事实上,它们仅是日益被算法主宰的人类世界的“冰山一角”。
近年来随着大数据技术的快速发展,我们正在进入“算法经济时代”。每天,算法都会对展示在我们眼前的信息进行分类、筛选与取舍。我们看到的谷歌搜索结果,脸谱网上显示的好友信息,以及购物网站给我们提供的个性化购买建议等,都是算法作用的结果。算法正在以各种各样的方式,影响着世界的方方面面,包括企业创新、产业变革、经济发展。
在《算法时代》一书中,作者带领读者展开了一次算法和大数据世界的探索之旅:探寻我们如何开始相信大数据的力量;向我们介绍人工智能专家、大数据科学家和硅谷的创业家们,是他们创造了这个美丽的新世界。
在当下以及未来,当大数据和算法成为社会、企业和个人已经无法忽视的资产时,就会催生一些新型经济模式。毋庸置疑,算法将成为新经济的新引擎。如果你对人工智能、大数据、互联网技术和算法感兴趣,《算法时代》就非常适合你阅读。
卢克·多梅尓(Luke Dormehl),记者、纪录片电影制片人,经常为《快公司》《连线》等媒体写作科技类文章。
从警务工作到定价,再到追求幸福,本书向我们展示了算法是如何在我们意想不到的领域中,帮助我们做出种种决策的。
——尼克·米尼,英国Epagogix数据分析公司首席执行官和联合创始人
这是一本逻辑清晰、可读性很强的书。对数据技术给世界带来的改变表示欣赏或担忧的人,都应该读读这本书。
——肯·奥莱塔,《被谷歌》作者
一本关于算法及其如何影响我们日常生活的书,视角睿智,启迪思考。
——约翰·凯利,黑石探索公司董事长和首席执行官
推荐序
引 言 算法的影响力
第1章 算法程序与人类的自我认知
通过数据认识自我
量化的世界
购物也是创造
用户的喜好就是我们的商机
第三次浪潮
请不要挂机,马上为你转接
谷歌的乌比冈湖策略
量化人的职业潜能
通过推特和脸谱网窥视用户的生活
近乎专制的员工管理方式
提升员工的工作效率与幸福度
简约现实聚合器与过滤气泡
清道夫级用户和差别定价法
圆形监狱与人类的数字身份
算法赋予我们的身份类别
第2章 理性的算法与浪漫的爱情
用公式预测婚姻关系的持续时间
算法时代的婚介业务
互联网为每个人都准备了一个公式
算法时代的爱情观
你确定要删除这段感情吗?
抓住技术创造的浪漫邂逅机会
形形色色的社交发现软件
触碰手机屏幕就能知晓一切
以前所未有的方式思考性生活
跟故去的亲人互道“我爱你”
人与机器人之间的浪漫爱情
爱情的算法化和编码化
再先进的算法也无法复制真爱
第3章 算法与人类执法者的较量
用算法预测并制止犯罪行为
犯罪统计学和道德统计学
现实版《少数派报告》
谁实施犯罪行为的可能性更大
未来的我们不需要律师
计算机算法属于颠覆性创新
透明的执法者
谷歌地图与社会偏见问题
技术给人类撰写的“剧本”
令人瞠目结舌的500 张罚单
规则与标准的冲突不断升级
公正的算法与带有偏见的算法
算法犯下的种种错误
算法解决方案的透明度问题
法官、陪审团与数据挖掘技术
第4章 用科学的算法进行艺术创作
公式和规律随处可见
能预测电影票房收入的“秘密武器”
艺术家与科学家之间的鸿沟
“平行宇宙”实验与流行歌曲排行榜
依据吸引力的大小量化艺术作品的价值
从二维照片变成三维物体
隐藏在艺术作品中的“真相”
《纸牌屋》成功背后的最大功臣
如果每部电影都有4 种结局
可以一直演下去的电视剧
数字看门人巨大的隐性权力
艺术品位是否有统一的衡量标准?
计算机也有可能成为艺术家
结 语 预测未来
算法在我们的生活中变得越发重要
算法能否处理一切事务?
每周工作20 个小时
人类和计算机的角色分工
后机械时代的客观性
算法会造谣中伤他人吗?
所谓的客观性不过是一种假象
人类世界被植入了计算机逻辑
在算法时代必须养成提问的好习惯
致 谢
用户的喜好就是我们的商机
在算法时代,身份识别蕴藏无限商机。跨网站与服务器追踪用户的能力推动大量网络数据分析公司蓬勃发展,这些公司不仅孜孜不倦地收集大量个人信息,还运用专业算法分析这些数据所表示的意义。
总部设在旧金山市区(此外,它在纽约、都柏林、伦敦、底特律、亚特兰大、芝加哥和洛杉矶也有办公室)的Quantcast是该领域最大的公司之一,在受众数据研究方面全球排名前五位。自2006年成立以来,该公司已经吸纳了超过5 320万美元的风险投资。Quantcast的核心业务是创建用于描述特定用户的公式,然后就投资策略给出咨询建议。公司的联合创始人康拉德·菲尔德曼说:“人们采用‘广告对象假设’(human hypothesis of advertising)这个方法,对某个产品的理想受众的特点及定位方法进行推断。现在,我们摒弃了这种方法,转而分析广告促销活动发挥作用的真正原因。通过定量分析大量数据,去找出受众的特点。”
菲尔德曼是英国人,毕业于伦敦大学学院。在创建Quantcast之前,他还创建了另外一家公司,利用算法帮助世界上的一些大银行监测洗钱行为。他说:“每个月我们都要仔细分析这些银行完成的无数笔交易,从中找出可疑行为。”在协助调查金融诈骗案件的过程中,菲尔德曼意识到算法在海量数据的分类方面具有超强的能力,能够从中找出一些规律,为我们的后续行动提供帮助。“算法可以描绘人们感兴趣的所有事物。金融方面的数据虽然有研究价值,但这些数据仅与人们的投资对象有关。而互联网数据不同,它可以凭借单一的数据形式,表现微观与宏观两个层面上的利益与变化趋势。”说到这里,菲尔德曼有点儿激动,显然他为这项业务的前景感到欢欣鼓舞。
说到广告业,菲尔德曼指出:“广告业一直以来采用的都是对总体数据的事后测量,因为人们以为广告业应该关注受众的总体特点。”菲尔德曼刚到美国时,每看一个小时的电视节目,就要经受长达20分钟的商业广告的狂轰滥炸。广告商们采用的是机关枪模式,就像对着河水扫射,希望碰巧能打中一两条鱼。菲尔德曼解释说,电视频道当然不可能针对每一名观众的需求做出调整。但是,互联网的情况不同。Quantcast可以根据运算结果帮助网店店主针对每名新客户整饬网店首页,这种做法与亚马逊网的个性化推荐非常相似,可以根据人口统计学数据、消费心态、兴趣、生活方式等粒度把受众分成若干类别。Quantcast在宣传材料中夸下海口:“是的,在总结行为规律与解读数据方面,我们拥有不可思议的能力。在客户及商家有所动作之前,我们早已对一切了然于胸。我们不仅知道客户的兴趣所在,还清楚他们将采取什么行动,因此,我们可以对这个过程产生实质性的影响。”
Quantcast的这种方式迅速演变成线上与线下商家的惯常做法。刚刚在纳什维尔成立的Facedeals公司承诺,他们可以帮助线上店铺安装面部识别摄像头。安装了这种摄像头之后,商家就可以扫描客户的面部,连接到客户的脸谱网个人页面,然后根据客户在网上发布的“个人喜好”信息为他们提供个性化的商品与服务。2013年年底,英国超市巨头乐购宣布将实施一些类似的计划,将在英国各地的乐购超市收银台安装有内置摄像头的显示屏,利用客户运算程序统计每名顾客的年龄与性别。这些信息就是增强版积分卡,可以帮助商家锁定零售广告投放对象,还可以根据日期、购物的具体时间,以及通过购物行为监测得出的新的分析结果,随时做出调整。面部情感识别系统OptimEyes的研发者、数字媒体公司Amscreen的总裁西蒙·休格表示:“广告业到了发生阶跃式变革的时候了。商家不仅需要评估他们的广告大概吸引了多少人,还需要知道这些人的身份。”
……
算法的影响力
从根本上看,算法比一系列的步进指令略显复杂,通常由计算机执行。不过,尽管算法描述起来非常简单,它们的内部运行机制以及对我们生活的影响却绝不简单。
每天,算法都会对展示在我们眼前的信息进行分类、筛选与取舍。我们看到的谷歌搜索结果、脸谱网(Facebook)上高亮显示的好友信息,以及亚马逊网站预测我们很可能购买的产品类型等,都是算法运行得出的结果。此外,电影、音乐等娱乐方式的发展,通过预测浪漫关系的结果来选择伴侣,甚至法律的执行与警察办案等,也将越来越依赖于算法。算法在扫描我们的元数据之后,可能会评价我们有希望成为一名勤劳的员工,也可能指控我们犯有某种罪行,或者认为我们不适合驾驶汽车。通过这些过程,算法正在深刻地改变我们看待生活、看待宇宙乃至看待一切事物的方式(引自道格拉斯·亚当斯)。
在人们针对技术发表的各种评论中,我最喜欢的是:“船只的发明同时带来了海难。”人们通常认为这是文化理论家保罗·维利里奥的观点。当然,我们也可以把这句话反过来,说海难的始作俑者就是船的发明者。在海难悲剧中,算法难辞其咎,但算法同时也发挥了极其重要的作用,帮助我们在每天产生的多达2.5艾字节(是人脑信息储存量的100万倍)的数据海洋中航行,并得出切实可行的结论。
这里,我将采用剥茧抽丝的方式,从本书的主要内容谈起。首先,这本书不宜用作计算机科学的算法教程。适合用作算法教程的书有很多,其教学效果也远胜这本(而且,很多作者比我更有资格编写这样的教程)。
其次,本书讨论的也不是算法概念的历史。我曾经也想做这种尝试,但是考虑到工作量太大,而且最终的成书(毫无疑问,如果由合适的人选来完成它,必将深受欢迎)与我敬而远之的教材并没有多大区别,因此我放弃了这个想法。我并不是说介绍算法历史的书与算法教程必然没有区别,而是指对算法(一度是小众数学概念)历史感兴趣的人,可能只限于那些已经熟悉这个概念的数学家或者计算机科学家。
算法通过各种各样的方式(有的非常微妙,有的则比较明显),影响着我们生活的方方面面,包括我们喜爱的娱乐活动与我们的爱情观。因此,在本书中,我希望揭示算法的这些影响,还要告诉大家以下事情的共通之处,比如,如何成功地吸引性感迷人的约会对象,好莱坞失败之作的产生过程,将自己的排泄物装袋处理,减少律师从我们身上赚钱的机会等等。也就是说,在本书里,我要告诉大家的是算法对我们眼下生活的处理方式。
我白天的工作是为《快公司》杂志写作“数字人文”领域的文章。上班时我常常思考,“算法”文化以及认为所有问题都可以选择适当的算法予以解决的观点(未必都不正确),可能会带来哪些后果。
比尔·唐瑟尔于2009年出版的《在线为王》一书中有一个典型的例子,可以帮助大家理解本书的意图。唐瑟尔[至少有一位作者称他是“世界上最卓越的网上(行为)专家”] 在书的开头介绍了他某天驾车时收听到的访谈。接受采访的是一位英国心理学家,他说自己研发了一种数学公式,可以找出一年中最令他沮丧的是哪一个星期。经过反复研究,他发现1月的第三个星期最令他感到沮丧,因为他同时遭遇了三个问题:新年决心未能实现,放假期间信用卡债暴增,没完没了的阴沉天气。唐瑟尔称他对此有所怀疑,但这并不是因为他认为一个简单的公式不可能为沮丧这种异常复杂、涉及多种因素的问题提供正确答案,而是因为他相信自己可以设计出一个更好的公式。
也就是说,他怀疑的不是最终结果,而是这个算法的工作原理。
多年来,我经常听到类似的说法,即人们认为技术可以将所有问题化繁为简,直至最适合用公式计算的程度,然后给出问题的客观答案。受他们的启发,我萌生了创作本书的念头。也正因为如此,我用大写来表示“公式”(The Formula),而不是把它简单地看成本书所描述的所有技术的笼统表达。对于算法及其相关技术,我是从更广义的角度来理解的,认为它们可以体现某种形式的技术理性,可以反映围绕客观性建立起来的某种社会秩序的特点,因此,“公式”这个概念暗含着某种意识形态的成分。这与已故美国政治学者、传播理论家哈罗德·拉斯韦尔对“技艺”(technique)一词的使用颇有相似之处。拉斯韦尔认为,所谓技艺,就是“通过可以利用的资源实现价值的整套方法”,而本书中的“公式”既表示一种应用及其应用范围,还表示潜藏在表面之下、有待我们利用合适的数据挖掘工具去梳理发掘的客观事实。
技术作家(除了几位著名作家以外)的世界观往往包含了强烈的乌托邦思想,认为所有的技术进步都是积极的。于是,在新的发明问世之后,这些技术作家往往会欢呼雀跃,认为这项发明标志着一个新“时代”的开始。因此,人们以一种蔑视的口吻,称之为“网络(技术)万能论”。尽管本书也可以随大溜,为书架上长篇累牍的关于算法与大数据的著作锦上添花,增添一些新内容,但我真正感兴趣的不是讨论互联网或者个人电脑时代的诞生过程,而是希望做进一步研究。
20世纪60年代前半叶,法国社会学家(同时也是基督教无政府主义者)雅克·埃吕尔在他的著作中描述了所谓的“技术人”,认为他们“对统一标准付诸实施之后所带来的即时结果感到心驰神往……孜孜不倦地寻找‘最佳方式’以实现任何指定目标”。他们希望实现的目标有时会变得含糊不清,但这不是因为他们对伦理道德的关注难以测量,而是因为他们对目标实现方法的热情过度,以为人类心灵手巧,针对任何问题都可以凭空想象出“效果惊人”的解决办法。
埃吕尔的研究表明,持有这种观点的人早已有之,谷歌创始人及本书讨论的那些高科技公司的领导者也不是“求序意志”(will-to-order)的先驱。这个概念是由已故美国社会学家刘易斯·芒福德提出的,它的意思是,人们希望借助公式了解身边世界。20世纪30年代,早在现代计算机问世之前芒福德就在著作中指出,自动化的另一个目的是“放大人体的机械或者感官能力,将人类生命的各个阶段简化为可以测量的秩序与规律”。他认为,我们对人类生命进行简化处理以便了解其全貌;为了让人类智力等抽象概念便于量化分析,我们又对这些概念做进一步提炼,去除各种复杂因素,再赋予看似任意的某个数值,最后得到某个人的智商值。
但是,这些著作还没有触及上述观点在现代社会中的影响范围。目前,算法与“公式”的影响无处不在,几乎涉及工作与休闲领域的方方面面。因此,本书试图探讨这种局面的形成原因,研究算法在人类创造力、人际关系(更具体地说,是人们的浪漫爱情)、身份概念与法律问题等方面的影响力。
在这些方面,算法都可以为我们提供答案。
但问题在于,算法提供的答案真的是我们想要的吗?算法的影响力
从根本上看,算法比一系列的步进指令略显复杂,通常由计算机执行。不过,尽管算法描述起来非常简单,它们的内部运行机制以及对我们生活的影响却绝不简单。
每天,算法都会对展示在我们眼前的信息进行分类、筛选与取舍。我们看到的谷歌搜索结果、脸谱网(Facebook)上高亮显示的好友信息,以及亚马逊网站预测我们很可能购买的产品类型等,都是算法运行得出的结果。此外,电影、音乐等娱乐方式的发展,通过预测浪漫关系的结果来选择伴侣,甚至法律的执行与警察办案等,也将越来越依赖于算法。算法在扫描我们的元数据之后,可能会评价我们有希望成为一名勤劳的员工,也可能指控我们犯有某种罪行,或者认为我们不适合驾驶汽车。通过这些过程,算法正在深刻地改变我们看待生活、看待宇宙乃至看待一切事物的方式(引自道格拉斯·亚当斯)。
在人们针对技术发表的各种评论中,我最喜欢的是:“船只的发明同时带来了海难。”人们通常认为这是文化理论家保罗·维利里奥的观点。当然,我们也可以把这句话反过来,说海难的始作俑者就是船的发明者。在海难悲剧中,算法难辞其咎,但算法同时也发挥了极其重要的作用,帮助我们在每天产生的多达2.5艾字节(是人脑信息储存量的100万倍)的数据海洋中航行,并得出切实可行的结论。
这里,我将采用剥茧抽丝的方式,从本书的主要内容谈起。首先,这本书不宜用作计算机科学的算法教程。适合用作算法教程的书有很多,其教学效果也远胜这本(而且,很多作者比我更有资格编写这样的教程)。
其次,本书讨论的也不是算法概念的历史。我曾经也想做这种尝试,但是考虑到工作量太大,而且最终的成书(毫无疑问,如果由合适的人选来完成它,必将深受欢迎)与我敬而远之的教材并没有多大区别,因此我放弃了这个想法。我并不是说介绍算法历史的书与算法教程必然没有区别,而是指对算法(一度是小众数学概念)历史感兴趣的人,可能只限于那些已经熟悉这个概念的数学家或者计算机科学家。
算法通过各种各样的方式(有的非常微妙,有的则比较明显),影响着我们生活的方方面面,包括我们喜爱的娱乐活动与我们的爱情观。因此,在本书中,我希望揭示算法的这些影响,还要告诉大家以下事情的共通之处,比如,如何成功地吸引性感迷人的约会对象,好莱坞失败之作的产生过程,将自己的排泄物装袋处理,减少律师从我们身上赚钱的机会等等。也就是说,在本书里,我要告诉大家的是算法对我们眼下生活的处理方式。
我白天的工作是为《快公司》杂志写作“数字人文”领域的文章。上班时我常常思考,“算法”文化以及认为所有问题都可以选择适当的算法予以解决的观点(未必都不正确),可能会带来哪些后果。
比尔·唐瑟尔于2009年出版的《在线为王》一书中有一个典型的例子,可以帮助大家理解本书的意图。唐瑟尔[至少有一位作者称他是“世界上最卓越的网上(行为)专家”] 在书的开头介绍了他某天驾车时收听到的访谈。接受采访的是一位英国心理学家,他说自己研发了一种数学公式,可以找出一年中最令他沮丧的是哪一个星期。经过反复研究,他发现1月的第三个星期最令他感到沮丧,因为他同时遭遇了三个问题:新年决心未能实现,放假期间信用卡债暴增,没完没了的阴沉天气。唐瑟尔称他对此有所怀疑,但这并不是因为他认为一个简单的公式不可能为沮丧这种异常复杂、涉及多种因素的问题提供正确答案,而是因为他相信自己可以设计出一个更好的公式。
也就是说,他怀疑的不是最终结果,而是这个算法的工作原理。
多年来,我经常听到类似的说法,即人们认为技术可以将所有问题化繁为简,直至最适合用公式计算的程度,然后给出问题的客观答案。受他们的启发,我萌生了创作本书的念头。也正因为如此,我用大写来表示“ 算法时代 [The Formula] 电子书 下载 mobi epub pdf txt
挺好
评分好评
评分经典图书,正版,翻译的很好。质量很不错。
评分推荐朋友继续买 正品好货
评分挺好
评分实在买了太多太多的书了,还有好多好多书都没拆…从外面来看,还不错吧…活动买的,挺实惠的…
评分推荐朋友继续买 正品好货
评分物流很快,态度很好,书包装完好,装订不错,内容以后再说
评分不错不错不错不错不错不错不错不错不错
算法时代 [The Formula] pdf epub mobi txt 电子书 下载