我们每年向几百名学生教授数据科学,他们都对人工智能很着迷,并会提出很好的问题。汽车如何学习自动驾驶?亚历克莎(Alexa)如何理解我在说什么?声田(Spotify)是怎样为我选择如此精彩的播放列表的呢?脸书如何在我上传的照片中识别我的朋友?这些学生意识到,人工智能不是来自未来的某种科幻机器人。
它存在于此时此刻。它在通过每一部智能手机改变世界。学生们都想理解人工智能,而且都想参与其中。
我们的学生不是唯一对人工智能产生热情的人。和他们一样欣喜的还有世界上最大的公司 — 从美国的亚马逊、脸书、谷歌到中国的百度、腾讯、阿里巴巴。你可能听说过,这些大型科技公司正在发动一场针对人工智能人才的昂贵的全球军备竞赛,他们认为这对他们的未来非常重要。我们看到,多年来,他们一直在用 30 万美元以上的年薪和远远优于我们学术界的咖啡来吸引刚毕业的博士。
现在,我们看到更多公司参与到人工智能领域的人才争夺之中 —比如坐拥海量数据的保险和石油公司,他们同样可以提供可观的薪水和独具特色的咖啡机。
这种军备竞赛当然是真实的,但我们认为人工智能领域目前还有另一个更加强烈的趋势 — 这个趋势不是集中,而是扩散和传播。是的,每家大型科技公司都在努力囤积数学和编程人才,但与此同时,人工智能背后的基本技术和思想正在以极快的速度扩散,被小公司、其他行业以及世界各地的爱好者、程序员、科学家和研究人员所掌握。这种民主化趋势是最让我们今天的学生感到激动的事情,因为他们正在考虑各种急切需要人工智能解决方案的问题。
比如,谁会想到一群大学生会对黄瓜数学如此着迷?当他们听说日本汽车工程师小池诚(Makoto Koike,音译)的故事时,他们的确很着迷。小池诚的父母有一座黄瓜农场。在日本,黄瓜具有各种令人眼花缭乱的大小、形状、颜色和毛刺度 — 人们必须根据这些外观特征将黄瓜分属九种类别,这些类别具有不同的市场价格。
过去,小池的母亲每天要花八个小时手工分拣黄瓜。后来,小池意识到,他可以用谷歌的开源人工智能软件 TensorFlow 完成这项任务。他可以编写一种“深度学习”算法程序,根据照片为黄瓜分类。
小池之前从未使用过人工智能和 TensorFlow,但他很容易就根据现有的所有免费资源完成了自学。当他的人工智能分拣机器视频在YouTube 上出现时,小池成了深度学习和黄瓜这两个领域的国际名人。他不仅为人们提供了一个有趣的故事,为他的母亲免除了无数个小时的辛劳,他还向全世界的学生和程序员传达了一个令人鼓舞的消息:既然人工智能可以解决黄瓜农场的问题,那么它应该可以解决几乎所有领域的问题。
这条消息目前正在迅速传播。医生正在用人工智能诊断和治疗癌症。电力公司用人工智能提高发电效率。投资者用人工智能管理财务风险。石油公司用人工智能提高深海钻井平台的安全性。执法机构用人工智能追捕恐怖分子。科学家用人工智能获取天文、物理和神经科学的新发现。世界各地的公司、研究人员和爱好者正在以数千种不同的方式使用人工智能,比如探测天然气泄漏,开采铁矿石,预测疾病暴发,避免蜜蜂灭绝,量化好莱坞电影中的性别歧视。
这仅仅是开始。
我们认为,人工智能的真实故事恰恰体现了这种扩散:从过去几十年甚至几百年间的几个核心数学概念,到今天的超级计算机和讲话、思考、分拣黄瓜的机器,到明天无处不在的新的数字奇迹。
我们这本书的目的就是向你讲述这个故事。它在一定程度上是科技故事,但它主要讲述的是思想以及思想背后的人 — 这些人所处的时代比现在早得多,他们只是在低调地解决他们面对的数学和数据问题,他们并不知道他们的解决方案将对现代社会起到怎样的作用。读完这个故事,你会理解人工智能的含义、来源、原理及其在生活中的重要意义。
人工智能到底是什么意思?
当你听到“人工智能”时,不要想到机器人。你应该把它看成一种算法。
算法是一组带有步骤的指令。这些指令非常清晰,就连计算机这样头脑简单的事物也能遵循。(你可能听说过下面的笑话。一个机器人卡在浴室里出不来了,因为洗发水瓶身上的算法是:“涂抹。冲洗。重复。”)算法本身并不比电钻更加聪明,它只能把一件事情做得很好,比如为数组排序,或者在网上搜索可爱的动物照片。不过,如果你将许多算法巧妙地组合在一起,你就可以生成人工智能,使人觉得它在某个领域可以做出智能行为。例如,你可能会向谷歌Home 这样的数字助理提出“奥斯汀最好的早餐玉米卷饼在哪儿”等问题。这种询问会引发算法的连锁反应:
一个算法将原始声波转化成数字信号。
另一个算法将这个信号转化成一串英语音素,即独特的
听觉感知:“brek-fust-tah-koze”。
下一个算法将这些音素划分成词语:“breakfast tacos”。
这些词语被发送到搜索引擎 — 搜索引擎本身就是海量算法的集合,可以处理查询,做出回答。
另一个算法将这种回答转化成清晰的英语句子。
最后一个算法以听上去不像机器人的方式表述这个句子:
“奥斯汀最好的早餐玉米卷饼在杜瓦尔街的胡里奥餐厅。您需要导航吗?”
这就是人工智能。几乎每个人工智能系统都会遵循这种“算法管道”模式,不管是自动驾驶汽车、自动黄瓜分拣机还是监测信用卡账户盗刷的软件。这种管道会接收来自某个具体领域的数据,执行一系列计算,然后输出预测或决定。
人工智能使用的算法有两个明显特征。首先,这些算法处理的通常不是确定性,而是概率。例如,人工智能中的算法不会直接指出某笔信用卡交易存在欺诈。相反,它会指出欺诈概率是 92%,或者它根据数据得到的任何概率。第二个特征涉及这些算法是如何知道应该遵循哪些指令的。在传统算法中,比如运行网站或处理文字的算法,这些指令是程序员提前固定下来的。不过,在人工智能中,这些指令是算法直接从“训练数据”中学到的。没有人告诉人工智能算法如何判断信用卡交易是否存在欺诈。相反,算法会看到每个类别(欺诈,无欺诈)中的许多案例,它会找到区分二者的模式。
对于人工智能来说,程序员的作用不是告诉算法应该做什么,而是告诉算法如何根据数据和概率规则获知自己应该做什么。
我们是如何走到今天的?
自动驾驶汽车和家庭数字助理等现代人工智能系统属于新鲜事物。不过,你可能会吃惊地发现,人工智能的重要思想其实很古老 — 许多思想已经存在了数百年 — 我们的祖先一直在用它们解决问题。以自动驾驶汽车为例,谷歌第一款自动驾驶汽车于 2009年首次亮相。不过,你将在第三章发现,这些汽车背后的主要思想之一是某个长老会牧师在 18 世纪 50 年代发现的 — 50 多年前,某个数学家团队还用这种思想解决了冷战时期最大的轰动性谜团之一。
另一个例子是图像分类,比如自动在脸书照片中为你的朋友做标记的软件。图像处理算法在过去五年取得了很大进步,但你将在第二章看到,这里的关键思想来自 1805 年 — 而且,一位不知名的天文学家亨丽埃塔·莱维特(Henrietta Leavitt)在一个世纪前利用这些思想帮助人类解答了历史上最深刻的科学问题之一:宇宙有多大?
再以语音识别为例,这是人工智能近年来的伟大胜利之一。亚历克莎和谷歌 Home 等数字助理在语言方面非常流利,而且它们只会变得越来越好。不过,第一个让计算机理解英语的人是一位美国海军少将,而且这件事发生在将近 70 年前。(见第四章。)
这里只举了三个例子,但它们说明了一个惊人的事实:不管你考察人工智能的哪些方面,你都会找到一个被人们长期研究过的思想。所以,从各方面来看,最大的历史谜团不是人工智能为什么会在今天出现,而是它为什么没有在很久以前出现。要想解释这个谜团,我们必须考虑将这些宝贵思想带入新时代的三个强大的技术力量。
第一个使人工智能成为可能的力量是计算机长达几十年的指数增长速度,通常被称为摩尔定律。你很难直观地理解计算机目前的速度有多快。过去的常见说法是,阿波罗宇航员登陆月球时使用的计算能力还比不上一只袖珍计算器。不过,这种说法已经无法使人产生共鸣了,因为……袖珍计算器是什么东西?所以,让我们用汽车来类比。1951 年,尤尼瓦克是速度最快的计算机之一,每秒可以进行 2000 次计算,而速度最快的汽车之一阿尔法罗密欧 6C 的时速可达 180 公里。之后,汽车和计算机都在提速。不过,如果汽车能像计算机那样提速,那么现代阿尔法罗密欧的速度将达到光速的800 万倍。
人工智能的第二个助推器是新的摩尔定律:随着人类所有信息的数字化,可用数据量出现了爆炸式增长。美国国会图书馆拥有10 太字节的存储量,但是谷歌、苹果、脸书、亚马逊四大科技公司 2013 年一年收集的数据就是这个数字的大约 12 万倍。而且,从互联网视角来看,这已经是上一代的事情了。数据积累的加速节奏比阿波罗火箭还要快。2017 年,YouTube 每分钟上传的视频超过300 小时,Instagram 每天贴出的照片超过 1 亿张。更多的数据意味着更聪明的算法。
第三个支撑人工智能的因素是云计算。消费者几乎看不到这种趋势,但它对人工智能产生了巨大的民主化影响。为说明这一点,我们要对数据和石油进行类比。假设 20 世纪早期的所有公司都拥有一些石油,但是它们需要独自建设基础设施,以便开采、运输和提炼石油。如果一家公司有了利用石油的新思想,它需要面对巨大的固定起步成本。因此,大多数石油都不会得到使用。同样的逻辑也适用于数据,即 21 世纪的石油。如果用自己的数据打造人工智能系统需要购买所有的装备和专业人才,大多数爱好者和小公司都会面对难以负担的成本。不过,微软 Azure、IBM 和亚马逊 WebServices 等平台提供的云计算资源将这种固定成本转化成了可变成本,极大地改变了大规模数据存储和分析的支出比重。今天,任何想要使用个人“石油”的人都可以租用其他人的基础设施,以降低成本。
当你将这四种趋势 — 更快的芯片、大量数据、云计算以及最重要的优秀思想 — 放在一起时,用人工智能解决实际问题的需求和能力就会出现爆炸式增长。