西部世界剧照 人工智能(Artificial Intelligence,AI),大数据(Big Data)和云计算(Cloud Computing)是当前最受关注的技术,业内常常取三个技术的英文单词的首字母合称为ABC。最近10年,资本和媒体对这三种技术的热度按时间排序,依次为:云计算、大数据和人工智能。事实上,若按照技术产生的时间排序,结果正好相反过来,人工智能出现最早, 大数据其次,而云计算则出现得最晚。 我们在2016年编写和出版《Cloud Foundry:从数字化战略到实现》时,预测了P层云在降低数字化门槛后,数字世界将呈现爆发式的发展。当前,ABC的发展以及各行各业对ABC的拥抱印证了我们的预测,ABC中的应用类的人工智能在中国又一次火爆。 无独有偶,美国电视剧《西部世界》的第二季第一集播出并引起热议。一时间,人和人工智能这个老话题又重新被辩论。为此,我们有必要对这个话题进行深入探讨,希望为读者打开一个认识这个世界的新窗口。另外,作为一个顶级研究机构,这些考量也是必须的,因为我们要确保自己的研究工作是为了创造一个更好的未来,而非相反。 在讨论人和人工智能的关系及其之间的差别之前,我们先看看人类知识的构成。作者并不是哲学专业背景,这里介绍的概念不一定和哲学概念能一一入座,所以哲学专业背景的读者可以建立一个对照转换。 作者认为,人的知识由经验和逻辑两个层面构成。第一类知识是逻辑知识,可以通过分析得出新知识的。下面是典型的逻辑知识: 所有人都会死,苏格拉底是人,所以苏格拉底会死。 根据勾股定理,直角三角形的三边关系如下图(其中x和y是两条直角边,z是斜边)。如果三角形的两条直角边长度分别是3和4,那么根据勾股定理,可以得到z的长度是5。 勾股定理 另一类知识就是经验知识。经验通常是我们没有经过逻辑推理或者无法通过逻辑推理而根据过去的经验建立起来的知识。下面是两个过去的经验知识: “地球是宇宙的中心”在哥白尼之前一直是人类社会的基本经验知识。 “地球是平的”在哥伦布之前一直是大部分人的经验知识。 太阳从东边升起,到今天为止还是大部分人的经验知识。 要观察人的知识体系的建立过程,可以观察小孩子的学习过程。如果把一个算盘竖起来给小孩子玩,小孩子可能会把珠子往上拨,然后珠子会掉下去。但是孩子会重复,因为他们不知道珠子总是会往下掉。为什么大人不再重复这个动作?因为学过物理的大人从逻辑上会知道珠子会因为重力往下掉,没有学过物理的人根据过去的经验也会知道,这样做珠子会往下掉,所以他们知道这么做是徒劳无功的。苹果为何总是从树上掉下来?在牛顿发明万有引力定律之前,对于所有人来说也都是经验知识。在牛顿定律发明以后,对于知晓力学的人则是个逻辑知识,对于不知晓力学的人依然还是个经验知识。 学过物理的读者先忍住不要笑话那些没有学过物理的人,因为经验和逻辑的关系不是绝对的,而是相对的。逻辑知识到一定层次不能推理的时候,人又会依赖经验(或者有时候是直觉或是情感)。或者有时候人懒得推理,也会停留在经验知识层面上。读者也不要笑“懒得推理”这回事情,因为人类沉淀下来的经验知识实在太多,如果要试图逻辑化所有的经验知识,人的寿命实在是有限。这就是极端聪明的人在无法逻辑化他们想逻辑化的知识的时候,他们的幽默感会诉诸一些最最基本的经验(以表示无奈)。后面介绍机器(计算机或者人工智能)的时候,我们会看到很多不可计算数,这是有限的人脑和机器对于无极限的知识体系的一种无奈。 为了解释逻辑和经验的相对性,我们再来回顾一下万有引力定律知识是怎么建立起来的。万有引力定律和牛顿三定律主要是用来解释开普勒观察到的天体运动规律(图一所示是用古典力学解释的开普勒观察到的太阳系各大行星的天体运动)。 万有引力定律和牛顿三定律本身是一系列假设上的一个数学模型,有效拟合了开普勒观察到的天体运动。这个处理方法和机器学习的神经网络模型一样,把标签过的数据集合输入到模型,调整模型的参数以拟合这些数据集。牛顿三定律和万有引力定律的参数经过拟合以后,物体间的作用力变量(F)和距离变量(r)系数关系是 -2 次方 (也就是平方成反比)。这个事情我们所有学习过物理的人都没有加以太多思考,不是吗? 但是哲学家们可是需要经过逻辑化才能认可这个结果。所以他们会问,为何系数是 -2 次方,而不是 -1.9999999…9 次方(中间间隔足够多的9)或者 -2.00000…01 次方(中间间隔足够多的0)?这样的系数一样能够拟合我们所有可以观察到的数据。当然牛顿选择 -2 次方而不是那两个长数字主要是因为处理问题方便,或者他相信简单的总是好的(作者没有机会用混有吴语口音的美式英语和牛顿的皇家口音英语隔着时空对话,但“简单是好”是大部分做模型的人的一个情感选择而不是逻辑选择。)当然牛顿没有心情和这些门口的哲学家一番口舌,他的回答有点类似于:“你们拿去用,一定屡试不爽,有问题再回来找我。”事实上哲学家们对于牛顿万有引力定律在内的古典力学体系的质疑是有一定道理的,因为后来古典力学在描述微观世界的时候不再成立(这时就需要量子力学了)。 图一:牛顿力学描述的太阳系天体运动(来自维基百科) 如果把古典力学运用到原子核和它的电子,我们无法解释为何电子不掉进原子核。这就意味着古典力学的模型无法对于某些数据进行拟合。经过一段时间的焦虑和挣扎,物理学家们建立了量子力学。和古典物理不同,量子力学的模型有很大一部分建立在概率上面。例如,在量子力学中人们无法预测电子在原子核外的固定位置,只能预测它出现在某个位置的概率。图二描述了氢原子的电子的波动方程。轨道的颜色深浅了代表了电子出现的概率。 图二:量子力学描述的氢原子波动(来自维基百科) 综合前面的讨论,万有引力无非是根据人类在更高层次和更广范围的观察得到的经验总结。苹果下落对于没有学过物理的人而言是经验知识,而对于学习过物理的人而言,他们的知识虽然在逻辑上往上走了一层,但是最终还是要依赖于一个经验数学模型(这个模型的参数不是通过逻辑推理出来的,而是根据过去数据匹配的出来的一个经验值。现在人工智能领域的模型正是这种情况。) 所以作者虽然具有理科和经济学科的交叉背景,但一直建议理科生不要小瞧文科生,因为最终我们的认知达到一定边界的时候所做的模型和假设不得不诉诸于情感(或者直觉),就好像牛顿为了简洁选择 -2 次方作为模型里面距离的系数,欧几里得的平行公理诉诸于世界是方方正正的情感(后面会详细讨论)。当然文艺青年也不要总是陷入在情感中,因为大部分的感性认知远没有到人类认知的边界,它们很容易逻辑化而上升到另外一个高度的感性认知。 这可能也是为何像北大这样的学校要求理科生必须选修一定数量的文科课程才能毕业,文科生也必须要选修一定数量的理科课程才能毕业。当然文科理科都需要学习游泳课程,万一掉水里,有限的大脑估计来不及把水中的经验逻辑化或者情感化。还有就是太极拳和五禽戏需要二选一,前者是一套阴阳平衡逻辑,后者是一套朴素的希望像猛禽一样强健的情感表达。 这里作者想说的是,读者可以审视一下自己的知识系统,逻辑和内化它们是非常耗神的,所以大部分知识还是处于非常朴素的经验层面。 虽然文理科学生对于逻辑和经验的训练可能不太一样,但是AI和人比起来如何呢?AI因为其机器强大的计算能力,在机器学习方面看上去要胜人一筹。例如,针对贷款申请的风险分数判断,AI能够把所有人的所有贷款历史读一遍来调教风险控制模型的参数,从而利用这些经验参数来判断当前一笔申请的风险。而任何一个有丰富经验的贷款专员也只能根据自己过去看到过的坏账的贷款的模糊图景来判断当前交易的风险。 如果说人算不过AI,那么人在逻辑推理方面是否比AI高人一等呢?我们需要放在一个更为广阔的数学和计算机的知识体系框架下讨论这个问题。 |