源 / 新智元 文 / Michael I. Jordan
【导读】机器学习专家、著名的计算机科学和统计学家 Michael I. Jordan 近日在《哈佛数据科学评论》上发表文章,评论当前的人工智能炒作,认为现在被称为 AI 的许多领域,实际上是机器学习,而真正的 AI 革命尚未到来。
人工智能(AI)已经成为当今时代的口号。
技术专家、学者、记者、风险投资家都在说这个词。跟其他许多从技术或学术领域流入普通大众的词语一样,“AI”这个词的使用也存在严重的误解。
然而,跟其他领域中公众不理解科学家在做的事情不一样,对于“AI”,科学家们经常和公众一样困惑。
某种程度上,我们这个时代正在看到一种与我们人类的智能相匹敌的硅基智能的出现,这既让所有人感到兴奋,让我们着迷,同时也让我们感到恐惧。不幸的是,它分散了我们的注意力。
Michael I. Jordan
我们急需发展构建推理和决策系统的原则
我们可以从另一个角度来讲述这个时代。有这样一个故事,其中涉及人类、计算机、数据和生死抉择,但重点不仅仅是硅基智能这类的幻想。
14年前,我的妻子怀孕时,我们做了超声波检查。医生是一位遗传学家,她指出胎儿心脏周围有一些白点。“这些都是唐氏综合症的标志,”她说,“现在你的风险已经上升到20分之一了。”她告诉我们,可以通过羊膜穿刺术了解胎儿是否真的有唐氏综合症基因畸变,但羊膜穿刺术存在风险——在穿刺术过程中胎儿死亡的几率大约是300分之一。
作为一名统计学家,我决定找出这些数字的来源。在我的研究中,我发现十年前英国有人做过一项统计分析,这些反映钙沉积的白点确实被认为是唐氏综合症的预测因子。我还注意到,我们做检查时使用的成像机每平方英寸的像素比英国研究中使用的成像机多几百个像素。我回去告诉遗传学家,我相信那些白点很可能是假阳性,也就是字面上的白噪音。
她说:“啊,这就解释了为什么我们几年前开始发现唐氏综合症的诊断有上升趋势。那恰好是新机器运来的时候。”
我们没有做羊膜穿刺术,几个月后妻子生下一个健康的女孩。但这件事一直让我放不下,尤其是我知道由于一次粗略的计算,那天可能有成千上万的人得到同样诊断,然后许多人选择做羊膜穿刺术,造成许多婴儿不必要的死亡。
这件事揭示的问题不是我个人的医疗问题;它关乎一个医疗系统,在不同的地点和时间测量变量和结果,进行统计分析,并在其他情况下使用结果。
这个问题不仅与数据分析本身有关,而且与数据库研究人员所称的“溯源”(provenance)有关——数据来自哪里,从数据中得出了什么推论,这些推论与当前的情况有多大关系?虽然专业人士可能在遇到个案时能逐步解决这些问题,但问题是设计一个行星级规模的医疗系统,该系统要能在不需要如此详细的人类监督的情况下做到这一点。
我也是一名计算机科学家,我突然想到,在我所受的教育中,根本找不到构建这种行星级规模的推理和决策系统所需要的原则,这些原则融合了计算机科学和统计学,并考虑到人类的效用。在我看来,发展这些原则至少与构建玩游戏之类眼花缭乱的AI系统同样重要,这些原则不仅在医学领域,而且在商业、交通和教育等领域都需要。
无论我们是否很快就能理解“智能”,我们都面临着一项重大挑战,那就是如何将计算机和人类结合起来,从而增强人类的生活。
尽管一些人认为这一挑战只是AI创造的一种辅助,但另一种观点认为,这是一个新的工程学分支。就像过去几十年的土木工程和化学工程一样,这门新学科的目标是围绕一些关键思想,为人们带来新的资源和能力,并确保安全。土木工程和化学工程建立在物理和化学的基础上,而这门新的工程学科将建立在上个世纪赋予了实质的思想之上,如信息、算法、数据、不确定性、计算、推理和优化。此外,由于新学科的大部分重点将放在来自人类和关于人类的数据上,因此,它的发展将需要社会科学和人文学科的观点。
虽然各种构建块已经就位,但是将它们组合在一起的原则还没有到位,因此目前将这些块组合在一起的方式是临时的。因此,就像人类在土木工程出现之前建造建筑物和桥梁一样,人类也在继续建造涉及机器、人类和环境的社会规模的推理和决策系统。正如早期的建筑和桥梁有时会以无法预见的方式倒塌,并带来悲剧性的后果一样,我们早期的许多社会规模的推理和决策系统已经暴露出严重的概念缺陷。
不幸的是,我们并不擅长预测下一个可能出现的严重缺陷是什么。我们缺少的是一个分析和设计原则的工程学科。
目前关于这些问题的公开讨论中,经常使用“AI”这个术语作为一个智能的通用词,这使得人们很难推断出新兴技术的范围和后果。因此,我们有必要深入了解AI在最近和曾经被用来指代什么。
如今大多数被称为AI的东西,尤其是在公共领域,实际上是机器学习(ML),这个术语在过去几十年里一直在使用。ML是一个算法领域,融合了统计学、计算机科学和许多其他学科的思想(见下文),设计处理数据、做出预测和帮助做出决策的算法。
就对现实世界的影响而言,ML是真实存在的,而不仅是最近才火起来的。事实上,在20世纪90年代初期,ML就已展现出将为产业界带来巨大改变的苗头。到了世纪之交,亚马逊等具有前瞻性的公司就已经在他们的业务中使用机器学习、解决关键任务、后端欺诈检测和供应链预测中存在的问题,以及建立面向消费者的创新服务,如推荐系统。
在随后的20年里,随着数据集和计算资源的迅速增长,很明显,ML很快将不仅为亚马逊提供动力,而且将为任何一家可以将决策与大规模数据关联在一起的公司提供动力。新的商业模式将会出现。
“数据科学”一词用来指代这种现象,反映了ML算法专家与数据库和分布式系统专家合作构建可扩展、强大的ML系统的需要,也反映了这样的系统将产生更大范围的社会影响。过去几年,这种思想和技术趋势的融合被重新命名为“人工智能”。这种品牌重塑的做法值得仔细审查。
从历史上看,“人工智能”一词是在20世纪50年代末创造的,指的是在软件和硬件上实现具有人类智能水平的实体这样一个令人兴奋的愿望。我将用“模仿人类的AI”(human-imitative AI)来指代这一愿望,强调人工智能实体似乎应该成为我们人类的一员,即使不是在身体上成为,那么至少在精神上要这样(无论这可能意味着什么)。
这在很大程度上是一项学术事业。虽然相关的学术领域,如运筹学、统计学、模式识别、信息论和控制理论已经存在,并且经常从人类或动物的行为中获得灵感,但这些领域可以说是专注于低水平的信号和决策。
比如,松鼠能够感知它所居住的森林的三维结构,并能在树枝间跳跃,这种能力对这些领域具有启发意义。AI旨在关注一些不同的东西:人类进行推理和思考的高级或认知能力。然而,60年后,高层次的推理和思想仍然难以捉摸。现在被称为AI的发展主要出现在与低水平模式识别和运动控制相关的工程领域,以及统计学领域,该学科的重点是在数据中发现模式,并做出有充分根据的预测、测试假设,以及决策。
事实上,现在被认为是所谓“AI革命”核心的著名的反向传播算法,是David Rumelhart在20世纪80年代初重新发现的,而它早在20世纪60年代和60年代的控制理论领域就已出现。其早期应用之一是优化阿波罗飞船飞向月球时的推力。
自上世纪60年代以来,AI已经取得了很大的进步,但可以说,这种进步并非源于对模仿人类的AI的追求。相反,就像阿波罗飞船的例子一样,这些想法往往隐藏在幕后,研究人员的工作专注于特定的工程挑战。虽然普通大众看不到,但在文档检索、文本分类、欺诈检测、推荐系统、个性化搜索、社会网络分析、规划、诊断和A / B测试等领域的研究和系统构建取得了重大进展,这些进步推动了谷歌、Netflix、 Facebook和亚马逊等公司的成功。
人们可以简单地把这一切称为AI,事实上,这似乎已经发生。对于那些发现自己突然被称为AI研究人员的优化或统计学研究人员来说,这样的标签可能会让他们感到意外。但撇开标签不谈,更大的问题是,使用这个单一的、定义不清的首字母缩略词,阻碍了他们对正在发挥作用的智能和商业问题范围的清晰理解。
在过去的20年里,工业和学术领域都取得了重大进展——作为模仿人类的AI的补充,通常被称为“智能增强”(Intelligence Augmentation, IA)。在这里,计算和数据被用来创建增强人类智力和创造力的服务。搜索引擎可以被视为IA的一个例子,因为它可以增强人类的记忆和事实知识;自然语言翻译也是IA的一个例子,它可以增强人类的沟通能力。基于计算机的声音和图像生成为艺术家提供了增强调色和创造的能力。虽然这类服务将来可能包含高层次的推理和思考,但目前还没有;它们主要执行各种字符串匹配和数值操作,以捕获人类可以使用的模式。
让我们广泛构思一个“智能基础设施”的学科,构建基于计算,数据和物理实体的网络,使人类环境更加有趣和安全。目前这种基础设施已经开始在运输,医药,商业和金融等领域出现,对个人和社会的影响正越来越深。
可以想象,我们生活在一个覆盖全社会的医疗系统中,这个系统能够建立人与医生、医疗设备之间的数据流和分析,帮助医生做出更准确地诊断,并提供护理服务。系统可以整合来自体细胞、DNA、血液测试,环境,群体遗传学以及关于药物和治疗的大量科学文献的信息。它不仅关注单个患者和医生,而且关注所有人类之间的关系,有助于维持关于医疗信息的相关性、来源和可靠性的概念,就像今天的银行系统关注金融和支付领域的挑战一样。尽管人们可以预见这样的系统中会出现许多问题,比如隐私问题、责任问题,安全问题等等。但我们应该将这些问题视作勇于面对的挑战,而不是前进的阻碍。
现在我们面临一个关键问题:目前在传统的、基于人类模仿的AI真的是解决这些挑战的最佳方式(甚至是唯一方式)吗?
事实上,机器学习近年来取得成功的一些成功案例都是在模仿人类的AI领域,如计算机视觉、语音识别、游戏和机器人技术。也许我们应该继续等待,等待这些领域的更多技术进步。这里有两件事情需要注意。
首先,目前模仿人类的AI取得的成功还很有限,我们的最终愿望还远未实现。同时,在这个领域已经取得的有限进展,产生了巨大的快感,也滋生了不少恐惧,导致AI的过度繁荣和媒体的过度关注,这一点在其他工程领域是不存在的。
更重要的是第二点,在这些领域取得的成功并不足以解决重要的IA和II问题。比如自动驾驶汽车。要实现自动驾驶,需要解决一系列工程上的问题,这些问题可能与人的能力(或人力资源缺乏)关系不大。整体交通运输系统(II系统)可能更接近当前的空中交通管制系统,而不是目前普遍关注的人类驾驶员。这种系统比现有的空中交通管制系统复杂得多,特别是可以使用大量数据和自适应统计建模,为精细化决策提供信息。应对这些挑战需要关注最前沿,仅仅关注模仿人类的AI是不够的。
至于必要性,有人说模仿人类的AI愿景涵盖了IA和II的目标,因为它不仅能够解决AI的经典问题(比如图灵测试),同时也是解决IA和II问题的最佳选择。不过这种说法几乎在历史上找不到先例。以前听说过要用AI木匠或AI瓦工来搞土木工程吗?化学工程是否应该建一个AI化学家的框架?更有争议的是:如果我们的目标是建立化工厂,是否应该首先打造一群AI化学家,然后让TA们去研究怎么建?
有一种说法是,人类智能是我们所了解的唯一一种智能,因此我们应该将模仿人类智能作为第一步。但是,人类实际上并不擅长某种推理,人类有自己的失误、偏见和局限。而且,至关重要的是,人类并没能进化足以执行现代II系统必须面对的大规模决策,也没有应对II环境中出现的各种不确定性的能力。
有人可能会说,人工智能系统不仅会模仿人类智能,还会纠正人工智能,而且这种能力可以扩展到任意规模的问题。当然,现在说的处于科幻小说的范畴,这种推测性的论点,虽然放在科幻小说中会很吸引人,但不应该成为我们面对关键的IA和II问题时采取的主要战略,这类问题已经开始出现了。我们需要根据自身的优势解决IA和II问题,而不仅仅靠模仿人类的AI。
当然,经典的人工模拟AI问题仍然很有意义。然而,目前的重点是通过收集数据进行AI研究,部署深度学习基础设施,以及模仿某些特定人类技能的系统的演示。这些研究中几乎没有涉及新的解释性原则,往往会将研究的注意力偏离经典AI领域的几个主要开放问题。
这些问题包括需要将意义和推理引入自然语言处理的系统,以应对推断和表示因果关系的需要。开发计算易处理的不确定性表示,以及开发制定和追求长期目标的系统。这些都是模仿人类的AI的经典目标,但在当前人工智能革命的热潮中,人们很容易忘记这些尚未解决的问题。
IA同样是非常重要的问题,因为在可预见的未来,计算机仍无法与人类在抽象推理真实情况的能力相比。我们需要经过深思熟虑的人机的交互来解决最紧迫的问题。我们希望计算机能够催生出人类创造力的新水平,而不是取代人类的创造力。
最早提出“人工智能”这个名词的是约翰·麦卡锡(时任达特茅斯大学教授,后来去了麻省理工学院),当时他提出这个名词,应该是为了区分他刚刚起步的研究项目和诺伯特·维纳的项目(当时是MIT的老教授)。维纳提出了“控制论”一词来指代他自己对智能系统的展望,这一概念与运营研究、统计学、模式识别、信息理论和控制理论密切相关。而麦卡锡则强调了与逻辑的联系。有趣的是,今天占据主导地位的更多是维纳的关于“智能”的内容体系,但外表却用的是麦卡锡提出来的“人工智能”一词。
除了历史上的观点差异之外,我们还要认识到,目前关于人工智能的公共对话,多数仅限于产业界和学术界的很小一部分,这种狭隘视野会影响我们面对人工智能所带来的全部挑战和机遇。
这里说的广阔视野,和实现科幻小说中的场景关系不大,更多与人类对技术的必要性的理解和塑造有关,因为它在日常生活中变得越来越有影响力。在这种理解和塑造中,需要来自各行各业的各种各样的声音,而不仅仅是技术上对话。仅仅关注模仿人类的AI,可能会让我们无法获知,或不愿去获知更广泛的信息。
学术界也要发挥重要作用,不仅仅是提供一些最具创新性的技术理念,而且会与计算、统计学等学科的研究人员共同作出贡献,这些贡献和观点非常重要,尤其需要社会科学、认知科学和人文科学的观点。
另一方面,虽然科学对人类的前进必不可少,但我们也不应该夸大我们的努力和成果。社会的目标是建立新的成果。应该构建这些工件以按照声明的方式工作。我们不希望造出一提供医疗、交通选择和商业机会的系统,然后发现这些系统无法真正发挥作用,发现它们会产生错误,影响到我们的快乐和生活。所以,正如我所强调的那样,目前在数据和学习为关注重点的领域还没能出现一个“工程学科”。尽管这些领域的发展前景令人兴奋,但目前还不能被视为“工程学科”。
我们应该接受这样一个事实,即我们正在见证一个新的工程学科的诞生。“工程”这个词具有独特的内涵,容易让人想到冷漠、情感的机器,以及失去对人类的控制,但我们可以打造自己想要的工程学科。在当今时代,我们迎来了一个真正的机会,来构思历史上前所未有的新东西:以人为本的新兴工程学科。我在这里不打算这个新兴学科取名,但如果缩略词“AI”继续作为学科名字使用,那么我们需要意识到这个词的真正意义和局限性。我们需要拓宽视野,平息炒作,并对未来的严峻挑战有一个清醒的认识。
参考链接:
https://hdsr.mitpress.mit.edu/pub/wot7mkc1/