前段时间,韩国公共广播电视台 KBS 专访了人工智能领域的泰斗级人物杰弗里·辛顿(Geoffrey Hinton)教授。作为 2024 年诺贝尔物理学奖得主,这位被誉为“深度学习之父”“AI 三教父”的科学家,深入探讨了 AI 技术的演进历程和未来发展方向。
顺带一提,韩媒给辛顿教授的绰号是“AI 四大天王”,应该是在Geoffery Hinton、Yoshua Bengio、Yann LeCun 三位图灵奖得主的基础上,又算上了“强化学习之父”Rich Sutton
在这场长达 17 分钟的对话中,辛顿教授分享了多个引人深思的观点:
- “长期以来,我们的主要局限是体力。工业革命消除了这个局限。而现在,我们的主要局限是智力,而 AI 将消除这个局限。”
- “在北美,每年约有 20 万人死于误诊。而如果医生与 AI 系统合作,正确诊断率可从 40% 提升至 60%。”
- “自主致命武器可能在两到三年内出现。所有的 AI 监管法规都有一条:这些规定不适用于 AI 的军事用途。”
- “如果你为富有创造力的研究人员提供充足的基础研究经费,他们实际上会更愿意从事基础科研,而不是去银行赚大钱。”
深度学习之路:从神经元到ChatGPT
人类发展史上存在两大局限:体力与智力。工业革命打破了体力的束缚,而今,人工智能正逐步突破智力的限制。深度学习的设计理念源自人脑的工作机制。尽管我们对大脑的全部奥秘尚未完全揭开,但已掌握颇丰的知识。大脑中密布着神经元(Neurons),它们之间形成了错综复杂的连接网络。学习的本质,就是调整这些连接的强度。神经元通过发出“ping”的信号与其他神经元进行通信。每个神经元的任务相当简单:判断何时发出“ping”信号。它通过接收来自其他神经元的输入来做出判断,这些输入可能来自感知神经元,例如视网膜中的神经元。当输入累积到一定阈值时,神经元就会发送信号,而达到阈值的难易程度取决于神经元间连接的权重(Weight)。权重小,信号影响就弱;权重大,信号就更可能触发接收神经元发送“ping”。学习的核心就在于调整这些连接的强度。关键在于:大脑究竟如何调整这些连接的强度?
20世纪80年代,科学家们提出了反向传播(Backpropagation)算法,这是确定如何调整连接强度的方法。当时,这种方法的效果并不显著,我们未曾预见,只要有足够的数据和计算能力,它将展现出惊人的威力。如今的大型聊天机器人正是运用反向传播来调整其模拟神经网络中的连接强度。这就是深度学习的基本原理。
以识别鸟类的神经网络为例:第一层的神经元可能负责识别边缘特征,第二层的神经元则识别特定的边缘组合,如以特定角度相交的两条边可能代表鸟喙。更上一层的神经元会识别鸟喙和眼睛的组合特征,如果这些特征的空间关系正确,网络就会将其识别为鸟头。这种层层递进的特征检测方式最终让网络能够判断:若同时检测到疑似鸟头、鸟脚和翅膀尖等特征,那么这个物体很可能就是鸟。而所有这些特征检测所需的权重,都是神经网络通过学习获得的。
自20世纪50年代人工智能诞生之初,就存在着两种截然不同的研究路径:一种基于逻辑(Logic-based),另一种基于生物学(Biology-based)。基于生物学的方法试图模拟大脑中的神经网络,而基于逻辑的方法则尝试通过模拟逻辑来实现推理。直到最近,基于生物学的神经网络方法才真正超越了逻辑方法。在人工智能发展的前50年里,几乎所有人都坚信逻辑方法是正确之道,但这条路并未带来实质性的突破。直到本世纪,大约在2009年前后,模拟生物学的神经网络方法突然开始展现出惊人的效果。这一转变具有划时代的意义。
2012年,神经网络在物体识别领域取得了重大突破,这标志着生物学方法的胜利。神经网络之所以能取得如此显著的成功,主要得益于三大关键因素:首先是计算能力的飞跃,如英伟达(NVIDIA)为游戏开发的芯片提供了强大的计算能力;其次是数据量的激增,互联网为我们提供了海量的训练数据;最后是技术的进步,例如,2017年谷歌推出的Transformer架构极大地提升了语言模型的性能。这些突破引发了人们对神经网络的极大兴趣。而当ChatGPT发布后,人们看到神经网络真的能够理解人类的表达并做出合理的回应,这再次掀起了一波更大的热潮。
AI改变世界的三大领域
我认为人工智能将在所有行业领域得到应用。在某些领域,如医疗保健,AI的影响将带来巨大的积极变革。以就医为例,如果我现在出现某些症状,我会去看家庭医生。但如果我患有一种罕见疾病,我的家庭医生可能从未见过类似病例。相比之下,我更愿意找一位“见过”上亿病人的医生,这位医生不仅了解我的全部基因组信息,还掌握了我完整的病史和所有医疗检查结果。这样的AI医生即将成为现实,他们的诊疗水平将远超普通医生。AI在医学影像解读方面也将表现出色。AI能够利用更全面的信息来辅助诊断。现有数据显示,对于疑难病例,人类医生的正确诊断率约为40%,AI系统能达到50%,而医生与AI系统合作则能达到60%的正确率。在北美,每年约有20万人死于误诊。因此,AI的应用将挽救大量生命。在教育领域,研究表明,一对一私教的学习效率是课堂教学的两倍。有了AI,每个孩子都能拥有自己的私教,这将使学习效率翻倍。这必将对教育产生巨大影响,尽管这对大学教育可能不是个好消息。实际上,只要有数据的地方,AI就能发挥作用。举个例子:我的邻居为一家矿业公司开发了AI系统。该公司拥有约100亿个数据点,记录了在不同情况下完成特定操作(如挖掘特定长度的矿井)所需的时间。现在这些数据被输入到AI系统中,可以快速回答各种问题。比如,如果承包商声称能在指定时间内完成某项工作,公司想知道他实现这一承诺的概率有多大。在过去,要得到这个答案,公司需要聘请大型咨询公司撰写报告,三周后才能得到结果。而现在,他的系统只需4秒就能给出答案。这只是一个例子,但在所有拥有大量数据的行业中都会出现类似的情况。企业将能够更快速、更有效地利用自己掌握的数据。
如今,当我遇到新问题时,我会向GPT-4求助。比如有一次,我的度假小屋被某种蚂蚁侵扰。我向GPT-4咨询,它告诉了我可能的蚂蚁种类以及相应的处理方法。这种体验就像有一个知识渊博且极其耐心的朋友。当然,我们也注意到了AI的“幻觉”(Hallucination)现象,有时它会产生错误的信息。但人类不也是如此吗?当人类出现类似现象时,我们称之为“虚构”(Confabulation)。人们总是在虚构。比如当人们回忆很久以前发生的事情时,他们往往无法准确记住细节。他们可能很自信,但细节却是错误的。从这个角度看,人类和这些大型聊天机器人很相似,都会产生虚构的内容。
在技术快速发展的时期,预测未来是非常困难的。如果你想了解十年后的情况,最好的方法可能是回顾十年前的状况。十年前,没有人能预想到会出现像GPT-4或谷歌的Gemini这样的大型聊天机器人。因此,从现在起的十年后,我们将看到许多超出人们预期的发展。短期内,变化可能不会太戏剧性。但在十年的跨度上,AI的能力将发生巨大的变革。
人类文明史上的AI革命
让我们看看工业革命:在工业革命中,人类的体力变得不再那么重要。工业革命之前,如果要挖一条沟,你需要人力来挖。虽然也有动物和风车、水车之类的工具,但基本上还是需要人力。工业革命后,人类体力的重要性大大降低。现在的情况是,人类的智力仍然很重要。但当AI变得比我们更聪明时,人类的智力将像工业革命后的体力一样变得不那么重要。你可以把历史看作是不断消除人类局限性的过程。长期以来,我们的主要局限是体力。现在,我们的主要局限是智力,而AI将消除这个局限。
人类与AI的未来:机遇与挑战
如果你问,在历史上有多少例子表明智力较低的存在能够控制智力较高的存在?我只知道一个例子,那就是母亲和婴儿的关系。进化投入了大量工作来确保婴儿能够控制母亲,这对物种的生存至关重要。但即便如此,婴儿和母亲的智力水平其实也差不多。因此,当这些AI系统变得比我们更智能时,我们不确定能否保持对它们的控制。我的朋友Yann LeCun等人认为这不会有问题,因为这些系统是我们创造的,它们会一直按照我们的指令行事。但我并不这么认为。我觉得我们不能对此太过自信。我相信人类本质上是物质的存在,人类的任何特质都可以在计算机中实现。从长远来看,计算机可以拥有我们所有的感知能力。我认为人类并没有什么特别之处。我们只是非常非常复杂的存在,经过了漫长的进化。对其他人而言我们很特别,但我们身上没有什么是机器无法模拟的。
有些人担心AI会夺走人类的工作。事实上,AI带来的风险有很多种,我们不应该把这些不同的风险混为一谈。不同的风险需要不同的解决方案。AI确实会取代很多工作岗位,这是毋庸置疑的。比如法律研究助理(Paralegal),现在AI已经能更好地完成他们的大部分工作。很多普通的办公室工作都将需要更少的人力。我有一位亲戚在医疗服务机构工作,负责回复投诉信。以前她要花25分钟写一封回复信,现在她只需要把投诉信输入ChatGPT,它就能生成回复,她检查一下就可以发送出去,整个过程只需要5分钟。这意味着这类工作只需要原来五分之一的人力。这种情况在许多普通办公岗位中都很典型。有人说AI会创造大量新的工作岗位。这确实是事实我们现在需要做的是,在技术发展过程中投入更多精力于安全研究。而唯一拥有这些资源的是大型科技公司。因此,我们需要政府强制要求这些大公司在安全方面做出更多努力。
显然,发展 AI 需要大量的算力,也需要大量的专业人才。要留住优秀的科学家,就要为他们提供能够开展研究的环境。以加拿大为例,按其经济规模来看,在 AI 领域表现相当出色。这要归功于其支持基础科研的政策。像我、Yoshua Bengio 和 Rich Sutton 这样的顶尖 AI 研究人员之所以来到加拿大,部分原因是这里的社会制度,但主要是因为这里愿意资助基础科学研究。因此,充分资助基础科学研究是关键。
我对韩国的建议是:如果你为富有创造力的研究人员提供充足的基础研究经费,他们实际上会更愿意从事基础科研,而不是去银行赚大钱。当然,总会有人选择去银行工作赚更多钱,这是无法避免的。但对基础科学研究的良好支持,包括对计算资源的支持,才是留住优秀研究人员的方式。
关于人形机器人(Humanoid Robot)的发展,现在确实有很多人在研究这个方向。这是可能实现的。开发人形机器人的一个原因是,工厂是为人类设计的。工厂里的所有机器都是按照人类操作的需求来设计的。因此,与其重新设计所有机器,不如重新设计一个“人”,这样就可以使用现有的机器。现在已经有人在尝试这么做了。我不知道这个方向会如何发展。
我认为我们正处在一个充满巨大不确定性的时期。在这样的时期,我们应该保持谨慎。人们问是否会出现调整期或衰退期。对此有两种不同的观点。我的观点是 AI 的发展会持续下去。有些人,特别是那些相信传统的、基于逻辑的 AI 方法,从来就不喜欢神经网络的人,一直在说这种发展即将结束。
但多年来,每当有人说神经网络被过分夸大时,神经网络都用实际成果证明了自己。现在他们确实能做出令人惊叹的事情。所以我不认为这是夸大其词。每隔几年,就会有人说:“嘿,神经网络被高估了,这一切马上就会崩溃和停止。”但他们每次都错了。我认为他们还会继续犯这样的错误。