盘古智库理事长易鹏:
以GPT为代表的人工智能将走向何方?
在我们所处的数字时代,人工智能正成为推动科技进步和社会变革的强大力量。无人驾驶、智能手机、机器人客服等,无一不在展示着人工智能的巨大威力。人们现有的生活发生了巨变,呈现出科技大片照进现实的既视感。
然而,在人工智能技术刚兴起的时候,几乎难以察觉和预测它对当今技术的革命性影响。2016年,谷歌DeepMind开发的AlphaGo击败围棋世界冠军,这件事只得到短暂关注,随后即从公众视野消失。2023年,ChatGPT以前所未见的方式吸引了全世界的关注。瑞银集团的报告显示,在ChatGPT推出仅两个月后,2023年1月末的月活用户已经突破1亿,成为史上用户增长速度最快的消费级应用程序。与此相比,TikTok达到1亿用户花了9个月,Instagram则花了2年半。
盘古智库理事长易鹏认为,人工智能从产生到销声匿迹再到爆发,这一波浪式的发展过程足以证明:任何新事物的崛起、新生态的完善和新趋势的形成,从来不是一蹴而就的,而是退二进三、裹挟向前的渐进过程。在人类社会从线下模式向线上模式加速进化的大背景下,人工智能已成为新质生产力的最重要组成部分。
《新大航海时代》
易鹏 著
湛庐文化/天津科学技术出版社 出品
他的新书《新大航海时代》巧妙地将历史探索的波澜壮阔与当代科技的飞速发展相结合,为我们展望人工智能的未来,引领我们驶向知识的深海,探索科技与未来的无限可能。
人工智能到GPT:逐步接近人类的思考模式
1950年基于规则的人工智能,其发展主要基于手写规则,并且处理的数据有限。20世纪80年代的机器学习找到了一些函数和参数,实现了对固定量数据的分类,比如区分猫和狗等特征非常明显的物体。1990年直至2006年左右,神经网络的出现,尤其是卷积神经网络和循环神经网络的出现,逐步让人工智能像人脑一样学习,但需要研究人员提前标记数据、搜集反馈。从2017年开始,Transformer的出现,让人工智能优化了人脑学习的过程,把机器学习系统提升了一个层次。人工智能越来越贴近人脑的思考过程,不断创造新的奇迹。
GPT开启了人们的想象之门。这要归功于其广泛的实用性:这一工具具备理解自然语言并创造内容的“超能力”,几乎任何人都可以使用它。我们曾经认为,用计算机写文章几乎不可能实现。但GPT底层的神经网络在写文章上获得了前所未有的成功,虽然写文章实质是“计算深度较浅”的问题,但使得类似于写文章的事情(处理语言)在“拥有一种理论”上更近了一步。GPT这类工具的使用,无论其是实用的还是概念性的,近几个世纪以来使我们超越了“纯粹的无辅助的人类思维”界限,使人类能够探索物理宇宙和计算宇宙的边际。
真正让GPT发挥作用的思维法则
GPT的成功,为一个基础而重要的科学事实提供了证据:我们仍然可以期待发现重大的、全新的“语言法则”,也就是“思维法则”。由于GPT是一个巨大的神经网络,法则是隐含的,如果能够让法则变得更加明确,则可以构造一个更明确的工具来做类似GPT所做的事情。
人类语言曾经被视为一个复杂的系统,人类大脑有1 000亿个神经元以及100万亿个连接,人类运用这些神经元和连接做到的一切,常常令人感叹造物之神奇。人们可能认为,除了神经元和连接之外,或许还存在尚未被发现的物理特性的某种载体。但GPT的问世,给了人们一个明确的新信息:一个连接数与大脑神经元数量相当的纯人工神经网络,就能够出色地生成人类语言。
为什么ChatGPT能在语言和人机沟通上取得空前的成功呢?正如计算机科学家斯蒂芬·沃尔弗拉姆(Stephen Wolfram)所判断的:“因为语言比它看起来更简单。”这意味着,即使是具有简单神经网络构造的ChatGPT,也能够成功捕捉人类语言的“本质”和背后的运算法则(见下图)。此外,在训练过程中,ChatGPT已经通过某种方式隐含地发现了使一切成为可能的语言和思维法则。
图:与ChatGPT的对话
资料来源:安德烈·卡帕西(Andrej Karpathy)2023年的演讲《GPT现状》(State of GPT)。
人脑和GPT的认知差异
人脑所做的思考,大都是一个经验选择的过程,并且避免计算不可约的选择。大脑几乎无法“想透”任何特殊程序的操作步骤,但有了计算机,就可以轻松完成耗时很长、计算不可约的任务。比如有了计算器,就可以非常快地得到十位数的运算结果,而人脑则无法“想透”这个结果。说到底,可学习性和计算不可约性之间存在着根本的矛盾。学习实际上是通过利用规律来压缩数据,但计算不可约则意味着最终可能存在的规律有一种限制。
人脑会通过思考、独白、以往经验等来寻求答案,而GPT的过程则更加单向。例如,当写一篇关于“加州的人口是阿拉斯加的53倍”的博客或文章时,人脑通常会经历丰富的内心独白,并结合相关资料和工具进行反复验证和纠错。然而,在训练GPT时,这些内容作为训练数据只是标记序列——所有内心独白、思考和推理过程都被剥离出去。GPT会对每个标记花费大致相同的计算能力来读取这些标记序列,而人脑则会根据任务难易程度花费长短不固定的时间。从本质上讲,GPT只是一个标记模拟器。
GPT,人工智能的不断演进和创新
GPT是Generative Pre-Training的首字母缩写,翻译成中文是“生成式预训练”。我们可以观察到,OpenAI研发的模型,从GPT-1到GPT-3,模型参数的数量一直在快速增加。人工智能的发展经历了若干阶段,从“规则型人工智能”(rule-based AI)到“判别式人工智能”(discriminative AI),再演变到“生成式人工智能”(generative AI)。这些阶段代表了人工智能在算法、学习方法和应用领域上的不断演进和创新。
规则型人工智能
20世纪60年代AI技术刚出现,这一时期的AI运算逻辑,主要是通过事先定义的规则和逻辑,通过逐步推理和匹配规则来解决问题。使用这种方法的代表是专家系统,1970年代开发的MYCIN系统是其中的典型代表。MYCIN系统可以帮助医生对血液感染患者进行诊断并选用抗菌素类药物,它使用了大量规则来诊断细菌感染。但是,事先制定的规则是先入为主和由机器制定的,并且缺乏通用性和灵活性,无法适应更加复杂的场景。
判别式人工智能
进入20世纪90年代,AI技术开始关注在输入数据中学习特定的模式和规律,再进一步对模式和规律进行分类、识别和预测。尽管近年来,深度神经网络(DNN)的出现让判别式人工智能在语音识别、图像识别、自然语言处理等领域取得了突破性进展,但它较大的局限性是尚不具备产生新数据的能力。
生成式人工智能
这个阶段可以追溯到2014年,当时生成对抗网络(GAN),引发了人们对生成式人工智能的广泛讨论和关注。GAN由一个生成器和一个判别器组成,通过两个神经网络相互博弈的方式生成学习模型。生成式人工智能最大的特点和进步是,GAN能够在不使用标注数据的情况下,生成任务的学习。GAN在图像生成、文本生成、音频生成等领域取得了重大突破,人工智能能够以更具有创新性的方式完成指定任务。
人工智能:显著提升生产率25%
2022年12月,全球对于生成式人工智能的搜索次数比2022年年初高8倍。根据彭博的数据,2022年生成式人工智能行业的全球市场收入达到400亿美元,并以40%的年平均增长率迅速上升,预计到2032年,这一数字将增加至1.3万亿美元。OpenAI基于生成式人工智能技术研发的聊天应用ChatGPT迅速被人熟知,并且其升级版在全球内突破性实现了大规模个人用户付费订阅的商业模式。
巨大的增长力吸引了全球投资者的目光(见下图。截至2023年一季度,全球有近400家生成式人工智能行业初创企业获得了私募股权或风险投资的注资。这些初创企业涵盖了人工智能价值链的各个环节,包括基础模型、行业模型以及不同模态的具体应用,如生成文字、生成代码等。
人工智能在提升行业生产效率和促进产品创新方面,具有无可比拟的优势,预期未来将颠覆全球各行各业的现有格局。根据麦肯锡的测算,人工智能技术对全球经济的潜在影响在17.1万亿~25.6万亿美元之间,相当于使生产率增长约25%。其中,生成式人工智能的影响相当于当前全球经济的8%。增长的来源既包括人工智能本身为企业带来的收入增加和成本优化,还包括人工智能推动全行业生产效率提升所带来的潜在经济价值。
图:人工智能对经济增量的影响
资料来源:麦肯锡。
GPT或成为人工智能的拐点
OpenAI开发的人工智能聊天机器人程序获得了空前关注,在2022年上线不到一周的时间里,用户量就突破了100万。比尔·盖茨评论:“ChatGPT人工智能技术出现的历史意义,不亚于互联网和个人计算机的诞生。”
GPT技术(见下表)的一大核心理念是用最简单明了的自回归生成架构来解决无监督学习问题,也就是无须特意标注原始数据,学习其中对世界的映射。自回归生成构架,就是非常通俗的“一次只增加一个词”。选择这种构架并不是为了做任务,而是为了理解或者学习,以实现模型的通用能力。
在2020年之前甚至近几年,业界很多专家想当然地认为GPT的任务是生成,这与之前出现的新技术无异,但他们忽视了GPT-1相关论文的标题是“通过生成式预训练改进语言理解”(ImprovingLanguage Understanding by Generative Pre-Training)。无论是ChatGPT还是Midjourney,都属于人工智能创造内容(AIGC)。
基于GPT-3的ChatGPT,其总体目标是根据所接受的训练(梳理、分析来自互联网数十亿页文本等),以“合理”的方式续写文本。ChatGPT的操作基本分为3个阶段。第一阶段是获取与目前文本相对应的标记序列,并找到表示这些标记的一个嵌入(即由数组成的数组)。
第二阶段是以“标准的神经网络方式”对嵌入进行操作,值“像涟漪一样依次通过”网络中的各层,从而产生一个新的嵌入(即一个新的数组)。在第三阶段,它获取此数组的最后一部分,生成包含50 000个值的数组,这些值就成了下一个标记的概率。
表:GPT系列基本情况
这3个阶段的每个部分都是由神经网络实现的,其权重是通过对神经网络进行端到端的训练确定的。这意味着,除了整体架构是事先设定的,其他所有细节都没有被明确设计,一切都是从训练数据中“学习”而来的。
人工智能:科学的开拓和工程的创新
ChatGPT既没有特别创新,也不具备革命性,OpenAI只是把已有的研究变成了工程应用,包括底层的Transformer算法、自监督训练、微调等做法,都已经存在,并非原创。ChatGPT只是将这些能力叠加,利用基础模型带来泛化能力,实现了质变。
——杨立昆(Yann LeCun)人工智能科学家
虽然人工智能和GPT并不是纯粹的科学创新,但是其技术极大地改变了人类的生活,使经济效益的提升呈几何级数增长。纵观科技发展的历程,瓦特改良了蒸汽机从而大大提高了生产效率,谷歌并非搜索引擎的首创者,苹果公司并没有发明手机,但他们对科技的应用大大影响了人类经济社会的发展。
科学发现是金字塔的基座,能为技术打下坚实的基础;但科学距离普通人的生活还很远,而工程和技术的发展可以直接作用于企业产能的提高、直接面向普通人的生活。
人工智能:另一个视角看未来
第一次工业革命使人类文明进入了蒸汽时代,第二次工业革命带来了电气化时代,第三次工业革命带来了信息化时代,第四次工业革命则催生了利用信息化技术促进产业变革的时代,人工智能是第四次工业革命的典型代表。
人工智能开启了无穷无尽的想象空间。人工智能卓越的下棋技艺,ChatGPT如同人类一般的对话,使得有些人认为人工智能无所不能,也有人开始担忧未来人工智能会替代人类。实际上,当我们冷静下来,会发现问题的关键在于人工智能可以发展到什么程度。被认为是模拟人类的、最容易替代人类的机器学习、深度学习、增强学习所依托的神经网络,几乎完全隐去了巨大的人机差距。这个差距就是,机器在单一维度上是超常运算的结果。人工智能的“智能”,是一种机械性、程序式的学习,在模仿人类的思维法则和程序方面,人工智能几乎不可能突破人类的“意识”,只有在它能突破“意识”的那一天,才会发生人们担心的事:人被机器替代甚至奴役。
同时,我们也应注意到,AlphaGo在最开始学习围棋的时候,参考了人类围棋高手的棋谱,但后来发现,人类的围棋经验会把它教“坏”。于是,升级版的AlphaGo Zero不再使用人类对弈数据,反而变得更厉害了。AlphaGo Zero真有没有掌握一点儿人类下棋的经验吗?如果是真的,那就太让人沮丧了。人类几千年来摸索出的对弈经验被证明是拖后腿的东西,一个算法高明且算力充沛的机器靠自我反馈就能摸索出围棋这门技艺的极限,围棋过去所承载的追求最优取舍之道的深邃哲思,似乎在意义的层面上消失了。
我们害怕的是,如果在将来的某一天,人工智能发现所谓的文学其实也不过是个数学问题,人类之前的写作经验也一样是拖后腿的东西,那些被视为不可替代且弥足珍贵的细腻情感,能够被人工智能轻易复现,然后流水线一样地呈现出震撼人心的伟大文章,那时文学就会陷入虚无,写作或许会变成一种宗教仪式般的行为。文学沦陷之后就是音乐,音乐沦陷之后就是美术,总之人类那些不可名状又朦胧的表达,全都被视为数学问题,然后被人工智能一一破解。
——本文节选自《新大航海时代》,易鹏 著,湛庐文化/天津科学技术出版社 出品
#书中自有黄金屋,读书互动#
你对“新大航海时代“如何看?
欢迎关注公众号“互联网思想”并在本文评论区留言,随机精彩原创的3位读者将有机会获得本书一本。活动限一周!
为伟大思想而生!
AI+互联网思想时代(wanging0123)