过去,人工智能往往局限于特定领域,而大模型凭借其强大的规模扩展性和多任务适应性,打破了这些壁垒,推动人工智能进入新的发展范式。大模型技术引领的新范式,正在推动人工智能走向“通才”,并加速其与各个行业的深度融合,催生众多创新应用场景,推动众多传统行业走向人工智能+。
4月27日,中国信通院人工智能研究所副所长魏凯在“算力中关村”技术成果对接交流专场活动上发表《人工智能+的广阔前景与落地之路》的主题演讲。他指出,**近年来,以Transformer为代表的大模型技术在语言、视觉等领域加速突破,推动人工智能进入了一个新的发展范式。**魏凯表示,人工智能进入到新的范式有几个特点,第一个特点是规模可扩展性强,第二是多任务适应性很强,第三是持续学习。
大模型在各个行业的突破,不仅仅在语言模型上,在其他领域的突破,更值得大家去重视,**大模型与行业知识深度融合,将催生众多创新应用场景,形成新的增长点。
魏凯表示,人工智能和行业融合的前景,也就是我们国家提出的人工智能+的场景,是非常丰富的。
两个方向来看,一个是TO C的,一个是TO B的。在消费端大模型应用中,办公、图片生成和对话类产品占比合计达60%,提升工作效率成为首要目标。TO B方向主要面向企业价值链的各个环节,包括研发、生产制造、经营管理、营销服务和智能产品等,大模型在这些领域都拥有巨大的应用空间,可以提升效率、降低成本,并推动产业升级。软件工程是 To B 领域应用的典型案例,大模型技术正在深刻改变软件行业,显著提升软件开发和测试的效率。
但大模型应用规模化落地仍存在诸多挑战,他强调,推动人工智能深度应用,应全面加强平台建设、数据治理、运营管理、风险管控四大支柱建设。
关于大模型和其他领域的融合,会上,魏凯具体指出了三个方向。
**其一是AI大模型在自动驾驶领域的应用。**特斯拉在美国开放了自动驾驶的第12版FSDV12,免费给大众使用一个月,这个技术是在去年的8月份就研发完成了,它的底层用的是Transformer,和ChatGPT是一个技术,不仅是特斯拉在做,上海人工智能实验室在文章上也证明了在端到端上来做Transformer也是可行的,这条路在深刻改变自动驾驶的技术路线。
数字开物查询公开信息获悉,上海人工智能实验室、武汉大学、商汤科技团队联合发表的论文《Planning-oriented Autonomous Driving》(以路径规划为导向的自动驾驶)首次提出感知决策一体化的自动驾驶通用大模型UniAD。
UniAD自动驾驶模型通过其统一的架构设计,有效地整合了全栈自动驾驶的关键任务,利用Transformer模块和查询向量建模技术,实现了高效的物体交互和路径规划,尤其是预测和规划效果远超其他模型。UniAD在感知决策一体化、多目标跟踪准确率、复杂场景下的表现以及三维目标检测等方面展现出了明显的优势,更是表明基于 Transformer 的端到端自动驾驶技术路线具备可行性,为自动驾驶领域的研究和发展提供了重要的指引和设计思路。
**其二是AI大模型在气象科学领域的应用。**谷歌和华为近期分别在 Nature 和 Science 杂志上发表文章,证明气象预报除了传统的数值计算和超级计算机方法外,还可以利用基于数据驱动的大模型进行预测,该模型只需输入历史数据,无需气象科学家的干预,即可快速、低成本地预测未来天气状况。
今年国内一些科研机构也报道称,大模型在气象预报方面取得了突破性进展,空间分辨率达到了 9 公里,这是历史上从未有过的精度。这一突破性的进展令人瞩目,为气象预报领域带来了新的可能性。
数字开物了解到,在气象科学领域,2023 年 7 月,谷歌发布了GraphCast,这是一个基于图神经网络的气象预报大模型。GraphCast 将地球表面划分为不同的节点,并根据地理位置和大气动力学关系构建图结构, 并使用图神经网络 (GNN) 对图结构进行学习,提取节点之间的关系特征和大气动力学特征,根据学习到的特征,预测未来不同时间和地点的气象要素,例如温度、降水、风速等。GraphCast具备高精度、快速预测、可解释性强的优势,适用于复杂地形和局部地区预报。
同时期国内,华为云研发团队也推出的一种基于 AI 的气象预报模型——盘古气象大模型。盘古气象大模型采用 3D 深度学习网络,能够更好地捕捉大气三维结构和动力过程,并利用数据同化技术将观测数据(如卫星遥感数据、地面气象站数据)与模型预测结果进行融合,提高预测结果的可靠性。盘古气象大模型在短期和中期天气预报方面展现出超越传统数值预报模型的精度,能够更精确地预测降水、温度、风速等气象要素,除此之外还可以用于极端天气事件预测以及气象变化研究。
AI 技术在气象领域的重大突破,为气象科学研究和应用带来了新的可能性,在天气预报、极端天气预警、气候变化研究等方面具有广阔的应用前景。
其三是AI大模型在机**器人领域的应用,**几个典型案例:美国一家机器人公司Figure和 OpenAI 合作,将 GPT-4 集成到机器人中,实现大模型对机器人行动和人机交互的控制。在GPT出现的不长时间,谷歌就开源了名为 RT-2 的机器人 Transformer 模型,该模型是 RT 的第二个版本,它将机器人的控制指令分解为不同的子任务,并利用语言模型进行处理。特斯拉的擎天柱机器人也采用了 Transformer 架构。
数字开物了解到,RT-2 (Robotic Transformer 2) 是谷歌 AI 团队于 2023 年 3 月开源的一种基于 Transformer 架构的机器人控制模型。RT-2 可以处理多种模态的输入,包括图像、文本和机器人状态信息,并且能够将自然语言指令转换为机器人动作,实现更灵活、更智能的机器人控制。RT-2 可以在多种机器人应用场景中发挥作用,例如家用机器人、工业机器人、医用机器人等。
特斯拉于 2023 年 9 月发布的第二代人形机器人Optimus Gen2,集成了更先进的 AI 技术,包括基于 Transformer 的模型,使其能够更好地理解环境、执行任务并与人类互动。美国机器人公司Figure的Figure 01机器人基于OpenAI的大模型,可以做到描述其视觉体验、规划未来的行动、反思自己的记忆、口头解释推理过程。
去年以来,AI 大模型技术在多个领域取得突破性进展,人工智能进入新发展阶段。同时,AI 与经济社会的融合程度和速度也在显著提升,展现出巨大的发展潜力,引领产业变革,为产业升级注入强大动能。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。