12月11日,量子位智库发布《2024年度AI十大趋势报告》,该报告不仅深入剖析AI这一前沿科技如何迭代技术能力、重塑商业版图、引领产业升级,还敏锐洞察变革趋势,对未来路径进行前瞻性展望。
《2024年度AI十大趋势报告》年度十大趋势:
1.大模型创新:架构优化加速涌现,融合迭代大势所趋
2.Scaling Law泛化:推理能力成皇冠明珠,倒逼计算和数据变革
3.AGI探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实
4.AI应用格局:第⼀轮洗牌结束,聚焦20赛道5大场景
5.AI应用竞争:多领域竞速运营大于技术,AI助手兵家必争
6.AI应用增长:AI+X赋能类产品大干快上,原生AI爆款难求
7.AI产品趋势:多模态上马,Agent席卷⼀切,高度个性化呼之欲出
8.AI智变千行百业:左手变革生产力,右手重塑行业生态
9.AI行业渗透率:数据基础决定初速度,用户需求成为加速度
10.AI创投:投融资马太效应明显,国家队出手频率提升
技术视角
大模型创新:架构优化加速涌现,融合迭代大势所趋
2017年《Attention Is All You Need》论文发表,Transformer架构问世,并逐渐成为自然语言处理领域主流技术范式。但Transformer并非完美无缺,产学研界也一直存在一种声音:架构领域需要新的突破,来构建强大且高效的新一代基础大模型。
谁将革新甚至颠覆Transformer,取而代之?
2023年以来,大量创新大模型架构涌现,尝试在保留Transformer优势的同时解决其算力开销太高的问题,有望在性能与效率上实现突破,对Transformer的绝对统治地位形成有力挑战。
类循环神经网络模型(以RWKV为代表)
状态空间模型(以Mamba为代表)
层次化卷积模型(以UniRepLKNet为代表)
多尺度保持机制模型(以RetNet为代表)
液体神经网络模型(以LFM为代表)
……
多种有代表性的技术路径,在不同程度保留Transformer架构优势的基础上,结合RNN、CNN等思想所做出的创新发展,这也使得大模型架构呈现出日益明显的混合趋势, 更多创新架构具备 “博采众家之长”的特点。
Scaling Law泛化:推理能力成皇冠明珠,倒逼计算和数据变革
技术层面,另一个备受关注的重点是Scaling Law的泛化。第一代Scaling Law指引模型开发者们在参数量、数据集和计算量之间寻找模型性能的最优解,引发了大家对算力、数据等资源分配的思考。
量子位智库观察到,参数量与计算量的膨胀带动我国万卡集群以及高性能网络的建设和发展;同时数据耗尽危机中,合理善用合成数据成为较优选择。
此外,OpenAI o1无疑是今年受瞩目的模型之一,在它身上体现了推理能力的大幅提升。以o1为代表的新Scaling Law,促使大模型追求更高的推理能力。
横向对比Apple Intelligence Foundation、Gemma 2、Llama 3.1、Qwen2训练方法可以看到,后训练的比重正在不断增加,模仿学习+强化学习成为典型AI发展路径范式。
AGI探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实
2024年,AI技术在多元方向持续突破,视频生成、世界模型、具身智能和空间智能等技术推动了人类对AGI的探索。
视频生成方面,扩散模型在多任务中取得显著成果,已成为视频⽣成的主流技术路径。尤以DiT(Diffusion Transformer)模型最受瞩目。
在世界模型领域,研究者们致力于开发能够模拟和理解真实世界的模型,核心在于通过学习大量数据,使模型能够自然涌现新的行为和决策能力。
与世界模型密不可分的还有具身智能。今年起,具身智能逐渐从概念走向落地,玩家们纷纷推出⾃⼰的⾸款⼈形机器⼈,同时开始在灵巧⼿自由度、控制精度和感知技术上发力,持续攻克技术难题。
而空间智能,则是一个与世界模型和具身智能都紧密相关的概念。空间智能指的是机器在三维空间和时间中感知、推理和⾏动的能⼒,其野望在于将空间计算操控虚拟世界的本领和具⾝智能触达现实世界的能⼒结合起来。
产品视角
AI应用格局:第⼀轮洗牌结束,聚焦20赛道5大场景
为了更好地从数据维度观察国内产品的现状,量子位智库选取了400余款具有代表意义的产品进行研究。
从细分赛道来看,这400款产品可以具体划分为20个品类——AI智能助手、AI陪伴、AI相机、AI写作、综合类套件、AI修图、AI视频、AI教育、AI音乐/音效、AI设计、AI生图、AI搜索、AI图示、AI总结和AI翻译,各赛道已分别产生代表产品进而再细分,并呈现出不同的发展特点。
其中,AI智能助⼿是表现最突出的AI原⽣类产品,也是国内⼤模型⾃研⼚商技术实⼒的最直观体现。目前来看,AI智能助手赛道内部已经出现了明显的梯队划分,豆包取得了断层式领先。
AI陪伴也在广泛应用,这些产品在设计和玩法上各具特色,但却共享一个核心理念:以对话为核心,为用户提供情感性体验。在 AI 技术引领的通讯服务变革中,如何在日新月异的用户需求下提升社交体验?
凭借在 AI 技术与娱乐社交场景深度融合的实践经验,网易云信为开发者提供了一个新的可行思路!今天,我们正式上线融合通讯+ AI ,通过低延迟性能、丰富多彩的角色定制和细腻的情感交互,在提升通信的效率与品质的同时,给用户打造一个更加个性化、智能化的社交体验。
目前,网易云信已经实现了将多种 并将社交开场话术、聊天话题推荐、一键回复对话、交友技巧建议等多种 AI 功能融入中。为了方便开发者快速接入,网易云信支持音视频通话、消息、美颜等功能组件化接入,以节约开发时间。
凭借全球领先的 IM 即时通讯能力,网易云信支持文本、图片、语音、表情等多样化消息类型,并且在单聊、群聊中支持大模型嵌入,方便开发者快速集成,降低客户的研发成本。消息必达的策略,更能应对亿级日活应用的高并发场景。此外,通过AI 技术与通讯服务的结合,为通讯端侧提供了强大的沟通辅助功能,包括文辞润色、翻译、助聊以及辅助回答等,极大地丰富了用户的交流方式。
低延迟的远端模型交互,是实现流畅通讯体验的关键。网易云信通过,基于 WE-CAN 全球网络,确保端到端的平均延迟低于 270 毫秒,而 RTC+AI 的结合延迟低至 1 秒,为用户提供高实时互动的 AI 体验。此外,网易云信的即时消息语音对话功能,能够理解用户的情感和意图,提供相应的语音回复,让我们更能享受到有来有回的语音互动,这种交流方式更加自然,也更加沉浸,为用户提供了一种更加生动的交流方式。
AI搜索则已经成为新的业务布局重点,既包括秘塔AI搜索等原生AI搜索,也包括类似纳米搜索、夸克浏览器的AI加强搜索和知乎直达、小红书达芬奇等业务AI搜索。
如果以具体使用场景划分,可以分为:重在整体效率提升的全使用场景、整体数据表现最优的工作提效、2025年有望显著突破的创意生成、面临严峻合规挑战的休闲娱乐和日常生活等。
AI应用竞争:多领域竞速运营大于技术,AI助手兵家必争
为了更好地还原国内AI产品的现状,量子位智库从用户规模、新增速度、用户活跃和用户粘性四⼤⻆度进行了数据统计。
目前,APP端和Web端均尚未出现比肩互联⽹时代现象级破圈之作的产品,且整体来看和海外同类型产品相差5倍以上。
在APP端,⽬前还没有产品能够拿出全维度的亮眼表现,市场缺乏诞生杀手级产品的场景。
AI应用增长:AI+X赋能类产品大干快上,原生AI爆款难求
当前,AI产品可被划分为以AI为底层设计逻辑的AI原⽣类产品、在原有互联⽹产品上深度嵌⼊AI功能的AI+X产品、基于外接API微创新的套壳类产品和将多个产品/模型API集中拼凑的集合站类产品。
从数据来看,由于和业务流程融合得更为紧密、需求识别明确等原因,AI+X类产品⽬前的整体数据表现显著优于AI原生类产品,并以办公软件和内容平台为重点布局领域。
对办公软件⽽⾔,续写、改写、命题写作等不同程度的AI写作功能,以及针对论⽂、⼩说等不同题材的AI总结功能基本成为标配。
其中,主要业务为提供模板及参考内容的素材库类产品和编辑器形态的办公软件表现更为突出,代表产品为百度⽂库和WPS AI。由于AI⽣成效果会直接影响产品的核⼼使⽤体验,此类产品相对更强调具体功能的精准度。
而在内容平台中,AIGC⼤多从三个⽅向共同发⼒:基于平台内容的AI搜索、⽤于带动UGC的AI⽣成功能及模板,还有⻔槛进⼀步降低的内容创作⼯具。
基于此,量子位智库对AI原生类产品提出了场景融合、简化用户体验、品牌信任和推广三大建议。
AI产品趋势:多模态上马,Agent席卷⼀切,高度个性化呼之欲出
随着⼤模型对图像和视频信息的处理能⼒快速提升,预计2025年将开始出现更为综合性的多模态交互,AI能够通过物联⽹、特定信息等多种感知通道进⾏协同。
多模态输⼊和输出使AI交互性更强、交互频次更⾼,适⽤场景也更加丰富,AI产品整体水平显著提升。
Agent作为融合感知、分析、决策和执⾏能⼒的智能体,能够根据⽤户历史行为和偏好,主动提供建议、提醒并个性化执⾏能⼒,为用户提供⾼度个性化的任务。其交互的主动性和⾃动化远超现有工具。
从技术和配套设施两方面发展来看,从2025年开始,AI Agent即将⼴泛投⼊使⽤。量子位智库认为,AI Agent有望带来独属于AI 2.0时代的交互⽅式、产品形态和商业模式。
从个性化推荐到直接⽣成个性化内容,AIGC能够使⽤户体验的个性化程度有明显提升,这将帮助产品进⼀步完善⽤户体验,并通过提高用户忠诚度和迁移成本,实现差异化定价和进⼀步的服务增值,对产品的差异化竞争有重⼤意义。
⽬前,基于AIGC的⾼度个性化已经在AI教育(个性化题库及教学安排)、AI陪伴(AI个⼈助理及虚拟伙伴)、AI营销(商品个性化推荐、营销内容个性化⽣成)领域有明显进展。在硬件端搭载的多款AI智能助手也已开始以高度个性的个人助理作为宣传重点。
行业视角
AI智变千行百业:左手变革生产力,右手重塑行业生态
过去的一年里,量子位智库发布多篇深度报告,持续追踪AI技术在千行百业的落地情况及发展潜力。
当前,AI在行业应用中呈现AI+和AI原生两大情境。
在AI+情境中,AI多以生产力工具角色出现,渗透行业各环节;在AI原生情境中,行业则从⼀开始就基于AI技术发展。
量子位智库在《2024年度AI十大趋势报告》中分析了AI在智能驾驶、具身智能、智能硬件、游戏、影视、营销、教育、医疗8个场景的落地效果和行业特点。
总而言之,AI对行业的变革和渗透值得高度关注,但仅有先后早晚、程度轻重之分,而没有有无之争。
AI行业渗透率:数据基础决定初速度,用户需求成为加速度
报告中,量子位智库将AI渗透行业的关键归纳为3类情景、9大因素,以解码行业发展背后不变的规律。
以下图所示的8个代表行业为例:
从AI行业影响力图谱可以看出,当前阶段,AI对各行业的渗透及引发的变革,呈现出较为清晰的三个生态位:
第一梯队中的智能驾驶和具身智能行业对AI技术具有紧密需求和强伴生性,显示出强关联。
第二梯队包括营销、游戏行业、影视行业和智能硬件。前三者通过AI技术实现生产降本增效、深度整合工作流;智能硬件行业有望通过AI技术推动行业升级。
在游戏AI领域中,网易数智作为这一变革的积极推动者,一直专注于 AI 技术的研发与实践。我们提供全链路 AI 解决方案,全面地覆盖了游戏行业的各个关键环节,从研发到发行,从买量到安全,助力游戏行业在玩家体验、玩法创新、安全保障、精细化运营等方面实现全新升级,赋能游戏行业创造更大的商业价值。作为网易旗下专注于企业服务的部门,网易数智游戏行业部一直都在积极为游戏产业贡献力量,并在不断的实践中得到了客户的广泛认可。
游戏AI竞技机器人 - 网易智企
例如,经历了从依赖预设规则到实现自主学习的飞跃式发展,通过强化学习、模仿学习等先进技术开发的游戏 AI 智能体,能够模拟真人操作,实现智能化自学习,不仅展现出高水平的游戏技能,还具备多策略应对和难度可控的特性,极大地丰富了游戏的多样性和挑战性。如今,网易数智游戏行业部通过自研的游戏 AI 智能体技术,为玩家提供接近真人的游戏体验,已广泛应用于棋牌、策略和角色扮演等游戏类型中。
AI 技术在游戏中的应用,不仅提高了游戏的生产效率,同时也提升了游戏的可玩性和互动性。在游戏运营方面,尹竞成表示,网易数智的 AI 技术在游戏运营中的应用,在提升游戏客户服务效率的同时,也为游戏安全“保驾护航”。
其中,网易数智 AI 客服技术通过整合智能客服推荐、多维度多指标训练服务机器人以及行业知识体系和算法模型导入,不仅优化了玩家与游戏的互动,还通过个性化的智能外呼系统,增强了游戏玩家的忠诚度。另外,为维护游戏环境的公正与秩序,AI 技术也被赋予了新的使命——反外挂。基于用户游戏内行为,利用深度学习技术实现的,通过智能风控平台、AI 脚本、工作室行为检测以及 FPS 外挂 AI 识别,为游戏运营提供了全面的安全保障,确保了游戏环境的公平性和健康性。
在游戏营销领域,AI 智能外呼的强交互、高拟人、智能自动化等特点,能够有效提升玩家体验、增加玩家粘性。例如,AI 智能外呼系统通过集成融合 ASR、NLP 和 TTS 技术,实现了与玩家的流畅交互,为玩家提供个性化的互动体验。NPC 的音色生成,为游戏世界中的人物注入生命力,从而极大地增强游戏的沉浸感和情感联系。此外,AI 智能外呼系统还具备惊喜式召回功能,通过发送个性化的语音信息,有效地召回玩家回归游戏。
此外,网易数智通过携手英国 Speech Graphics 公司,推出了语音驱动的面部和角色动画生成技术,这项技术不仅大幅降低了动画制作周期,还显著得提升了动画呈现效果。目前该技术已被应用于《最后生还者2》、《霍格沃茨遗产》、《High On Life》、《生化危机》、《堡垒之夜》、《星战绝地》、《古墓丽影》等游戏中。
在 AI 美术建模、AI 生成音乐、AI 虚拟偶像、AI 视频/面部动捕等创新技术的应用方面,我们也在不断地让技术去落到实地,助力企业提高内容生产效率和质量,为游戏行业的持续繁荣贡献力量。
最后,给大家准备了完整版干货资料,✉我立即get~(LTT936)
《网易数智年度技术精选合集》
《2023泛娱乐出海白皮书》