智谱宣布完成新一轮30亿元融资，将继续投入基座大模型｜甲子光年

分享好友最新动态首页最新动态分类切换频道

智谱宣布完成新一轮30亿元融资，将继续投入基座大模型｜甲子光年

2024-12-26 10:13

从中国的OpenAI，到世界的智谱。

作者｜赵健

大模型的融资节奏在放缓，但远没有结束。

12月17日，“大模型六小虎”之一的智谱宣布完成新一轮30亿人民币融资，引入多家战投及国资，君联资本等老股东继续跟投。

这是智谱近期可查的第二轮融资。今年9月，中关村科学城公司宣布以投前200亿估值领投智谱。智谱成为当前估值最高的国产大模型公司之一。

同时，智谱也首次公开其商业化成绩： 2024年商业化收入增长超过100%，平台日均Tokens消耗量增长150倍。其中，MaaS平台的API年收入同比增长超过30倍，MaaS平台已经吸引了70万企业和开发者用户。

智谱业务覆盖智能汽车、制造、大消费、金融、政务服务、医疗健康、游戏娱乐、文化旅游等行业，近期推出的Agent带动大模型在智能设备的落地。

C端产品智谱清言App拥有超过2500万用户，年化收入（ARR）超千万。清言可以通过文本、图像、音频、视频来进行多模态互动，是拥有最全模态的AI助手。

对于本次融资，智谱打算怎么花？还会继续做预训练吗？

此前业内曾有传闻有两家大模型公司放弃预训练。在上周的2024甲子引力年终盛典上，智谱CEO张鹏对此明确回复：“ 我们肯定一直在做预训练，今年8月份还刚刚发布了最新迭代的模型GLM-4-Plus。按照我们的节奏，差不多4～6个月就会迭代一版新模型。”

今天的大模型有从预训练转向后训练的趋势，OpenAI发布的o1模型就代表了向推理的范式转移，国内已经有AI公司在迅速跟进。关于智谱在预训练与后训练推理的算力分配，张鹏也在甲子引力现场透露，“大约一半一半”。

智谱表示，本轮融资将用于智谱基座大模型的进一步研究， 从回答问题升级到解决复杂推理、多模态任务，更好地支撑行业生态发展。

在国内的“大模型六小虎”里，智谱是最稳扎稳打的一名。2023年年初，智谱曾定下目标：用一年的时间追平OpenAI最先进的模型。此后两年时间里，智谱大部分资源都投入在了确定性最高、风险最小的领域，那就是紧盯行业内最好的AI公司——OpenAI，从底层的预训练框架，到模型，到最上层的应用，做全方位的对标。

在预训练层，智谱在2020年自研了预训练框架GLM（General Language Model），这是与OpenAI的GPT（Generative Pre-trained Transformer）并不相同的技术框架。

基于GLM预训练框架，智谱在2021年训练完成百亿参数模型GLM-10B，同年利用MoE架构成功训练出收敛的万亿稀疏模型，2022年研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。GLM-130B已经实现大模型在昇腾、海光、神威等国产平台上的从零训练，适配在寒武纪、摩尔、燧原等国内外40多种GPU芯片上的高效推理。

基于全自研基座大模型的能力，智谱打造了完整的模型产品，包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。

图片来自智谱

2023年，智谱推出千亿基座对话模型ChatGLM并两次升级，开源版本的ChatGLM-6B让大模型开发者的本地微调和部署成为可能。目前，智谱开源模型系列全球累计下载量超过3000万，并入选Hugging Face平台最受欢迎人工智能机构。

2024年1月，智谱推出新一代基座大模型GLM-4，整体逼近GPT-4；6月，智谱开源GLM-4-9B及视觉模型GLM-4V-9B，多模态能力媲美GPT-4V；7月，智谱推出视频生成模型CogVideoX以及视频生成产品“清影”，与Sora直接对标；8月，智谱新升级基座大模型GLM-4-Plus推出；10月，智谱发布对标GPT-4o的端到端情感语音模型GLM-4-Voice。

如果智谱的发布节奏停留在此，可以说智谱仍然只算是一名追赶者，OpenAI始终领先半步。但接下来，智谱在10月发布大模型交互智能体AutoGLM，以及11月的升级版本和GLM-PC，意味着智谱真正走到了探索AI创新的最前沿。

AutoGLM与GLM-PC是智谱发布的Agent产品，前者可以模仿人类操控手机（phone use），后者可以模仿人类操控电脑（compute use）。在11月的发布会上，张鹏在现场演示了用AutoGLM在微信里建群并在群里发出了100个、总价值2万元的红包。

萨姆·奥尔特曼也非常看好Agent技术的突破，但OpenAI目前尚未发布类似产品。

此前，智谱公布了其接下来面向AGI的的路线图。

智谱定义了大模型发展的五个阶段，与OpenAI的定义有所不同，其中，L1代表语言能力，L2代表逻辑思维能力与多模态能力，L3代表使用工具（Agent）的能力，L4代表自我学习的能力，L5代表全面超越人类、探究科学规律的能力。

图片来自智谱

并且，智谱也提出了他们认为每一个阶段的进度条。目前，L1的语言能力已经达到80%；L2的逻辑思维能力完成度为60%，o1模型是推理模型的新范式；L3 Agent的能力还比较早期，只有40%，与人类相比还有很大的提高空间；L4、L5基本才刚刚开始。

张鹏认为，目前的Agent能力更像是在用户和应用之间，增加一个智能的调度层，链接所有应用甚至是所有设备。 这可以看做是大模型通用操作系统（LM-OS）的一种雏形。未来，基于大模型智能能力（从L1到L4乃至更高），有机会实现原生的人与机器交互的方式LM-OS，这将改变人与机器交互的方式。

去年，大模型公司都被看作“中国的OpenAI”，某种程度上这仍然是跟随者的标签。自从2023年下半年开始，智谱就在很多场合强调，做中国的ChatGPT远非公司的目标。

很多人可能忽略了，智谱成立于2019年，远远早于ChatGPT发布的时间点。智谱成立的第一天，就写下了“让机器像人一样思考”的愿景，这跟今天的AGI殊途同归。

据「甲子光年」了解，今年有智谱员工在飞书的个性化签名上写着： “不做中国的OpenAI，做世界的智谱”。

这句话也可以看作智谱通往AGI之路的必经之路。