智谱发布GLM-4全家桶：性能提升60%，多模态、128K长文本，全能All Tools及GPTs商店

分享好友最新动态首页最新动态分类切换频道

智谱发布GLM-4全家桶：性能提升60%，多模态、128K长文本，全能All Tools及GPTs商店

2024-12-26 03:27

以下内容节选自硅星GenAI、深网腾讯新闻对智谱AI CEO 张鹏的访谈。

硅星GenAI：智谱AI在垂直领域的商业化很早，给外界的感觉一直是比较 to B，GLM 模型智能体会是一个跟 GPTs 很像的东西吗，还是不一样？

张鹏：商业化落地这件事还是围绕着我们模型价值本身。我们早期的模型能力不太够，那可能就需要去为了填补模型本身的能力和最终业务需求之间的 gap，而去垂直领域多做一点事情。

你不去做，你不知道客户在想什么，也就不知道你的技术最终帮助客户提升的用户价值到底有多少。

这实际上是我们去寻找 Best Practice（最佳实践）的一个过程。我们希望把这个路径蹚通，回过头来把这些东西沉淀下来之后赋能给生态。

硅星GenAI：所以可以这么理解，我们做很多垂直领域的事，其实是为了反哺通用模型的基础能力提升。做的目的是为了以后不做。

张鹏：对。GLM 模型智能体就是在探索一种更通用的路径。

张鹏：如果我们现在真的进入到了大模型的应用半场的话，产品能力是大家都很关注的一件事。

智谱 AI 之前也有自己的一些产品化的东西，其实用户量都还不错，我觉得产品能力应该来说还不算差，当然我们会持续的在这方面去加强。

但是反过头来讲，你看 ChatGPT，作为一个产品本身没有什么特别复杂的东西。所以——我个人感觉，因为我不是做产品出身——所谓产品力这个东西，在这个时代它变成了一种对需求的敏锐感知能力和对于新技术的领悟能力的兼顾，在这个基础上，考验的是如何揉合这两种能力，去产生一种新的产品表达形态的这样一种复合的能力。

硅星GenAI：这跟移动互联网时期的小步快跑、快速迭代和敏捷开发这些东西可能是不一样了。

张鹏：这一套沉淀下来的产品开发逻辑还在，尤其是 ToC。但为什么现在大家说要找一款所谓的 Killer App 这么难，好像所有的产品经理都没有头绪。

我个人觉得其实矛盾在于，原来传统的互联网爆款的产品经理，他对于现在最新的技术没办法理解。真正懂技术的这些人，对于所谓的用户需求和产品需求又没法理解。

好像现在只能开发者自己去尝试，但在这之外，其实有一些本质的东西做产品的人可以在间隙思考一下。

回到第一性原理，大模型本质上解决了什么样的问题，找到这个点，然后你把你所有需求写出来，然后你去找到这两者间的连线。

比如我反问你，ChatGPT 解决的是什么问题？你第一天用上，它就直接告诉你这是个不一样的东西，从来没有人想过这个问题——虽然他帮你解决了很多问题。

硅星GenAI：所以 ChatGPT 解决了什么问题？

张鹏：我个人认为它最本质上解决的还是人机交互的问题。机器终于有一天能够比较像样的能听懂人说什么，然后说出来的话也让人能听懂。这个是个本质的问题，它弥合了人和机器之间的距离，这是他第一性要解决的问题。

顺着这个思路，哪些场景可以被这件事情解决掉，很容易判断出自动客服这类的需求。

这是大模型解决的第一件事。第二是大模型在经过大量语料数据训练之后，具备超越一般人积累的知识和数据量，能很好的去解答人们日常生活当中的问题。这件事本质上解决的是我们人类社会当中人与人之间的信息和知识传递的成本和范围问题。

深网：从技术上看，国内的大模型能赶超 GPT 吗？

张鹏：现在还是一个追赶的态势，我们也一直在缩小之间的差距，毕竟后发有后发的优势，也省去了前面的一些探索，把精力集中在相对正确的路径上。但说实话，光靠这样的东西不太可能实现超越的，因为大家的路径是一样的，因此最后你可能最多做到和 tGPT 一样。

这正是智谱选择自研 GLM 预训练框架的原因。我们尝试用局部的或者整个链条中的一些创新突破，来提升我们追赶的速度。

OpenAI 起步比较早，发展的速度体现为曲线的斜率，国产大模型起步比它晚，只有用一点一点的积累去调整发展速度，调整曲线的斜率，才有可能预期会越来越近，会有一个交叉的点。

因此，算法、系统工程、数据、应用到落地等等这一个链条上，所有的创新累加起来，才有可能去超越它。

深网：在您看来，国内大模型目前和硅谷的差距主要在什么维度？

张鹏：差距从各个方面都能列举一些出来，我觉得本质还是大家对这个事情的认知。以 OpenAI 和谷歌这些世界顶尖级团队为代表，他们对大模型的认知一定是非常高的。

深网：为什么存在这种差异？

张鹏：去年参加一些论坛和圆桌，大家讨论认为，中国人不太擅长 0 到 1，但很擅长 1 到 100。我在思考为什么？大家去总结过去的一些事情，以移动互联网和互联网举例，中国都不是技术的起源，但从应用的角度来说，中国的公司跑的都很猛，超过了美国公司。

当然这些过去不足以去贴一个标签，限制自己去想 0 到 1 的事情，我一直在想，我们应该能够把这个标签彻底扔掉，不要用它来限制自己创新和进步的脚步。

如果你关注大模型领域，欢迎扫码加入我们的大模型交流群，来一起探讨大模型时代的共识和认知，跟上大模型时代的这股浪潮。

更多阅读

Bill Gates 对谈 Sam Altman：AGI 五年内的发展预测，以及将如何改变人类社会？

在 AI 时代称王还是被取代？关于 Canva 的八个思考

CES上的惊喜AI硬件！199美元、真正的AI助手rabbit r1，可以帮用户操作任意app

苹果官宣 Vision Pro 2 月 2 日上市！它为什么能值 3499 美元？

那些百亿美金 APP 的前 1000 个用户都是怎么来的？