分享好友 最新动态首页 最新动态分类 切换频道
智谱发布GLM-4全家桶:性能提升60%,多模态、128K长文本,全能All Tools及GPTs商店
2024-12-26 03:27


智谱发布GLM-4全家桶:性能提升60%,多模态、128K长文本,全能All Tools及GPTs商店

以下内容节选自硅星GenAI、深网腾讯新闻对智谱AI CEO 张鹏的访谈。

硅星GenAI:智谱AI在垂直领域的商业化很早,给外界的感觉一直是比较 to B,GLM 模型智能体会是一个跟 GPTs 很像的东西吗,还是不一样?

张鹏:商业化落地这件事还是围绕着我们模型价值本身。我们早期的模型能力不太够,那可能就需要去为了填补模型本身的能力和最终业务需求之间的 gap,而去垂直领域多做一点事情。

你不去做,你不知道客户在想什么,也就不知道你的技术最终帮助客户提升的用户价值到底有多少。

这实际上是我们去寻找 Best Practice(最佳实践)的一个过程。我们希望把这个路径蹚通,回过头来把这些东西沉淀下来之后赋能给生态。

硅星GenAI:所以可以这么理解,我们做很多垂直领域的事,其实是为了反哺通用模型的基础能力提升。做的目的是为了以后不做。

张鹏:对。GLM 模型智能体就是在探索一种更通用的路径。


张鹏:如果我们现在真的进入到了大模型的应用半场的话,产品能力是大家都很关注的一件事。

智谱 AI 之前也有自己的一些产品化的东西,其实用户量都还不错,我觉得产品能力应该来说还不算差,当然我们会持续的在这方面去加强。

但是反过头来讲,你看 ChatGPT,作为一个产品本身没有什么特别复杂的东西。所以——我个人感觉,因为我不是做产品出身——所谓产品力这个东西,在这个时代它变成了一种对需求的敏锐感知能力和对于新技术的领悟能力的兼顾,在这个基础上,考验的是如何揉合这两种能力,去产生一种新的产品表达形态的这样一种复合的能力。

硅星GenAI:这跟移动互联网时期的小步快跑、快速迭代和敏捷开发这些东西可能是不一样了。

张鹏:这一套沉淀下来的产品开发逻辑还在,尤其是 ToC。但为什么现在大家说要找一款所谓的 Killer App 这么难,好像所有的产品经理都没有头绪。

我个人觉得其实矛盾在于,原来传统的互联网爆款的产品经理,他对于现在最新的技术没办法理解。真正懂技术的这些人,对于所谓的用户需求和产品需求又没法理解。

好像现在只能开发者自己去尝试,但在这之外,其实有一些本质的东西做产品的人可以在间隙思考一下。

回到第一性原理,大模型本质上解决了什么样的问题,找到这个点,然后你把你所有需求写出来,然后你去找到这两者间的连线。

比如我反问你,ChatGPT 解决的是什么问题?你第一天用上,它就直接告诉你这是个不一样的东西,从来没有人想过这个问题——虽然他帮你解决了很多问题。

硅星GenAI:所以 ChatGPT 解决了什么问题?

张鹏:我个人认为它最本质上解决的还是人机交互的问题。机器终于有一天能够比较像样的能听懂人说什么,然后说出来的话也让人能听懂。这个是个本质的问题,它弥合了人和机器之间的距离,这是他第一性要解决的问题。

顺着这个思路,哪些场景可以被这件事情解决掉,很容易判断出自动客服这类的需求。

这是大模型解决的第一件事。第二是大模型在经过大量语料数据训练之后,具备超越一般人积累的知识和数据量,能很好的去解答人们日常生活当中的问题。这件事本质上解决的是我们人类社会当中人与人之间的信息和知识传递的成本和范围问题。


深网:从技术上看,国内的大模型能赶超 GPT 吗?

张鹏:现在还是一个追赶的态势,我们也一直在缩小之间的差距,毕竟后发有后发的优势,也省去了前面的一些探索,把精力集中在相对正确的路径上。但说实话,光靠这样的东西不太可能实现超越的,因为大家的路径是一样的,因此最后你可能最多做到和 tGPT 一样。

这正是智谱选择自研 GLM 预训练框架的原因。我们尝试用局部的或者整个链条中的一些创新突破,来提升我们追赶的速度。

OpenAI 起步比较早,发展的速度体现为曲线的斜率,国产大模型起步比它晚,只有用一点一点的积累去调整发展速度,调整曲线的斜率,才有可能预期会越来越近,会有一个交叉的点。

因此,算法、系统工程、数据、应用到落地等等这一个链条上,所有的创新累加起来,才有可能去超越它。

深网:在您看来,国内大模型目前和硅谷的差距主要在什么维度?

张鹏:差距从各个方面都能列举一些出来,我觉得本质还是大家对这个事情的认知。以 OpenAI 和谷歌这些世界顶尖级团队为代表,他们对大模型的认知一定是非常高的。

深网:为什么存在这种差异?

张鹏:去年参加一些论坛和圆桌,大家讨论认为,中国人不太擅长 0 到 1,但很擅长 1 到 100。我在思考为什么?大家去总结过去的一些事情,以移动互联网和互联网举例,中国都不是技术的起源,但从应用的角度来说,中国的公司跑的都很猛,超过了美国公司。

当然这些过去不足以去贴一个标签,限制自己去想 0 到 1 的事情,我一直在想,我们应该能够把这个标签彻底扔掉,不要用它来限制自己创新和进步的脚步。



如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。



更多阅读

Bill Gates 对谈 Sam Altman:AGI 五年内的发展预测,以及将如何改变人类社会?

在 AI 时代称王还是被取代?关于 Canva 的八个思考

CES上的惊喜AI硬件!199美元、真正的AI助手rabbit r1,可以帮用户操作任意app

苹果官宣 Vision Pro 2 月 2 日上市!它为什么能值 3499 美元?

那些百亿美金 APP 的前 1000 个用户都是怎么来的?

最新文章
360小工具单文件版 适用平台:PC
提到360,许多人会想到什么?我猜许多人的第一反应是“流氓软件”、“小火箭”、“弹窗满天飞”、“广告多”、“难卸载”等等。没错,如果你安装了360全家桶,这些问题就会接二连三地出现。不过说实话,360真的那么糟糕吗?或许我们可以从
056期专家[李南]双色球6+1精准预测
玩法本期推荐上期推荐命中情况红球24码03,04,05,0607,08,09,1214,15,17,1819,21,23,2425,26,27,2829,31,32,3302,03,04,0708,09,10,1213,14,16,1718,19,20,2223,24,25,2627,28,29,31对5码红球21码04,05,06,0708,09,12,1415,18,19,2123,24,26
24年福彩3d341期专家[世家]包星预测
中国福彩中心3D上期奖号->278(组六)。双单双,小大大,和值17[和尾7],跨度6今期福彩3D定位除三余数点评百位近七期除三余数分别开出0路:2个、1路:0个、2路:5个。本期百位推荐参考号码1579十位近七期除三余数分别开出0路:3个、1路:4个、2路:0个
Flink-SQL管理工具flink-streaming-platform-web部署
flink-streaming-platform-web系统是基于Apache Flink 封装的一个可视化的、轻量级的flink web客户端系统,用户只需在web 界面进行sql配置就能完成流计算任务。 主要功能:包含任务配置、启/停任务、告警、日志等功能,支持sql
2024招商林屿境售楼处(招商林屿境)官方网站-百度百科-广州房天下
最近广州楼市讨论最火的莫过于四代住宅很多老铁跟老K感叹,终于有机会割一回开发商韭菜了其中在四代住宅里面,最逆天的莫过于南沙横沥岛的招商蛇口林屿境85平三房,实用面积105/110平,实用率约128%起;110平四房,实用面积153/158平,实用
AI工具站独立开发者出海用好这七步,精准挖掘需求
最近发现很多新出海的程序员朋友,对选品或者需求挖掘还没有太强的认知,还不知道怎么选一个真正利基市场,往往盲目找了个词就去吭哧吭哧一顿折腾,上了站,最后结果就是流量几个几个,不了了之。千万不要“你自己觉得好用”,一定要学会判
2024国家都有什么学校排名
以下是2024年全球大学排名的部分信息:QS世界大学排名牛津大学位列榜首斯坦福大学位列第二麻省理工学院位列第三哈佛大学位列第四剑桥大学位列第五普林斯顿大学位列第六加州理工学院位列第七新加坡国立大学位列第八北京大学位列第17位清华大
2023最流畅的手机浏览器是哪个软件好用
2023最流畅的手机浏览器是哪个软件好用目前市面上的很多主流手机浏览器越来越臃肿了,一打开浏览器,页面充斥着各种各样的信息和广告。对于那些只想好好搜索,不想要那么多复杂功能的用户来说,造成一定的阻碍。目前最流畅的和机浏览器是哪
iOS 动态库和静态库
静态库和动态库的区别 .a文件肯定是静态库,.dylib肯定是动态库,.framework可能是静态库也可能是动态库;静态库在链接时,会被完整的复制到可执行文件中,如果多个App都使用了同一个静态库,那么每
相关文章
推荐文章
发表评论
0评