AI究竟是入口,还是效率工具?

   日期:2024-12-26    作者:rlrtco1688 移动:http://mip.riyuangf.com/mobile/quote/53160.html

来源:雪球App,作者: 枯叶先生,(https://xueqiu.com/1010392927/316861054)

这两年AI热潮是一个永恒的话题,市场对之关注度也很高。新技术也不断刷新人们的耳目,从文本生成到代码生成,从智能搜索到AI阅读,从创意绘画到Sora问世,……,一个接一个的惊喜呈现在面前,一个接一个的担忧也随之袭来。

虽然我不是这方面的专家,但也对之持续紧密地跟踪着,因为AI将会带来人们生活工作效率的全面提升。于是,早在去年年初曾经通过三篇长文(《ChatGPT一定是搜索的助手吗?还是有一天会翻身做主人》,《谈谈我了解的ChatGPT》和《如何看待这波人工智能的热潮》)记录下了对AI肤浅的理解。

通过这两年持续的观察,AI的发展基本符合当初的猜测。然而,随着这几个月豆包热度持续上升(见下图),市场又开始热议“AI将改变互联网入口”的话题,甚至很多人又开始担心AI将撼动的基石。

如果单从下载量来看,豆包的确超出市面上其他产品太多,大有袭卷一切的态势。然而,这仅仅是一种表相。首先,各家训练的大模型并不等于我们所看到的App,我们手中的App仅仅是基于大模型开发的一种应用,无论是撰文、写代码、生成图片,还是文生视频等,皆是用此大模型喂给特定数据后开发出的一种应用。

从我个人这几个月的持续跟踪试用来看,各家模型差异并不象大家想象得那么大。豆包强在语音亲和度更高、智能体更加多样化,其它方面,如撰文、智能阅读、写代码、文生图、文生视频啥的并不突出。

下面是豆包和元宝智能体的对比:

看到了吗?豆包智能体不但丰富,其入口还很浅,经常还会推荐不同的智能体给你试用。而元宝的智能体却藏在应用广场中,如不寻找还发现不了,进去后也只有《庆余年》和《长相思》两部影片中仅有的几个人物,不仅不会推荐更多的智能体,点开里面的人物对话,给人的感觉也是爱搭不理的(的确符合影片人物特性),完全没有聊下去的兴趣。

也许大家已经发现,豆包对小朋友的吸引力特别强,那个几个奥特曼、孙悟空、小猪佩奇、玉皇大帝啥的就比叶轻眉、林婉儿、李承泽更广为人知,更讨人欢心。而对于工作中经常要搜寻数据、处理表格、分析文档的成人,豆包似乎并不比元宝更出色,甚至还逊色不少。

试问,如果元宝发力全面复制豆包的音色和智能体,这很难吗?因此,对这两天,市场广为流传的豆包未来的入口之争,我却持不同的观点,具体理由如下:

人工智能的发展离不开四点: 算力、算法、数据和场景。从目前看来,各家算力和算法并无明显差异,但数据和场景却存在明显不同。

一、数据:

众所周知,一个大模型的好坏和用于训练的数据多少和好坏紧密相连,各家大厂在数据方面各有千秋,手上有最多最全的商品交易数据,抖上有最佳的短视频数据,手上有丰富的搜索数据,手上有微信、公众号、搜一搜、短视频、小程序交易等各种综合数据。因此,大厂数据方面各有千秋,但腾讯绝对不是一个缺乏数据的存在,其丰富度,甚至更胜一筹。因此,你能看到在AI搜索方面腾讯还略胜一筹,毕竟大量高质量的公众号文章是其独有的存在。

然而,据Epoch AI Research研究团队预测,到2026年,现存的用于AI模型训练的高质量语言数据将耗尽。信息技术研究和分析公司Gartner发布的研究报告也提到,到2030年,合成数据将成为AI模型的主要训练数据来源,而在此之前,高质量数据的短缺将是一个长期存在的问题。

但无论是数据合成,还是数据拥有量上,各家大公司也具有绝对的优势,特别是掌握多维度数据的。

二、场景落地

对大模型来说,差异最大的还不是数据,而是落地场景。而落地场景又分为to C和to B,我们通常看到的个人助手,豆包、元宝、kimi等等也仅仅是to C方面的冰山一角。更不要说藏在水面下的to B部分了。

从目前的跟踪观察来看,各家大模型的发力点并没有放在to C上。虽然C端(消费者市场)潜力巨大,但大模型在B端(企业服务市场)的商业化应用却率先取得显著进展。各家大模型开发企业都将自身大模型应用与云计算结合,替代传统云计算,为大模型应用在企业生产力场景中的规模落地提供关键支撑。

造成这种局面的原因主要在于: 虽然C端市场用户基数大,机会更多,但由于功能单一等因素(个人助手),导致消费者对于大模型的付费意愿并不强。而B端企业更愿意为大模型产品付费,最主要是其能够直接提升业务效率、降低成本,并增强竞争力。因此,B端市场在大模型应用方面展现出了更大的潜力和商业价值,商业化模式也逐步得到验证,商业逻辑已初具雏形。这一方面不仅可以从一些报道中可以观察到,从各家财务报表的阐述中也能发现一些端倪。

因此,在面向企业决策应用场景时,依托智能体协同技术,结合工作流、数据流、决策流,AI大模型能帮助企业在复杂商业环境中实现智能决策,为长远战略发展提供支持。相较而言,B端商业模式开发难度也小于C端。在B端付费意愿更强的背景下,各家大模型企业更加注重B端的投入力度,以求拥有持续的盈利模式。在当下融资困难的环境下,这种策略是正确的,很多早期的创业公司已陷入无米下锅的窘境。

哪怕是字节,也开始意识到问题。据智能涌现报道:

豆包目前的用户活跃度并不算高,每周仅活跃2至3天,且每天用户发送消息轮次仅为5到6次,单次2分钟左右,用户人均使用时长仅为10分钟左右。上述这些数据在过去一年中的增长幅度并不显著。

字节内部有管理层提出,这可能并非豆包的问题,豆包的相关数据已经是国内产品第一梯队,类似ChatGPT这种基于文本的对话类产品,大概率不是最理想的产品形态。

根据QuestMobile的第三方监测数据,过去一年,豆包、Kimi、文小言等产品的用户日均使用频次,均在4到5次之间徘徊,人均使用时长也基本位于5到10分钟之间,没有明显变化。

有知情人士透露,字节内部判断,付费订阅模式在中国不太可能走通。而时长和轮次太低,又导致潜在的广告空间较小,这都构成了这类产品的隐形天花板。

而这方面,拥有最为广泛应用的企业微信和腾讯会议,有有强大的云计算基础设施作为后盾,你说分不了一杯羹我肯定是不相信的。

三、AI是效率之争,还是入口之争?

经过上面的分析阐述,无论是工业效率提升场景(to B),还是消费市场落地场景(to C),其核心仍是对现有场景效率提升的工具。除了陪聊和未来可能的人形机器人属于新的场景外,写代码、文本生成、智能绘画、视频生成、智能阅读等等,皆为对原有工作生活场景的提效,并不象智能手机出现后对很多应用的场景延伸,如购物不再局限于坐在电脑旁,地铁上,床上,路上皆可随心购。

当然,何谓入口呢?所谓入口其本质就是对“需求更好的满足后,吸引了更多人的应用”。以前占据了搜索入口,现在还是吗?过去占据了手机入口,但智能手机出现后被吊打; 是入口吗?淘宝是入口吗?是入口吗?微信是入口吗?抖快视频号是入口吗?……。你看,入口被泛化后很迷人,却很容易掉入陷阱; 但具化后其实并不神秘,核心就是对需求的满足,谁更好地满足了需求就占有了入口。AI仅仅是提效工具,使各家能够更好地、更高效地满足用户需求。

目前仅仅就用豆包热度来预言入口的变化,似乎太过危言耸听了,更何况细看下来,其亮点更多的在于表相,并非技术能力上甩开了对手。

另外,大家再想想,切换一个“个人助手”的成本真的比切换一个购物平台更高吗?再进一步看,和切换一个聊天工具比呢?

于是,我更相信在24年一季度说明会上的阐述:

这确实对我们来说是一个增长的加速器。首先,我们的业务本身就是非常关注社交以及通讯还有游戏,我们大部分业务都是关注于用户之间的沟通,需要高质量的内容,而基于这一点,这样的用户之间的服务和内容很难被人工智能所生成的内容或是基础模型取代,但是基础模型还有包括其他的新的技术可以加持人和人之间互动的产品或场景,但是不会取代人的工作。从这个角度来说,我们采取的战略是会在资源上进一步投资,来建立自己的基础模型,因为我们相信通过这样的方法能够助力我们未来各业务线条的发展,与此同时我们也能够通过这样的一种投入帮助今后推广新的业务,进一步提升用户间的交流,进一步提升人机互动。我们的解决方法是希望能够做得对而不是做的急,我们要确保基础模型的基础打好、打牢,而且要有非常稳的根基。从我们的角度来说,首先要推出多个基础模型的迭代版本,他是一个长期的游戏,是一个长期的旅行,也需要不断地迭代,我们相信这也是未来可能会推出的应用的领域。所以对我们来说这是一个商业机会,是我们可以去逐渐建立的,而不是要马上解决的商业机会,我们希望把资源投放到聚焦的领域,但与此同时也能够建立我们的能力,建立我们的基础模型,能够更好地助力公司业务的可持续发展,我们相信从能力的角度来说,我们有数据、用户引力、云以及包括计算和云的基础设施建设,同时我们也一直在人工智能方面有非常广泛的经验,我相信建立这些优势能够助力我们业务线的进一步发展。从基础设施建设的角度来说,我们现在确实已经有了很多芯片能够帮助实现模型的打造,同时,我们有非常强的云业务,以及包括相关的技术的到位,能够帮助我们更好地去可扩展地、以较高的密度进一步提升产品的性能,最终真正帮助我们完成基础模型的培训,特别是模型几次迭代后的复杂度提升,需要大量的计算能力来进行培训。从商业化角度来说,我们认为人工智能是一个加速器,他将会进一步地改善我们现有业务,同时帮助加速我们的商业化,比如说我们可以使用生成性的内容聚焦广告在目标受众上的投放,同时能够进一步提升我们的效率,大家可以看到很多的内容平台以及内容业务可以使用这些技术来进一步地实现内容的生成,对于创造者、对腾讯而言都是一种高效率的方式,而且参与者的参与程度会进一步地提升,特别是对用户端来说。与此同时我们也会更加关注一些新的业务机会,对新的业务机会来说,我们认为可能业务模式会不断地截断,首先要创造一些有用的东西,之后再考虑有效的商业模型,这对我们来说是一个非常激动的机会。

四、大模型综合评测:

上面谈到,市场上的喧嚣可能仅仅停留于表面现象,很多观点往往停留于个人感觉,很难给出比较客观的评测数据。下面,我们看看业内比较公认的大模型评测排名:

8月:

10月:

从此排名不知大家发现没有,混元大模型并不象大家想象得那么不堪,虽然出来的比较晚,但在8月排名中,混元甚至达到仅次于业界标杆ChatGPT-4o的水平,哪怕是10月最新评测数据,也排在豆包之前。


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号