分享好友 最新动态首页 最新动态分类 切换频道
AI真的要“断粮”了?OpenAI创始人的最新警告震动全球,但他可能忽略了这个事实...
2024-12-26 13:54

你可能想象不到,就在几天前的NeurIPS会议上,OpenAI的联合创始人Ilya Sutskever抛出了一个令整个AI圈震惊的观点:'我们熟知的预训练模式必将终结。'

等等,预训练不是AI发展的基石吗?为什么会终结?

预训练是 AI 模型开发的第一阶段,大语言模型通过互联网、书籍等海量未标记数据来学习模式。

让我们先回到AI发展的核心驱动力 -算法、算力、数据这'三驾马车'。如今,随着硬件升级和数据中心扩建,算力呈指数级增长;随着技术突破和持续创新,算法不断进步。‍

不过,笔者对这个观点并不完全认同。

中国古人讲“温故而知新”,同样的内容在不同阶段重新学习,往往能获得新的理解和启发。对AI系统来说也是如此,随着算法的进步和模型架构的改进,重新处理已有数据可能会挖掘出此前未能发现的模式和关联。

而且,现有的互联网数据质量参差不齐,如果能通过更好的数据清洗和筛选提升训练数据的质量,可能比简单地扩大数据规模带来更显著的效果提升。

当然,高质量的新数据依然是AI发展的重要推动力,它能为模型带来全新的知识领域和应用场景。关键在于如何平衡和优化这两个维度:一方面深化对已有数据的理解,另一方面不断拓展新的数据来源。而且,互联网也并非静态存在,每天都有海量新的内容被创造出来。

更值得深思的是,如果说目前的数据已经接近枯竭,那就意味着现有的大模型已经用尽了世界上所有的有效数据,却只达到了目前这样的水平——这显然不够令人信服。事实上,我们有理由相信,无论是在数据利用效率还是模型架构上,都还有很大的优化空间。

因此,仅仅因为可能面临'数据枯竭'就断言AI发展将遇到天花板,似乎还为时尚早。

从十层神经网络到现实的瓶颈

为了更好的理解预训练,让我们回溯到10年前。2014年,Sutskever提出了一个看似简单的'深度学习假设':一个十层神经网络就能模仿人类在瞬间完成的任何任务。选择十层的原因很实际——当时的技术条件只能支持这个规模。这个假设建立在人工神经元和生物神经元的相似性基础上。

但有一个关键的区别:人脑可以自我重构,而AI系统需要与其参数规模相匹配的海量训练数据。这就像一个永远饥饿的巨人,需要越来越多的“养料”才能继续成长。

这个想法开创了预训练时代,催生了GPT-2、GPT-3等里程碑式的模型。这一重大进展要归功于前OpenAI同事Alec Radford和Anthropic创始人Dario Amodei的贡献。但现在,Sutskever认为这种方法似乎已经触及天花板。有意思的是,Alec Radford和Dario Amodei倒没有提出这样的观点。

-AI代理:发展具有真正独立思考能力的系统, 不再依赖纯数据训练

-合成数据:创造高质量的新型训练数据,他称这是'重大挑战'

-增强推理计算:在推理阶段投入更多计算资源,而不是一味扩大预训练规模

他预测,下一代模型将具有'真正的代理特性'。'代理' (Agent) 已成为 AI 领域的热词,虽然他没有详细解释,但业内普遍认为这指的是能够自主执行任务、做决策并与软件交互的 AI 系统。尽管当前系统的'代理性'还很初级,但随着独立思考和推理能力的发展,这种情况将发生改变。

除了代理特性,他表示未来的系统还将具备推理能力。不同于当前主要依赖模式匹配的 AI,未来的 AI 系统将能够像人类思考一样逐步推理。

Sutskever 指出,系统的推理能力越强,其行为就越难预测,就像顶级国际象棋 AI 的走法经常让特级大师也感到意外一样。

'它们能够从有限数据中获取洞察,'他说,'而且不会产生混淆。'而且向真实推理的转变可能有助于减少AI的'幻觉'现象

这场“数据危机”很可能重塑整个AI行业的发展路径。但与1970年代的石油危机不同,数据资源的优化还有更多可能性:提升数据质量、改进处理方法、深化对已有数据的理解,以及探索新的学习范式。

在这个充满挑战和机遇的时代,谁能在数据质量提升、已有数据深度挖掘以及新数据获取三个维度取得突破,谁就可能成为下一个AI时代的引领者。

最新文章
提升外链实力,下载免费外链工具软件368
外链是搜索引擎优化 (SEO) 的关键因素,有助于提高网站的知名度、信任度和排名。为了帮助网站管理员和 SEO 专业人员轻松有效地建立外链,本文提供了全面的网站外链建设规划计划和执行方案,并精心挑选了免费且强大的外链工具软件下载。外链
马斯克并非狗狗唯一支点,蚂蚁L9 来特DOGE性能王者
备受政客支持的狗狗币的当前价格为0.42728美元,24小时内的涨幅为1.81%,其未来走势是被看好的。自美国选举日以来,狗狗币的价格已经上涨了惊人的153%,比特币在同一时期也上涨了30%。因为狗狗币等数字货币在短期内取得了显著的涨幅,所以
遂宁国家农业科技园区管委会 “遂宁国家农业科技园区瞿河百亿农产品加工园区总体规划”环境影响评价报批前公示
根据《中华人民共和国环境影响评价法》及《环境影响评价公众参与办法》(生态环境部令第4号)等相关规定,现公开拟报批的遂宁国家农业科技园区管委会《遂宁国家农业科技园区瞿河百亿农产品加工园区总体规划环境影响报告书》和公众参与说明
流浪猫冬天怎么帮它们保暖
冬天可以通过给猫咪提供猫窝、取暖设备、补充营养等方式来帮助猫咪过冬。1、提供温暖的猫窝:为猫咪准备一个舒适的猫窝是保暖的基础。猫窝应该选择不易透风、蓬松保暖的毛绒材质,并且尺寸要适中,以便猫咪蜷缩在其中感到温暖和安全。2、使
怎么创建小程序商店、excel怎么添加小程序商店?
网上搜索小程序推广方法,有很多,对商家而言,有的也是一脸懵,不实用或不靠谱。为此,得有店总结了下四种实用的小程序商城推广方法,希望对各位商家的运营有所启发。一、微信公众号结合小程序引流做运营的,几乎人人都有微信公众号,并积
简洁新闻资讯信息流类网站WordPress模板主题(含手机站)
简洁新闻资讯类网站wordpress网站主题模板编码:UTF-8。简洁新闻资讯类网站WordPress模板主题是含手机站模板。这是一款利于SEO的Wordpress模板,手工CSS+DIV,图片ALT,H系列标签已合理运用。并且同步手机站功能,手机站很强大,带同步数据
(一)利用人工智能编写自进化程序
英特尔实验室的两位研究人员,利用遗传算法和图灵完备语言,号称实现了首个能够自动编程的AI系统“AI Programmer”。文章共三篇,以下是网络翻译的详细内容:近年来,随着计算机技术、硬件、内存和CPU速度的进步,人工智能一直在稳步发展。
手机云电脑哪个好用 玩游戏无需买电脑
现在很多人都喜欢玩大型的电脑游戏,可是有时候在外面不方便开电脑,那么我们就可以通过手机来玩电脑游戏啦,这个主要采用的是云技术,让你不管在哪里都可以轻轻松松体验游戏了。一、极云普惠云电脑格来云电脑 V4.3.0 安卓版类别:系统安全
王者荣耀挚爱玫瑰怎么获得
王者荣耀挚爱玫瑰怎么获得?挚爱玫瑰是王者荣耀中的一个道具,可以送给自己的游戏好友,增加与好友之间的亲密度,不少玩家不是很清楚这个道具要怎么获得,这次就由8495小编来给大家讲讲王者荣耀挚爱玫瑰获取攻略,感兴趣的小伙伴一起来看看吧!
微信广告大事件直播推广解决方案升级-上虞网络公司为你呈现
产品升级PRODUCT PROMOTION越来越多的品牌选择通过直播推广方式做大事件营销,短时间内集中曝光,高效触达目标用户并提升品牌影响。微信广告不断丰富营销触点,打造大事件直播推广解决方案,助力奢侈品、汽车、3C 等行业品牌在大事件营销中
相关文章
推荐文章
发表评论
0评