分享好友 最新动态首页 最新动态分类 切换频道
NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论
2024-12-25 12:56

  白小交 发自 凹非寺

  量子位 | 公众号 QbitAI

  我们无法忽视世界是三维的,解决三维智能是根本性的。

  李飞飞最新采访来了,继续延伸她在NeurIPS有关视觉智能的话题。

  她表示,解决空间智能问题是迈向全面智能化的基础和关键一步。

  何恺明竟然探讨起了AI宿命论???

  来来来,来看看一个吃瓜汇总。

  李飞飞180页PPT谈视觉智能

  采访实录:

  Q:为什么演讲题目是“攀登视觉智能的阶梯(Ascending the Ladder of Visual Intelligence)”?

  Q:你的意思是说,我们会对某些景象做出本能的反应?

  李飞飞:我说的不仅仅是本能。如果你看一下感知力的进化和动物智力的进化,就会发现这两者之间有着深刻的联系。每当我们能够从环境中获得更多信息时,进化的力量就会推动能力和智力的发展。如果你不能感知环境,你与世界的关系就会非常被动;你是吃还是被吃,都是非常被动的行为。但是,一旦你能够通过感知从环境中获取线索,进化的压力就会真正增强,从而推动智力向前发展。

  Q:你认为这就是我们创造更深入的机器智能的方式吗?让机器感知更多的环境?

  李飞飞:我不知道 “深度 ”是不是我想用的形容词。我认为我们正在创造更多的能力。我认为它正变得越来越复杂,越来越有能力。我认为,解决空间智能问题是迈向全面智能化的基础和关键一步,这是绝对正确的。

  Q:我看过世界实验室的演示。你为什么要研究空间智能并构建这些三维世界?

  李飞飞:我认为空间智能是视觉智能的发展方向。如果我们真的要破解视觉问题,并将其与做事联系起来,那么有一个极其简单、一目了然的事实:世界是三维的。我们生活的世界不是平面的。我们的物理Agent,无论是机器人还是设备,都将生活在三维世界中。就连虚拟世界也变得越来越3D化。如果你与艺术家、游戏开发者、设计师、建筑师、医生交谈,即使他们是在虚拟世界中工作,其中大部分也是三维的。如果你能花点时间认识到这个简单而深刻的事实,那么毫无疑问,解决3D智能问题就是根本所在

  一旦你尊重了世界的三维性,很多事情就自然而然地发生了。例如,在我们发布在社交媒体上的一个视频中,篮球被投放到一个场景中。因为它是三维的,所以你可以拥有这种能力。如果场景只是 2D 生成的像素,篮球将无处可去。

  Q:或者,就像Sora中那样,它可能会去到某个地方,但随后就消失了。在你尝试推进这项技术的过程中,最大的技术挑战是什么?

  李飞飞:没有人解决过这个问题,对吧?这非常非常难。在世界实验室的演示视频中,你可以看到我们将一幅梵高的画作,以一致的风格生成了它周围的整个场景:艺术风格、灯光,甚至是那个社区会有什么样的建筑。如果你转过身去,它就变成了摩天大楼,那就完全没有说服力了,对吗?它必须是 3D 的。你必须进入其中。所以它不仅仅是像素。

  Q:你能说说你用来训练它的数据吗?

  李飞飞:很多。

  Q:你们在计算负担方面遇到过技术挑战吗?

  李飞飞:计算量很大。这是公共部门负担不起的计算量。这也是我很高兴能休假,以私营部门的方式来做这件事的部分原因。我的亲身经历强调了在获得充足资源的情况下进行创新的重要性。

  知识的发现需要资源的支持,对吧?在伽利略时代,是最好的望远镜让天文学家观测到了新的天体。是虎克意识到放大镜可以变成显微镜,发现了细胞。每一次新技术工具的出现,都有助于知识的探寻。而现在,在人工智能时代,技术工具涉及计算和数据。我们必须认识到这一点。

  Q:假设我们能让人工智能系统真正理解三维世界,这会给我们带来什么?

  李飞飞:它将为人们释放大量的创造力和生产力。我希望能以更高效的方式设计我的房子。我知道,许多医疗用途都涉及到理解一个非常特殊的三维世界,那就是人体。我们总在谈论未来人类将创造机器人来帮助我们,但机器人是在三维世界中航行的,它们需要空间智能作为大脑的一部分。我们也在谈论虚拟世界,它能让人们参观景点、学习概念或娱乐。这些虚拟世界使用三维技术,尤其是混合技术,也就是我们所说的 AR(增强现实技术)。我很想戴着一副眼镜在国家公园里漫步,它能为我提供有关树木、道路和云彩的信息。我还想通过空间智能学习不同的技能。

  Q:什么样的技能?

  李飞飞:我举个蹩脚的例子,如果我在高速公路上爆胎了,我该怎么办?现在,我打开了一个 “如何换轮胎 ”的视频。但如果我能戴上眼镜,看到我的车发生了什么,然后在指导下完成这个过程,那就很酷了。但这只是个蹩脚的例子。你可以考虑烹饪,可以考虑雕刻—有趣的事情。

  Q:你认为我们在有生之年能在这方面取得多大进展?

  李飞飞:哦,我认为这将在我们有生之年实现,因为科技进步的步伐真的很快。你已经看到了过去 10 年所带来的变化。这无疑预示着下一步会发生什么。

  今年NeurIPS好热闹

  NeurIPS整个会议期间,可以说是好不热闹。

  比如,Bengio和OpenAI的人吵起来了。

  据在场的人爆料,在今年因果关系小组讨论中,OpenAI o1的主创表示,我们最终应该训练Agent来优化对世界的理解,来解决科学问题。

  Bengio还有一位谷歌AGI安全研究员Tom Everitt则指出这样做很可怕!他们表示不应该制造这样强大的Agent,还有其他方法可以增强人类的能力,并进行科学研究,比如让模型学习因果图。

  而就在刚才,Bengio还进一步回应了,再次强调了AI Agent潜在的风险。

  据热心网友们的爆料,他是在被问到AI属于发明还是发现的时候。

  据小红书网友爆料,他提到一个有意思的观点,他将人类比作大模型的传感器:

  参考链接:

  [1]https://spectrum.ieee.org/fei-fei-li-world-labs

  [2]https://x.com/connoraxiotes/status/1866921924703498412

  [3]https://x.com/kyliebytes/status/1866987524805234785

  [4]https://www.xiaohongshu.com/explore/6759be860000000001029429

  [5]http://xhslink.com/a/IFIoiN1IoRy1

最新文章
AI美女写真生成攻略:揭秘最强生图神器,轻松一键创建唯美形象!
在这个数字化与人工智能迅猛发展的时代,很多小伙伴们都渴望拥有能让人惊艳的照片,却可能因为忙碌的生活和拍照技术的局限性而感到无从下手。家人们,有没有想过,借助AI的力量,你也能轻松生成超逼真的美女写真?今天,就让我们一起深入了
AI美女写真生成:用搜狐简单AI一键打造你的数字女友
首先,打开微信,搜索小程序“搜狐简单AI”。点击进入后,你会看到美观大方的界面,让人一下子就想开始探险。步骤2:选择风格 在首页,你可以看到多种样式供你选择。点击“美女写真”选项,会出现各种不同风格的选项,比如清新、性感、古典
7777788888管家婆老家|全面数据应用分析
  标题:7777788888管家婆老家|全面数据应用分析  在当今社会,随着数字技术的飞速发展,人们收集、处理和应用数据的能力达到了前所未有的水平。7777788888管家婆老家作为一个与时俱进的信息平台,对于“全面数据应用分析”的研究至关
2024 ACL Fellow出炉!全球九位科学家入选,华人有四位
智东西(公众号:zhidxcom)作者 依婷编辑 漠影智东西12月13日报道,当地时间12月11日,计算语言学会(The Association for Computational Linguistics:ACL)宣布2024年度ACL会士(ACL Fellow)名单,全球有9名科学家入选,其中华人有4名
AI绘画神器评测:超逼真美女写真,轻松一键生成!
ArtbreederArtbreeder 是一个引人注目的在线艺术平台,它结合了多种艺术风格和用户上传的图像,可以创建崭新的艺术作品。用户只需调节简单的滑杆,就可以生成千变万化的人物肖像,甚至可以整合来自不同图像的特征。优点是生成的图片非常高
74cms 采集规则 发布模块
76-46-B8-58-87-7F-6C-7C-1F-76-B6-28-69-2C-9E-11-70-C3-71-5A-B2-43-1E-02-99-39-D3-9C-62-5F-6A-1E-00-95-80-12-2B-E7-5F-52-C2-AE-FF-37-0A-B5-55-49-12-DF-A9-0F-3B-BF-62-25-BF-1E-A7-20-33-3C-52-7F-EF-AA-3D-FD-D8-4A-08-43-DA-42-
Excel排名函数rank使用介绍
rank函数是排名函数。rank函数最常用的是求某一个数值在某一区域内的排名。rank函数语法形式:rank(number,ref,[order])函数名后面的参数中 number 为需要求排名的那个数值或者单元格名称(单元格内必须为数字),ref 为排名的参照数值区域
2025电商发展趋势
随着互联网技术的飞速发展,电子商务已经成为全球商业领域的重要组成部分。从最初的在线购物到如今的社交电商,电商行业经历了翻天覆地的变化。而到了2025年,电商行业将迎来新的变革和趋势。为您揭示2025年的电商发展趋势,帮助您更好地把
AI写代码——让机器替你编程的时代已经到来了吗
在当今数字化时代,人工智能(AI)正迅速改变着我们的生活和工作方式。而在编程领域,已经成为了一个备受关注的话题。那么,真的能够取代人类工程师的工作吗?它将如何改变我们的编程方式?让我们深入探讨一下。AI写代码是指利用人工智能技
AI手机时代,谷歌加入竞争!美媒:谷歌要想占据重要地位,困难重重
【环球时报报道 记者 倪浩】在9、10月份,国内外主流手机厂商苹果、华为、三星等宣传将集中推出新品之前,谷歌出人意料抢在8月份推出了多款人工智能(AI)手机,其挟安卓系统之利在AI手机时代再图领先的意图呼之欲出。在全球企业纷纷发力抢
相关文章
推荐文章
发表评论
0评