分享好友 最新资讯首页 最新资讯分类 切换频道
“具身智能”来了,如何加速人形机器人“进化”
2024-12-30 02:16

  新华社北京12月13日电 新闻分析|“具身智能”如何加速人形机器人“进化”

  新华社记者彭茜 张漫子

  继大模型后,“具身智能”成为今年科技界的新热点,被认为是新一波人工智能(AI)浪潮中的重点方向。众多初创公司涌现、融资屡创新高、技术不断突破……人形机器人作为该领域最具代表性的实体,正在大模型催化下加速产业化落地。

  如果将大模型视为“有趣的灵魂”,“具身智能”赋能的人形机器人则有了“好看的皮囊”,已在多个领域成为人类的有力助手。

  重新定义机器人

  作为连接虚拟空间和现实空间的桥梁,“具身智能”是指将AI融入机器人等物理实体,赋予它们像人一样感知、学习和与环境动态交互的能力。

  “具身智能”一词本身具有浓厚的技术哲学色彩。1945年,法国哲学家莫里斯·梅洛-蓬蒂提出“具身性”概念,认为人类需通过身体与周围环境进行互动和感知,进而理解世界。1950年,被称为“AI之父”的英国计算机科学家图灵在论文《计算机器与智能》中首次提出“具身智能”这一概念。

  事实上,智能化水平相对较低的工业机器人(机械臂)早已在制造业广泛应用,带来质效提升。但传统工业机器人是“固定程序+机械臂”的组合,而“具身智能”赋能的机器人则是“多模态感知+大脑决策”的迭代。

  清华大学交叉信息研究院助理教授许华哲认为,未来机器人将呈现多姿多彩的形态:双足、四足、轮式,机械狗、智能无人机甚至机械小蜜蜂,但人形机器人对人类社会适配性最佳,将成为最能够帮助人类的机器人。

  人形机器人可解决生产线“最后一公里”的问题。很多个性化、定制化的产品无法靠流水线统一组装,这就需要具有泛化能力的人形机器人来“帮忙”,把批量生产的零部件按客户的定制需求组装成产品。在家庭服务、公共服务等更复杂多变的场景中,人形机器人也更具优势,可适应不同的环境和需求完成多种任务。

  三大难点待突破

  人形机器人研发始于对人类的学习与模仿,其研发难点也可以比照人类的大脑、小脑和本体来理解。“大脑”主要是机器人负责自主学习、规划和决策的中枢;“小脑”负责运动控制,包括从行走到跑跳,以及从简单抓取到复杂的手部动作等;而“本体”部分则包括躯干四肢结构和灵巧手设计。

  优必选科技副总裁、研究院院长焦继超告诉记者,目前这三大领域都有较多技术难点有待突破:“大脑”方面,云边端一体计算架构、多模态感知与环境建模等是近年技术焦点,“仿人最大难点在于对人脑的模仿,现有科学理论对人脑的研究远远不足”;“小脑”方面,人机交互能力、复杂地形通过、全身协同精细作业等是重要方向;“本体”方面,刚柔耦合仿生传动机构、高紧凑机器人四肢结构与灵巧手设计等关键技术,是人形机器人灵活运动所需的重要硬件基础。

  大模型的出现让机器人“大脑”显著“进化”,大大提升了机器人的通用性和泛化性,有望降低人形机器人开发成本,加速其走入千家万户。

  据优理奇机器人科技公司创始人兼首席执行官杨丰瑜介绍,现在业界主要使用预训练大模型对机器人进行预训练,让其具备更强学习能力;大模型可将特定任务的学习迁移到机器人任务上,提高其适应能力;另外还可利用大模型的多模态处理能力,结合视觉、听觉、触觉等各种输入,提升机器人对复杂场景的理解。

  中国起跑不落后

  环顾全球,人形机器人已进入产业化落地初期阶段,在工业制造、商用服务和家庭陪伴领域开始“试水”。无论是技术突破、落地进展还是融资规模,人形机器人研发竞赛基本以中美为主导。

  优必选人形机器人Walker今年聚焦汽车、消费电子等制造业重点领域,已进入多家车厂实训;宇树科技的机器人实现了完全仿人的自然行走;优理奇机器人正在酝酿“进家”计划;波士顿动力的新版Atlas机器人实现了在工厂中不同储物柜之间灵活搬动零件;特斯拉人形机器人“擎天柱”计划2025年开始量产……

  焦继超说:“如果把人形机器人行业比喻成一场马拉松,中国和欧美国家,目前几乎都处在前面1000米的起跑阶段。”

  杨丰瑜持同样观点,大模型研发能力、感知技术的领先使美国企业在机器人决策系统和复杂任务处理方面具有更强竞争力。而中国的优势更多体现在工业机器人领域,特别是在制造业中的应用较为成熟。在人形机器人技术专利方面,中国也已走在前列。

  虽然机器人“大脑”的核心算法和高端芯片仍存在挑战,但中国机器人行业拥有丰富的应用场景和庞大的潜在用户人口,数据是最大竞争优势之一。

最新文章
Dopamine多巴胺越狱2.0最新版,支持iOS15.0-16.5.1越狱
opa334巨魔大神终于发布了Dopamine多巴胺越狱2.0!期待已久的好消息,终于有完整版的越狱了!注意是完整版越狱,而非完美越狱!
Chrome插件:Wappalyzer 展现网站背后用了哪些技术
我是鬼哥,10年+老程序员一枚。要说到在互联网世界里瞎逛,有时候咱们总会好奇那些炫酷的网站背后到底用了哪些黑科技。比如,有
AI 与人工同传首次正面交锋,翻译完整性成优势
现在的AI翻译真的比人好?AI会取代人工同传吗?为深入探讨这一问题,12月23日,科技媒体《差评》在中国传媒大学举办了行业首个“
css命名规则
页面制作最重要的就是CSS,定义合理的CSS命名规范,可以大幅提高页面制作的效率和方便开发及相关人员修改编写。1.通用命名规则:
Apo AI聊天助手
编辑点评:已接入GPT4接口提供每天的免费次数。这意味着,即使用户没有付费也可以免费地使用Apo AI,并且每天都可以享受一定数量
eBay刊登工具介绍:Title Builder
据介绍,Title Builder项目适用于eBay、亚马逊、Etsy和其他电商平台。可以帮助需要对店铺搜索引擎优化和网络营销活动的卖家。基
2022年新兴行业、2022新兴行业创业项目推荐十个!
一、未来10-20年,比较有前景的行业是什么?1.电商创业【淘宝客】——氧惠APP氧惠APP,2022全新模式,0投资,最快63天做到月入十
FL Studio21揭秘:AI编曲时代或将来临
【FL中文官网资讯】1997年是一个「古老」的年代,那时人们还在用「猫」上网,微信、QQ的江湖被ICQ统治,音乐编辑领域 Cool Edit
Facebook海外三不限和国内白名单三不限的区别体现在哪些方面?
Facebook海外三不限户和国内白名单三不限户同属于三不限企业户,但还是有很多人不是很清楚两者之间的区别。本期内容做一个具体介
Android笔试面试题AI答之Kotlin(9)
在Kotlin中, 和都是接口,它们都定义了对集合(即一系列元素)的基本操作,但它们在可变性ÿ