分享好友 最新动态首页 最新动态分类 切换频道
AI大家说|斯坦福大学报告:一些领域AI已领先于人类
2024-12-26 18:43

AI 在某些任务上已超越人类,但仍有不足

在图像分类、视觉推理和英语理解等基准测试中,AI已领先于人类,但在更复杂的任务如数学竞赛、视觉常识推理和规划方面,仍显劣势。

前沿AI研究依旧以产业为主

2023年,产业界推出了51个值得关注的机器学习模型,而学术界仅有15个。此外,产业与学术联合推出了21个重要模型,创下新高。

AI不仅提高了生产力,还提升了工作质量

2023年的多项研究表明,AI帮助员工更高效地完成任务,并显著提升了工作成果质量,同时缩小了不同技能水平员工之间的工作差距。

AI加速科学进步

AI在科学研究中的应用从2022年的初显端倪,而到了2023年,更是一举推出了多款重磅的科学相关AI应用。从大幅提升算法排序效率的AlphaDev,到加速材料发现进程的GNoME,这些AI工具极大地提高了科学发现的速度与效率。

全球对AI影响的关注与日俱增

益普索(Ipsos)的一项调查显示,在过去一年中,认为AI会在未来3至5年内对生活产生重大影响的人从60%增至66%。然而,与此同时,表达对AI产品和服务担忧的受访者比例也从2022年的39%飙升至52%。

研究与开发

前沿AI研究依旧以产业为主外,基础模型数量倍增,开源比例显著提升。2023年共发布了149个基础模型,是2022年的两倍多。其中,65.7%是开源模型,而这一比例在2022年为44.4%,2021年仅为33.3%。

前沿模型变得更加昂贵。根据估算,最先进的AI模型的训练成本已经达到了前所未有的水平。例如,OpenAI的GPT-4估计使用了价值7800万美元的计算资源进行训练,而谷歌的Gemini Ultra的计算成本则高达1.91亿美元。

AI专利数量激增。2021年至2022年,全球AI专利授权量大幅增长62.7%。自2010年以来,AI专利授权量增长了31倍多。

开源AI研究蓬勃发展。自2011年以来,GitHub上与AI相关的项目数量稳步增长,从2011年的845个跃升至2023年的约180万个,仅2023年就增长了59.3%。2023年,GitHub上AI相关项目的星标总数也显著增加,从2022年的40万个增至1220万个,增加了两倍多。

AI论文发表量也持续增加。2010至2022年间,AI相关论文总量从约88000篇增加至超过240000篇。

技术表现

除了前文提到的,AI在某些任务上已超越人类,但仍有不足外,多模态AI也是一个重要趋势。过去,AI系统往往局限于单一能力,例如语言模型擅长文本理解但在图像处理上表现不佳。然而,诸如Google的Gemini和OpenAI的GPT-4等多模态模型展示了强大的灵活性,不仅能够处理文本与图像,部分情况下还可以处理音频。

在ImageNet、SQuAD和SuperGLUE等经典基准测试上,AI表现已趋于饱和。2023年,研究者开发了更多具有挑战性的基准测试,包括SWE-bench(编程)、HEIM(图像生成)、MMMU(通用推理)、MoCa(道德推理)、AgentBench(代理行为)和 HaluEval(幻觉评估)等。

从模型表现来看,更好的AI依赖更好的数据。新一代AI模型如SegmentAnything和Skoltech开始被用于生成特定任务的专门数据,例如图像分割和3D重建。数据对于AI的技术改进至关重要。利用AI创建更多的数据可以增强当前模型的能力,并为未来的算法改进铺平道路,尤其是在难度较大的任务上。

此外,人类评估成为新趋势。随着生成式模型的文本和图像质量不断提高,基准测试逐渐向纳入人类评估的方向转变,例如Hugging Face上加入了人类偏好的对比排行Chatbot Arena Leaderboard,取代了过去以ImageNet或SQuAD为代表的机器评判排名。公众对AI的看法正日益成为追踪AI进展的重要考虑因素。

得益于语言模型,机器人技术变得更加灵活。语言建模与机器人技术的结合,催生了像PaLM-E和RT-2这样更具灵活性的机器人系统。这些模型不仅在机器人能力上有所提升,还能够主动提出问题,标志着机器人与现实世界交互能力的重大进步。

智能代理AI研究迎来更多突破。创建能够在特定环境中自主运行的AI代理系统,一直是计算机科学家面临的难题。然而,新兴研究表明,这些自主AI代理的表现越来越好。如今的代理AI已经能够精通Minecraft等复杂游戏,并高效完成在线购物、研究辅助等现实任务。

报告还指出,封闭式大语言模型显著优于开源模型。在10项选定的AI基准测试中,封闭模型的表现全面领先,表现中位数高出24.2%。这一性能差异对AI政策的讨论具有重要影响。

AI相关的经济趋势

AI 对经济的深度影响引发了诸多发人深省的问题。有人预测AI将推动生产力提升,但其影响到底有多深仍是个未知数。本章通过分析Lightcast、LinkedIn、Quid、麦肯锡、Stack Overflow和国际机器人联合会(IFR)等来源的数据,深入探讨了AI相关的经济趋势。

首先,AI相关岗位缩减,全球趋势同步。2022年,AI相关职位占美国总职位发布的2.0%,而这一比例在2023年下降至1.6%。AI职位发布数量减少的主要原因包括顶尖AI公司发布的职位数量下降,以及这些公司在技术岗位中的比例减少等。

其次,AI有效降低成本并提升收入。根据麦肯锡最新调查,42%的受访企业表示,通过应用AI(包括生成式 AI)有效降低了成本,同时有59%的企业表示收入实现了增长。与前一年相比,报告成本下降的企业比例增加了10个百分点,显示出AI正在显著推动业务效率的提升。

企业对AI的采用率有所上升。麦肯锡2023年的一份报告显示,目前有55%的企业在一个或多个业务单元或职能部门中应用了AI(包括生成式 AI)。这一比例高于2022年的50%,更是远超2017年的20%。

中国在工业机器人领域占据主导地位。自2013年超越日本成为工业机器人安装量最大的国家以来,中国与最接近的竞争国家之间的差距大幅扩大。2013年,中国的安装量占全球总量的20.8%,而到2022年,这一比例已上升至52.4%。

同时,机器人应用场景更加多元化。2017年,协作机器人仅占当年新增工业机器人安装量的2.8%,而到2022年,这一比例已攀升至9.9%。与此同时,2022年各类服务机器人的安装量也普遍增长,唯有医疗机器人领域例外。这一趋势不仅显示出机器人安装总量的整体上升,也反映出机器人正在更多地被部署到面向人类的服务角色中。

财富500强企业掀起了一股讨论AI的热潮,尤其是生成式AI。2023年,AI在394场财报电话会议中被提及,覆盖了近80%的财富500强企业,这一数字较2022年的266次显著增加。自2018年以来,AI在财富500强财报电话会议中的提及次数几乎翻了一番。其中,生成式AI是最热门的细分主题,在19.7%的电话会议中被提到。

最新文章
三分钟学会使用自动化的技术写爬虫
很多同学对爬虫比较感兴趣,很想知道什么是爬虫到底是什么,爬虫学起来难不难?从哪里入手开始学习?这里我想跟大家说,其实你们学完自动化之后,要想学习爬虫,其实非常简单,爬虫里面用
黑龙江:税务部门助力续写冰雪经济发展新篇章
近年来,黑龙江省抢抓冰雪产业发展战略机遇,以冰雪运动为引领,带动冰雪装备、冰雪旅游、冰雪文化全产业链发展。黑龙江省税务部门充分发挥税收职能作用,聚焦冰雪产业主体税费诉求,落实税惠政策,推出专属服务,推动得天独厚的“冷资源”
长沙爱采购seo排名(长沙爱采购seo排名第几)
大家好,今天小编关注到一个比较有意思的话题,就是关于长沙爱采购seo排名的问题,于是小编就整理了3个相关介绍长沙爱采购seo排名的解答,让我们一起看看吧。百度爱采购,难道让seo优化无路可走了吗?如何建立优秀电商团队?现在白帽SEOer
南大光电诊股,深度解析与前景展望,南大光电诊股深度解析及前景展望
南大光电诊股:深度解析及前景展望。本文探讨了南大光电的当前状况、业务模式、业绩表现以及未来发展趋势。该公司以其独特的技术和市场地位,在行业中表现突出。文章还涵盖了公司的财务状况、竞争优势以及潜在风险,并对公司的未来发展进行
怎么让网站被百度收录了_详解让网站被百度收录的全流程与技巧
在当今的互联网时代,拥有一个被百度收录的网站对于自媒体作者来说是至关重要的,它不仅能够增加网站的曝光度,吸引更多的读者和用户,还能提升网站的权【北京建站公司】重和排名,为后续的发展打下坚实的基础,究竟怎么让网站被百度收录呢
阿里云服务器ECS实例规格怎么选?
启动一台ECS实例前,您需要结合性能、价格、工作负载等因素,做出性价比与稳定性最优的决策。根据业务场景和vCPU、内存、网络性能、存储吞吐等配置划分,阿里云ECS提供了多种实例规格族,一种实例规格族又包括多个
百度诉360劫持流量案终审胜诉 360判赔40万
本报讯 (记者 王鑫) 昨日记者获悉,百度诉360劫持流量案终审宣判,法院判决书表明,奇虎360以保护网民利益为借口,对百度网页搜索结果进行插标,并非是为了公共利益,而是为了奇虎公司的经营私利,扰乱了互联网秩序。对此,法院维持一审
鸡西市牙套搭桥口腔医生排行榜一览名单发布-鸡西市牙套搭桥医生技术稳扎稳打
说到鸡西市牙套搭桥,找到一个经验十分丰富技术高超的牙套搭桥医生非常重要!今天本文就根据牙友们口碑给您汇总鸡西市牙套搭桥医生排名前10~都是鸡西市上牙友们评选出来的鸡西市牙套搭桥医生推荐名单哟!擅长项目:牙套搭桥,重度感染,发育
SEO如何创业,有哪些基本的步骤和策略?
创业是一条有前途的路。随着人们日益重视网络营销,SEO成为了一项非常具有价值的技能。SEO创业在未来几年将有非常大的发展潜力,但是SEO创业需要你有一定的技术基础,需要你对搜索引擎算法有了解,同时你还需要一些基本的策略和步骤来确保
【5210S(电信版)鲁大师下载】酷派5210S 电信版鲁大师10.9.0免费下载
手机跑分、验真假、清理垃圾专业工具!1亿用户选择的手机硬件专家。鲁大师发福利了,新用户下载即送现金!现在清理手机垃圾还能赚钱,轻松体现秒到账!===手机评测===【鉴别真假】全面检测各项指标,快速鉴别手机真伪,买到假机帮你上报维
相关文章
推荐文章
发表评论
0评