分享好友 最新动态首页 最新动态分类 切换频道
什么是生成式AI
2024-12-26 14:21

您的关注是对我最大的支持

『 AI每日快讯 欢迎大家转载、引用、分享,让更多人了解AI,学习AI 』

生成式人工智能无处不在。事实上,像OpenAI的ChatGPT这样的生成式AI,它展示了一种似乎由人类编写的生成文本的惊人能力,使得一些头条新闻可能实际上是由它撰写的。

但当人们谈论“生成式AI”时,他们到底指的是什么?

在过去几年的生成式AI热潮之前,当人们谈论AI时,通常是指能够基于数据进行预测的机器学习模型。例如,这些模型通过数百万例子的训练,可以预测某个X射线是否显示出肿瘤的迹象,或者某个借款人是否可能违约。

生成式AI可以被认为是一种被训练来创建新数据的机器学习模型,而不是对特定数据集进行预测。生成式AI系统是一种学会生成类似于其训练数据的更多对象的系统。

麻省理工学院电气工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola说:“在生成式AI和其他类型AI的实际机制方面,区别可能有点模糊。通常,同样的算法可用于两者。”

尽管ChatGPT及其同类产品的发布伴随着炒作,但这项技术本身并不是全新的。这些强大的机器学习模型依赖于超过50年的研究和计算进展。

复杂度的提升

生成式AI的一个早期示例是一种更简单的模型,称为马尔可夫链。这项技术以1906年引入这种统计方法来模拟随机过程的俄罗斯数学家安德烈·马尔可夫的名字命名。在机器学习中,马尔可夫模 型长期用于诸如电子邮件程序中的自动完成功能之类的下一个词预测任务。

麻省理工学院电气工程与计算机科学的Thomas Siebel教授、CSAIL和数据、系统与社会研究所(IDSS)成员Tommi Jaakkola说,在文本预测中,马尔可夫模型通过查看前一个单词或几个前面的单词来生成句子中的下一个单词。但由于这些简单模型只能回溯这么远,它们不擅长生成可信的文本。

他解释道:“我们在过去十年之前就在生成东西,但主要区别在于我们可以生成的对象的复杂性,以及我们可以训练这些模型的规模。”

就在几年前,研究人员还倾向于寻找一种机器学习算法,以最佳利用特定数据集。但这种重点已经有所转变,许多研究人员现在使用更大的数据集——可能包含数亿甚至数十亿数据点——来训练能够取得令人印象深刻结果的模型。

作为马尔可夫模型的基础模型,ChatGPT及类似系统的基础模型工作方式大致相同。但一个很大的区别是,ChatGPT的规模远大且更为复杂,拥有数十亿参数。它接受了大量数据的训练——在这种情况下,是互联网上大部分公开可用的文本。

在这庞大的文本语料库中,单词和句子以某些依赖性出现在序列中。这种重复性帮助模型了解如何将文本切割成具有一定可预测性的统计块。它学习这些文本块的模式,并使用这些知识来提出接下来可能出现的内容。

更强大的架构

虽然更大的数据集是引发生成式AI热潮的一个催化剂,但多项重大研究进展也导致了更复杂的深度学习架构的发展。

2014年,蒙特利尔大学的研究人员提出了一种名为生成对抗网络(GAN)的机器学习架构。GAN使用两个模型协同工作:一个学习生成目标输出(如图像),另一个学习区分真实数据和生成器输出。生成器试图欺骗鉴别器,并在此过程中学会制作更逼真的输出。图像生成器StyleGAN基于这些类型的模型。

斯坦福大学和加州大学伯克利分校的研究人员在一年后引入了扩散模型。通过迭代地完善它们的输出,这些模型学会生成类似于训练数据集中样本的新数据样本,并已被用于创建逼真的图像。文本到图像生成系统Stable Diffusion的核心就是扩散模型。

2017年,谷歌的研究人员引入了变压器架构,用于开发大型语言模型,如ChatGPT的动力。在自然语言处理中,变压器将文本语料库中的每个单词编码为一个标记,然后生成一个注意力图,该图捕获每个标记与所有其他标记的关系。这个注意力图帮助变压器在生成新文本时理解上下文。

这些只是用于生成式AI的众多方法中的几种。

应用范围

所有这些方法的共同点是,它们将输入转换为一组标记,这些标记是数据块的数值表示。只要你的数据可以转换成这种标准的标记格式,那么理论上,你可以应用这些方法来生成看起来类似的新数据。

Isola说:“你的成效可能会有所不同,这取决于你的数据有多嘈杂以及提取信号的难度,但它确实越来越接近通用CPU可以接收任何类型的数据并以统一的方式开始处理的方式。”

这为生成式AI打开了一个巨大的应用阵列。

例如,Isola的小组正在使用生成式AI创建合成图像数据,这些数据可以用于训练另一个智能系统,例如教授计算机视觉模型如何识别对象。

Jaakkola的小组正在使用生成式AI设计新颖的蛋白质结构或指定新材料的有效晶体结构。就像生成模型学习语言的依赖性一样,如果向它展示晶体结构,它可以学习使结构稳定和实现的关系。

但是,尽管生成模型可以取得令人难以置信的结果,它们并不是所有类型数据的最佳选择。麻省理工学院电气工程与计算机科学教授、信息和决策系统实验室成员Devavrat Shah指出,对于涉及对结构化数据(如电子表格中的数据)进行预测的任务,传统的机器学习方法往往比生成人工智能模型表现更佳。

他说:“在我看来,它们最大的价值是成为一个非常好的、对人类友好的机器接口。以前,人们必须用机器语言与机器交流以完成任务。现在,这个接口已经学会了如何同时与人类和机器沟通。”

提出风险

生成人工智能聊天机器人现在被用于呼叫中心处理人类客户的问题,但这一应用强调了实施这些模型的一个潜在风险 —— 工人被取代。

此外,生成人工智能可能会继承并扩散训练数据中存在的偏见,或放大仇恨言论和虚假陈述。这些模型具有剽窃的能力,可以生成看似由特定人类创作者制作的内容,引发潜在的版权问题。

另一方面,Shah提出,生成人工智能可以赋予艺术家权力,他们可以使用生成工具帮助他们制作他们可能无法自己生产的创意内容。

他预见,在未来,生成人工智能将改变许多学科的经济学。

麻省理工学院电子工程与计算机科学副教授、计算机科学与人工智能实验室成员Phillip Isola看到生成人工智能的一个有前途的未来方向是其在制造方面的应用。他提到,与其让模型制作一张椅子的图像,不如生成一张可以生产的椅子的计划。

他还看到生成人工智能系统在开发更普遍智能的人工智能代理中的未来用途。

他说:“这些模型的工作方式与我们认为人类大脑的工作方式之间存在差异,但我认为也有相似之处。我们能够在头脑中思考和梦想,提出有趣的想法或计划,我认为生成人工智能是将使代理能够做到这一点的工具之一。”

关注我,每天领取AI领域最新大事

设置⭐️标不迷路

转发朋友圈为您朋友播报每日AI大事

进交流群请扫下面码







最新文章
INSTAGRAM营销推广
感谢您在茫茫网海进入到我们的网站,今天有幸能与您分享关于INSTAGRAM营销推广,INSTAGRAM营销推广方案的有关知识,本文内容较多,还望您能耐心阅读,我们的知识点均来自于互联网的收集整理,不一定完全准确,希望您谨慎辨别信息的真实性,
2025年国家公务员考试成绩啥时候出
  辽宁华图小编为您整理国家公务员考试文章:2025年国家公务员考试成绩啥时候出  2025年辽宁国考笔试已结束,国考笔试成绩预计1月中上旬发布成绩及最低合格分数线考生可登录国家公务员局查询,查询网址:http://www.scs.gov.cn/。目前
CSS三种样式表:行内样式表、内部样式表、外部样式表
目录 一、CSS三种样式表 1、内部样式表 2、行内式(内联样式) 3、外部样式表(外链式) 二、三种样式表的对比 三、CSS样式表规则 1、内部样式表2、行内样式表(内联式)3、外部样式表(外链式&
2025全国十大装修公司最有名的是(知名公司排行榜)
装修市场发展几十年,口碑好、知名度高、实力强的装修公司屹立不倒,这些公司也更值得业主选择。那么,全国十大装修公司最有名的是哪些呢?下面根据各家公司的口碑、实力、价格及优势等综合评选,整理出了全国十大知名公司排行榜,供有需求
ao3中文链接入口官方版下载
ao3中文链接入口官方版下载是一款非常好用的小说阅读软件,超多精美的小说可以在这里免费阅读。随时随地在这里阅读最新的小说,超多优质的小说可以随意的在这里阅读。每日都有很多全新的章节内容更新,每天都有很多精彩的内容呈现给大家,
AI科普丨2025《自然医学》预测:11项影响医学的临床试验,AI独占三项
Nature子刊 Nature Medicine 邀请了全球11位顶尖研究人员,探讨了可能在2025年对医学产生重大影响的临床实验项目。从治疗朊病毒病和镰状细胞病的基因疗法,到应对癌症和心理健康的数字工具,这一“清单”涵盖了多个领域的前沿创新。值得关
3D期尾6走势图近100期
功能类福彩3D显示遗漏:显示/隐藏遗漏值,遗漏值是指自上期开出到本期间隔的期数。福彩3D遗漏分层:是将当前遗漏值用柱状图形标注。福彩3D分段线:是每五期使用分隔线,使横向导航更加清晰。福彩3D显示断区:在分区走势中使用,将开出0个号
03 抖音商家、达人、代理商等均可在巨量千川开户
简单来说,巨量千川是整合了字节旗下带货及推广平台的一个新平台。在巨量千川上线前,用户想完成DOU+或抖音号推广,需分别使用不同的账号。但未来,未来只需一个千川账号,即可进行所有抖音店铺推广的操作。同时,千川还将抖音店铺、抖音账
2024年12月14日实时热搜Top榜单大猜想,预测未来风向
摘要:预计2024年12月14日的实时热搜top榜单将涵盖多个领域,包括娱乐、政治、社会事件等。基于当前趋势分析,可能的热门话题将包括重大节日活动、热门电影和电视剧、科技进步、政策改革等。预测未来风向显示,环保、可持续发展等议题将逐
相关文章
推荐文章
发表评论
0评