分享好友 最新动态首页 最新动态分类 切换频道
人工智能的未来?RAG 结合了语言和搜索
2024-12-26 15:00

随着专家们暗示大型语言模型(LLM)的技术极限即将到来,人们的焦点转向了检索增强生成(RAG)——这是一项很有前途的进步,可以通过将信息检索与自然语言生成相结合来重新定义人工智能(AI)。

LLM引领了人工智能技术,并改进了各种应用。然而,他们产生虚假信息的倾向限制了他们的潜力。RAG 允许 AI 访问特定的外部数据并将其纳入其响应中,使其更加有效和准确。

“RAG相对于LLM的主要优势在于,前者完全基于所述RAG的所有者可以控制的专有数据集,从而允许更有针对性的应用程序,”人工智能公司Wonderslide的首席执行官Renat Abyasov告诉PYMNTS。“假设医生想为他们的病人部署一个聊天机器人;使用 RAG 将使他们能够确保所述聊天机器人提供的建议是可靠和一致的。LLM很难实现这种可靠性,LLM是用大量公开可用且有时相当可疑的数据进行训练的系统。

RAGs致富
RAG 模型是将语言理解与实时信息检索相结合的尖端 AI。这使他们能够通过访问来自外部来源的最新相关数据来提供更准确和最新的答案。RAG 模型在新闻、研究和客户支持等动态领域表现出色,它们整合新鲜信息的能力使其在需要保持最新状态的情况下具有高度的适应性和价值。

在某些情况下,RAG 可能会击败 LLM。 Tonic.ai 是一家以其专有基准测试平台 Tonic Validate 而闻名的公司,最近对 RAG 系统进行了一系列评估。在其中一项测试中,焦点集中在 CustomGPT.ai 上,这是一种无代码工具,使企业能够将 ChatGPT 风格的解决方案与 RAG 数据库一起部署。

为了评估 CustomGPT.ai 的性能,Tonic.ai 将其与 OpenAI 的内置 RAG 功能进行了比较。评估数据集包括保罗·格雷厄姆(Paul Graham)撰写的数百篇文章和一组55个基准问题,这些问题的答案来自文本。主要目标是评估平台生成准确且与上下文相关的响应的能力。

测试结果显示,CustomGPT.ai 和 OpenAI 的工具都可以产生高质量的答案。然而,CustomGPT.ai 始终如一地为复杂查询提供更精确的响应,从而优于竞争对手。这一结果凸显了 CustomGPT.ai 部署生成式 AI 聊天机器人的简化方法的有效性,使其成为寻求在没有广泛编程知识的情况下实施此类解决方案的企业的一个有吸引力的选择。

使用 RAG 可以带来现实世界的好处。斯坦福大学研究人员和合作者最近发表在NEJM AI杂志上的一份报告表明,RAG可以显着提高LLM在回答医学问题方面的表现。

研究发现,在回答董事会认证医生编写的问题时,GPT-4 的 RAG 增强版本和其他程序的表现优于标准 LLM。作者认为,RAG对于在临床环境中安全使用生成式AI至关重要。

即使是医学特定的LLM,如Google DeepMind的MedPaLM,仍然在与幻觉作斗争,可能无法准确处理临床相关任务。

在相关新闻中,MedPerf 是一项新举措,旨在加快医疗 AI 的发展,同时保护数据隐私。这凸显了对安全可靠的数据集成方法(如 RAG)的需求日益增长,以确保医疗保健中人工智能生成的响应的准确性和相关性。

RAG的优势
Trustible的首席技术官Andrew Gamino-Cheong告诉PYMNTS,许多LLM都接受过相当通用的信息培训,这些信息可以很容易地从互联网上收集。他强调,RAG是增强LLM的一种强大且具有成本效益的方法。通过整合机密或最新信息,RAG 使 LLM 能够提供更准确和相关的响应。这种方法使企业能够充分利用 LLM 的潜力,同时保持其专有数据的安全性和特异性。

他补充说:“LLM的许多用例都受到可能较旧的数据的限制,而RAG模式是使它们保持最新状态的最有效方法,而无需花费数百万美元对其进行全面再训练。“一个秘密是,许多 LLM 提供商希望用户添加 RAG 管道或直接微调他们的基础模型,因为这从根本上转移了很多产品责任。”

Abyasov 解释说,RAG 模型最常用于创建自操作的技术援助程序和对话式 AI 界面。

“在LLM出现在公众的雷达上之前,RAG已经用于这个应用程序多年了,”他补充道。“总的来说,几乎任何需要你拥有严格控制的数据集的应用程序都会倾向于使用RAG,因为它们可以减少意外,并全面获得更一致的结果。”

如何学习大模型 AI

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天:初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么
  • 大模型是怎样获得「智能」的
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天:高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天:模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天:商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

最新文章
360清理垃圾
360清理垃圾,一般又称360清理大师。
golang 规则引擎gengine
Gopher掌握规则 Grule导入 github.com/hyperjumptech/grule-rule-engine Go的规则引擎是Golang编程语言的规则引擎库。受著名的JBOSS Drools的启发,完成了 Gopher掌握规则,Grule导入了 github.com/hyperjumptech/grule-rule-engine。Go的
2025元旦节的祝福句子
2025,祝所求皆所愿,所行化坦途,多喜乐,长安宁,岁无忧。那么2025元旦节的祝福句子有哪些?下面小编给大家带来2025元旦节的祝福句子,供大家参考!1、 日出日落就是一天,花开花谢就是一年。元旦已至,腊八相随,我把最暖最美的祝福送到
14个值得建筑师和设计师重视的顶级AI工具
在整个行业中,建筑师在他们的创造性追求中正在拥抱一个新的合作伙伴:AI。 一旦受到重复和单调的困扰,建筑工人发现自己正处于数字革命的风口浪尖,其中比特和字节掌握着自动化和曾经难以想象的可能性的关键。AI革命并不是在敲我们的门,
95384微众银行能协商吗
小编导语在现代社会,金融服务的多样化使得人们的生活变得更加便利。伴随着便利而来的还有一些问,例如贷款逾期、信用卡欠款等。这些问不仅影响个人的信用记录,还可能导致法律纠纷。对于借款人而言,如何处理与银行之间的债务关系,尤其是
2024祛斑排行榜TOP10名单公布,祛斑效果最好的排名第一
祛斑效果最好的排名第一。作为一个长期奋斗在祛斑一线的护肤达人,最近照镜子时突然发现那些顽固的斑斑点点竟然开始退散,尤其是那些明显的晒斑,已然消失得无影无踪。这无疑是我近期最为欣慰的惊喜,现在出门,我终于可以和厚重的遮瑕说再
10个优秀的谷歌seo服务商
当谈到提高您的在线形象并为您的网站带来更多流量时,搜索引擎优化 (SEO) 是关键。 找到合适的 SEO 公司来帮助您实现目标可以改变您的业务。但面对如此多的选择,您如何知道哪一个最适合您的需求呢? Moz 是 SEO 行业
360优化大师V1.4.0 安卓版正式版发布
  精准管理、全新UI  今日,360优化大师发布V1.4.0正式版。新版本增加默认软件设置、系统瘦身、通知栏提醒等功能,方便用户精准管理手机的各项应用。同时,新版本在UI界面上做出了全新的调整,个性化背景、透明化功能按键,让软件界面
adguard 安卓中文破解2025v4.8.6
《adguard》一款非常实用的手机拦截广告工具,可以轻松拦截各种网页,视频的弹窗,免除广告的打扰,让你享受更加安全的上网环境,所有高级版的功能都可以免费使用,欢迎大家前来下载。可以轻松拦截各种网页的弹窗享受最安全简约的上网环境
AI绘画黑化孙悟空
一、黑化孙悟空:AI绘画的新尝试AI绘画是指通过人工智能技术实现的自动绘画。随着机器学习和深度学习的不断发展,AI绘画在艺术领域引起了广泛关注。黑化孙悟空成为了一个备受瞩目的案例。AI绘画黑化孙悟空的诞生,不仅代表了AI绘画技术的突
相关文章
推荐文章
发表评论
0评