分享好友 最新动态首页 最新动态分类 切换频道
100行代码实现私人定制多模态RAG机器人
2024-12-27 02:20

报告日期:2024年8月18日

100行代码实现私人定制多模态RAG机器人

项目负责人:Bilyc(WsWs

该项目旨在构建多模态智能体对话机器人,以txt 文本为RAG知识库并结合图片识别功能。选用 Nvidia NIM 平台的相关模型,进行数据构建和向量化处理。通过环境搭建和代码实现,具备一定的可操作性。应用场景广泛,包括客户服务、教育培训、金融服务等多个领域。其亮点在于采用先进模型,能提供全新互动体验,且数据处理和功能整合较为有效。

模型选择: 选择微软的phi-3-small-128k-instruct和ai-phi-3-vision-128k-instruct模型,分别实现txt文档和png、jpg、jpeg图像的智能回答和识别。

Phi-3-Small-128k-Instruct 模型占用资源相对较少,便于部署和应用在资源有限的环境中,同时仍能提供较为准确和有用的指令响应。它在处理常见任务时能够保持高效和可靠。 AI-Phi-3-Vision-128k-Instruct 模型则在视觉相关的指令处理上表现出色。能够理解和处理图像相关的指令,为涉及图像分析、识别和理解的任务提供有力支持。这两个模型都具有长上下文处理能力,能更好地理解复杂的任务和指令,为用户提供更全面和准确的服务。

1.数据构建过程

首先,收集txt电子书和图片。当选择txt电子书后,Phi-3-Small-128k-Instruct 模型会对文本进行预处理,建立本地Faiss vector向量数据库。而图片则直接喂给模型分析。

2.向量化处理方法及其优势。

向量化模型选用ai-embed-qa-4。对 txt 文档进行向量化。该模型会对文档中的文本进行深度分析和编码。它会将文本分解为单词、短语或更细粒度的语言单元,并通过其内部的神经网络架构将这些单元转换为数值向量。

采用gradio框架和Nvidia的NIM服务,将两个模型整合成一个多模态的智能机器人,并实现网页可视化应用。

1. 创建Python环境

首先需要安装Miniconda

大家可以根据自己的网络情况从下面的地址下载

miniconda官网地址:https://docs.conda.io/en/latest/miniconda.html

清华大学镜像地址: Index of /anaconda/miniconda/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

安装完之后,打开Anaconda Powershell:

在打开的终端中按照下面的步骤执行,配置环境:

创建python 3.8虚拟环境

 

进入虚拟环境

 

安装nvidia_ai_endpoint工具

 

安装Jupyter Lab

 

安装langchain_core

 

安装langchain和langchain_community

 
 

安装matplotlib

 

安装Numpy

 

安装faiss

 

安装OPENAI库

 

2.Macbook 环境

Macbook也可以按照上面的步骤同样执行, 只是在下载Miniconda的时候要下载Mac OS版本的

直接上干货仅,有100行左右。

 
 
 

客户服务与支持、教育培训领域、金融服务行业、医疗健康领域、企业内部应用、政务服务领域、媒体与新闻行业、旅游与出行领域等。

1.首先看图片的识别效果。

2.再看一看RAG文本的实现效果

本文旨在构建一个以txt文本为知识库和图片识别相结合的多模态智能体对话机器人,为读者提供全新互动体验。 选择Nvidia NIM平台的(phi-3-small-128k-instruct 和 ai-phi-3-vision-128k-instruct)模型,并采用了有效的数据构建和向量化处理方法。 详细介绍了环境搭建和代码实现,具有可操作性。总体而言,该项目具有一定的创新性和实用性,但在性能评估和未来规划方面还有待进一步完善。读者可在此基础上进行改进完善。

该项目未来可朝着以下方向发展:一是优化模型性能,提高对文本和图像的理解与分析能力,提升回答的准确性和全面性;二是拓展应用场景,深入挖掘更多领域的需求,为用户提供更广泛的服务;三是加强与其他技术的融合,如与物联网、大数据等结合,实现更智能的交互;四是持续改进用户体验,根据用户反馈不断优化界面和交互方式;五是探索商业化应用,为企业和个人带来实际价值。

1. https://python.langchain.com/v0.1/docs/integrations/chat/nvidia_ai_endpoints/

2. NVIDIA NIM页面: https://build.nvidia.com/explore/discover

3. NVIDIA DLI课程学习资料页面:https://www.nvidia.cn/training/online/

最新文章
用AI一键生成美女写真,轻松打造你的虚拟女友!
Artbreeder:这个平台利用生成对抗网络(GAN)技术,用户可以通过调节不同的参数(如性别、面部特征)来调制自己想要的照片效果。Artbreeder的优点在于自由度极高,可以生成各种风格的图像,包括超现实主义和动漫风格。但有个缺点是对于新
内衣达人直播权限开通详情步骤,内衣类目怎么可以开直播?电商平台小店开通教程 内衣类目 - 副本
2022年05月17日何***100企业一站式服务,电商平台店铺开通|定向邀约报白|天猫入驻|京东入驻|抖音入驻/快手入驻/小红书入驻/拼多多入驻各电商平台店铺开通 医疗器械 药品 保健品滋补品 食品饮料 酒水 服饰鞋包 珠宝文玩 数码家电 本地生活服
第9章 大模型的伦理安全与隐私9.3 隐私保护技术9.3.1 数据匿名化与脱敏
作者:禅与计算机程序设计艺术 9.3.1 数据匿名化与脱敏 9.3.1.1 背景介绍 在大数据时代,越来越多的个人信息被收集、处理和分析,导致个人隐私风险的显著增加。因此,保护个人隐私成为一个重要的课题,而数
神马优化seo_神马优化关键词快速排名(优化神马搜索引擎关键词排名工具)
1 移动端优化紧张性随着移动互联网的快速发展,手机搜刮用户数量巨大,企业需器重手机网站,否则大概错失大量客户百度神马和搜狗是重要搜刮引擎,各具官方优化指南2 优化指南要点百度移动优化指南夸大简便域名服务器稳固HTML5顺应性呆板可
无忧建站,打造轻松高效的网站建设体验,无忧自助建站
在当今这个信息爆炸、互联网高速发展的时代,网站已成为企业、个人乃至组织展示形象、传播信息、开展业务的重要平台,对于许多非技术背景的人来说,搭建一个专业、美观、功能齐全的网站并非易事,从域名注册、服务器选择到页面设计、功能开
珠宝直播间调查③丨售卖假珠宝的淘宝网店没有工商信息,记者15分钟注册假珠宝店无需证照
红星新闻此前报道,不少中老年人热衷在各个平台的直播间购买低价珠宝玉石。受访者余大妈就曾在2年里花费超3万元购入低价珠宝,其中不乏十几元的玉髓,几十元的和田玉、玛瑙、翡翠等。 为查验这些带着鉴定证书发货的珠宝是否为真,记者将余
科普重大通报“开端棋牌可以开挂吗”详细有挂内幕
【央视新闻客户端】登录新浪财经APP 搜索【信披】查看更多考评等级  债市研判六人谈  来源:债券杂志  特邀专家:  李东荣 中国人民银行原副行长、中国互联网金融协会创始会长  黄艺明 广发银行信用卡中心资产管理部副总经理  
比本科还牛的专科学校(比较牛的专科学校) 全国最好的大专排名一览表
今天大学科目网小编整理了比本科还牛的专科学校(比较牛的专科学校) 全国最好的大专排名一览表相关信息,希望在这方面能够更好帮助到大家。1、比本科还牛的专科学校(比较牛的专科学校)2、广州番禺职业技术学院王牌专业排名一览表3、全国
搜索广告召回技术在美团的实践
从美团流量场景角度来看,美团搜索广告分为两大类,一是列表推荐广告;二是搜索广告。推荐广告以展现商家模式为主,通常叫商家流。搜索广告的展现形式比较丰富,有商家模式,即以商家展现为主,
百度、吉利就“极越汽车”发表联合声明
集度汽车有限公司是百度控股与吉利控股投资设立的造车新势力初创公司,是探索汽车智能化转型的创新产物。由于行业竞争格局发生巨大变化,既定商业计划无法执行,经营遇到了挑战。极越汽车产品由吉利工厂制造,授权集度独家经营。百度、吉利
相关文章
推荐文章
发表评论
0评