分享好友 最新动态首页 最新动态分类 切换频道
【大模型本地知识库搭建】ChatGLM3,M3E,FastGPT,One-API_fastgpt m3e
2024-12-26 15:58

目录

引言

【大模型本地知识库搭建】ChatGLM3,M3E,FastGPT,One-API_fastgpt m3e

一、ChatGLM3大模型本地部署

二、部署M3E模型

三、部署One-API

四、部署FastGPT

 
  • 知识延迟问题是训练大模型需要一定的时间,从而训练数据就不可能具有实时性,而且相当耗费资源。

  • 幻想问题问题则由于LLM采用的概率模型,即预测生成下一个字符概率是多少,所有或多或少的它在生成结果的时候都有定的可能出现错误。

     
 
 

使用python api_server.py启动后使用postman工具进行测试。

api_server.py启动后监听8000端口

Postman工具使用post方式进行测试

ChatGLM3返回报文

测试请求体

 
 

M3E 是 Moka Massive Mixed Embedding 的缩写,其中

  • Moka,此模型由 MokaAI 训练,开源和评测,训练脚本使用 uniem ,评测 BenchMark 使用 MTEB-zh

  • Massive,此模型通过千万级 (2200w+) 的中文句对数据集进行训练

  • Mixed,此模型支持中英双语的同质文本相似度计算,异质文本检索等功能,未来还会支持代码检索

  • Embedding,此模型是文本嵌入模型,可以将自然语言转换成稠密的向量

    M3E模型使用场景主要是中文,少量英文的情况,多语言使用场景,并且不介意数据隐私的话,建议使用 openai text-embedding-ada-002。

项目地址:moka-ai/m3e-base · Hugging Face,把项目拉下来即可使用。把项目地址在ChatGLM中openai_api_demo/api_server.py相应修改。

One-API使用Docker进行快速部署,One-API和FastGPT建议使用Linux系统进行部署,本文采用虚拟机安装了CentOS进行部署。

先安装Docker,Docker部署命令

 

One-API部署命令

由于FastGPT也是使用3000端口,这里One-API改用3080端口。

 

利用docker ps查看One-API是否启动

启动后在本地浏览器打开One-API地址为本地IP地址+3080端口,登录页初始账号为root,密码123456。

One-API登录界面

由于是本地部署的模型,需要在“渠道”里配置ChatGLM大模型M3E向量模型的地址。其中Base URL是能访问大模型的地址,密钥是自定义的,可以随意填写。

配置大模型渠道

配置M3E模型渠道

配置好后测试两个模型是否可以调用,点击测试按钮即可。

测试响应

设置令牌,后面在配置FastGPT时会用到。

配置令牌

 
 

FastGPT功能结构示意图

先来了解下 FastGPT 是如何进行知识库检索的。首先了解几个基本概念

  • 向量:将人类直观的语言(文字、图片、视频等)转成计算机可识别的语言(数组)。
  • 向量相似度:两个向量之间可以进行计算,得到一个相似度,即代表:两个语言相似的程度。
  • 语言大模型的一些特点:上下文理解、总结和推理。

结合上述 3 个概念,便有了 “向量搜索 + 大模型 = 知识库问答” 的公式。下图是 FastGPT V3 中知识库问答功能的完整逻辑

FastGPT本文在Linux系统下使用Docker进行部署,目前这也是官方推荐的部署方式,官网介绍链接

依次执行下面命令,创建 FastGPT 文件并拉取和,执行完后目录下会有 2 个文件。

 

接下来修改docker-compose.yml文件

主要修改fastgpt/environment下的OPENAI_BASE_URLCHAT_API_KEY

前者填入One-API的地址和端口号,后者填写设置好的令牌口令。数据库的账号密码可以后面再重新设定。

 

同时修改config.json文件

主要修改“llmModels”键值对中“model”和“name”的名字和其它需要的配置,如果不用其它的模型,保留这样一个字典就行,同时也要修改一下向量模型 "vectorModels"的“model”和“name”。

 

修改后启动容器

在 docker-compose.yml 同级目录下执行。同时确保版本最好在2.17以上,否则可能无法执行自动化命令。

 

用docker ps查看是否正常启动

若oneapi没正常启动

 

正常启动后在浏览器上访问fastgpt,本地ip:3000端口。

账号root,初始密码1234。创建应用后即可测试是否正常使用本地部署的大模型。

那么,如何系统的去学习大模型LLM

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

👉LLM大模型学习指南+路线汇总👈

这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【】
最新文章
【信道估计】梳状导频序列OFDM信道估计(线性内插法)【含Matlab源码 9771期】
🚅座右铭:行百里者,半于九十。 🏆代码获取方式: CSDN Matlab武动乾坤—代码获取方式 更多Matlab信号处理仿真内容点击👇 ①Matlab信号处理(进阶版) ⛳️关注CSDN Matlab武动乾坤&#
内容质量:优质内容是吸引用户和搜索引擎的关键
在如今信息化的时代,网站的SEO优化已经成为每个网站成功的关键因素之一。尤其是对于商家和内容创作者而言,如何通过提高网站在搜索引擎中的排名,吸引更多流量,已经是他们面临的重要问题。那么,如何提高网站的SEO效果?有哪些实用技巧可
最新章节 更新:2024-12-16
长佩VIP2020-09-17完结收藏:9350评论:4371海星:72675人气:186.04万文案:北京大杂院的竹马和竹马1987年的腊月初八。年将8岁的秋实从黑龙江密山回到了北京。他在纸鸢胡同逼仄的大杂院里,遇到了10岁的徐明海。俩人跟随着那个清秀纯白的
达观助手AI智能写作,全方位智能写作新体验!
近日,首个免费中文智能AI写作辅助工具——达观助手宣布上线。此款WPS第三方插件内含多项实用功能,如AI续写、AI润色、智能纠错、智能排版、标题AI助手、OCR等,可以极大地优化用户写作体验,全面提升文本创作效率和质量。 据悉,与其他收费的智
特别策划|承载社会议题 多元类型融合 悬疑剧创作再升级
2024年,悬疑赛道持续火热,成为荧屏一道亮丽风景。从《边水往事》《雪迷宫》《唐朝诡事录之西行》等剧集凭借口碑脱颖而出,到《微暗之火》《新生》《错位》等作品引发广泛热议,再到《白夜破晓》《太阳星辰》《我是刑警》等播放指数持续攀
谷歌认证:2021全新Android开源框架权威排行榜(附源码解析)
Github WidgetContributions, stars, followers, trending etc. on Github.Guide中文文档What is Github Widget?DownloadStyles of Github Widget4142-142-243-14345-24345-344-144-2445-345-145-2SettingsProblems, Bugs or EnhancementVe
微信小程序制作指南,从零开始,轻松打造专属小程序
本文目录导读:微信小程序概述开发环境搭建小程序注册与登录界面设计功能开发测试与发布随着科技的发展,微信小程序逐渐成为人们生活中不可或缺的一部分,作为一名大学讲师,我将为大家详细介绍如何制作微信小程序,本课件将分为以下几个部
解锁外贸网站推广的奥秘,助力企业拓展全球市场
解锁外贸网站推广的奥秘,助力企业拓展全球市场在当今全球化的经济环境中,外贸网站已成为企业拓展国际市场、提升品牌影响力的关键工具。然而,仅仅拥有一个功能完善、设计精美的外贸网站并不足以确保成功,有效的推广策略同样至关重要。本
榆树网站优化-正规白帽技术
【网商在线】全称深圳市网商在线科技有限公司成立于2014年,网商在线是一家专注seo搜索引擎优化的技术型网络公司,12年SEO搜索引擎优化实战经验,致力于百度PC,手机端,360搜索,搜狗,神马等关键词seo排名优化.效果稳定,见效快。榆树市是吉林
百度站长平台:多种站内需求挖掘功能上线
站长之家(Chinaz.com)3月25日消息 百度站长平台昨日发布公告称,百度站内搜索上线了多种新功能:在站点的文章页中提供关键词推荐功能(包括嵌入式关键词推荐和悬浮式关键词推荐两种形式)、以及内文提词功能;搜索框新增了侧滑、弹窗、悬
相关文章
推荐文章
发表评论
0评