ChatGPT--LLM（大语言模型）速览、实操与对比

日期：2024-12-26 作者：5qt2n 移动：http://mip.riyuangf.com/mobile/quote/51677.html

LLM（大语言模型）速览与实操

ChatGPT（全名：Chat Generative Pre-trained Transformer），是 OpenAI 研发的一款聊天机器人程序，于2022年11月30日发布。广泛应用于各种场景，比如回答问题、撰写文章、创意写作、编程帮助和翻译等等。目前ChatGPT无需注册即可使用，4.0版本需每月20美元。

kimichat是由国内初创公司月之暗面科技有限公司研发的一款人工智能助手，它支持超长的汉字输入和输出能力，输入的长度可达20万字，输出的长度可达2万字。基于强大的长文本处理能力，kimichat可以在多轮对话中依然保持良好的理解能力和记忆能力。kimichat没有智能体，除了文本处理能力表现突出之外，其他方面的应用能力有待提升。

Gemini是谷歌公司于2023年12月6日发布的一款人工智能多模态大模型。该模型由Google DeepMind开发，标志着AI技术在多模态任务处理能力上的一个重要里程碑。Gemini模型的发布，被看作是谷歌在AI领域重新夺回主导地位的尝试1。模型的名称“Gemini”（双子座）象征着快速思维和沟通的能力

LLaMA（Large Language Model Meta AI）是由Meta AI（原Facebook AI研究实验室）发布的一系列基础语言模型。Meta公司正在开发的大型语言模型LLaMA 3，是继LLaMA 1和LLaMA 2之后的新一代模型269。LLaMA 3的预期发布时间为2024年6月。

Grok1.5是由xAI公司开发的一款大型语言模型，是Grok系列模型的最新迭代版本，具有显著改进的推理能力和长上下文理解能力。Grok1.5的一个关键特性是它能够处理多达128K tokens的长上下文，这是之前版本的16倍。访问方法1：官网访问，但需推特会员。方法2：GitHub下载模型参数本地运行。

Anthropic 公司推出的 Claude 3 系列模型是其最新的人工智能产品，旨在提供先进的认知能力和多模态理解。该系列包括三个不同版本的模型：Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku，Claude 3 Opus 被设计为具有接近人类的理解能力，能够灵巧地处理开放式提示和复杂任务。据官方资料，其性能全面超过了 GPT-4

ChatGLM-4 是智谱AI公司推出的一款新一代基座大模型，其整体性能相比上一代有显著提升，接近或达到了GPT-4的水平，目前免费使用。ChatGLM-4 不仅增强了文生图和多模态理解的能力，还推出了全新的CogView3，其效果超越了开源的SDXL模型，并与OpenAI的DALL·E 3相媲美

文心一言4.0是百度公司推出的一款大型人工智能语言模型。该模型在百度世界2023大会上正式发布2，李彦宏在会上自信地表示文心一言4.0的能力「和GPT-4比毫不逊色，该模型4.0版本收费。

通义大模型最早发布于 2022年9月2日,在阿里达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上。目前免费开放1000万字的长文档处理功能。基于通义大模型的通义听悟支持单记录、跨记录、多语言超长音视频自由提问。处于业界顶尖

讯飞星火认知大模型是科大讯飞发布的大模型。

该模型具有7大核心能力，即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互。

可根据文本自动生成PPT，且支持虚拟数字人，播报PP

北京左医科技有限公司是专注于人工智能技术在医疗健康领域应用的高科技创新型企业，公司打造的左手医生是国内领先的全科智能医生。左医GPT的主要应用场景包括拟人化AI医生问诊和问答、智能导诊、智能病历书写、结构化抽取以及智能诊断等

LLM（大语言模型）对比

a)语意理解

题目：领导说：“你这是什么意思？”小明说:“没什么意思，意思意思。" 领导说：“你这就不够意思了。”小明说:“小意思，小意思。”这段话里，不同的“意思”分别代表什么意思？

a)摘要提炼

Sora团队说：Sora是一个视频生成模型，其工作原理是分析大量视频数据并学会生成视频。具体工作方法融合了扩散模型（如DALL-E）和大型语言模型（如GPT系列）的技术。

架构上Sora类似于介于两者之间，训练方式类似于DALL-E，但在结构上更像GPT。结构上更像GPT这一点在Sora刚出现的时候就有不少人分析过，这也算Sora的一大技术特点。接下来，是同样让人好奇的，Sora的训练数据到底来自于哪里？在官方发布的Sora生成视频中，无论是咖啡杯中的海盗船，还是东京街头行走的女性，都在表示Sora似乎理解了许多世界的物理规律。之前不少民间说法讨论，Sora极有可能在数据集中添加了用UE5生成的文本、视频当作合成数据。面对这样的问题，Sora成员Tim Brooks没有明确回应，打了一个太极，表示不方便说得太细，但是他透露，大体上使用的是公开数据和OpenAI被授权使用的数据，并分享了一个“技术创新”。

以往，不论是图像还是视频生成模型，通常会以非常固定的尺寸进行训练，比如只有一个分辨率的视频。在Sora的训练中，他们将各种各样的图片和视频，不管是高宽比、长短、高清还是低清，都分割成了一小块一小块。研究人员可以根据输入视频的大小，训练模型认识不同数量的小块，这也让Sora能更灵活地学习各种数据，并生成出不同分辨率和尺寸的内容。这一技术在Sora技术文档里也有提过，就是所谓的patch。大语言模型建模时把文本拆成了以token为最小单位，而视频大模型中的token就是patch。这一技术并不是OpenAI创造的，当OpenAI宣布使用了该技术时还引起了讨论，为什么OpenAI能就能通过别人的技术造出好的AI产品出来。

主持又问到：你觉得Sora擅长做什么？哪些方面还有所欠缺？比如我看到有个视频里一只手竟然长了六个手指。Sora生成视频截图Sora团队先扬后抑的表示到，Sora擅长写实类视频，并且可以生成1分钟时长的视频，很强。但仍然存在一些问题，比如手部细节（所有AI的噩梦）摄像机轨迹、物理现象变化等。除此之外，Sora团队还介绍了一些其他酷炫的功能，比如通过除prompt之外，用视频合成的方式生成视频。这实现了在完全不同主题和场景构成的视频之间无缝过渡。在OpenAI的Tiktok上就有无人机变成蝴蝶在斗兽场转化的珊瑚礁中飞翔的视频。

无论在技术还是体验上，都与原先的视频生成模型完全不同。Aditya Ramesh更是表示，他们做的事情，就是先模拟自然，再超越自然！目前为止，OpenAI在Tiktok上的AI生成视频都使用了配音，而不是AI无缝生成声音。Sora团队表示，AI声音暂时不是他们考虑的事情，当务之急还是在于视频生成，让它实现更长的时间，更好的画质和频率。但不知道随着Pika Sound Effects功能的发布，Sora加上声音是否指日可待。帮我将以上文章内容，提炼成一句话得摘要。

b)摘要提炼

a)工作技能类

题目：如何在 WPS 中连续使用格式刷

b)专业知识类

题目：癌症患者的疼痛疲乏睡眠障碍症状群的定义，以及各自的病因（篇幅原因，去网页实际操作查看）

a)推理问题类

题目：小明牵着一只狗和两只小羊回家，路上遇到一条河，没有桥，只有一条小船，并且船很小，他每次只能带一只狗或一只小羊过河。你能帮他想想办法，把狗和小羊都带过河去，又不让狗吃到小羊吗

a)内容生成能力

题目：帮我写一段简要概述：中医护理技术在治疗癌症患者的疼痛疲乏睡眠障碍的症状群的应用

b)翻译

题目1.：将输入的英文文本翻译成中文，注意：星号(*)包围的文本保留英文原文不要翻译。

英文文本：

1. Edit the Regions > Transparent Components > Boundaries > Transparent Components/Air [0] node and set the following properties:

2. Click Close.

3. Edit the **Regions > Transparent Components > Boundaries > Walls** node and set the following properties:

Click Close. 5. Save the simulation

题目1.：Sora的技术创新

题目2：小明的动物朋友之间有什么关系？

题目1.：小米su7的参数配置以及购买建议

题目2：Sora技术报告解读

大模型岗位需求

掌握大模型技术你还能拥有更多可能性：

• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；

• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。为了让大家少走弯路，少碰壁，这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好，希望能够真正帮助到大家。

-END-

👉AI大模型学习路线汇总👈

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

👉大模型视频和PDF合集👈

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0

0 条相关评论

相关最新动态

推荐最新动态

点击排行