Datawhale AI冬令营(第一期)--- 1.1 零基础定制你的专属大模型
2024-12-26 21:42
主要学习了使用讯飞开放平台免费定制了一个基于《甄嬛传》剧本中的甄嬛台词 ,通过五个简单的步骤 ,不写一行代码 ,打造一个模仿甄嬛语气、风格的专属聊天模型—— Chat-嬛嬛 。
微调的数据集是定制大模型的关键 影响模型最后效果的最大难点问题在于复杂的 清洗数据、处理、生成数据、归类数据 上
本次使用的数据集格式 — Alpaca格式
字段说明 : (1 ) instruction :任务的指令 ,模型需要完成的具体操作 ,一般可以对应到用户输入的 P rompt 。 (2 )input :任务所需的输入内容。若任务是开放式的 ,或者不需要明确输入 ,可以为空字符串。 (3 )output :在给定指令和输入的情况下 ,模型需要生成的期望输出 ,也就是对应的正确结果或参考答案。
样例数据 :
特点与应用 :结构简单清晰 ,易于理解和处理。它明确地将任务指令和输入内容分离开来 ,能够很好地适用于各种自然语言处理任务 ,像文本生成、翻译、总结等任务 ,尤其适合单轮的、以任务为导向的指令微调任务。
注意 :还有其他的数据格式 ,比如 :ShareGPT 、jsonl、csv、文生图数据和图像分类数据等格式
详细说明可见大模型微调平台数据集格式说明
Step1 :注册登录讯飞星辰MaaS
Step2 :下载数据集
数据集下载链接
Step3 :定制专属嬛嬛大模型 !
最新文章
水排的汉语大词典
水排的汉语大词典是:古代一种利用水力推动革囊鼓风的冶铁装置。《三国志·魏志·韩暨传》:“旧时冶,作马排,每一熟石用马百匹;更作人排,又费功力;暨乃因长流为水排,计其利益,三倍于前。”明徐光启《农政全书》卷十八:“水排,韦囊
PyTorch深度学习模型训练加速指南2021
点击上方“AI公园”,关注公众号,选择加“星标“或“置顶” 作者:LORENZ KUHN 编译:ronghuaiyang导读简要介绍在PyTorch中加速深度学习模型训练的一些最小改动、影响最大的方法。我既喜欢效率又喜欢ML,所
网站怎么优化电池推荐
优化您的网站以推荐电池产品涉及几个方面,包括SEO(搜索引擎优化)、用户体验和内容策略。以下是一些关键步骤: 1. 关键词和SEO优化- 关键词研究: 使用工具如Google Keyword Planner、Ahrefs或SEMrush来识别与电池相关的高搜索量关键词,
虾皮店铺转让多少钱?如何转让?
现在很多卖家选择在跨境平台虾皮上注册开店,但是由于平台上的店铺是非常激烈的,很多卖家无法继续将店铺经营下去,就会想要将店铺进行转让,那么虾皮店铺转让是多少钱了?shopee店铺转让价格并不是一定的,主要还是看店铺的运营情况。一般
超高清美女写真,这款AI工具教你一键生成心仪形象!
限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在这个数字时代,许多人希望通过高科技手段来实现艺术创作,而AI的崛起让这一切变得轻而易举
科技智能重塑外汇体验,最新动态与未来展望
摘要:外汇市场最新动态显示,科技引领未来发展趋势,智能产品正在重塑外汇交易体验。随着科技的不断进步,外汇交易逐渐实现智能化,提供更加便捷、高效的交易方式。智能产品的应用,使得外汇交易更加智能化、个性化,满足不同交易者的需求
讲座回顾 | 探秘以“假”乱真的AIGC图像与视频生成
图|广外国际学院随着人工智能深入高等教育,海内外优质高等教育资源也在积极响应科技发展的步伐,愈发重视人工智能在现代商业中的关键作用。本次AI系列讲座是广外国际学院响应高等教育高质量发展的一次全新举措,从AI的起源和发展史,到AI
抖音申请药品类目的方法,开通具体步骤
如果您想在douyin平台上开设药品类目店铺,您需要遵循一系列严格而详细的步骤,以确保您的店铺合法、合规并成功运营。以下是一份详尽的申请和开通指南,帮助您顺利踏入douyin药品电商的蓝海。一、准备必要的资质文件首先,确保您已准备好所