分享好友 最新动态首页 最新动态分类 切换频道
摩尔线程携手无问芯穹:0到1端到端大模型实训在国产GPU首次突破
2024-12-26 02:55

摩尔线程联合无问芯穹宣布,双方在近日正式完成基于国产全功能GPU千卡集群的3B规模大模型实训。该模型名为“MT-infini-3B”,在摩尔线程夸娥(KUAE)千卡智算集群与无问芯穹AIStudio PaaS平台(https://cloud.infini-ai.com/aistudio)上完成了高效稳定的训练。本次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算集群深度合作的新范式。

MT-infini-3B模型训练总用时13.2天,经过精度调试,实现全程稳定训练不中断,集群训练稳定性达到100%,千卡训练和单机相比扩展效率超过90%。目前,实训出来的MT-infini-3B性能在同规模模型中跻身前列,相比在国际主流硬件上训练而成的其他模型,在C-Eval,MMLU,CMMLU等3个测试集上均实现性能领先。

MT-infini-3B性能表现 

无问芯穹联合创始人兼CEO夏立雪表示:“国内大模型与国产芯片的软硬件协同发展,最终目标是构建一个成熟的生态系统。无问芯穹正在打造‘M种模型’和‘N种芯片’间的‘M×N’中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署。摩尔线程是第一家接入无问芯穹并进行千卡级别大模型训练的国产GPU公司,而‘MT-infini-3B’的训练是行业内首次实现基于国产GPU芯片从0到1的端到端大模型实训案例。”

摩尔线程创始人兼CEO张建中表示:“无问芯穹在夸娥千卡智算集群上实现的从零开始的大模型训练,不仅是对摩尔线程技术实力的有力认证,更是实现了国内大模型训练的国产化闭环。摩尔线程夸娥千卡智算集群以全功能GPU为底座,提供软硬一体化的全栈解决方案,具备高兼容性、高稳定性、高扩展性等综合优势,我们致力于成为AGI时代大模型训练坚实可靠的先进基础设施。”

此前,摩尔线程与无问芯穹已达成深度战略合作。无问芯穹大模型开发与服务平台“无穹Infini-AI”和摩尔线程大模型智算千卡集群夸娥已完成系统级融合适配,该平台可以灵活调用夸娥的集群能力以完成大模型的训练、微调与推理任务。未来,双方还将开展更多适配与测试,推动国产大模型技术的快速发展与应用普及,为中国人工智能产业的蓬勃发展贡献力量。

关于无问芯穹

无问芯穹(Infinigence AI)依托行业领先且经过验证的AI计算优化能力与算力解决方案,追求大模型落地的极致能效。打造“M种模型”和“N种芯片”间的“M×N”中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署。链接上下游,共建AGI时代大模型基础设施,加速AGI落地千行百业。

关于摩尔线程

摩尔线程是一家以全功能GPU芯片设计为主的集成电路高科技公司,能够为广泛的科技生态合作伙伴提供强大的计算加速能力,致力于打造为下一代互联网提供多元算力的元计算平台。

雷峰网(公众号:雷峰网)

最新文章
2024年10大AI生成PPT工具推荐:提升您的演示效率与创意
轻竹办公轻竹办公是一款专注于中文用户的AI驱动PPT生成工具,致力于为用户提供高效、智能的PPT制作解决方案。用户只需输入主题或上传文档,轻竹办公便可自动生成大纲、内容和PPT设计。其丰富的模板库涵盖求职、述职、汇报等多种场景,尤其
36漫画免费阅读下载2.60v1.1.3
36下载2.60是一款专为漫画爱好者打造的强大软件,汇聚了海量高清正版漫画资源,覆盖了热血、恋爱、悬疑、搞笑等多种类型,满足用户多样化的阅读需求。该软件以其丰富的漫画资源、流畅的阅读体验和无广告的阅读环境,赢得了广大漫画迷的喜爱
AI技术再创新!OpenAI发布GPT-O1提升推理算力
在人工智能快速发展的背景下,OpenAI最近推出了其最新模型GPT-O1,此款新模型在推理能力上实现了显著提升,标志着AI应用落地的重要一步。随着C端AI应用如ChatGPT的用户访问量不断上涨,企业级(B端)的AI解决方案也在不断获得青睐,推动了
2016 年第一季度微信品牌公众号运营报告(上篇)
2015第四季度和2016第一季度微信品牌公众号到底发生了什么变化?有哪些行业是公众号运营的佼佼者?行业之间又有什么差异?现在我们带大家来回顾一下各大行业的公众号运营情况。微信公众号运营报告下载地址:http://pan.baidu.com/s/1dFDIAE
2024四大平台爆款剧排名,《庆余年2》只能排第三,第一实至名归
爱奇艺刚刚举行的尖叫之夜把剧王颁给了《唐朝诡事录之西行》,也就是《唐朝诡事录》的第二季。其他几家虽然还没有举行相应的盛典,但是从站内的数据可以看到,优酷今年排名第一的是《墨雨云间》;腾讯排名第一的是《庆余年》第二季;芒果TV
BOSS直聘APP攻略,游戏化求职的胜利秘诀
在现今的求职市场中" -,BOSS直聘已经成为求职者与雇主之间的重要ੰ
2025届高三第一次八省联考政治试卷和答案
八省联考能够让考生熟悉新高考的流程、题型以及模式。下面是关于2025届高三第一次八省联考政治试卷和答案的相关内容,希望对大家有所帮助!试卷满分:100分 考试用时:75分钟中特、经社、政法、哲文、国际、法律和逻辑选择题16道;非选择题
2024147期[幸运儿]预测专家精准7+1复式
玩法本期推荐上期推荐命中情况红球24码01,04,05,0607,08,09,1013,16,17,1819,20,21,2223,24,25,2627,29,31,3301,02,04,0507,08,09,1011,13,15,1617,18,19,2022,23,24,2526,28,29,31对4码红球21码01,04,05,0607,08,09,1013,18,19,2021,22,23
52个Martech关键词:广告验证
由于各种各样的原因,广告没有被正确的用户看到——如果他们根本没有被用户看到的话,大量的广告费用过被浪费了。广告验证旨在验证广告投放的位置,以减少浪费,并保护广告主和出版商免受广告投放不当可能造成的任何损害。广告验证通常被广
相关文章
推荐文章
发表评论
0评