首页 > 其他资讯 > 700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决

700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决

时间:25-04-26

新智元报道

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

编辑:好困

【新智元导读】近日,全球规模最大的大模型开发工具与社区Colossal-AI,发布了全套Llama 2训练、微调、推理方案,可以为700亿参数模型的训练加速195%。

ChatGPT引发的大模型热潮愈演愈烈,全球科技巨头和明星初创争相入局,打造以AI大模型为核心的竞争力和多样化商业使用需求。

其中LLaMA系列模型,因良好的基础能力和开放生态,已积累了海量的用户和实际应用案例,成为无数开源模型后来者的模仿和竞争的标杆对象。

但如何降低类Llama 2大模型预训练成本,如何基于Llama 2通过继续预训练和微调,低成本构建AI大模型实际应用,仍是AIGC相关企业面临的关键瓶颈。

作为全球规模最大、最活跃的大模型开发工具与社区,Colossal-AI再次迭代,提供开箱即用的8到512卡Llama 2训练、微调、推理方案,对700亿参数训练加速195%,并提供一站式云平台解决方案,极大降低大模型开发和落地应用成本。

700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决

开源地址:https://github.com/hpcaitech/ColossalAI

Llama 2训练加速195%

Meta开源的LLaMA系列大模型进一步激发了打造类ChatGPT的热情,并由此衍生出了诸多项目和应用。

700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决

最新的7B~70B Llama 2大模型,则进一步提高了语言模型的基础能力。

但由于Llama 2的预训练预料大部分来自英文通用知识,而仅用微调能够提升和注入的领域知识和多语言能力也相对有限。

此外,高质量的专业知识和数据集通常被视为各个行业和公司的核心资产,仅能以私有化形式保存。

因此,以低成本预训练/继续预训练/微调Llama 2系列大模型,结合高质量私有化业务数据积累,帮助业务降本增效是众多行业与企业的迫切需求与瓶颈。

但Llama 2大模型仅发布了原始模型权重与推理脚本,不支持训练/微调,也未提供数据集。

针对上述空白与需求,Colossal-AI开源了针对Llama 2的全流程方案,并具备高可扩展性,支持从70亿到700亿参数的模型,从8卡到512卡都可保持良好的性能。

在使用8卡训练/微调Llama 2 7B时,Colossal-AI能达到约54%的硬件利用率(MFU),处于业界领先水平。

对于预训练任务,以使用512张A100 40GB预训练Llama 2 70B为例,DeepSpeed ZeRO3策略因显存不足而无法启动,仅能通过速度衰减较大的ZeRO3-offload策略启动。

相比之下,Colossal-AI则因卓越的系统优化和扩展性,仍能保持良好性能,训练提速195%。

700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决

Colossal-AI Llama 2训练/微调方案的高性能来源于新的异构内存管理系统Gemini和高性能算子(包括Flash Attention 2)等系统优化。

新Gemini提供了高可扩展性,高鲁棒性,高易用性的接口。其Checkpoint格式与HuggingFace完全兼容,减小了使用和转换成本。其对于切分、offload等的设置更加灵活且易用,能够覆盖更多硬件配置下的Llama 2训练/微调任务。仅需数行代码即可使用:

代码语言:javascript代码运行次数:0运行复制
from colossalai.booster import Boosterfrom colossalai.booster.plugin import GeminiPluginplugin = GeminiPlugin()booster = Booster(plugin=plugin)model, optimizer, train_dataloader, criterion = booster.boost(model, optimizer, train_dataloader, criterion)
登录后复制
这就是700亿参数Llama 2训练加速195%!训练/微调/推理全流程方案开源,0代码一站解决的全部内容了,希望以上内容对小伙伴们有所帮助,更多详情可以关注我们的菜鸟游戏和软件相关专区,更多攻略和教程等你发现!

热搜     |     排行     |     热点     |     话题     |     标签

手机版 | 电脑版 | 客户端

湘ICP备2022003375号-1

本站所有软件,来自于互联网或网友上传,版权属原著所有,如有需要请购买正版。如有侵权,敬请来信联系我们,cn486com@outlook.com 我们立刻删除。