DeepSpeed

AI训练模型

DeepSpeed

微软开源的低成本实现类似ChatGPT的模型训练

标签： AI训练模型

访问官网

DeepSpeed-Chat是微软最新公布的一套工具,旨在加速大规模模型训练和推理过程，用于训练类ChatGPT模型。

主

要

功

能

简化 ChatGPT 类型模型的训练和强化推理体验：只需一个脚本即可实现多个训练步骤，包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤、甚至生成你自己的类 ChatGPT 模型。此外，还提供了一个易于使用的推理 API，用于用户在模型训练后测试对话式交互。
DeepSpeed-RLHF 模块：DeepSpeed-RLHF 复刻了 InstructGPT 论文中的训练模式，并确保包括 a) 监督微调（SFT），b) 奖励模型微调和 c) 基于人类反馈的强化学习（RLHF）在内的三个步骤与其一一对应。此外，还提供了数据抽象和混合功能，以支持用户使用多个不同来源的数据源进行训练。
DeepSpeed-RLHF 系统：其将 DeepSpeed 的训练（training engine）和推理能力（inference engine) 整合到一个统一的混合引擎（DeepSpeed Hybrid Engine or DeepSpeed-HE）中用于 RLHF 训练。DeepSpeed-HE 能够在 RLHF 中无缝地在推理和训练模式之间切换，使其能够利用来自 DeepSpeed-Inference 的各种优化，如张量并行计算和高性能 CUDA 算子进行语言生成，同时对训练部分还能从 ZeRO- 和 LoRA-based 内存优化策略中受益。DeepSpeed-HE 还能够自动在 RLHF 的不同阶段进行智能的内存管理和数据缓存。

@版权声明:部分内容从网络收集整理，如有侵权，请联系删除!

类似网站

/uploadfile/202406/6d019d78250927b.png

讯飞星火大模型V4.0

讯飞星火大模型V4.0在国内外中英文12项主流测试集中，8项超越GPT-4 Turbo。

/uploadfile/202312/f099c5fd45c172b.png

Evidently AI

开源的机器学习模型监测和测试工具

/uploadfile/202312/f6f5c0bd616b2f9.png

HuggingFace

AI模型开发社区

/uploadfile/202312/d1c2d821be7456e.png

Meta（Facebook）推出的AI大语言模型

/uploadfile/202312/94ebd213bebc69b.png

天工AI助手

昆仑万维与奇点智源联合研发的对标ChatGPT的大语言模型

/uploadfile/202312/71f29c143db6143.png

清华团队支持发起的大规模预训练语言模型库与相关工具

/uploadfile/202312/4895db935136325.png

Runway最新推出的AI视频生成模型

/uploadfile/202312/4df0b68a77809.png

Google AI文字到图像生成模型

/uploadfile/202312/b4043a21654c.png

低门槛快速定制大语言模型的引擎

AI569工具箱收录了国内外当下流行的数百款 ai工具，定期检查更新最新的好用工具，工具包含了ai文本模型、ai绘画模型、ai 视频模型、ai声音模型等各种类型!Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

AI工具箱导航关于我们免责声明

Copyright © AI569工具导航站-ai工具大全京ICP备16027678号-17