自己机器就可以训练大模型

Ken XR 和 AIGC 2024年09月12日 21:08

90 tok/s!3 小时从零完全训练一个 26M 的小参数 GPT?仅需 2G 显卡即可推理⚡️🤯🤯 提供完整复现顶尖模型的全流程和视频教程🔥

改进自 DeepSeek-V2!minimind 也太好了,让每一个人都可以自行体验完整训练一个可用的模型!🔥


https://www.bilibili.com/video/BV12dHPeqE72



https://github.com/jingyaogong/minimind


图片