Pre-train CPM-2 此分支为110亿非 MoE 模型的预训练代码,MoE 模型的预训练代码请切换到 moe 分支 CPM-2技术报告请参考link。 若您想使用CPM-2进行推理,我们建议使用高效推理工具BMInf,支持1060以上显卡单卡推理。 由于运行环境都已在 Docker 中配置好,因此不需要设置 ...