跳转到正文
莫尔索随笔
返回

类 ChatGPT 模型私有化部署:LLaMA、Alpaca 与微调实践指南

预计 2 分钟

第一时间捕获有价值的信号

面对国内政策与数据安全需求,本文调研类 ChatGPT 模型私有化部署方案。详细介绍 LLaMA、Alpaca 等开源模型,并探讨 LoRA 等微调技术,为企业内部落地提供参考。

核心内容

ChatGPT虽然强大,但在国内的政策下,真要落地数据安全才是最重要的,Meta AI 发布的 LLaMA 让大家看到在相对较小的模型上使用大规模数据集训练并达到较好性能的曙光,笔者也第一时间使用 Docker 和 Alpaca LoRA 对 LLaMA 7B 大模型进行 Fine-Tune,内部使用达到预期效果。下面将该过程使用到的背景资料进行整理,为想私有化落地的朋友作为参考!

ChatGPT模型

类ChatGPT模型

LLaMA

Alpaca

Bloomz(支持中文)

Belle(支持中文)

哈工大中文LLaMA(支持中文)

ChatGLM

其他

训练方法

学习资料

相关论文