LLM 大模型部署实战:Ollama、OpenLLM、LocalAI 与 Dify 集成指南
引言
随着大语言模型(LLM)技术的快速发展,数据隐私、成本控制以及响应延迟成为企业和个人用户关注的核心问题。本地化部署大模型能够在保障数据不出域的前提下,实现私有化的智能服务。本文将详细介绍四种主流的本地及混合部署方案:Ollama、OpenLLM、LocalAI 以及基于 Dify 的应用编排,并提供详细的配置步骤与常见问题解决方案。
1. Ollama 部署方案
Ollama 是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型而设计。它简化了 Docker 容器中的部署过程,支持多种操作系统,并提供了简洁的 API 接口。
1.1 安装方式
一键安装脚本
使用官方提供的安装脚本是最快捷的方式。如果遇到证书验证错误(如 error setting certificate verify locations),通常是因为 CA 证书路径配置不正确。
解决方法:
- 找到或下载
cacert.pem文件。 - 设置环境变量指向证书路径:
export CURL_CA_BUNDLE=/path/to/cacert.pem # 示例:export CURL_CA_BUNDLE=/www/anaconda3/ssl/cacert.pem - 执行安装命令:
curl -fsSL https://ollama.com/install.sh | sh
手动安装二进制文件
适用于需要更精细控制环境的场景。
- 下载 Linux 二进制文件:
sudo curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama sudo chmod +x /usr/bin/ollama - 创建系统用户:
sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama - 配置 systemd 服务文件
/etc/systemd/system/ollama.service:[Unit] Description=Ollama Service After=network-online.target [Service] ExecStart=/usr/bin/ollama serve User=ollama Group=ollama Restart=always RestartSec=3 [Install] WantedBy=default.target - 启动服务:


