Ollama 本地部署与运行开源大语言模型指南

什么是 Ollama？

Ollama 是一个可以在本地部署和管理开源大语言模型的框架。它极大地简化了开源大语言模型的安装和配置细节，一经推出就广受好评，目前在 GitHub 上已获得大量 Star。

不管是著名的 Llama 系列，还是最新的 AI 新贵 Mistral，各种开源大语言模型都可以用 Ollama 实现一键安装并运行。支持的更多模型列表可以查看 Ollama 官网。

| Model | Parameters | Size | Download | | --- | --- | --- | | Llama 2 | 7B | 3.8GB | ollama run llama2 | | Mistral | 7B | 4.1GB | ollama run mistral |

如何安装 Ollama 框架？

Ollama 支持各个平台：Mac、Windows 和 Linux，也提供了 Docker Image。在 Ollama 官网或 GitHub 可以下载，然后一键安装 Ollama 框架。

Linux: curl -fsSL https://ollama.com/install.sh | sh
macOS: curl -fsSL https://ollama.com/install.sh | sh
Windows: 下载安装包后直接运行安装程序。

由于 Windows 上的相关配置可能随版本更新而变化，以下示例主要以 Linux 上运行 Ollama 来举例说明。

运行 Ollama 服务

在 Ollama 安装完成后，一般会自动启动 Ollama 服务，而且会自动设置为开机自启动。安装完成后，可以使用如下命令查看 Ollama 是否正常启动。如果显示'Active: active (running)'表示 Ollama 已经正常启动。

$ systemctl status ollama
● ollama.service - Ollama Service
     Loaded: loaded (/etc/systemd/system/ollama.service; enabled; vendor preset: enabled)
    Drop-In: /etc/systemd/system/ollama.service.d
             └─environment.conf
     Active: active (running) since Thu 2024-03-07 09:09:39 HKT; 4 days ago
   Main PID: 19975 (ollama)
      Tasks: 29 (limit: 69456)
     Memory: 1.1G
        CPU: 14min 44.702s
     CGroup: /system.slice/ollama.service
             └─19975 /usr/local/bin/ollama serve

在 Linux 上，如果 Ollama 未启动，可以用如下命令启动 Ollama 服务：ollama serve，或者 sudo systemctl start ollama。

通过分析 Linux 的安装脚本 install.sh，可以看到其中已经将 ollama serve 配置为一个系统服务，所以可以使用 systemctl 来 start / stop ollama 进程。

status "Creating ollama systemd service..."
cat <<EOF | $SUDO tee /etc/systemd/system/ollama.service >/dev/null
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=$BINDIR/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=$PATH"

启动 Ollama 服务后，可以查看当前的 Ollama 版本，以及常用命令。

~$ ollama -v
ollama version is 0.1.20
~$ ollama --help
Large language model runner

Usage:
  ollama [flags]
  ollama []

Available Commands:
  serve       Start ollama
  create      Create a model from a Modelfile
  show        Show information  a model
  run         Run a model
  pull        Pull a model from a registry
  push        Push a model to a registry
  list        List models
            Copy a model
            Remove a model
          Help about any

Ollama 本地部署与运行开源大语言模型指南

什么是 Ollama？

如何安装 Ollama 框架？

运行 Ollama 服务

更多推荐文章

相关免费在线工具

如何下载并运行大语言模型？

模型管理命令

REST API 与 Python 集成

HTTP 请求示例

Python 客户端示例

FAQ 与高级配置

如何查看运行的日志？

如何配置本地大模型对局域网提供服务？

本地有多张 GPU，如何用指定的 GPU 来运行 Ollama？

下载的大模型存储在哪个路径？

如何修改大模型存储的路径？

常见问题排查

更多推荐文章

相关免费在线工具

Ollama 本地部署与运行开源大语言模型指南

什么是 Ollama？

如何安装 Ollama 框架？

运行 Ollama 服务

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

如何下载并运行大语言模型？

模型管理命令

REST API 与 Python 集成

HTTP 请求示例

Python 客户端示例

FAQ 与高级配置

如何查看运行的日志？

如何配置本地大模型对局域网提供服务？

本地有多张 GPU，如何用指定的 GPU 来运行 Ollama？

下载的大模型存储在哪个路径？

如何修改大模型存储的路径？

常见问题排查

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具