本地大模型运行工具 Ollama 安装与使用指南

近年来，人工智能技术发展迅猛，其中大型语言模型（LLM）的进步尤为引人注目。LLM 拥有海量的参数和强大的学习能力，能够执行各种复杂任务，例如生成文本、翻译语言、编写不同类型的创意内容等等。以往，想要体验 LLM，通常需要将模型部署到云端，这对于个人用户来说门槛较高，且成本不菲。现在，Ollama 的出现打破了这一限制。

Ollama 是一款开源工具，旨在将 LLM 的强大功能带到你的本地机器。通过 Ollama，可以轻松下载和运行各种 LLM 模型，而无需将数据上传到云端。

Ollama 有哪些优势？

本地部署，数据安全：Ollama 将 LLM 模型部署在你的本地机器上，无需将数据上传到云端，数据安全更有保障。
降低成本：与云端部署相比，使用 Ollama 可以显著降低 LLM 的使用成本。
离线使用：Ollama 支持离线使用，即使没有网络连接也能照常使用 LLM。
易于使用：Ollama 提供了易于使用的命令行界面和 API，即使是初学者也能快速上手。
跨平台支持：支持 macOS、Linux 和 Windows 系统。

Ollama 可以做什么？

Ollama 的应用场景非常广泛，以下是一些示例：

生成创意内容：你可以使用 Ollama 生成诗歌、代码、脚本、音乐作品、电子邮件、信件等创意内容。
翻译语言：你可以使用 Ollama 将文本从一种语言翻译成另一种语言。
问答系统：你可以构建一个问答系统，使用 Ollama 来回答用户的问题。
聊天机器人：你可以构建一个聊天机器人，使用 Ollama 来与用户进行对话。
代码辅助：利用 Code Llama 等模型辅助编程，解释代码或生成片段。

Ollama 如何安装

Ollama 的安装非常简单，官方推荐使用以下命令，支持跨平台（MacOS、Linux、Windows）：

1. 标准安装方法

在终端中执行以下命令：

curl -fsSL https://ollama.com/install.sh | sh

该脚本会自动检测操作系统架构并下载对应的二进制文件。

2. 验证安装

安装完成后，你可以通过以下命令验证 Ollama 是否安装成功：

ollama --version

如果输出版本号（如 0.1.32），则说明安装成功。

Ollama 如何使用

Ollama 的核心操作主要通过命令行完成。以下是常用命令及其说明：

# 查看帮助信息
ollama --help

# 启动服务（后台运行）
ollama serve

# 拉取模型
ollama pull <model_name>

# 运行模型
ollama run <model_name>

# 列出已下载的模型
ollama list

# 删除模型
ollama rm <model_name>

启动服务

注意：这个服务必须先启动，否则无法使用 Ollama 运行模型。默认情况下，Ollama 会监听 127.0.0.1:11434 端口。

Model	Parameters	Size	Download Command
Llama 3	8B	4.7GB	`ollama run llama3`
Llama 3	70B	40GB	`ollama run llama3:70b`
Phi-3	3.8B	2.3GB	`ollama run phi3`
Mistral	7B	4.1GB	`ollama run mistral`
Neural Chat	7B	4.1GB	`ollama run neural-chat`
Starling	7B	4.1GB	`ollama run starling-lm`
Code Llama	7B	3.8GB	`ollama run codellama`
Llama 2 Uncensored	7B	3.8GB	`ollama run llama2-uncensored`
LLaVA	7B	4.5GB	`ollama run llava`
Gemma	2B	1.4GB	`ollama run gemma:2b`
Gemma	7B	4.8GB	`ollama run gemma:7b`
Solar	10.7B	6.1GB	`ollama run solar`
Qwen	7B	4.5GB	`ollama run qwen`

本地大模型运行工具 Ollama 安装与使用指南