Ollama 简介
大模型是当前技术领域的热点话题,无论是国外的 ChatGPT、Llama3,还是国内的文心一言、通义千问等,都备受关注。Ollama 是一个支持在本地运行大语言模型的工具,兼容 Windows、Linux 和 MacOS 操作系统。它允许用户无需联网即可在本地设备上运行开源大模型,保障数据隐私并降低延迟。
安装方法
Ollama 支持主流桌面操作系统,安装方式简单快捷。
macOS
brew install ollama
Linux
curl -fsSL https://ollama.com/install.sh | sh
Windows
访问官网下载 Windows 安装包进行安装,或直接在 PowerShell 中运行:
winget install Ollama.Ollama
安装完成后,服务会自动启动并在后台运行。
常用模型列表
Ollama 本身不包含预装模型,需要单独拉取。支持的模型库可在 ollama.com/library 查看。以下是部分常用模型及其参数信息:
| Model | Parameters | Size | Download Command |
|---|---|---|---|
| Llama 3 | 8B | 4.7GB | ollama run llama3 |
| Llama 3 | 70B | 40GB | ollama run llama3:70b |
| Phi 3 Mini | 3.8B | 2.3GB | ollama run phi3 |
| Phi 3 Medium | 14B | 7.9GB | ollama run phi3:medium |
| Gemma | 2B | 1.4GB | ollama run gemma:2b |
| Mistral | 7B | 4.1GB | ollama run mistral |
| Code Llama | 7B | 3.8GB | ollama run codellama |
| LLaVA | 7B | 4.5GB | ollama run llava |
示例: 拉取并运行 Qwen 模型(阿里通义千问)
ollama pull qwen
ollama run qwen
命令行交互
安装并拉取模型后,可直接在终端与模型对话。Ollama 默认监听本地端口 11434。
基础对话
ollama run llama3
> 你现在是一个程序员,请用 JS 写一个冒泡排序算法。
> 好的,这是一个简单的冒泡排序实现...


