Ollama 简介
Ollama 是一个支持在 Windows、Linux 和 MacOS 上本地运行大语言模型的工具。它允许用户非常方便地运行和使用各种大语言模型,比如 Qwen 模型等。用户只需一行命令就可以启动模型。
主要特点
- 跨平台支持 Windows、Linux、MacOS 系统。
- 提供了丰富的模型库,包括 Qwen、Llama 等 1700+ 大语言模型,可以在官网 model library 中直接下载使用。
- 支持用户上传自己的模型。用户可以将 huggingface 等地的 ggml 格式模型导入到 ollama 中使用。也可以将基于 pytorch 等格式的模型转换为 ggml 格式后导入。
- 允许用户通过编写 modelfile 配置文件来自定义模型的推理参数,如 temperature、top_p 等,从而调节模型生成效果。
- 支持多 GPU 并行推理加速。在多卡环境下,可以设置环境变量来指定特定 GPU。
- 强大的技术团队支持,很多模型开源不到 24 小时就能获得支持。
总的来说,Ollama 降低了普通开发者使用大语言模型的门槛,使得本地部署体验大模型变得简单易行。对于想要搭建自己的 AI 应用,或者针对特定任务调优模型的开发者来说,是一个非常有用的工具。
安装指南
Windows 安装
直接从下载页面下载相对应系统的安装程序,Windows 安装包选择 Download for Windows(Preview)。
下载好以后一路 install 安装即可。
安装完成之后,打开一个 cmd 命令窗口,输入 ollama 命令,如果显示 ollama 相关的信息就证明安装已经成功了。
Mac 安装
直接从下载页面下载相对应系统的安装程序,点击 Download for Mac。
下载好后打开安装命令行。
Linux 安装
在 Linux 系统上,可以通过脚本安装或源码编译的方式来安装 Ollama。
脚本安装
Ollama 提供了一键安装脚本,可以快速在 Linux 系统上安装 Ollama。安装步骤如下:
打开终端,执行以下命令下载安装脚本:
curl -fsSL https://ollama.com/install.sh | sh
等待安装完成。安装脚本会自动下载所需的组件,并完成 Ollama 的安装与配置。
安装完成后,可以通过以下命令启动 Ollama:
ollama serve
二进制安装
将 Ollama 的二进制文件下载到 PATH 中的目录:
sudo curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama
将 Ollama 添加为自启动服务,首先,为 Ollama 创建用户:
sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama
然后在该位置:/etc/systemd/system/ollama.service 创建服务文件:
[Unit]
Description=Ollama Service
After=network-online.target
[Service]
ExecStart=/usr/bin/ollama serve
=ollama
=ollama
=always
=
=default.target


