Ollama 本地部署与开源大模型实战指南

1、快速体验

1.1、下载 Ollama

首先得把 Ollama 装好，直接去官网 https://ollama.com/ 就能找到安装包。

文章配图

1.2、下载模型

Ollama 内置了很多开源模型，带 thinking 标签的通常支持深度思考，vision 具备多模态视觉能力，而 tools 则能调用 MCP 工具。我们按需选择即可。

文章配图

比如下载 gemma3，直接在命令行输入 ollama run <模型名>，它会自动先下载再启动，跑起来就能对话了。

ollama run gemma3

1.3、模型命名规则

你会发现模型版本很多，如果不加后缀，默认下载的是通用版。如果想更精细控制，就得看懂后面的参数组合：通常是 模型名 + 参数量 + 量化精度。

参数量越大性能越强，量化精度越高效果越好，但显存占用也会增加。比如 gemma3-12b-it-q4_K_M 代表：Gemma 第 3 代、120 亿参数、指令微调版、4-bit 量化（K-quant 中等规模）。

文章配图

1.4、更改模型下载地址（可选）

默认模型存在系统盘，如果空间紧张，可以改到外接硬盘或其他位置，实现模型自由。

echo 'export OLLAMA_MODELS="/<文件夹路径>/models"' >> ~/.zshrc
source ~/.zshrc

1.5、基础使用

安装完模型后，掌握几条管理命令就够了。基本逻辑就是 ollama + 操作名称。

查看已下载的模型：

ollama list

运行模型（不存在会自动下载）：

ollama run deepseek-r1:1.5b

删除模型：

ollama rm deepseek-r1:1.5b

想看运行时的速度和 Token 消耗细节，加上 --verbose 参数：

from langchain_community.chat_models import ChatOllama from langchain_community.chat_message_histories import SQLChatMessageHistory from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder class LangChainChatBot: def __init__(self, model_name="qwen3:1.7b", session_id="default"): """使用 LangChain 连接 Ollama 模型，并使用的 SQLChatMessageHistory 存储历史对话 Args: model_name: 模型名称 session_id: 会话 ID """ self.session_id = session_id # 初始化模型 self.__llm = ChatOllama( model=model_name, base_url="http://localhost:11434", temperature=0.7 ) # 使用 LangChain 的 SQLChatMessageHistory self.__chat_history = SQLChatMessageHistory( session_id=session_id, connection_string="sqlite:///chat_history.db" ) # 设置对话链，包含系统提示和历史 # 创建提示模板 self.__prompt = ChatPromptTemplate.from_messages([ ("system", "你是一个有帮助的 AI 助手。请根据对话历史回答用户的问题。"), MessagesPlaceholder(variable_name="chat_history"), ("human", "{input}"), ]) # 创建对话链 self.__chain = self.__prompt | self.__llm def chat(self, user_input: str) -> str: """进行对话""" try: # 调用对话链 response = self.__chain.invoke({"chat_history": self.__chat_history.messages, "input": user_input}) # 保存消息到历史 self.__chat_history.add_user_message(user_input) self.__chat_history.add_ai_message(response.content) return response.content except Exception as e: return f"错误：{str(e)}" def main(): bot = LangChainChatBot(session_id="langchain_session") print("=== 使用 LangChain SQLChatMessageHistory ===") print(f"会话 ID: {bot.session_id}") while True: user_input = input("\n你：") response = bot.chat(user_input) print(f"AI: {response}") if __name__ == "__main__": main()

Ollama 本地部署与开源大模型实战指南

1、快速体验

1.1、下载 Ollama

1.2、下载模型

1.3、模型命名规则

1.4、更改模型下载地址（可选）

1.5、基础使用

更多推荐文章

相关免费在线工具

1.6、图片识别

2、自定义模型

2.1、创建模型：给模型写档案说明

2.2、可自定义的模型参数

2.3、可视化界面

3、进阶：局域网服务器

3.1、更改 Ollama 服务地址

3.2、保留模型权重

3.3、永久更改配置

3.4、局域网访问

使用代码访问

更多推荐文章

相关免费在线工具

Ollama 本地部署与开源大模型实战指南

1、快速体验

1.1、下载 Ollama

1.2、下载模型

1.3、模型命名规则

1.4、更改模型下载地址（可选）

1.5、基础使用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.6、图片识别

2、自定义模型

2.1、创建模型：给模型写档案说明

2.2、可自定义的模型参数

2.3、可视化界面

3、进阶：局域网服务器

3.1、更改 Ollama 服务地址

3.2、保留模型权重

3.3、永久更改配置

3.4、局域网访问

使用代码访问

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具