【LLM】Ollama：本地大模型 WebAPI 调用实战指南

优质文章学习记录

09 Apr 2026 — 2 min read

1. 为什么选择Ollama部署本地大模型

最近两年大模型技术发展迅猛，但很多开发者面临一个现实问题：公有云API调用不仅费用高昂，还存在数据隐私风险。Ollama的出现完美解决了这个痛点，它就像是你本地的模型管家，可以一键部署各种开源大模型。我去年在开发智能客服系统时就深受其益，既避免了敏感客户数据外泄，又省下了大笔API调用费用。

与传统方案相比，Ollama有三大优势：首先是安装简单，用Docker一条命令就能跑起来；其次是模型丰富，支持Llama、Mistral等主流开源模型；最重要的是API标准化，完全兼容OpenAI的接口规范。实测在16GB内存的MacBook Pro上运行7B参数的模型，响应速度可以控制在2秒以内，完全能满足大多数应用场景。

2. 五分钟快速搭建Ollama环境

2.1 准备工作就像搭积木

在开始之前，我们需要准备两个基础组件：Docker和Python环境。这里有个小技巧分享——建议使用Docker Desktop的WSL2后端（Windows用户），性能比传统虚拟机模式提升30%以上。安装完成后，记得执行以下命令验证版本：

docker --version # 应该输出类似：Docker version 24.0.7

Python环境推荐3.8+版本，太老的版本可能会遇到依赖冲突。我习惯用miniconda创建独立环境：

conda create -n ollama python=3.10 conda activate ollama pip install requests python-dotenv

2.2 启动Ollama服务

部署Ollama简单得令人发指，这条命令背后其实做了三件事：下载最新镜像、创建容器、映射API端口：

Read more

大模型训练：LLaMA-Factory快速上手

第1步：安装环境 git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory # 推荐使用 conda conda create -n llama-factory python=3.10 conda activate llama-factory pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 pip install -r requirements.txt pip install -e ".[torch,metrics]" ⚠️ 注意：推荐使用

【AI开发】—— Copilot最佳使用方式与配置

【AI开发】—— Copilot最佳使用方式与配置

从 Claude Code 到 Copilot：我的 AI 编码工具选型与深度配置指南本人使用过很多智能体开发工具，Claude Code、Codex、Cursor、Google Studio、Coze，其实千篇一律，大同小异。各厂商对 Agent 的 Prompt 设定与思考逻辑等略有差异，例如 Claude Code、Codex 等都有内置的系统提示词，作为开箱即用的 Coding 工具，专门针对编码、测试等开发流程进行了优化，使大家使用起来觉得非常高效（以 Claude Code 为例，感兴趣的可以参考 Claude Code 的系统提示词及智能体的设定）；后来出现了 Skills、MCP 等、Plan Agent、SubAgent 等新特性，

主流大模型介绍(GPT、Llama、ChatGLM、Qwen、deepseek)

主流大模型介绍(GPT、Llama、ChatGLM、Qwen、deepseek)

GPT系列模型一、ChatGPT 的本质 * 发布者：OpenAI（2022年11月30日） * 类型：聊天机器人模型，基于自然语言处理技术 * 核心能力：理解语言、生成对话、撰写邮件/文案/代码、翻译等 * 增长数据：2个月用户破1亿，日活约1300万二、GPT 系列模型演进对比模型发布时间参数量核心创新主要局限GPT-12018.061.17亿引入生成式预训练 + Transformer Decoder语言模型单向；需微调才能泛化GPT-22019.0215亿多任务学习 + Zero-shot 能力无监督能力仍有限GPT-32020.051750亿Few-shot 学习 + Sparse Attention成本高、长文本不稳定、内容不可控ChatGPT2022.11基于GPT-3引入 RLHF（人类反馈强化学习）服务不稳定、可能生成错误信息三、核心技术点回顾 1. GPT-1 * 使用单向 Transformer Decoder（

[论文阅读] (38)基于大模型的威胁情报分析与知识图谱构建论文总结（读书笔记）

[论文阅读] (38)基于大模型的威胁情报分析与知识图谱构建论文总结（读书笔记）

《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座，并分享给大家，希望您喜欢。由于作者的英文水平和学术能力不高，需要不断提升，所以还请大家批评指正，非常欢迎大家给我留言评论，学术路上期待与您前行，加油。忙碌的五月终于过去，忙到来不及分享技术，六月开启，继续更新博客，感谢大家的支持，久等了！本文旨在系统梳理大语言模型（LLM）在网络安全与威胁情报分析中的最新研究进展，侧重知识图谱构建、攻击行为建模以及模型泛化与推理能力等关键技术维度。结合作者当前的研究方向与兴趣，本文挑选并归纳了多篇代表性论文，其中重点详述的为与团队工作紧密相关、具有实际借鉴价值的工作。这些大佬的文章真心值得我们学习，希望本文对您有所帮助，写得不足之处还请海涵。在逐篇阅读过程中，笔者特别关注以下要素：论文所提出的系统框架图、大模型的技术创新点、与知识图谱的融合机制、以及所采用的实验验证方法和开源代码。这些内容不仅拓宽了对 LLM 能力边界的理解，也为我们后续在威胁情报建模与网络安全防御方面提供了一定的路径指引。同时，欢迎各位老师和大佬补充相关高质量论文，后续笔者也将不断更新与精炼此系列内容。希望