Ollama 本地代码补全助手配置指南 | 极客日志

编程语言AI算法

Ollama 本地代码补全助手配置指南

综述由AI生成Ollama 是一款用于构建大语言模型应用的工具，提供 CLI 和服务器接口管理开源 LLM。详细说明了在 Windows 和 Linux 环境下安装 Ollama 的步骤，涵盖 Docker CPU 与 GPU 版本的部署方式。通过下载 Codeqwen 和 Qwen2 模型，配合 VS Code 的 Continue 插件配置，实现了本地代码自动补全与 AI 对话功能。此外，还介绍了集成 LanceDB 进行 RAG 向量检索以优化上下文体验的方法，帮助开发者快速搭建高效的本地 AI 编程助手。

念念不忘发布于 2025/2/6更新于 2026/6/216 浏览

Ollama 是一个用于构建大语言模型应用的工具，它提供了一些简单易用的 CLI 和服务器，能够让用户轻松下载、运行和管理各种开源 LLM。

一、如何使用？

本文以 Windows 环境为例，但实际体验来看，同等硬件环境下 Linux 系统体验会更流畅些。

1.1 安装 Ollama

Windows 用户可访问官网下载安装包。Docker 版本安装说明如下：

CPU 版本

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

GPU 版本

同时需要先安装 Nvidia Container Toolkit，下载地址：https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html#installation

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

Ollama 常用命令

启动 Ollama

ollama serve

查看已有模型列表

ollama list

下载模型 - 以千问 72b 为例

ollama pull qwen2:72b

运行模型

ollama run qwen2:72b

Docker 容器运行模型

docker exec -it ollama ollama run qwen2:72b

AI 提效 - 本地代码补全助手 + AI 助手

通过结合代码生成模型、Ollama 和 IDE 插件来打造强大的代码补全助手。例如使用 Codeqwen 7B 模型 + VSCode 的 Continue 插件，即可实现高效便捷的代码补全功能。

推荐的模型组合：Codeqwen 7B + Qwen2 7B 模型。

ollama run codeqwen
ollama run qwen2:7b

这两个模型中，Codeqwen 7B 是专门用于代码补全的模型，Qwen2 7B 是通用的聊天模型，且两者都不是重量级模型，本地运行负担较小。结合使用可实现代码补全 + AI 助手的聊天功能。

下载并运行好上述两个模型后，前往 VSCode 进行配置，编辑 Continue 插件的 config.json 文件：

{
  "models": [
    {
      "title": "Codeqwen 7B",

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

ollama pull nomic-embed-text
ollama run nomic-embed-text

Ollama 本地代码补全助手配置指南

一、如何使用？

1.1 安装 Ollama

CPU 版本

GPU 版本

Ollama 常用命令

启动 Ollama

查看已有模型列表

下载模型 - 以千问 72b 为例

运行模型

Docker 容器运行模型

AI 提效 - 本地代码补全助手 + AI 助手

更多推荐文章

相关免费在线工具

加上 RAG 向量检索优化聊天

更多推荐文章

相关免费在线工具

Ollama 本地代码补全助手配置指南

一、如何使用？

1.1 安装 Ollama

CPU 版本

GPU 版本

Ollama 常用命令

启动 Ollama

查看已有模型列表

下载模型 - 以千问 72b 为例

运行模型

Docker 容器运行模型

AI 提效 - 本地代码补全助手 + AI 助手

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

加上 RAG 向量检索优化聊天

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具