跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

KoboldAI 安装与配置指南

介绍 KoboldAI 的安装与配置。KoboldAI 是基于浏览器的 AI 辅助写作前端,支持本地和远程模型。提供在线(Google Colab)、Windows 离线、Linux 及 Docker 多种部署方式。涵盖依赖安装、模型配置、三种使用模式(冒险、写作、聊天)、性能优化及 API 接口说明。适用于小说创作、文字冒险游戏及对话交互场景。

不知所云发布于 2026/4/5更新于 2026/5/2327 浏览

KoboldAI 简介

KoboldAI 是一个基于浏览器的 AI 辅助写作前端,支持多种本地和远程 AI 模型。它提供标准化的写作工具套件,包括记忆功能、作者笔记、世界信息、保存加载、可调节的 AI 设置、格式化选项等。你可以将其作为写作助手、游戏平台或聊天机器人使用。

核心功能亮点

  • 多种游戏模式:小说模式、冒险模式、聊天模式
  • 丰富的 AI 模型:支持多种本地和云端模型
  • 完整写作工具:记忆系统、世界构建、格式控制

快速开始:三种安装方式

在线免费体验(最简单)

使用 Google Colab 在线运行 KoboldAI,无需安装任何软件:

  • TPU 版本:支持 13B 大模型
  • GPU 版本:兼容更多 2.7B 模型

Google Colab 使用技巧:

  • 定期处理验证码,避免实例被关闭
  • 使用 Google Drive 存储文件和设置
  • 可选择下载保存文件到本地
Windows 用户离线安装(最稳定)
  1. 运行安装脚本:
    • 以管理员身份运行 install_requirements.bat
    • 选择临时 B:驱动器选项
    • 等待安装完成,不要中途关闭
  2. 启动应用:
    • 运行 play.bat 或 remote-play.bat

获取离线安装包:

git clone [项目仓库地址]
cd KoboldAI-Client
Linux 用户安装指南
  1. 安装依赖:
    • Nvidia 用户:运行 ./play.sh
    • AMD 用户:运行 ./play-rocm.sh

克隆仓库:

git clone [项目仓库地址]
cd KoboldAI-Client

环境配置详解

依赖要求

项目使用 Python 环境,主要依赖包括:

  • transformers==4.24.0 - Hugging Face 模型加载
  • torch>=1.9,<1.13 - PyTorch 深度学习框架
  • Flask==2.2.3 - Web 应用框架

完整依赖列表见 requirements.txt

模型配置

KoboldAI 支持多种 AI 模型,配置文件位于 maps/ 目录:

  • bloom.json
  • gpt_neo.json
  • gptj.json

使用模式详解

冒险模式
  • 启用设置中的冒险模式
  • 使用第二人称视角("You take the sword")
  • 支持角色扮演和文本冒险游戏
写作助手模式
  • 使用小说优化模型
  • 第一人称或第三人称写作
  • 专业的文学创作支持
  • 聊天模式
    • 自动添加用户名到对话开头
    • 防止 AI 以用户身份发言
    • 适合对话式交互

    Docker 部署选项

    对于喜欢容器化部署的用户,项目提供了多种 Docker 方案:

    CUDA 支持
    • Dockerfile
    • docker-compose.yml
    ROCM 支持(AMD GPU)
    • Dockerfile
    • docker-compose.yml

    性能优化技巧

    模型选择策略
    • 新手推荐:从 6B 模型开始
    • 写作需求:选择小说优化模型
    • 游戏需求:选择冒险模式模型
    硬件配置建议
    • NVIDIA GPU:Compute Capability 5.0+
    • AMD GPU:仅 Linux 系统支持
    • CPU 模式:虽然较慢但可用

    常见问题解决

    安装失败处理
    • ModuleNotFoundError:重新运行安装脚本
    • GPU 未找到:检查 CUDA 版本兼容性
    • 配置文件缺失:确保模型文件完整
    网络连接问题
    • 检查防火墙设置
    • 验证端口 5000 是否可用
    • 使用 remote-play 脚本进行远程访问

    高级功能探索

    Softprompts 软提示
    • 改变现有模型的输出风格
    • 支持特定主题和写作风格
    • 社区资源丰富
    Userscripts 用户脚本
    • 自动化任务和修改 AI 行为
    • 使用 LUA5.4 脚本语言
    • 内置安全沙盒保护

    API 接口使用

    KoboldAI 提供完整的 REST API:

    • 访问地址:http://127.0.0.1:5000/api
    • 交互式文档支持
    • 便于集成其他应用

    通过这份完整的 KoboldAI 安装配置指南,你现在应该能够顺利安装并开始使用这个强大的 AI 写作工具了。无论你是作家、游戏玩家还是 AI 爱好者,KoboldAI 都能为你带来全新的创作体验。

    目录

    1. KoboldAI 简介
    2. 核心功能亮点
    3. 快速开始:三种安装方式
    4. 在线免费体验(最简单)
    5. Windows 用户离线安装(最稳定)
    6. Linux 用户安装指南
    7. 环境配置详解
    8. 依赖要求
    9. 模型配置
    10. 使用模式详解
    11. 冒险模式
    12. 写作助手模式
    13. 聊天模式
    14. Docker 部署选项
    15. CUDA 支持
    16. ROCM 支持(AMD GPU)
    17. 性能优化技巧
    18. 模型选择策略
    19. 硬件配置建议
    20. 常见问题解决
    21. 安装失败处理
    22. 网络连接问题
    23. 高级功能探索
    24. Softprompts 软提示
    25. Userscripts 用户脚本
    26. API 接口使用
    • 💰 8折买阿里云服务器限时8折了解详情
    • Magick API 一键接入全球大模型注册送1000万token查看
    • 🤖 一键搭建Deepseek满血版了解详情
    • 一键打造专属AI 智能体了解详情
    极客日志微信公众号二维码

    微信扫一扫,关注极客日志

    微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

    更多推荐文章

    查看全部
    • 无线蜂窝网络:构建万物互联的无形之网
    • 开源大模型争议:是真开源还是假开源?
    • Spring Web MVC 核心概念与实战详解
    • C++微服务 UserServer 设计与实现
    • Flutter 三方库 arcane_helper_utils 鸿蒙化适配指南
    • LLaMA 大模型微调实践与心得:基于 LoRA 的高效方案
    • 实战:用 Claude Code 重构 Jakarta EE 消息队列生产者代码
    • 国产时序数据库云原生实践:Apache IoTDB 与 TimechoDB 深度应用
    • 智能车摄像头控制:动态权、模糊 PID、速度决策与路径优化
    • 数据结构基础:树的概念与结构详解
    • 仓颉语言 libmd 哈希算法库实现详解
    • Whisper 模型本地化部署:版本下载与离线环境搭建
    • VS Code 使用 VS2022 编译 C++ 的完整流程
    • 2026 无人机 AI 算法全景:7 大场景与 50+ 核心算法
    • Selenium 自动化中如何获取折叠面板内的内容
    • MacOS 极简部署 OpenClaw:Docker 版 + 飞书集成
    • llama.cpp SYCL 后端配置指南:在 Intel GPU 上运行大模型
    • 单核 CPU 可抢占优先级任务调度算法解析
    • OpenClaw 接入自定义模型并基于 WebUI 完成智能操作
    • OpenClaw 开源 AI Agent 框架技术解析与实战指南

    相关免费在线工具

    • 加密/解密文本

      使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

    • RSA密钥对生成器

      生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

    • Mermaid 预览与可视化编辑

      基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

    • 随机西班牙地址生成器

      随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

    • Gemini 图片去水印

      基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

    • curl 转代码

      解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online