百川 2-13B-Chat WebUI v1.0 故障排查手册：6 大常见问题解决 | 极客日志

PythonAI算法

百川 2-13B-Chat WebUI v1.0 故障排查手册：6 大常见问题解决

百川 2-13B-Chat WebUI v1.0 部署后的六大常见问题及解决方案。涵盖网页无法访问（检查服务、端口、防火墙）、响应速度慢（模型加载、GPU 占用、参数设置）、回复中断（Max Tokens、停止标记、显存不足）、内存溢出（OOM 检查、对话历史清理）、服务自动停止（日志分析、Supervisor 配置）以及回答质量下降（模型完整性、参数调优、Prompt 优化）。通过状态检查脚本、日志查看及资源监控命令，可快速定位并修复大部分问题。

SparkGeek发布于 2026/4/6更新于 2026/7/2150 浏览

百川 2-13B-Chat WebUI v1.0 故障排查手册

1. 问题一：网页打不开，显示'无法访问此网站'

这是最常见的问题，通常有几种可能的原因。咱们一步步来排查。

1.1 检查服务是否真的在运行

首先，打开终端，运行状态检查脚本：

/root/baichuan2-13b-webui/check.sh

你会看到类似这样的输出：

╔══════════════════════════════════════════════════════════════╗ ║ 百川 2-13B-Chat WebUI 状态检查 ║ ╚══════════════════════════════════════════════════════════════╝ 【服务状态】 ❌ 未运行 baichuan-webui STOPPED Not started 【端口监听】 ❌ 7860 端口未监听 【GPU 状态】 型号：NVIDIA GeForce RTX 4090 D 显存：500 MiB / 24576 MiB (2.0%) 利用率：0% 【WebUI 访问】 ❌ 不可访问 URL: http://0.0.0.0:7860 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ ❌ 发现问题：服务未运行！ ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

supervisorctl start baichuan-webui

netstat -tulpn | grep 7860

tcp 0 0 0.0.0.0:7860 0.0.0.0:* LISTEN 12345/python

supervisorctl start baichuan-webui

# 查看哪个进程占用了 7860 端口 sudo lsof -i :7860 # 如果确实有其他进程占用，杀掉它（注意：确认不是重要服务） sudo kill -9 <进程 ID>

supervisorctl stop baichuan-webui

# 对于 Ubuntu/Debian 系统（使用 ufw） sudo ufw allow 7860 sudo ufw reload # 对于 CentOS/RHEL 系统（使用 firewalld） sudo firewall-cmd --permanent --add-port=7860/tcp sudo firewall-cmd --reload # 临时开放端口（测试用） sudo iptables -I INPUT -p tcp --dport 7860 -j ACCEPT

# 查看服务器的 IP 地址 ip addr show # 或 hostname -I

# 查看服务日志，看模型加载进度 tail -f /root/baichuan2-13b-webui/logs/error.log

Loading model from /root/models/baichuan2-13b-chat-4bits... Loading tokenizer... Loading model weights... Model loaded successfully! Time: 32.5s

nvidia-smi

+-----------------------------------------------------------------------------+
| Processes:
|
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================
|
| 0 N/A N/A 12345 C .../python baichuan-webui 21000MiB |
+-----------------------------------------------------------------------------+

# 检查 CPU 使用率 top # 检查内存使用 free -h # 检查磁盘 IO iostat -x 1

# 测试到服务器的网络延迟 ping 你的服务器 IP # 测试端口连通性 telnet 你的服务器 IP 7860 # 或 nc -zv 你的服务器 IP 7860

用户：请继续写完上面的回答。

继续。

请接着上面的话说完。

请完整回答，不要中途停止。

# 检查显存使用情况 nvidia-smi

supervisorctl restart baichuan-webui

# 查看服务超时设置 cat /root/baichuan2-13b-webui/config.py | grep timeout

nvidia-smi

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.161.07 Driver Version: 535.161.07 CUDA Version: 12.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA RTX 4090 D Off| 00000000:01:00.0 Off | Off |
| 0% 45C P8 30W / 450W| 10500MiB / 24576MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+

错误信息：CUDA out of memory. Tried to allocate...

supervisorctl restart baichuan-webui

# 找到占用显存的进程 ID nvidia-smi # 停止进程（谨慎操作，确认不是重要服务） kill -9 <进程 ID>

fuser -v /dev/nvidia*

（请忽略之前的对话，重新开始）我的问题是：...

# 每天凌晨自动重启（通过 crontab） 0 3 * * * supervisorctl restart baichuan-webui

# 实时监控 GPU 状态 watch -n 1 nvidia-smi

# 查看服务状态 supervisorctl status baichuan-webui # 查看详细日志 tail -100 /root/baichuan2-13b-webui/logs/error.log

Error: [Errno 98] Address already in use

Error loading model weights: File corrupted

CUDA error: out of memory CUDA error: illegal memory access

# 检查 Supervisor 配置 cat /etc/supervisor/conf.d/baichuan-webui.conf

[program:baichuan-webui]
command=python app.py # 启动命令
directory=/root/baichuan2-13b-webui # 工作目录
autostart=true # 是否自动启动
autorestart=true # 是否自动重启
startretries=3 # 启动重试次数
stderr_logfile=/root/baichuan2-13b-webui/logs/error.log # 错误日志
stdout_logfile=/root/baichuan2-13b-webui/logs/access.log # 访问日志

# 查看进程限制 cat /proc/$(pgrep -f baichuan-webui)/limits # 查看系统日志（可能记录 OOM killer） dmesg | tail -50

# 每周重启一次 0 4 * * 0 supervisorctl restart baichuan-webui

# 简单的监控脚本
#!/bin/bash
STATUS=$(supervisorctl status baichuan-webui | awk '{print $2}')
if [ "$STATUS" != "RUNNING" ]; then
    echo "百川服务异常！状态：$STATUS"
    # 可以发送邮件或微信通知
    supervisorctl restart baichuan-webui
fi

# 每天检查一次错误日志 grep -i error /root/baichuan2-13b-webui/logs/error.log | tail -20

# 检查模型文件大小 du -sh /root/models/baichuan2-13b-chat-4bits/ # 应该有几个 GB 的大小 # 如果大小异常，可能需要重新下载

grep -A5 -B5 "Loading model" /root/baichuan2-13b-webui/logs/error.log

# 备份原有模型 mv /root/models/baichuan2-13b-chat-4bits /root/models/baichuan2-13b-chat-4bits.backup # 重新下载（根据实际下载命令） # 这里需要根据你的实际下载方式调整

写代码

翻译

解释一下

请用 Python 写一个快速排序算法，要求：
1. 包含详细的注释说明每一步
2. 包含 3 个测试用例
3. 分析时间复杂度和空间复杂度

请将以下英文技术文档翻译成中文，要求：
1. 专业术语翻译准确
2. 保持技术文档的严谨性
3. 语句通顺符合中文表达习惯
[英文文档内容]

请用通俗易懂的方式解释什么是神经网络，要求：
1. 用生活中的例子类比
2. 避免使用复杂数学公式
3. 说明核心思想和工作原理

# 查看系统编码 echo $LANG # 查看 Python 编码 python -c "import locale; print(locale.getpreferredencoding())"

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8')

export LANG=en_US.UTF-8
export LC_ALL=en_US.UTF-8

（请忽略之前的所有对话，重新开始）我的问题是：...

网页打不开？
├─ 服务是否运行？ → 否 → 启动服务
│ 是
├─ 端口是否监听？ → 否 → 检查端口占用
│ 是
├─ 防火墙是否阻挡？ → 是 → 开放端口
│ 否
└─ 浏览器/网络问题？ → 是 → 清除缓存/检查网络

响应速度慢？
├─ 是否是首次加载？ → 是 → 等待 30-60 秒
│ 否
├─ GPU 是否被占用？ → 是 → 停止其他任务
│ 否
├─ 参数设置是否合理？ → 否 → 调整参数
│ 是
└─ 服务器资源是否充足？ → 否 → 优化/升级

回复中断？
├─ Max Tokens 是否太小？ → 是 → 增大设置
│ 否
├─ 是否遇到停止标记？ → 是 → 使用继续指令
│ 否
├─ 显存是否不足？ → 是 → 重启服务/清理历史
│ 否
└─ 是否请求超时？ → 是 → 拆分问题/调整配置

内存不足？
├─ 检查当前显存使用 → 接近 100% → 重启服务
│ 正常
├─ 是否有其他进程？ → 是 → 停止不必要进程
│ 否
├─ 对话历史是否过长？ → 是 → 清理历史
│ 否
└─ 是否批量处理？ → 是 → 改为逐个处理

# 查看完整的错误日志 cat /root/baichuan2-13b-webui/logs/error.log # 查看系统日志 journalctl -u supervisor.service --since "1 hour ago" # 查看内核日志（可能有关 OOM） dmesg | tail -100

百川 2-13B-Chat WebUI v1.0 故障排查手册：6 大常见问题解决

百川 2-13B-Chat WebUI v1.0 故障排查手册

1. 问题一：网页打不开，显示'无法访问此网站'

1.1 检查服务是否真的在运行

更多推荐文章

相关免费在线工具

1.2 检查端口是否被占用

1.3 检查防火墙设置

1.4 检查浏览器缓存和代理

1.5 检查 IP 地址是否正确

2. 问题二：响应速度慢，等半天才有回复

2.1 首次加载需要时间

2.2 GPU 被其他任务占用

2.3 参数设置不合理导致速度慢

2.4 服务器资源不足

2.5 网络延迟问题

3. 问题三：回复中断或不完整

3.1 Max Tokens 设置太小

3.2 模型遇到停止标记

3.3 显存不足导致中断

3.4 请求超时

4. 问题四：GPU 内存不足或 OOM（内存溢出）

4.1 检查当前显存使用

4.2 常见的内存问题场景

4.3 预防内存问题的建议

5. 问题五：服务自动停止或频繁重启

5.1 检查服务状态和日志

5.2 Supervisor 配置问题

5.3 系统资源限制

5.4 定期维护建议

6. 问题六：回答质量下降或输出乱码

6.1 模型加载不完整

6.2 参数设置不当

6.3 提示词（Prompt）问题

6.4 编码问题导致乱码

6.5 对话历史污染

7. 总结：快速排查流程图

更多推荐文章

相关免费在线工具

百川 2-13B-Chat WebUI v1.0 故障排查手册：6 大常见问题解决

百川 2-13B-Chat WebUI v1.0 故障排查手册

1. 问题一：网页打不开，显示'无法访问此网站'

1.1 检查服务是否真的在运行

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 检查端口是否被占用

1.3 检查防火墙设置

1.4 检查浏览器缓存和代理

1.5 检查 IP 地址是否正确

2. 问题二：响应速度慢，等半天才有回复

2.1 首次加载需要时间

2.2 GPU 被其他任务占用

2.3 参数设置不合理导致速度慢

2.4 服务器资源不足

2.5 网络延迟问题

3. 问题三：回复中断或不完整

3.1 Max Tokens 设置太小

3.2 模型遇到停止标记

3.3 显存不足导致中断

3.4 请求超时

4. 问题四：GPU 内存不足或 OOM（内存溢出）

4.1 检查当前显存使用

4.2 常见的内存问题场景

4.3 预防内存问题的建议

5. 问题五：服务自动停止或频繁重启

5.1 检查服务状态和日志

5.2 Supervisor 配置问题

5.3 系统资源限制

5.4 定期维护建议

6. 问题六：回答质量下降或输出乱码

6.1 模型加载不完整

6.2 参数设置不当

6.3 提示词（Prompt）问题

6.4 编码问题导致乱码

6.5 对话历史污染

7. 总结：快速排查流程图

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具