内网安全部署：Java + OpenClaw 本地大模型私有化方案

Ne0inhk

15 Mar 2026 — 10 min read

文章目录

前言
一、开篇：你的数据正在裸奔吗？
二、技术栈选型：为什么选这三兄弟？
三、架构设计：三层铁桶怎么搭？
- 3.1 数据流向图（脑补版）
- 3.2 安全边界划分
四、环境搭建：从0到1手摸手
五、Java集成实战：代码说话
六、内网安全加固：把门焊死
七、性能调优：让老爷车跑上高速
八、踩坑实录：这些坑我替你踩过了
九、总结：私有化的正确姿势

无意间发现了一个ZEEKLOG大神的人工智能教程，忍不住分享一下给大家。很通俗易懂，重点是还非常风趣幽默，像看小说一样。床送门放这了👉 http://blog.ZEEKLOG.net/jiangjunshow

前言

数据不出内网、模型本地跑、代码自己控——这套方案教你用Java+OpenClaw搭建企业级私有AI中枢，告别数据裸奔，让核心资料安心喂给AI。

一、开篇：你的数据正在裸奔吗？

想象一下，你花三个月整理的竞品分析报告、客户核心数据，随手丢给某个云端AI助手去总结。这就像在商场里大声喊你的银行卡密码——技术上可行，但心里特别不踏实。

很多公司不是不想用AI，是怕用AI。财务数据、用户隐私、商业机密，哪一样都不敢往公网送。所以私有化部署这五个字，成了2026年企业AI落地的硬通货。

今天这套方案，咱们玩的是铁桶阵：本地大模型（Ollama/Llama.cpp）+ OpenClaw自动化中枢 + Java业务中台，全程内网闭环，数据连公司WiFi都不会出。

二、技术栈选型：为什么选这三兄弟？

2.1 本地大模型：Ollama是傻瓜相机

别一听本地部署就头大。Ollama这工具把大模型部署做成了一键安装包，拉个镜像、跑条命令，Llama 3、Qwen 2.5、DeepSeek随你挑。4B以下的小模型普通笔记本都能跑，7B-13B的企业级模型配个RTX 4090也够用。

关键是它暴露了OpenAI兼容的REST API，这让后续集成爽到飞起。

2.2 OpenClaw：AI界的机械臂

OpenClaw是啥？简单说，它是让大模型长出手和眼的框架。不仅能对话，还能操作浏览器、读写本地文件、调用系统命令。最骚的是它支持视觉识别——给张截图，AI知道点哪个按钮。

在内网环境，OpenClaw相当于你的数字员工，能自动化处理Excel报表、抓取内部系统数据、甚至帮你写周报。

2.3 Java：老当益壮的底盘

别跟风学什么Python全栈了。企业里存量系统90%是Java，Spring Boot生态稳如老狗。用Java对接AI，不是图时髦，是图平滑落地——现有微服务加个接口就能调用本地模型，重构成本趋近于零。

三、架构设计：三层铁桶怎么搭？

3.1 数据流向图（脑补版）

[用户请求] → [Spring Boot网关] → [OpenClaw决策层] → [Ollama本地模型]

↓ ↓ ↓ ↓

业务数据权限校验/限流工具调用/视觉识别推理计算

所有流量在内网192.168.x.x段打转，物理隔离外网。

3.2 安全边界划分

模型层：Ollama只绑定localhost:11434，不对外暴露
控制层：OpenClaw通过Unix Socket或本地HTTP与模型通信
业务层：Java服务加JWT鉴权，敏感操作留审计日志

这三层就像俄罗斯套娃，拿下一层还有一层。

四、环境搭建：从0到1手摸手

4.1 本地模型部署（Ollama）

先装Ollama，官网下个安装包，5分钟搞定。别急着拉70B的怪兽，先搞个7B的试手：

# 拉取Qwen2.5 7B模型，中文场景吊打同体量 ollama pull qwen2.5:7b # 后台运行，只监听本地（关键！）OLLAMA_HOST=127.0.0.1:11434 ollama serve

验证一下是否跑通：

curl http://localhost:11434/api/generate -d'{ "model": "qwen2.5:7b", "prompt": "你好，请用一句话证明你是本地部署的AI" }'

看到返回JSON，说明你的大脑已经长好了。

4.2 OpenClaw安装与配置

OpenClaw需要Node.js环境（18+），npm一把梭：

npminstall-g @openclaw/cli

初始化配置

openclaw init --local-only

配置文件~/.openclaw/config.yaml里改这几行：

llm:provider: ollama model: qwen2.5:7b base_url: http://127.0.0.1:11434security:sandbox_mode: strict # 严格沙箱，禁止危险操作allowed_paths:- /opt/data/ # 只允许AI碰这个目录

4.3 Java项目准备

Spring Boot 3.x新建项目，加这几个依赖：

 org.springframework.boot spring-boot-starter-web org.springframework.ai spring-ai-ollama-spring-boot-starter 1.0.0-M3

注意Spring AI的版本要匹配，M3版本已经支持Ollama原生集成。

五、Java集成实战：代码说话

5.1 基础对话接口

先写个Service层，封装对Ollama的调用：

@ServicepublicclassLocalLLMService{privatefinalOllamaChatClient chatClient;publicLocalLLMService(OllamaChatClient chatClient){this.chatClient = chatClient;}publicStringchat(String message){return chatClient.call(message);}}

Controller暴露REST接口：

@RestController@RequestMapping("/api/ai")publicclassAIController{@AutowiredprivateLocalLLMService llmService;@PostMapping("/chat")publicResponseEntitychat(@RequestBodyChatRequest request){// 这里可以加企业级逻辑：权限校验、敏感词过滤、日志记录String response = llmService.chat(request.getMessage());returnResponseEntity.ok(response);}}

5.2 对接OpenClaw：让AI动手

OpenClaw暴露了本地HTTP接口（默认localhost:3000），Java用RestTemplate调用：

@ServicepublicclassOpenClawService{privatefinalRestTemplate restTemplate =newRestTemplate();privatestaticfinalStringOPENCLAW_URL="http://127.0.0.1:3000/api/execute";publicStringexecuteTask(String taskDescription){Map request =newHashMap<>(); request.put("task", taskDescription); request.put("context","内网环境，只能访问/opt/data目录");ResponseEntity response = restTemplate.postForEntity(OPENCLAW_URL, request,String.class);return response.getBody();}}

比如让AI处理Excel报表：

@PostMapping("/process-excel")publicStringprocessExcel(@RequestParamString filePath){String task ="读取"+ filePath +"，统计第三列销售额总和，生成汇总报告保存到/opt/data/report.txt";return openClawService.executeTask(task);}

这时候OpenClaw会：

调用视觉模型确认文件存在
读取Excel内容（通过本地Python脚本或Java辅助）
调用Ollama做数据分析
写入结果文件

全程数据在你服务器上打转，连GitHub Copilot都看不到。

5.3 高级玩法：RAG私有化

企业知识库也得本地化。用PgVector（PostgreSQL插件）做向量库：

@ServicepublicclassPrivateRAGService{@AutowiredprivateVectorStore vectorStore;publicStringqueryWithContext(String question){// 1. 向量化检索本地知识库List docs = vectorStore.similaritySearch(question);// 2. 组装PromptString context = docs.stream().map(Document::getContent).collect(Collectors.joining("\n"));String prompt ="基于以下内部资料回答问题：\n"+ context +"\n\n问题："+ question;// 3. 调用本地模型return llmService.chat(prompt);}}

文档入库时记得脱敏，正则表达式把手机号、身份证号打码：

privateStringdesensitize(String content){return content.replaceAll("\\d{11}","【手机号】").replaceAll("\\d{18}","【身份证】");}

六、内网安全加固：把门焊死

6.1 网络层隔离

Ollama默认只监听到127.0.0.1，这是最安全的。但如果你有多机部署需求，改成内网IP时记得加防火墙：

# 只允许特定IP段访问11434端口 iptables -A INPUT -p tcp --dport11434-s192.168.1.0/24 -j ACCEPT iptables -A INPUT -p tcp --dport11434-j DROP

6.2 Java层安全策略

请求限流：用Bucket4j防止某个内鬼疯狂刷接口
审计日志：谁问了什么、AI回了什么，全部落库
敏感操作二次确认：删除文件、发送邮件等操作，AI只是生成脚本，必须人工确认后执行

@Aspect@ComponentpublicclassAIAuditAspect{@AfterReturning(value ="@annotation(Auditable)", returning ="result")publicvoidlogAIInteraction(JoinPoint jp,Object result){// 记录到数据库，留着查账 auditLogService.save(newAIInteractionLog(jp.getArgs(), result));}}

6.3 OpenClaw沙箱配置

别让AI手滑删库。OpenClaw的strict模式下，所有文件操作都在/opt/data沙箱里，想越狱？门都没有。

sandbox:type: chroot # 类似Docker的隔离，但更轻量readonly_paths:- /etc/passwd # 想看用户列表？没门- /var/log # 日志也不给看

七、性能调优：让老爷车跑上高速

本地部署最怕的是一顿操作猛如虎，一看延迟五秒五。几个实用优化：

7.1 模型量化

Ollama支持Q4_K_M量化，7B模型压缩到4GB显存，推理速度翻倍。精度损失？对于文本生成任务，肉眼几乎不可感知。

ollama pull qwen2.5:7b-q4_K_M

7.2 并发处理

Java端用虚拟线程（JDK 21+）处理AI请求，一个请求等模型推理时，线程不阻塞：

@GetMapping("/stream-chat")publicFluxstreamChat(String message){return chatClient.stream(message).flatMap(content ->Flux.just(content)).subscribeOn(Schedulers.boundedElastic());}

7.3 缓存热点问题

员工问得最多的公司WiFi密码、报销流程，直接走Caffeine本地缓存，别每次都麻烦AI：

@Cacheable(value ="aiResponse", key ="#message.hashCode()")publicStringchat(String message){return chatClient.call(message);}

八、踩坑实录：这些坑我替你踩过了

8.1 编码问题

Ollama返回的中文可能是乱码，Java端强制UTF-8：

System.setProperty("file.encoding","UTF-8");

8.2 显存泄漏

长时间运行后CUDA out of memory？加个定时重启脚本，凌晨3点自动重启Ollama服务，比啥优化都管用。

8.3 OpenClaw权限

Linux下OpenClaw操作文件可能遇到权限不足，把运行用户加到data组，别给root权限，那是给自己埋雷。

九、总结：私有化的正确姿势

这套方案的核心就三点：

数据物理隔离：内网IP+防火墙，比啥加密都实在
能力分层：Java管业务、OpenClaw管自动化、Ollama管脑子，各司其职
可审计可追溯：所有操作留痕，出事能查

别觉得私有化部署多高大上，其实就是把云上的东西搬回家。Ollama让你零成本拥有GPT-3.5水平的模型，OpenClaw赋予它双手，Java把它包进现有业务流。

下次老板再问能不能用AI但别泄露数据，你可以把这篇文章拍他桌上——不仅能用，还安全得一批。

代码仓库：文中完整示例代码已整理至GitHub（搜索"java-openclaw-local-llm"），包含Docker Compose一键启动配置，5分钟搭完整个环境。

内网安全部署：Java + OpenClaw 本地大模型私有化方案

Ne0inhk

文章目录

前言

一、开篇：你的数据正在裸奔吗？

二、技术栈选型：为什么选这三兄弟？

2.1 本地大模型：Ollama是傻瓜相机

2.2 OpenClaw：AI界的机械臂

2.3 Java：老当益壮的底盘

三、架构设计：三层铁桶怎么搭？

3.1 数据流向图（脑补版）

3.2 安全边界划分

四、环境搭建：从0到1手摸手

4.1 本地模型部署（Ollama）

4.2 OpenClaw安装与配置

4.3 Java项目准备

五、Java集成实战：代码说话

5.1 基础对话接口

5.2 对接OpenClaw：让AI动手

5.3 高级玩法：RAG私有化

六、内网安全加固：把门焊死

6.1 网络层隔离

6.2 Java层安全策略

6.3 OpenClaw沙箱配置

七、性能调优：让老爷车跑上高速

7.1 模型量化

7.2 并发处理

7.3 缓存热点问题

八、踩坑实录：这些坑我替你踩过了

8.1 编码问题

8.2 显存泄漏

8.3 OpenClaw权限

九、总结：私有化的正确姿势

Read more

EnvPilot：一款基于 Rust 的跨平台环境变量神器，一键搞定 Windows/Linux 环境配置！

Flutter for OpenHarmony：convert 高效的二进制编码解码器，轻松处理 Hex、JSON、Base64（数据格式转换）深度解析与鸿蒙适配指南

[鸿蒙2025领航者闯关] 从零到英雄：我的鸿蒙开发技术成长与社区贡献之旅

网络（TCP）

文章目录

前言

一、开篇：你的数据正在裸奔吗？

二、技术栈选型：为什么选这三兄弟？

2.1 本地大模型：Ollama是傻瓜相机

2.2 OpenClaw：AI界的机械臂

2.3 Java：老当益壮的底盘

三、架构设计：三层铁桶怎么搭？

3.1 数据流向图（脑补版）

3.2 安全边界划分

四、环境搭建：从0到1手摸手

4.1 本地模型部署（Ollama）

4.2 OpenClaw安装与配置

4.3 Java项目准备

五、Java集成实战：代码说话

5.1 基础对话接口

5.2 对接OpenClaw：让AI动手

5.3 高级玩法：RAG私有化

六、内网安全加固：把门焊死

6.1 网络层隔离

6.2 Java层安全策略

6.3 OpenClaw沙箱配置

七、性能调优：让老爷车跑上高速

7.1 模型量化

7.2 并发处理

7.3 缓存热点问题

八、踩坑实录：这些坑我替你踩过了

8.1 编码问题

8.2 显存泄漏

8.3 OpenClaw权限

九、总结：私有化的正确姿势

Read more

EnvPilot：一款基于 Rust 的跨平台环境变量神器，一键搞定 Windows/Linux 环境配置！

Flutter for OpenHarmony：convert 高效的二进制编码解码器，轻松处理 Hex、JSON、Base64（数据格式转换） 深度解析与鸿蒙适配指南

[鸿蒙2025领航者闯关] 从零到英雄：我的鸿蒙开发技术成长与社区贡献之旅

网络（TCP）

Flutter for OpenHarmony：convert 高效的二进制编码解码器，轻松处理 Hex、JSON、Base64（数据格式转换）深度解析与鸿蒙适配指南