CoPaw 和 OpenFang,两者软件本体都免费开源,但模型 API 可能产生费用。
CoPaw(阿里云)
- 软件本身:完全免费开源(Apache 2.0),无会员、无广告、无功能限制
- 本地部署:免费,仅需 Python 环境,可跑本地模型(Ollama 等),零 API 费用
- 云端部署:魔搭创空间有免费测试额度;长期使用按云资源(CPU/GPU/存储)计费
- 模型 API:调用通义千问、OpenAI、DeepSeek 等按官方标准按量付费
CoPaw GitHub 地址
https://github.com/agentscope-ai/CoPaw
OpenFang(AI Agent 操作系统)
- 软件本身:完全免费开源(Apache-2.0 + MIT),可商用、可二次开发
- 本地部署:免费,支持 Ollama、LM Studio 等本地模型,零 API 费用
- 云端部署:免费,仅承担云服务器/算力成本
- 模型 API:调用云端大模型按各厂商标准付费
OpenFang GitHub 地址
https://github.com/RightNow-AI/openfang
一句话总结:工具免费,模型可能花钱;本地跑模型则全程免费。
Ollama 本地运行的内存需求,核心看模型大小 + 量化等级,CoPaw 调用时和直接用 Ollama 一致。
主流模型内存参考(纯 CPU,Q4 量化)
- 0.5B / 1B:≥4GB 内存即可跑(入门聊天/简单任务)
- 3B:≥6GB 内存(日常对话、写文案)
- 7B:≥8GB 内存(流畅对话、代码、写作)
- 13B:≥16GB 内存(强推理、长文本)
- 32B:≥32GB 内存(复杂分析、专业场景)
- 70B:≥64GB 内存(企业级、深度推理)
关键影响因素
- 量化等级:Q2/Q3 比 Q4 更省内存,但效果略降;Q5/Q8 效果更好但更占内存
- GPU 加速:有 NVIDIA/Apple Silicon 时,显存分担内存压力,16GB 内存 + 4GB 显存可流畅跑 7B
- 上下文窗口:
num_ctx越大越占内存,默认 2048 够用,开 8192 会多占 1–2GB - 系统占用:Windows/macOS 本身占 2–4GB,建议预留 2GB 冗余
给 CoPaw 用的最佳实践
- 8GB 内存:选 3B 模型(qwen2.5:3b、llama3.2:3b),别跑 7B
- 16GB 内存:选 7B 模型(qwen2.5:7b、mistral:7b),日常足够
- 32GB+ 内存:可上 13B/32B,体验接近 GPT-3.5


