
Ubuntu 20.04 安装 Ollama 及 Open WebUI 部署大模型教程
介绍在 Ubuntu 20.04 系统上安装 Ollama 并部署本地大型语言模型的步骤。内容包括 Ollama 环境准备、命令行模型运行与管理,以及通过 Docker 部署 Open WebUI 图形化界面的全过程。重点涵盖数据隐私保护、离线可用性及硬件要求分析,提供从基础安装到图形交互的完整指南。
博客作者
逃离喧嚣
357
已发布文章
13K
博客获赞
924K
博客浏览
第 7 页

介绍在 Ubuntu 20.04 系统上安装 Ollama 并部署本地大型语言模型的步骤。内容包括 Ollama 环境准备、命令行模型运行与管理,以及通过 Docker 部署 Open WebUI 图形化界面的全过程。重点涵盖数据隐私保护、离线可用性及硬件要求分析,提供从基础安装到图形交互的完整指南。

OpenClaw 框架的技能包管理工具 ClawHub 的使用方法。内容包括 ClawHub CLI 的安装、技能包的搜索与批量安装(如 Self-Improving、Tavily Search、Summarize 等)。详细讲解了 Self-Improving 记忆系统的初始化配置及 API Key 设置。通过技术趋势研究助手的实战案例,演示了搜索、总结、…
介绍如何将高精度抠图模型RMBG-2.0(基于BiRefNet架构)无缝接入Stable Diffusion本地工作流。内容涵盖从单图抠图到批量处理,支持WebUI插件、ComfyUI节点及Python API三种集成方式。通过本地运行确保隐私安全,解决生成后背景替换难、手动PS耗时等问题。实战演示了电商产品图的多角度生成与合成流程,并提供了内存优化、LoR…
Circle Loss 提出了一种统一的相似度优化视角,将基于分类的学习(如 Softmax)与基于度量的学习(如 Triplet)统一在一个框架下。通过引入动态权重机制,根据样本难度自适应调整梯度,解决了传统损失函数优化不够灵活的问题。其决策边界从直线演变为圆弧,能更有效地处理正负样本对的优化,提升模型收敛效率。
介绍 Llama-Factory 开源框架,旨在降低大模型微调门槛。它支持多种主流模型架构,提供命令行与 WebUI 两种操作方式。核心功能包括 QLoRA、LoRA 及全参数微调,可在消费级显卡上运行。文章详细解析了从数据准备、训练配置到模型部署的全流程,并提供了代码示例、超参调优经验及安全实践建议,帮助开发者高效构建垂直领域模型。

一个基于 Web 的在线投稿系统的设计与实现。系统采用 SSM 框架(Spring+SpringMVC+MyBatis)作为后端核心,结合 Vue 前端技术,并使用 MySQL 数据库进行数据存储。文章阐述了系统的研究背景、目的意义及相关技术选型,重点分析了 B/S 架构的优势及 MySQL 数据库的特性。在系统实现部分,展示了用户信息管理和编辑信息管理等功…

Dify 1.13.0 版本发布重大更新,核心引入 HITL(人类参与闭环)机制。新增人工输入节点,支持工作流在关键节点暂停,由人工审核输出并决定流程走向,实现从自动化工具到可控智能执行系统的升级。同时,底层工作流引擎完成重构以支持暂停恢复能力。

SpringAI 框架在大模型应用开发中的入门知识。文章对比了 LangChain 与 SpringAI 的适用场景,指出 SpringAI 更适合 Spring 生态且需 JDK17 及以上环境。内容涵盖大模型 API 接入方式、pom.xml 与 application.yaml 配置、ChatClient 构建、同步与流式调用方法、System 设定、…
GitHub Copilot 在 PyCharm 中代码建议不准确的原因,主要包括对项目上下文理解有限及网络延迟等问题。针对此问题,文章提出了优化方案:完善项目文档和类型注解,通过详细的 docstring 和参数说明帮助 AI 理解业务逻辑;同时提及了合理组织项目结构的重要性,以提升代码生成的准确性和效率。
基于数字孪生与 VR/AR 技术的新能源汽车实训系统架构。针对高压电风险与教学痛点,系统采用状态机模拟电气逻辑,利用 AR 粒子特效可视化微观物理过程,并通过 VR 实现高精度拆装交互。在部署层面,解决了多设备帧级同步与局域网高并发问题,实现了软硬件协同,为职业教育提供安全、可视化的实训解决方案。
LightGBM 项目中 GitHub 机器人因权限变更导致 403 错误的故障。通过对比新旧权限矩阵,定位到 GitHub 组织级默认策略收紧问题。解决方案为在工作流文件中显式声明 issues 和 pull-requests 的 write 权限。修复后标签管理及 issue 状态更新功能恢复正常,误关闭率降为零,建立了可持续的自动化管理体系。
深度拆解字节跳动豆包系列大模型,涵盖官方定义、版本迭代、技术架构及落地场景。豆包作为国民级全模态 AI 产品,采用自研动态稀疏 MoE 架构与全模态原生融合技术,提供永久免费基础服务。文章分析了其在中文语境优化、端云协同语音交互、长上下文处理等方面的核心优势,以及政企服务、硬核推理、全球化布局等方面的现存不足。豆包通过生态深度整合与普惠化设计,解决了普通用户…

介绍如何基于 Node.js 开发 AI Skill 以实现网页内容抓取。通过构建包含 SKILL.md 元数据与执行脚本的项目结构,利用 axios 和 cheerio 库提取网页文本及媒体资源 URL。文章涵盖项目目录规范、元数据配置、核心代码逻辑及测试评估方法,帮助开发者扩展大模型能力,使其能自主获取并处理外部网络信息。

OpenClaw 开源 AI 智能体的多渠道接入配置指南。内容涵盖 Discord、微信(个人与企业)、Telegram、飞书、钉钉及 Slack 等平台的接入步骤与配置方法。重点讲解了 Wechaty 个人微信桥接方案的代码实现、企业微信回调配置以及 Docker 部署流程。此外,文章还提供了多模型配置、权限管理、安全实践、故障排查及实战案例(如代码审查、…

RoboBrain 2.0 是支持统一感知、推理和规划的具身大脑模型,提供 3B、7B、32B 版本。介绍环境搭建(Conda、依赖库、Torch)及多场景推理示例,包括图文问答(含思考模式)、目标检测、可供性预测、轨迹预测、指向预测及导航任务。

MCP Apps 是 MCP 协议的扩展标准,允许 AI 助手在对话框中渲染交互式 UI 界面,弥补了纯文本交互的不足。它通过 Server + Host + View 协同机制,支持数据可视化、表单配置、文档审查及实时监控等场景。与传统'应用优先'的 SaaS 不同,MCP Apps 转向'任务优先',让 AI 成为承载功能的小型操作系统入口。

基于 Java 开发者视角,对比了 IntelliJ IDEA 中 GitHub Copilot、TRAE AI 和阿里云灵码三款 AI 编程插件。重点分析了代码补全、对话交互及 Agent 工作流能力。结果显示 Copilot 在 Agent 流程和代码修改上表现最佳,适合高强度开发;TRAE AI 免费但体验割裂;灵码在国内环境下可用但智能度有限。建议根…

Flutter 组件 upnp_client 在 OpenHarmony 环境下的适配方案涉及底层 UDP 通信配置与权限设置。通过 DeviceDiscoverer 类可实现局域网内设备的自动发现与描述文件解析。针对鸿蒙系统多播包丢包及 XML 解析性能问题,建议采用定时器重试机制与后台线程处理。结合 AVTransport 服务可完成 DLNA 投屏控制…

Midjourney AI 图像生成工具的核心功能、价格方案及详细使用教程。内容包括如何注册 Discord 并接入 Midjourney 服务器,掌握/imagine 命令生成图像,理解 U/V 按钮功能,以及保存高清图片的方法。文章还提供了提升出图质量的五个技巧,如具体描述、指定风格、控制构图、优化光影和使用参数。此外,解答了关于语言要求、商用权限、替代…

基于 RFC 7519 标准,系统讲解 JWT 的定义、结构、原理及工作流程。涵盖 JWS/JWE 分支、签名算法分类、核心优劣势分析。重点阐述生产环境安全规范、双令牌刷新机制、分布式落地架构及常见误区。提供多语言实现库参考与进阶场景解决方案,帮助开发者构建安全的身份认证体系。