
Ubuntu 20.04 安装 Ollama 与 Open WebUI 部署大模型指南
Ubuntu 20.04 环境下安装 Ollama 服务以运行本地大语言模型,结合 Docker 部署 Open WebUI 图形界面。流程包括环境检查、服务安装、模型拉取、参数配置及容器启动。支持 DeepSeek、Llama 3 等模型,提供类 ChatGPT 的本地交互体验,确保数据隐私与离线可用性。
博客作者
道法自然
336
已发布文章
9.2K
博客获赞
359K
博客浏览
第 13 页

Ubuntu 20.04 环境下安装 Ollama 服务以运行本地大语言模型,结合 Docker 部署 Open WebUI 图形界面。流程包括环境检查、服务安装、模型拉取、参数配置及容器启动。支持 DeepSeek、Llama 3 等模型,提供类 ChatGPT 的本地交互体验,确保数据隐私与离线可用性。

Qwen3.5-397B-A17B 作为原生多模态开源大模型,在预训练、异构基础设施及推理性能上实现全面升级。模型采用极致稀疏 MoE 架构,支持 256K 至 1M 上下文,具备强大的视觉推理与 Agent 构建能力。相比竞品,其在多语言支持、解码吞吐量及成本效益上表现优异,填补了国内多模态开源空白,为后续多模态 Agent 开发奠定基础。

基于 Java Swing 开发的个人所得税计算模拟器,模拟官方个税 APP 核心功能。包含综合所得年度汇算计算、税率表查询、专项扣除项目设置及税务计算结果展示。核心类实现 2023 年最新个税计算规则,使用 BigDecimal 确保精度,内置七级累进税率表。GUI 界面支持输入年收入、三险一金及专项附加扣除,自动计算应纳税额与税后收入,并提供月度数据估算…

Git 分支管理涉及创建、切换、合并及冲突处理等核心操作。通过理解分支作为并行宇宙的概念,开发者可在独立环境中工作而不影响主分支。掌握 fast-forward 与 no-ff 合并策略能保留历史痕迹。遇到冲突时需手动标记解决,利用 stash 暂存现场可灵活应对 Bug 修复。合理的分支策略保障开发效率与代码安全。

一个基于 C++20 实现的单机任务调度器,涵盖任务生命周期管理、资源控制及进程隔离。支持优先级调度、超时控制、cgroup 隔离、PSI 背压监测及 SQLite 持久化。提供 Prometheus 指标导出与 HTTP 健康检查接口。适用于 AI 训练、CI/CD、Serverless 及边缘计算等场景,强调低延迟与高可靠性。
Discord 机器人创建涉及开发者门户应用建立、Bot 用户添加、特权意图开启、Token 获取及 OAuth2 邀请链接生成。需确保 Message Content Intent 启用以读取消息内容,并在服务器角色权限中配置 View Channels 等必要许可。安全方面建议将 Token 存入环境变量而非硬编码代码库,同时注意 API 限流与审核要求…

AIGC 技术通过人工智能生成内容,涵盖文本、图像、语音、视频等多模态应用。梳理了 AIGC 核心概念、与大模型关系及行业影响,提供 DeepSeek、文心一言等工具的使用案例,包括 PPT 生成、代码辅助、AI 搜索与智能办公实践,旨在帮助读者掌握 AIGC 技术落地方法,提升工作效率。
介绍 Git 回退到指定 Commit 的三种主要方法。git reset 用于本地分支重置历史,分为 soft、mixed、hard 模式;git revert 通过创建新提交撤销更改,适用于已推送的共享分支;git checkout 用于临时查看旧版本或创建新分支。此外,git reflog 可用于恢复误删的提交记录。根据是否涉及远程共享及是否需要保留历…

利用文心一言生成智能体提示词,以职业卡通形象生成器为例。文章详解智能体信息配置,包括名称、简介、人设及开场白。工作流部分解析消息节点、文本处理节点、插件节点和图片消息节点的作用与配置。提供提示词优化技巧,涵盖结构化框架设计、多轮对话优化、细节强化及常见误区避免,帮助开发者实现稳定的工作流调用与输出效果。

涵盖前端面试核心知识点,包括闭包原理、事件循环机制、BFC 布局、内存泄漏排查、Vue 响应式与虚拟 DOM 原理、ES6 新特性、HTTP 缓存策略及性能优化方案。内容从基础语法到架构模式,结合代码示例解析常见陷阱与解决方案,适合求职者系统复习或开发者查漏补缺。

二分查找是算法竞赛中的高频考点,通过 A-B 数对与烦恼的高考志愿两道经典例题,深入讲解排序预处理后的区间查询技巧。重点剖析了利用 lower_bound 和 upper_bound 统计元素数量的方法,以及手动实现二分查找寻找最接近值的边界处理细节。文章强调二段性在二分中的应用,并对比了 STL 函数与手写二分的适用场景,帮助读者掌握高效解题思路。

介绍 C++ STL 栈 (stack) 的基本操作,涵盖入栈、出栈、访问栈顶、判空及获取大小。通过示例演示栈的声明、初始化及遍历。结合有效括号、最长有效括号、括号分数、Rails 序列验证及吐泡泡等算法题,展示栈在解决实际问题中的应用与实现逻辑。

数据库基础涵盖文件存储与数据库的对比、主流数据库类型、安装连接及服务器管理。深入解析 MySQL 架构、SQL 语言分类(DDL/DML/DQL/TCL)及存储引擎机制。通过创建学生表的完整流程演示建库、建表、增删改查操作,并探讨关键字大小写敏感性问题,为初学者构建扎实的数据库知识体系。

Java 开发环境搭建涉及 JDK 安装、环境变量配置及 IDE 部署。本指南详细演示了 LTS 版本 JDK 的选择与路径设置技巧,Windows 系统下的环境变量生效机制,以及 IntelliJ IDEA 的标准安装流程。通过构建 HelloWorld 项目,验证了编译运行环境,并解析了类定义与主方法入口的关键语法,为后续学习打下基础。

Java LangChain4j 集成 Milvus 向量数据库需完成环境部署、依赖引入、配置连接及核心操作。Milvus 为分布式云原生架构,支持亿级数据与高并发,适合生产环境;Chroma 为轻量嵌入式存储,适合开发测试与小规模应用。两者在 LangChain4j 中接口统一,可根据数据规模、运维成本及扩展需求进行选型,开发阶段可用 Chroma 快速验…

利用闲置安卓手机配合 KSWEB 搭建 Typecho 博客,并通过 Termux 安装 cpolar 实现内网穿透以支持外网访问。内容涵盖环境准备、KSWEB 配置、数据库建立、博客部署、隧道设置及主题适配等步骤,无需公网 IP 即可安全对外提供服务,适合预算有限的个人开发者或数码爱好者进行低成本服务器实践。
Android WebView 内核升级方案详解,针对华为等机型 Chromium 版本过低导致 H.265 硬解不支持的问题,介绍 WebViewUpgrade 开源库的免安装替换原理。通过 Hook 系统服务,在 Application 初始化前切换至 Google WebView 内核,实现视频解码能力升级。需注意多进程限制及升级时机,配合 JS 探测…

该章节阐述了临床决策支持系统的核心接口设计,展示了基于 Go 语言实现电子病历数据接收的结构。通过 POST /v1/cds/suggestions 接口,系统能够解析患者主诉及生命体征信息,为上层 AI 推理提供标准化输入。内容强调了数据结构映射的准确性与业务逻辑分层的重要性,确保 HIS 对接过程中的数据完整性与扩展性,避免硬编码导致的维护困难。

顺序表是线性表的顺序存储结构,采用数组连续存储数据元素。分为静态和动态两种,重点讲解动态顺序表的实现。内容包括初始化、销毁、打印、扩容、尾部及头部插入删除、指定位置插入删除、查找元素等操作。同时结合力扣算法题,演示双指针技巧在移除元素、删除有序数组重复项及合并有序数组中的应用。

基于 FastGPT 与 MCP 协议构建工具增强型智能体的方法。内容涵盖 MCP 协议原理、在 FastGPT 中创建与测试 MCP 工具集、AI 模型调用工具的单点与集合模式、私有化部署的环境配置及升级步骤,以及使用 MCP-Proxy 聚合多服务的高级方案。通过该方案可实现海量开源 MCP 组件快速接入,提升智能体应用的集成能力与灵活性。