Windows 11 下利用 llama.cpp 测试 Qwen3.5 量化模型
记录了在 Windows 11 环境下使用 llama.cpp 运行 Qwen3.5 系列量化模型的测试过程。主要步骤包括下载 CPU 版本的 llama.cpp 二进制文件,从 HuggingFace 获取 GGUF 格式的量化模型(如 0.8B 和 2B 版本)。测试涵盖了翻译、数学解题及物理化学问答等任务。结果显示,UD-Q4_K_XL 精度优于 Q4…
博客作者
恶作剧之神
365
已发布文章
10K
博客获赞
816K
博客浏览
第 5 页
记录了在 Windows 11 环境下使用 llama.cpp 运行 Qwen3.5 系列量化模型的测试过程。主要步骤包括下载 CPU 版本的 llama.cpp 二进制文件,从 HuggingFace 获取 GGUF 格式的量化模型(如 0.8B 和 2B 版本)。测试涵盖了翻译、数学解题及物理化学问答等任务。结果显示,UD-Q4_K_XL 精度优于 Q4…

介绍使用 Cursor AI 工具从零开发 Chrome 浏览器插件的过程。通过优化 Prompt,利用 Cursor 的 Agent 模式自动生成代码,实现从豆包网站下载并去除图片水印的功能。内容涵盖需求分析、项目搭建、调试解决 HTTP 403 错误及水印处理,最终完成插件功能验证与发布流程。

介绍开源 AI 编程工具 OpenCode 的使用方法。涵盖全平台安装(终端脚本、Homebrew、Docker 等)、API 密钥配置、项目初始化及核心功能实战。重点讲解 Plan+Build 双模式工作流、Slash 命令体系及 VSCode 集成方案,帮助开发者提升编码效率与协作体验。

基于 LLaMA-Factory 平台进行大模型微调与部署的完整流程。内容包括环境安装(容器与编译)、数据集准备(Alpaca/ShareGPT 格式)、LoRA 微调参数配置、训练过程监控、批量推理评估(BLEU/ROUGE 指标)、模型合并导出以及使用 Ollama+GGUF 进行最终部署。文章提供了详细的命令行操作示例和关键参数说明,适用于希望快速上手…

一款渐进式AIGC聚合系统,集成了多种主流大模型能力。系统支持AI聊天、专业绘画、智能体应用、Agent应用及视频生成等功能。核心特性包括对Claude、GPT、Gemini、Nano-Banana-2、VEO3、Sora-2等模型的接入,以及基于Coze的工作流与插件开发。系统提供私有化部署方案,涵盖管理后台、移动端适配及微信登录支付功能,面向个人、开发者…

介绍从人类 RGB 视频到人形机器人跳舞的全流程。首先利用 GVHMR 从视频提取人体运动轨迹,通过 GMR 将动作重定向至 Unitree G1 机器人关节空间。接着使用 BeyondMimic 框架在 Isaac Lab 中基于 PPO 算法进行强化学习训练,并导出 ONNX 模型。最后通过 rl_sar 框架在 MuJoCo 仿真验证并部署至真机。文章…
使用 Python(FastAPI/Flask)构建后端 API 并与前端框架(React/Vue)集成的全栈开发流程。内容包括 RESTful API 设计、前后端数据交互(JSON)、跨域处理(CORS)、JWT 认证机制以及 Docker 部署方案。此外,还简要对比了 Python 与 Rust 在 Web 开发中的特性差异,并提供了常见问题的解决方案…

探讨了 AI 辅助编程工具(如 Copilot)在编写测试用例时的能力边界。通过 TypeScript 和 Jest 的实验,发现 AI 擅长生成 Happy Path 和基础 Mock 代码,但在理解业务意图、处理边界条件和复杂集成测试时存在幻觉和局限。文章指出 AI 目前应定位为高级助理,人类需负责深层逻辑校验,并提出通过明确 Prompt 和角色设定来…

探讨了语义化 AI 驱动器从指令集到语义认知网络的技术范式重构,涵盖多模态语义解析器进化、提示词工程认知分层及自然语言交互意图理解。文章展示了医疗、法律、智能家居等领域的代码实现案例,分析了 2025 至 2030 年的技术演进路线,包括安全性增强、跨语言对齐及因果推理集成。此外,还讨论了动态伦理约束框架、提示词审计系统及开发者能力升级路线图,强调在 AI…

Stable Diffusion 3.5 Large 模型参数量大,对显存要求高。介绍在 8GB-12GB 显存消费级显卡上运行的方案。核心策略包括使用 FP8 或 NF4 量化降低显存占用,针对 T5-XXL 文本编码器采用 8-bit 量化或 CPU Offloading 技术解决溢出问题。此外,建议优化 Windows 虚拟内存设置及显示器分辨率以减少…

Seedance 2.0 是一款支持多模态输入的 AI 视频生成工具,允许用户上传图片、视频、音频及文字描述,通过@引用机制精确控制画面风格、动作节奏与配乐。教程详细介绍了从选择全能参考入口、上传素材、分配任务到编写提示词及生成的完整操作流程,帮助用户实现电影级视频创作。
对比了基于 OpenCV 的 AI 印象派艺术工坊与 Stable Diffusion 在图像风格迁移任务中的表现。前者依赖传统计算机视觉算法,无需预训练模型,资源消耗低、启动快、可离线运行,适合移动端及边缘设备;后者基于大模型,支持无限风格但显存需求高、延迟大。通过性能、质量、部署成本及实际场景测试,文章建议根据资源约束和功能目标(如标准化处理 vs 创意…

基于 Spring AI 和 RAG 技术构建知识库问答机器人的完整实现方案。内容涵盖 RAG 原理、项目结构搭建、自定义向量存储实现、文档分块与向量化处理、问答服务核心逻辑及控制器开发。通过集成 Tika 文档解析、HanLP 中文分词及智谱大模型,实现了文档上传、检索增强生成及流式响应功能。方案包含内存向量库实现及标准 Spring AI 向量存储两种模…

详细介绍如何通过 GitHub Student Developer Pack 免费获取 GitHub Copilot Pro 服务。内容涵盖资格准备(在读证明、学校邮箱)、验证流程(自动或手动上传材料)、激活步骤(IDE 扩展安装)及常见问题解答。旨在帮助学生完成身份验证并享受 AI 编程助手权益。

自然语言处理(NLP)在医疗领域的核心应用场景,包括电子病历分析、医学文本分类及智能问答。阐述了 BERT、GPT-3 等前沿模型的技术实现,并讨论了数据隐私、多语言处理及专业术语识别等特殊挑战。最后通过实战项目演示了基于 Python 和 Hugging Face Transformers 库开发电子病历分析应用的全过程,涵盖系统架构设计、代码实现及测试流…

vkedit 是一款基于 Vue3 和 Konva.js 的 Web 图形编辑器 npm 包,无需后端即可在浏览器中运行。它支持标签、票据、二维码等多种设计场景,提供可视化拖拽界面、智能对齐、撤销重做及插件化架构。通过 npm 安装后,开发者可快速集成到 Vue 项目中,实现像素级精度的图形编辑与导出(JSON/PNG/PDF),显著提升开发效率并降低维护成…

KrLongAI 旗博士是一款本地部署的 AI 数字人口播视频自动化生成工具。它整合了文案提取、仿写、语音合成、数字人驱动、字幕及多平台发布等九大核心功能,实现全链路流程自动化。技术架构采用模块化解耦设计,基于 Whisper、CosyVoice 等开源方案,强调本地优先与流程可控。该工具既适合开发者学习 AI 视频工程化集成,也能帮助内容创作者批量生产高质…

系统梳理了卷积神经网络(CNN)的原理、结构及数学表达,涵盖卷积、池化操作与前向传播流程。通过 MNIST 手写数字分类的 PyTorch 实战案例,展示了模型构建、训练过程及可视化方法。文章还回顾了 CNN 发展历程,对比了 ResNet、DenseNet 等经典变体的架构特点与优劣,并提供了参数调优、正则化及行业应用建议,旨在帮助读者全面掌握 CNN 的…
对比了 GitHub Copilot、通义灵码、iFlyCode 和 Trae 四款 AI 编程工具在 VSCode 及前端开发中的使用体验。分析了各工具的定位、功能特点及优缺点。Copilot 适合全栈开发,通义灵码中文支持好且免费,iFlyCode 基于星火大模型,Trae 为独立 IDE 集成多模型。文章提供了各工具的注册入口及核心功能说明,帮助开发者…

对比了三种 Claude Code 与 Figma 协作方式:HTML 原型导入、Copy as code 同步、Figma MCP Server 双向同步。实测表明三种方式均免费可用,其中 MCP Server 写入功能不限次数。推荐初期使用 HTML 生成加插件导入,日常迭代用 Copy as code,进阶配置 MCP 实现自动化。核心在于建立设计与代…