llama.cpp加载多模态gguf模型

llama.cpp预编译包还不支持cuda12.6
llama.cpp的编译,也有各种坑
llama.cpp.python的也需要编译
llama.cpp命令行加载多模态模型
llama-mtmd-cli -m Qwen2.5-VL-3B-Instruct-q8_0.gguf --mmproj Qwen2.5-VL-3B-Instruct-mmproj-f16.gguf -p "Describe this image." --image ./car-1.jpg 

**模型主gguf文件要和mmporj文件从一个库里下载,否则会有兼容问题,建议从ggml的官方库里下载
Multimodal GGUFs官方库

llama.cpp.python加载多模态模型

看官方文档
要使用LlamaChatHandler类,官方已经写好了不少多模态模型的加载类,比如qwen2.5vl的写法:

from llama_cpp import Llama 

Read more

ToDesk 全新 ToClaw,正在把电脑交给AI去操作

ToDesk 全新 ToClaw,正在把电脑交给AI去操作

这两年,AI 工具层出不穷,但大多数产品还停留在“能回答、会生成”的阶段:帮你写一段话、搜一份资料、整理一个思路,真正到了执行层,还是得你自己坐回电脑前,一个软件一个软件地点、一项任务一项任务地做。 这也是很多人对 AI 的真实感受——它会说,但不一定真能干活。而 ToDesk 新上线的 ToClaw,想解决的正是这个问题。 一、ToClaw 是什么? ToClaw 是一款基于 OpenClaw 深度定制、并与远程控制运行时深度结合的 AI 助手。它最大的不同,不只是“懂你说什么”,而是能直接在你的电脑上执行操作。 你只需要一句话,它就可以在电脑端完成对应动作:打开软件、点击按钮、填写表单、拖拽文件、整理资料、生成表格、汇总信息……很多原本需要人守在电脑前操作的工作,现在都可以交给 ToClaw

Altium Designer + AI:智能PCB设计新革命

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 点击'项目生成'按钮,等待项目生成完整后预览效果 输入框内输入如下内容: 创建一个演示AI辅助PCB设计的项目,展示Altium Designer中AI自动布线、元件优化布局和设计规则检查功能。项目应包含一个典型双面PCB设计案例,演示AI如何根据电路复杂度自动优化走线路径,减少交叉和过孔数量,同时满足EMC设计要求。提供可视化对比展示AI优化前后的设计差异,并生成性能对比报告。 最近在做一个双面PCB项目时,尝试了Altium Designer的AI辅助功能,发现它确实能大幅提升设计效率。作为一个经常被布线折磨的硬件工程师,这次体验让我对AI在电子设计自动化领域的应用有了全新认识。 1. 传统PCB设计流程的痛点 以前完成一个中等复杂度的双面板设计,至少需要3-5天时间。最耗时的环节就是手动布线和反复调整元件布局: * 需要不断切换层间过孔来避免走线交叉 * 高频信号线要手动做阻抗匹配和等长处理 * 每次修改原理图后都要重新调整大片走线 2. AI带来的三

如何用50张图片打造专属AI绘画风格?lora-scripts实战教学

如何用50张图片打造专属AI绘画风格?LoRA-Scripts实战教学 在数字艺术与生成式AI交汇的今天,越来越多创作者开始思考一个问题:如何让AI真正“学会”我的画风? 不是简单地输入“水墨风”或“赛博朋克”,而是无论生成什么主题,画面中都自然流露出属于你个人笔触、色彩偏好和构图逻辑的独特气质。这正是当前AIGC领域最令人兴奋的方向之一——个性化模型微调。 而在这条路上,有一个技术组合正悄然改变游戏规则:LoRA + 自动化训练脚本。尤其是像 lora-scripts 这类工具的出现,使得仅凭50张图片、一块消费级显卡,就能在几小时内训练出高质量的专属风格模型。 要理解这一切是如何实现的,我们不妨从一个实际场景出发:假设你是一位插画师,积累了近百幅手绘作品,风格统一、辨识度高。你想把这些“视觉DNA”注入Stable Diffusion,让它成为你的AI分身。传统做法是全量微调整个模型,但这不仅需要数万张数据、多张高端GPU,还极容易过拟合。有没有更轻量、高效的方案? 答案就是 LoRA(Low-Rank Adaptation)。 它不改动原始大模型权重,而是在关键层(如

如何用MCP AI Copilot提升运维效率300%?真实数据告诉你答案

第一章:MCP AI Copilot 运维提效全景解析 在现代企业IT基础设施日益复杂的背景下,MCP AI Copilot 作为智能化运维助手,正在重塑传统运维模式。通过融合机器学习、自然语言处理与自动化执行能力,它能够实时分析系统日志、预测潜在故障并主动触发修复流程,显著降低平均修复时间(MTTR)。 智能告警与根因分析 MCP AI Copilot 可对接 Prometheus、Zabbix 等主流监控系统,利用语义聚类技术对海量告警进行去噪和聚合。当检测到异常指标时,自动调用链路追踪数据进行根因推理。 例如,以下 Go 代码片段展示了如何通过 API 触发告警分析任务: // 初始化AI分析客户端 client := NewAIClient("https://api.mcp-copilot/v1") // 提交告警事件进行智能分析 resp, err := client.AnalyzeAlert(Alert{ Timestamp: