基于 GLM-4.6V-Flash-WEB 的光伏组件 EL 隐裂与黑斑检测
介绍利用 GLM-4.6V-Flash-WEB 多模态大模型进行光伏组件 EL 图像检测的方案。针对传统人工判图效率低、误判率高的问题,该模型通过视觉编码与文本提示融合,实现隐裂与黑斑的语义化描述。文章涵盖模型原理、核心优势、代码调用示例及系统集成架构。实测显示在 T4 GPU 上推理延迟低,支持批量处理,可嵌入产线自动化流程,提升质检准确性与可解释性,适用…
博客作者
仙气飘飘
340
已发布文章
16K
博客获赞
863K
博客浏览
第 6 页
介绍利用 GLM-4.6V-Flash-WEB 多模态大模型进行光伏组件 EL 图像检测的方案。针对传统人工判图效率低、误判率高的问题,该模型通过视觉编码与文本提示融合,实现隐裂与黑斑的语义化描述。文章涵盖模型原理、核心优势、代码调用示例及系统集成架构。实测显示在 T4 GPU 上推理延迟低,支持批量处理,可嵌入产线自动化流程,提升质检准确性与可解释性,适用…

飞算 JavaAI 智能编程助手的技术架构与应用流程。该工具支持本地化智能分析,能够深度理解项目上下文并生成代码。核心功能包括需求拆解、接口设计、表结构生成及源码构建,支持多种数据库方言。通过自动化代码生成与优化,旨在提升 Java 开发效率,降低重复劳动,保障代码安全与隐私。

对比了 Cursor、GitHub Copilot、Trae 和 Claude Code 四款主流 AI 编程工具。内容涵盖功能特点、模型支持、中文支持度、收费模式及适用场景。Cursor 擅长理解大代码库和重构;Copilot 集成度高适合日常开发;Trae 完全免费且中文体验好;Claude Code 侧重高质量代码与企业级应用。开发者可根据预算、项目规…
对比了 GitHub Copilot 的四种工作模式:Ask、Edit、Agent 和 Plan。Ask 模式用于纯问答和代码理解,不修改代码;Edit 模式支持多文件精准修改,需人工确认;Agent 模式具备项目级自主执行能力,可跨文件操作和调用命令;Plan 模式专注于生成结构化执行方案而不直接执行。文章通过定义、机制、特点及场景分析,提供了模式选择的决…

对比了国内主流 AI 智能体工具,包括腾讯 QClaw、WorkBuddy、字节 ArkClaw、飞书 OpenClaw、阿里 JVS Claw、悟空、QoderWork、智谱 AutoClaw、月之暗面 Kimi Claw、百度 RedClaw 及小米 MiClaw。涵盖本地部署、云端服务及移动端方案,分析各平台功能特点、适用场景及获取方式,帮助用户选择合…
探讨了前端微前端架构在大型项目中的应用价值与潜在风险。微前端通过拆分应用提升可维护性、支持多技术栈及独立部署,但增加了调试复杂度、样式冲突及通信难度。文章以 Single-SPA 为例展示了主应用配置、子应用生命周期、样式隔离及通信机制的实现,并强调微前端并非银弹,需根据团队规模与技术需求谨慎决策,做好规划以避免陷入新坑。
GitHub Copilot 在 VSCode 中的安装步骤及深度配置方法。内容涵盖环境准备、插件安装授权、关键设置项调整(如启用开关、快捷建议触发、终端支持)以及快捷键自定义。旨在帮助用户绕过常见坑点,将 Copilot 作为高效的开发辅助工具使用。

LangChain 中 PyPDFLoader 的使用,涵盖安装、基础加载(按页、指定页码、全文合并)、常见问题排查(加密、乱码、分块)及进阶功能(OCR 图片文本提取、批量处理)。通过实战代码展示如何结合 RapidOCR 提取扫描版 PDF 内容,并优化文本分块策略以适应大模型输入,为构建向量数据库提供数据支持。

介绍基于 PX4 固件与 MID360 激光雷达,利用 FAST_LIO 算法实现无人机室内自主定位与定点悬停的配置流程。主要步骤包括:设置 PX4 飞控参数将定位源改为视觉模式并关闭磁力计;编写 Python 节点将 Fast-LIO 位姿发布至 MAVROS 话题;调整雷达扫描频率;运行 Mavros 及定位程序。最后通过 QGC 验证坐标系方向与运动数…
对比分析了豆包、元宝、千问、Kimi、DeepSeek、MiniMax、GLM 七款国内主流 AI 工具。涵盖开发公司、核心功能及适用场景。豆包适合快速问答与写作;元宝集成于腾讯会议;千问中文理解强且支持多模态;Kimi 擅长长文档处理;DeepSeek 代码与推理能力突出;MiniMax 创意生成能力强;GLM 学术背景深厚。文章提供了功能评分对比表及针对…

浏览器 Web Bluetooth API 的使用方法,涵盖核心概念如设备、服务、特征及 UUID,以及完整的通信流程。内容包括如何扫描并选择设备、连接 GATT 服务器、获取服务与特征、读写数据(包括通知模式)、数据转换方法(DataView 处理)、标准 UUID 参考、错误处理机制及重连策略。文章还提供了 JavaScript 类封装示例和 Vue 组…

AI 辅助论文写作工具的核心功能,涵盖选题定位、大纲生成、内容修改、图表添加、查重保障、参考文献管理及格式修正等模块。通过自动化技术提升写作效率,优化内容结构,并降低学术不端风险。用户反馈显示,该类工具能显著减少查找文献和格式调整的时间,适合需要快速完成高质量论文的学生群体。
如何通过配置 OpenClaw 实现 AI 会话记忆的自我管理。主要方案包括在 Token 使用率达 70% 时触发自动压缩以节省上下文;构建 QMD 短期记忆与 Mem0 长期记忆的双层架构,分别处理本地索引与云端语义沉淀;并通过定时脚本模拟'三省吾身',在特定时间段进行计划检查、进度回顾与总结归档。最终实现了 AI 助手的主动记忆维护与知识沉淀,提升长期…

探讨了 AI 驱动游戏在鸿蒙生态中的机会。分析了 AI 与游戏的天然结合点,如可控环境、即时反馈和用户接受度。重点阐述了鸿蒙分布式能力、端侧 AI 及软硬一体带来的优势。提出四大核心方向:AI 玩家、AI NPC、AI 游戏生成和多 Agent 游戏。同时给出了开发者切入建议,从 Demo 开始、抽象接口、引入服务层。最后讨论了性能、设计、安全及成本挑战,并…
MixAIHub 是一个 AI 模型镜像服务平台,支持 ChatGPT、Claude、Sora、Grok、Midjourney 等大模型平台的访问。该服务完整还原了原官网的界面布局、交互流程以及核心功能,方便开发者、内容创作者和普通用户使用。无需额外网络配置即可访问,直接通过浏览器进入官网地址即可使用全部功能。

使用 Python 结合 neo4j-driver 和 py2neo 库将 CSV 文件数据导入 Neo4j 图数据库的完整流程。主要步骤包括准备 UTF-8 格式的 CSV 数据集、安装必要的 Python 依赖(pandas, neo4j-python-driver, py2neo)、配置并启动 Neo4j 服务。通过 Python 脚本读取 CSV 数…

详细解析了如何依托 Amazon Bedrock 生成式 AI 能力,结合 Slack 生态与亚马逊云科技服务构建企业级图像生成 App。文章介绍了 Amazon Bedrock 的平台特性与优势,阐述了包含 Lambda、S3、DynamoDB 等服务的架构方案,并提供了从 AWS 账号注册到 Slack App 配置及 Lambda 函数实现的完整部署流…

介绍基于 SpringBoot2、Vue3、MyBatis-Plus 及 MySQL8.0 构建的银行账目账户管理系统。系统采用前后端分离架构,后端通过 Spring Security 实现 RBAC 权限控制与 JWT 安全认证,前端利用 Vue3 Composition API 提升复用性。核心功能包括账户开立销户、转账汇款、交易流水查询及风控规则配置。…

探讨 C#初级开发者在 AI 时代面临的挑战,特别是 AI 基于历史数据预测代码重构需求的局限性。文章分析了 AI 模式匹配的机制及其在强类型语言中的不足,指出人类开发者在业务上下文理解上的优势。通过提供提升代码质量、利用 AI 辅助而非替代、培养业务洞察力等策略,帮助开发者保持主动性,从焦虑转向高效行动,成为不可替代的技术人才。

深入对比了 Trae、Cursor、GitHub Copilot 等主流 AI 编程工具的核心特性与适用场景。重点分析了本土化适配、网络稳定性、支付便捷性及数据安全等因素。针对学生、独立开发者、中小企业及大型企业等不同群体,提供了具体的选型建议与组合策略,帮助开发者根据自身技术栈和安全需求做出最优决策。