
Prompt 辅助的实体识别(NER)实战案例与技巧
Prompt 辅助实体识别(NER)利用大语言模型直接从非结构化文本中提取关键信息,相比传统方法具备低门槛、快迭代、强泛化的优势。通过金融财报、医疗病历、法律合同三个实战案例,详细展示了如何设计包含明确实体定义、约束输出格式及 Few-Shot 示例的高质量 Prompt。针对长文本遗漏、实体边界混淆、格式不规范等常见问题,提供了分段处理、边界细化、模板绑定…
博客作者
分布式追踪专家
341
已发布文章
16K
博客获赞
838K
博客浏览
第 2 页

Prompt 辅助实体识别(NER)利用大语言模型直接从非结构化文本中提取关键信息,相比传统方法具备低门槛、快迭代、强泛化的优势。通过金融财报、医疗病历、法律合同三个实战案例,详细展示了如何设计包含明确实体定义、约束输出格式及 Few-Shot 示例的高质量 Prompt。针对长文本遗漏、实体边界混淆、格式不规范等常见问题,提供了分段处理、边界细化、模板绑定…

Trae 是字节跳动推出的 AI 原生 IDE,对标 Cursor 和 Windsurf,主打免费与顶级大模型接入。文章详细介绍了国内版与国际版的差异,涵盖下载安装、VS Code 环境迁移、CLI 工具配置等步骤。通过贪吃蛇实战演示了 Builder 模式的代码生成与调试流程,并指导如何根据场景切换 DeepSeek-R1 等大模型。适合希望提升开发效率的…
RexUniNLU 集成 Rasa 对话系统方案详解。通过封装 ModelScope 的 Siamese-UIE 模型为自定义 NLU 组件,实现零样本意图与实体识别。教程涵盖环境搭建、代码封装、Rasa 配置及测试流程,解决了传统 NLU 依赖大量标注数据的痛点,支持快速迭代与新业务冷启动。重点包括 Schema 设计策略、性能优化建议及混合管道配置方案。
GraphRAG 正逐步取代传统向量检索,成为 2026 年企业级 RAG 的主流方向。相比传统方案,它通过知识图谱实现了多跳推理和上下文关系理解,有效解决了上下文窗口限制及长文本信息丢失问题。同时,结合 DeepSeek 等大模型的推理能力,GraphRAG 能提供可解释的决策路径,满足金融、医疗等行业的合规需求。DeepSeek-V3 在其中扮演核心角色…
智能家居正经历从被动响应指令到主动理解需求的质变。基于 AI 应用架构视角,探讨设备如何进化为猜需求、破解多设备信息孤岛及平衡智能与隐私的核心逻辑。通过场景案例与架构设计,揭示 AI 重塑智能家居体验的关键路径。
人脸识别技术将图像分类问题转化为度量学习问题,通过特征向量比对实现身份识别。FaceNet 提出 Triplet Loss 直接优化嵌入空间距离,但收敛慢且依赖三元组挖掘策略。ArcFace 引入角度间隔损失函数,在余弦空间增加加性 margin,显著提升类内紧凑性和类间分离度,成为当前主流方案。PyTorch 实现展示了两种损失函数的具体代码及训练流程,A…

GTC2026 核心转向 Agentic AI 与 Physical AI,强调从生成到行动的转变。Nemotron 3 Super 提供混合架构支持长上下文推理,配合开源策略降低企业部署门槛。NeMo Agent Toolkit 标准化智能体开发流程。物理 AI 方面,Cosmos 构建世界模型,Isaac 平台完善仿真训练闭环,GR00T 推动类人机器人…

旋转位置编码 RoPE 解决了传统正弦位置编码在外推和相对距离表达上的缺陷。文章深入探讨了 RoPE 的 base 参数控制、2D 到 nD 的几何扩展原理、GPT-J 与 GPT-NeoX 实现等价性分析,以及长度外推中的 OOD 问题与解决方案。内容涵盖免训练外推策略、少量长文本微调方法,并从几何与傅里叶角度解析了高低频旋转圈数差异对训练的影响。旨在帮助…
针对大模型生成前端代码时常见的审美不足问题,Anthropic 官方推出了 Frontend-Design Skill。该技能包通过强化动效、质感、排版等设计原则,能显著提升各类编程模型的前端输出质量。支持 Claude Code、Codex 及 Cursor 等工具,安装简单且可自定义品牌调性,是提升 AI 辅助编程视觉效果的实用方案。
Qwen1.5-0.5B-Chat 轻量级对话模型在资源受限环境下的工程落地方案。通过 ModelScope SDK 集成模型,采用 Flask 后端结合 Server-Sent Events 实现流式输出,配合 HTML/JavaScript 构建简洁交互界面。文章涵盖架构设计、核心模块职责、前后端代码实现细节及性能优化策略,包括模型加载加速、推理速度提升…

OpenTiny NEXT 前端智能化系列直播征文活动聚焦 AI 前端、MCP、WebAgent 等技术方向。文章分析了前端从固定界面到动态生成交互的演变,探讨了智能工作流设计的重要性。通过梳理学习路径和投稿建议,引导开发者将概念落地,结合实战复盘与经验总结,提升在 AI 前端领域的工程能力。活动涵盖 TinyVue、TinyEngine 等工具链,强调原创…

三星研究院提出 Shallow-π系统,通过知识蒸馏技术将视觉 - 语言 - 动作(VLA)模型从 18 层压缩至 6 层,削减 70% 计算量。该方法采用三重奏学习框架,涵盖基础技能、深层理解及注意力分配传承。实验显示推理速度提升超 2 倍,性能损失小于 1%,并在 Jetson Orin 等边缘设备成功部署。相比传统层跳跃方法,Shallow-π解决了动…

OpenClaw 默认配置往往只发挥部分能力。通过调整人格设定文件(SOUL.md)、构建分层记忆结构、自定义技能扩展、配置心跳机制以及实施多模型分级策略,可显著提升 AI 助手的主动性与工作效率。分享了从被动聊天到主动干活的实战配置经验,帮助开发者将通用框架转化为贴合个人工作流的智能搭档。
Llama-3.2-3B 模型配合 Ollama 本地部署,针对中文会议语音转写文本进行摘要测试。实测显示,该模型能将平均 7860 字的输入压缩至 295 字左右,压缩率达 96.3%。信息保留率方面,决策项、责任人、时间节点及待办事项四项指标平均得分 91.7 分。对比 8B 模型,3B 版本在推理速度和内存占用上优势明显,仅损失微量完整性。文章提供了环…
FPGA HDMI 输出涉及接口原理、TMDS 编码、时序设计及工程调试。文章系统介绍了 HDMI 1.4/2.0/2.1 版本特性,详细解析了 8b/10b 编码与 DC 平衡机制,提供了 1080p 和 4K 的时序参数与 Verilog 代码示例。内容涵盖从时序生成器、TMDS 编码器到 OSERDES 序列化的完整架构,包含仿真验证、上板调试步骤及时…

Windows 系统下通过 npm 全局安装 OpenClaw 框架,配置 DeepSeek API Key 及模型参数。启动网关服务后访问 Web UI 验证连接。集成飞书时若遇 CLI 启动错误,需手动安装扩展包并配置依赖。完成授权后即可在飞书群内通过指令操作本地文件、执行自动化任务,实现 AI 智能体对本地环境的控制。

MacOS 环境下通过 Docker 部署 OpenClaw 并对接飞书机器人的完整流程。涵盖 Docker 安装、镜像拉取、大模型 API 配置、飞书开放平台应用创建及权限设置、长链接回调搭建以及容器内 TUI 对话与配对操作。重点解决环境兼容性问题,实现 AI 助手在办公场景中的轻量化落地,支持自定义技能扩展与多平台接入。
VS Code 远程连接服务器时 GitHub Copilot 常因网络、扩展未同步或认证失效而不可用。排查需先确认本地功能正常,再检查服务器网络及代理设置,确保远程会话中安装并启用了 Copilot 扩展,重新登录 GitHub 账号清除缓存,最后验证相关配置项。多数情况下,完成网络连通性测试、扩展同步及身份验证重置即可恢复服务。
Trae 集成 Figma MCP 功能可实现前端代码自动生成。操作前需确保 Trae 版本为 3.0 以上且为企业版账号。配置步骤包括在设置中找到 MCP 入口,从 Figma 账户安全设置中生成新 Token 并填入。使用时切换至 MCP 模式,输入包含 Figma 设计稿链接的提示词,即可根据设计稿生成高一致性网页代码。需注意 Figma 链接需具备相…
机器人领域旗舰会议包括 ICRA、IROS 及视觉方向 CVPR,是跟踪前沿研究的关键。具身智能学习路径分为基础巩固、核心模块、实践项目及进阶深化四个阶段,涵盖感知、决策、执行全链路。建议优先掌握 ROS2、SLAM 及强化学习技术,遵循仿真先行原则降低试错成本,最终实现从算法验证到实物落地的完整流程。