背景
在信息爆炸的时代,及时获取有价值的资讯至关重要。虽然市面上已有各类新闻 APP 和信息渠道,但它们主要服务于大众群体,难以完全契合个人的特定需求。如果可以根据自己的兴趣定制专属的新闻获取器,将是一件非常有价值的事情。
本文介绍了如何利用大模型编排工具构建个性化新闻助手。文章详细阐述了从背景分析到具体实现的完整流程,包括 Bot 创建、工作流分支设计(新闻检索与可视化)、Prompt 工程优化以及进阶功能扩展。通过整合新闻插件、思维导图工具和语音合成技术,实现了资讯的自动获取、分类、可视化呈现及语音播报。该方法降低了开发门槛,适用于多种信息聚合场景,并提供了错误处理和深度解析的优化思路。

在信息爆炸的时代,及时获取有价值的资讯至关重要。虽然市面上已有各类新闻 APP 和信息渠道,但它们主要服务于大众群体,难以完全契合个人的特定需求。如果可以根据自己的兴趣定制专属的新闻获取器,将是一件非常有价值的事情。
传统的定制方案往往需要较高的技术门槛,但大语言模型(LLM)的出现降低了这一门槛。模型能够抽象复杂的处理流程,挖掘更本质的策略,使得开发者既能保持方案的简洁性,又能获得高质量的信息筛选能力。
本文旨在介绍如何利用大模型编排工具搭建一个具备以下能力的新闻小助手:
本文将使用字节跳动的'扣子'(Coze)平台作为实现载体,结合其工作流编排能力和丰富的插件生态,展示如何快速构建此类应用。
进入扣子平台后,点击'创建 Bot'。为应用设置清晰的名字和描述,例如'个人新闻助手',以便后续管理。点击下一步即可进入配置界面。
在此阶段,建议明确 Bot 的核心功能定位,这将有助于后续提示词(Prompt)的编写和工作流的规划。
首先需要在系统提示词中定义助手的角色。例如,可以设定两个核心角色:'新闻提供者'负责检索和整理,'新闻可视化专家'负责生成思维导图结构。
具体的指令可以参考以下逻辑:
扣子平台目前提供了多个模型选项,如豆包、千问-max、Minmax6.5 等。由于工作流涉及较长的上下文和复杂的指令遵循,建议选择指令长度支持较好且逻辑能力较强的模型。例如 Minmax6.5s 4k 版本在处理复杂任务时表现较为稳定。
为了实现不同功能的解耦,建议构建两个独立的工作流分支:
该工作流包含四个关键工序:
任务:生成包含用户输入的时间和问题的检索词。
1. 解析输入的时间格式(YYYY-MM-DD HH:MM:SS),例如 "2024-05-28 06:57:21"。
2. 根据输入时间推算出目标时间段,例如推算出一周内的时间段为 "2024-05-21 至 2024-05-28"。
3. 组合用户的 query 和推算出的时间段生成检索词。
示例:
输入时间:"2024-05-28 06:57:21"
用户输入的 query:"最新的科技新闻"
任务步骤:
1. 解析输入时间 → "2024-05-28 06:57:21"
2. 推算 1 周时间段 → "2024-05-21 至 2024-05-28"
3. 生成检索词 → "2024-05-21 至 2024-05-28 最新的科技新闻"
请根据以上步骤生成检索提示词:
检索词:"[推算出的时间段] 用户输入的 query"
用户输入:当前日期是{{current}},用户输入的时间{{day}};用户输入的 query 是{{query}}
只输出 [推算出的时间段] 用户输入的 query
请从下面的用户输入中提取并格式化每条新闻的名称、url,并判断新闻属于什么类。要求如下:
1. 将每条新闻单独列出,名称、url 和类别分别输出。
2. 新闻名称:直接摘录内容,不需要做任何改动。
3. url:从提供的链接中提取,不需要修改。
4. 类别判断:根据新闻简介内容,判断其主要涉及的关键词。例如,如果新闻涉及健康、医学研究,判断其为'健康'。如果涉及宇宙、天文,判断其为'天文'。
5. 输出的新闻标题,基于 summary 提取,不要用输入的 "title"。
6. 并对每条新闻作出简短解读。
7. 根据输入格式化并分类新闻条目,最终结果以 JSON 格式输出。
示例输入:
[
{"title": "脑损伤揭示慷慨路径", "summary": "...", "url": "..."}
]
输出格式:
[
{"category": "健康", "title": "...", "url": "...", "interpretation": "..."}
]
该工作流旨在将结构化的新闻数据转换为可视化的思维导图。
首先需要将检索回来的新闻资讯进一步加工,适配 TreeMind 或其他思维导图插件的输入格式。这一步通常由大模型完成,它需要将 JSON 数据重组为层级结构。
将大模型加工好的数据输入给插件(如 TreeMind)。以下是用于生成 XMind 格式数据的 Prompt 示例:
Generate a mind map in xmind format from the following data. The mind map should be organized with top-level nodes as categories and under each category, include the articles as sub-nodes with their titles and URLs.
Data:
[
{"category":"健康","title":"脑损伤揭示慷慨路径","url":"http://m.toutiao.com/group/7373817664730300978/"},
{"category":"天文","title":"哈勃探索宇宙奇观","url":"http://m.toutiao.com/group/7373817664730300978/"}
]
The mind map structure should look like this:
- 健康
- Title: 脑损伤揭示慷慨路径
URL: http://...
- Title: 微塑料入侵
URL: http://...
- 天文
- Title: 哈勃探索宇宙奇观
URL: http://...
用户输入:{{input}}
TreeMind 插件会将上述文本渲染为可交互的思维导图,用户可以直观地看到不同类别下的新闻分布。
利用 TTS(Text-to-Speech)插件,可以让机器朗读生成的新闻摘要。用户只需输入'新闻播报',Bot 即可自动读取当天的精选内容。若需自动化,可结合定时触发器,每天固定时间推送。
在基础检索之上,可以增加 RAG(检索增强生成)链路。当用户对某条新闻感兴趣时,Bot 可以调用知识库插件,结合更多背景资料进行深度分析,提供比单纯摘要更全面的信息。
在实际使用中,API 可能会返回空结果或格式错误。建议在 Prompt 中加入异常处理指令,例如:'如果未找到相关新闻,请回复'未找到相关结果',并建议用户调整关键词。'同时,在工作流中设置条件分支,当插件返回失败时自动重试或切换备用源。
通过大模型编排工具,我们可以低成本地构建个性化的信息获取助手。本文展示了从 Bot 创建、工作流设计到具体 Prompt 工程的全过程。这种模式不仅适用于新闻聚合,还可以扩展到研报分析、竞品监控等多个场景。随着模型能力的提升和插件生态的丰富,未来的智能助手将更加精准和高效。
开发者可以根据自身需求,灵活调整检索源、分类逻辑和展示方式,打造出真正符合个人习惯的智能终端。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online