告别复制粘贴:SiYuan网页剪藏全攻略

告别复制粘贴:SiYuan网页剪藏全攻略

【免费下载链接】siyuanA privacy-first, self-hosted, fully open source personal knowledge management software, written in typescript and golang. 项目地址: https://gitcode.com/GitHub_Trending/si/siyuan

你是否还在为网页内容保存不完整、格式错乱而烦恼?作为一款隐私优先的个人知识管理软件,SiYuan(思源笔记)提供的网页剪藏功能彻底解决了这一痛点。本文将带你掌握从安装配置到高级剪辑的全流程,让网页知识收集效率提升10倍。

为什么选择SiYuan剪藏

传统网页保存方式存在三大痛点:格式丢失、链接失效、管理混乱。SiYuan作为开源知识管理工具(GitHub_Trending/si/siyuan),通过深度整合的剪藏功能实现了三大突破:

  • 原格式保留:完整保存网页排版、图片和表格,避免Markdown转换丢失
  • 双向链接:自动建立剪藏内容与源网页的关联,支持后续回溯
  • 块级管理:剪藏内容可拆分为独立知识块,便于碎片化重组
技术实现:SiYuan通过自研的块级文档模型(Block Model)和kernel/api/clipboard.go处理剪贴板数据,结合app/src/protyle/util/paste.ts实现富文本解析,确保内容无损转换。

准备工作:5分钟快速配置

安装剪藏扩展

SiYuan提供浏览器扩展实现一键剪藏,支持Chrome/Edge等基于Chromium的浏览器:

  1. 官方仓库下载扩展包
  2. 在浏览器地址栏输入chrome://extensions/进入扩展管理
  3. 开启"开发者模式",拖拽扩展包到页面完成安装

配置剪藏目标

通过SiYuan的设置界面配置剪藏内容的默认存储位置:

  1. 打开SiYuan,进入设置 > 编辑器 > 网页剪藏
  2. 设置默认笔记本和文件夹路径(建议使用/剪藏/{{domain}}/{{date}}格式)
  3. 选择剪藏格式选项:完整HTML/纯文本/Markdown

配置文件路径:剪藏规则保存在工作空间的conf/appearance.json中,可通过API_zh_CN.md提供的接口进行批量配置。

三种剪藏方式全解析

1. 一键剪藏整个页面

适用于需要完整保存文章、教程等内容的场景:

  1. 浏览目标网页,点击浏览器工具栏的SiYuan图标
  2. 在弹出面板选择"完整页面"模式
  3. 等待3-5秒处理后自动跳转到剪藏结果页

技术原理:扩展通过chrome.tabs.captureVisibleTab()获取页面截图,同时使用document.execCommand('copy')复制完整DOM结构,通过自定义协议siyuan://clipboard传输到客户端。

2. 选区剪藏精准提取

针对只需部分内容的场景,实现精准知识截取:

  1. 按住鼠标选中网页中的目标内容(支持跨段落选择)
  2. 右键选择"SiYuan剪藏" > "选区内容"
  3. 可选设置标签和备注,点击确认完成剪藏

代码示例:选区剪藏的核心处理逻辑

// 简化自app/src/protyle/util/paste.ts async function handleSelectionClipboard() { const selection = window.getSelection(); if (!selection.rangeCount) return; const range = selection.getRangeAt(0); const fragment = range.cloneContents(); // 创建临时容器处理选中内容 const tempDiv = document.createElement('div'); tempDiv.appendChild(fragment); // 处理图片和相对链接 await fixRelativeResources(tempDiv); // 通过IPC发送到主进程 window.api.send('clipboard:html', tempDiv.innerHTML); } 

3. 静默剪藏后台处理

适合需要批量保存多个页面的场景,不打断浏览流程:

  1. 在剪藏面板勾选"后台剪藏"选项
  2. 继续浏览其他网页,剪藏任务将在后台处理
  3. 所有剪藏完成后会收到系统通知
提示:可在SiYuan的设置 > 通知中配置剪藏完成提醒方式,支持系统通知和桌面通知两种模式。

剪藏内容的高效管理

内容去重与整理

SiYuan提供智能去重功能,避免重复剪藏相同内容:

  1. 剪藏时自动检测相似内容(基于SimHash算法)
  2. 提供"跳过/覆盖/另存为"三种处理方案
  3. 支持按域名、日期等维度批量管理剪藏内容

高级编辑技巧

利用SiYuan的块编辑能力优化剪藏内容:

  • 拆分块:使用Ctrl+Shift+D将长文本拆分为逻辑段落
  • 标注重点:选中文字后按Ctrl+B添加高亮标记
  • 关联知识:通过[[插入内部链接,建立知识网络

快捷键参考:完整的编辑快捷键列表可在app/guide/目录下的帮助文档中查看。

常见问题解决方案

剪藏失败排查流程

当剪藏功能异常时,可按以下步骤诊断:

  1. 检查浏览器扩展是否最新版本
  2. 确认SiYuan主程序正在运行(剪藏依赖内核服务)
  3. 查看工作空间logs/目录下的clipboard.log定位错误

格式错乱修复

若剪藏内容出现格式问题,可尝试:

  • 使用"纯文本模式"重新剪藏
  • 在编辑界面执行"清理格式"命令(Ctrl+Shift+V
  • 手动调整CSS样式(通过块属性面板添加自定义样式)

批量处理脚本

对于大量历史剪藏内容,可通过SiYuan的API编写处理脚本:

# 使用SiYuan API批量更新剪藏标签 import requests API_TOKEN = "your_token_here" BASE_URL = "http://127.0.0.1:6806/api" headers = { "Authorization": f"Token {API_TOKEN}", "Content-Type": "application/json" } # 获取所有剪藏文档 response = requests.post(f"{BASE_URL}/filetree/lsNotebooks", headers=headers) notebooks = response.json()["data"]["notebooks"] # 批量添加标签 for notebook in notebooks: if "剪藏" in notebook["name"]: requests.post(f"{BASE_URL}/attr/setBlockAttrs", headers=headers, json={ "id": notebook["id"], "attrs": {"custom-tags": "web,clipboard"} } ) 

总结与进阶路线

通过本文学习,你已掌握SiYuan网页剪藏的核心技能。建议进一步探索:

  1. 自动化工作流:结合IFTTT实现RSS触发自动剪藏
  2. OCR增强:配置Tesseract实现图片内容识别(需安装插件)
  3. 模板定制:使用模板功能定义个性化剪藏格式
资源推荐:官方提供的剪藏示例库位于app/guide/20211226090932-5lcq56f,包含多种场景的最佳实践。

立即开始使用SiYuan剪藏,让网页知识真正成为你的个人知识库一部分。如有问题,可访问中文讨论区获取社区支持。

收藏本文,下次遇到优质网页时,你就知道该怎么做了!🚀

【免费下载链接】siyuanA privacy-first, self-hosted, fully open source personal knowledge management software, written in typescript and golang. 项目地址: https://gitcode.com/GitHub_Trending/si/siyuan

Read more

VSCode Copilot 终极魔改:以智谱 GLM-5.1 为例,一文搞定任意大模型接入

VSCode Copilot 终极魔改:以智谱 GLM-5.1 为例,一文搞定任意大模型接入

VSCode Copilot 终极魔改:以智谱 GLM-5.1 为例,一文搞定任意大模型接入 前言:为何你的 Copilot 需要一次“魔改”? 本文旨在帮助所有希望突破 VSCode Copilot 模型限制、追求更高代码效率和性价比的开发者。如果你也曾面临以下困境,那么这篇文章就是为你量身打造的: * Copilot 官方模型不够用:想尝试最新、最强的国产模型(如智谱 GLM、文心一言、Kimi)却无从下手。 * API 订阅成本高:官方或其他国外模型的订阅费和按量计费(通常以美元结算)让个人开发者望而却步。 * 替代品体验有瑕疵:其他辅助插件在某些场景下不如原生的 Copilot 轻便、流畅。 本文将提供一个终极解决方案:通过一个 VSCode 插件,无缝接入任何支持 OpenAI 兼容接口的大模型。我将以当前备受瞩目的国产模型智谱 GLM-5.1 为例,

我用AI编程1个月开发的AI写作神器,已经超15000+人使用,单月GMV已破10W+(3000字技术解读篇)

写在前面 我是墨云,10年编程老兵,目前ALL IN AI创业中。 先说一个让我自己都觉得魔幻的事实: 这套系统如果放在两年前,至少需要5-10人的团队、3-6个月的开发周期。 而现在,1个人、不到1个月,搞定了。 这就是AI时代的效率革命——不是提升10%、20%,而是数量级的碾压。 今天这篇文章,我来介绍一下用AI编程一个月做出的产品:智能笔尖——一款专为公众号创作者设计的AI写作生产力工具。 这不是一个"我有个想法"的故事,而是一个已经跑通的商业闭环。 但我今天想聊的不是数字本身,而是背后的技术决策——因为我踩过的坑、做过的取舍,可能对你有参考价值。 一、整体架构:一张图说清楚 先看全局,智能笔尖的系统架构可以分为四层: 四层架构说明: 层级 职责 核心组件 用户交互层 接收用户输入、展示输出 选题管理、空间配置、风格库、排版器 业务逻辑层

Copilot、Codeium 软件开发领域的代表性工具背后的技术

Copilot、Codeium 软件开发领域的代表性工具背后的技术

早期, Claude、Copilot、Codeium新兴的AI代码助手,模型的温度、切片的效果、检索方式、提示词的约束、AI 回复的约束、最终数据处理;整个环节,任何一个地方都可能造成最终效果不理想。 旨在通过代码生成、代码补全、代码解释和调试等多种功能,帮助开发者减少重复劳动,提高开发效率。尽管Codeium已经取得了显著的成果,但在处理复杂的代码任务、跨文件的修改以及支持定制化库和框架方面仍面临一定的局限性。 2020 年,OpenAI发布的GPT-3模型使AI生成代码的能力得以广泛应用,标志着AI代码助手的转型。2021年,GitHub 推出基于OpenAI Codex的 Copilot,提供实时代码补全和生成能力,提升开发效率,支持跨文件复杂任务。 其痛点,在大规模代码生成、跨文件任务处理以及定制化框架支持方面的局限性仍然限制了其在复杂项目中的应用。 2023年,Claude 3.5等新一代大型语言模型陆续出世,有效提升了自然语言理解与代码生成的能力。这类模型集成了代码生成、调试和文档自动生成等多项功能,能够帮助开发者快速编写高质量代码、优化程序性能并自动修复错误。随着

llama.cpp 多环境部署指南:从CPU到CUDA/Metal的高效推理实践

1. 环境准备:从零开始的硬件与软件栈 如果你和我一样,对在本地运行大模型充满好奇,但又不想被复杂的框架和庞大的资源消耗吓退,那 llama.cpp 绝对是你该试试的第一个项目。简单来说,它是一个用 C/C++ 编写的轻量级推理引擎,能把 Hugging Face 上那些动辄几十GB的模型,“瘦身”成几GB的 GGUF 格式文件,然后在你的电脑上——无论是 Mac 的 Apple Silicon 芯片,还是 Windows/Linux 的 CPU 或 NVIDIA GPU——流畅地跑起来。我最初接触它,就是想在不升级显卡的老电脑上体验一下 7B 参数模型的对话能力,结果发现它不仅能在 CPU 上跑,还能充分利用 GPU 加速,效果远超预期。