逛逛的粉丝推荐的 GitHub 项目,收藏一波。

01

论文配图自动生成:AutoFigure-Edit

写论文最头疼的是什么?画图啊!尤其是那些流程图、架构图,画一张得折腾半天。

最近在 GitHub 上发现一个叫 AutoFigure-Edit 的开源项目,专门解决这个问题。它入选了 ICLR 2026,属于学术圈的正经工具。

说白了,这玩意儿就是把你的论文方法部分文字丢进去,它能自动生成专业的论文配图,而且是可编辑的 SVG 格式。

它的核心工作流程是这样的:先用 LLM 根据文字生成一个草图,然后用 SAM3 做图像分割识别出各个图标区域,再通过 RMBG-2.0 去背景,最后组装成完整的矢量图。

最牛的是它支持风格迁移,你可以丢一张参考图进去,它会模仿那个风格来画你的图。这对于想要统一论文配图风格的人来说,简直是救星。

项目还内置了一个 Web 界面,生成的图可以直接在浏览器里编辑,拖拖拽拽就能调整,非常方便。

开源地址:https://github.com/ResearAI/AutoFigure-Edit

02

零代码网页自动化:WebRPA

说到网页自动化,大部分人第一反应是写 Python 爬虫。但对于不会编程的人来说,这就很痛苦了。

WebRPA 这个项目很有意思,它是一个可视化的网页自动化工具,通过拖拽模块就能构建自动化工作流,完全不用写代码。

这个项目内置了整整 260 个功能模块,覆盖了网页操作、数据采集、文件处理、媒体转换、AI 对话等各种场景。而且它自带 Python 3.13 和 Node.js 环境,解压就能用。

它的功能非常全面:浏览器自动化用的是 Playwright,支持 CSS 选择器、XPath 等多种定位方式;数据处理支持 JSON、正则表达式、Excel 读写;媒体处理基于 FFmpeg,能搞定 50 多种视频音频格式转换;AI 能力支持 OpenAI、智谱、通义千问等多家服务商。

特别值得一提的是它的触发器系统,支持 Webhook、定时任务、文件监控、热键监听等 10 种触发方式,可以做出很复杂的自动化流程。

作者是个大一新生,能把项目做到这个完整度,确实挺厉害的。

开源地址:https://github.com/pmh1314520/WebRPA

03

Claude Code 效率神器:Trellis

如果你经常用 Claude Code 写代码,那 Trellis 这个项目一定要看看。

它是一个专门为 Claude Code、Cursor、Codex 设计的 AI 框架工具箱,核心卖点是让 AI 能够持久记住你的项目规范和最佳实践

很多人的痛点是,每次跟 AI 聊天都要重新描述一遍代码规范、组件风格、文件结构之类的。Trellis 通过自动注入机制解决了这个问题,你写一次规范,它就会在每次对话开始时自动加载进去。

它还支持并行会话功能,可以在不同的 worktree 里同时跑多个 AI 任务,互不干扰。这对于需要同时开发多个功能的场景特别有用。

项目结构设计得挺清晰的,spec 目录存放规范文档,workspace 目录是个人工作空间,不同人协作也不会冲突。还有一个很实用的功能是用 /trellis:record-session 记录工作日志,下次启动时 AI 能自动读取之前的上下文。

跟普通的 CLAUDE.md 文件相比,Trellis 的分层架构更灵活,只会加载当前任务相关的规范,不会把所有东西都塞给 AI。

开源地址:https://github.com/mindfold-ai/Trellis

04

QQ 机器人接入:qqbot

想把 AI 接到 QQ 上?sliverp 开源的这个 qqbot 项目可以帮到你。

它是 OpenClaw 框架的一个插件,通过 QQ 开放平台的长连接事件订阅机制,实现消息和事件的回调处理。

整个配置流程其实不算复杂。首先去 QQ 开放平台注册账号、创建机器人,拿到 AppID 和 AppSecret。然后用 openclaw plugins install @sliverp/qqbot@latest 安装插件,把凭证配置好就能用了。

项目文档写得很详细,从账号注册、实名认证到机器人创建的每一步都有截图说明,对新手很友好。

需要注意的是,QQ 开放平台的机器人目前只支持私聊,不支持群聊。不过对于个人使用来说,私聊够用了。

开源地址:https://github.com/sliverp/qqbot

05

生产级 AI Agent 框架:CountBot

CountBot 是一个用 21K 行代码实现的生产级 AI Agent 框架,今年 2 月刚开源。

项目的定位是字数统计工具,但它的架构设计得很通用,采用了工具即智能体的理念,为后续扩展 AI 文本分析、写作辅助等功能预留了空间。

技术栈方面,它基于 Flutter 开发,支持 Windows、macOS、Linux 三端,还适配了鸿蒙 HarmonyOS 6.0。对于想学习跨端开发的同学来说,这个项目是个不错的参考。

作为一个生产级框架,它的代码组织、模块划分、错误处理都比较规范,可以作为学习 AI Agent 架构设计的参考案例。

开源地址:https://github.com/countbot-ai/CountBot

06

OpenClaw 骨架模板:ai-openclaw-skeletons

这个项目是 OpenClaw 生态的一部分,提供了 AI Agent 开发的骨架模板。

OpenClaw 是一个开源的全能 AI 助手框架,在 GitHub 上有超过 16 万 Star,主打的是让 AI 真正能干活,而不只是聊天。

ai-openclaw-skeletons 这个仓库提供了一系列项目模板,可以帮助开发者快速搭建基于 OpenClaw 的 AI 应用。如果你想在 OpenClaw 生态里做二次开发,这个骨架项目可以帮你省去很多初始化工作。

开源地址:https://github.com/1596941391qq/ai-openclaw-skeletons

07

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

Read more

开源AI网络爬虫Crawl4AI:智能数据抓取与分析的未来

1. 从“盲人摸象”到“庖丁解牛”:Crawl4AI如何重新定义数据抓取 记得我刚入行做数据分析那会儿,搞数据抓取简直就是一场噩梦。那时候用的爬虫工具,说好听点叫“自动化”,说难听点就是个“网页复读机”。你得写一大堆复杂的规则去匹配网页结构,今天网站改个版,明天加个动态加载,你的爬虫脚本立马就“瞎”了,要么抓回来一堆乱码,要么干脆啥也抓不到。那种感觉,就像让一个盲人去摸一头大象,摸到腿说是柱子,摸到尾巴说是绳子,永远没法完整、准确地理解网页里到底有什么。 直到我遇到了 Crawl4AI,我才真正体会到什么叫“智能爬虫”。它给我的感觉,就像从“盲人摸象”一下子进化到了“庖丁解牛”。它不再是一个只会机械执行指令的工具,而是一个能“看懂”网页的智能助手。这背后的核心,就是它把 AI,特别是自然语言处理和计算机视觉的能力,深度融入了爬虫的每一个环节。 传统爬虫是怎么工作的?它依赖的是HTML标签、CSS选择器、XPath这些结构化的“路标”

By Ne0inhk
SpringBoot实战:高效获取视频资源

SpringBoot实战:高效获取视频资源

文章目录 * 前言 * 技术实现 * SpringBoot项目构建 * 产品选取 * 配置 * 数据采集 * 号外号外 前言 在短视频行业高速发展的背景下,海量内容数据日益增长,每天都有新的视频、评论、点赞、分享等数据涌现。如何高效、精准地获取并处理这些庞大的数据,已成为各大平台和开发者面临的核心挑战。 技术实现 SpringBoot项目构建 打开编程软件 IDEA,选择创建新项目 对项目名、路径、jdk等参数进行配置,然后点击【下一步】创建项目。 创建完项目之后引入的父依赖如下图 接着我们在pom.xml中增加爬虫所需要的依赖项 到此,项目的基础信息已经准备完毕。 产品选取 配置 在浏览器输入网址,选择【产品】下的 跳转页面,选择【开始免费试用】按钮 如果没有账号直接注册即可,简单几步就可以完成注册,有账号的可以直接点击【登录】按钮进行登录 登录完成之后,

By Ne0inhk
MySQL & NaviCat 安装及配置教程(Windows)【安装】

MySQL & NaviCat 安装及配置教程(Windows)【安装】

文章目录 * 一、 MySQL 下载 * 1. 官网下载 * 2. 其它渠道 * 二、 MySQL 安装 * 三、 MySQL 验证及配置 * 四、 NaviCat 下载 * 1. 官网下载 * 2. 其它渠道 * 五、 NaviCat 安装 * 六、 NaviCat 逆向工程 软件 / 环境安装及配置目录 一、 MySQL 下载 1. 官网下载 安装地址:https://www.mysql.com/cn/ 点击 No thanks, just start my download. ,弹出下载框,即可下载,不需要付费

By Ne0inhk

OpenViking上下文数据库Golang集成实践

引言 随着AI Agent从简单的单轮对话处理器演变为能够执行复杂长周期任务的智能实体,上下文管理已成为制约Agent能力发展的关键瓶颈。传统RAG系统采用扁平化的向量存储模式,导致记忆碎片化、检索质量差、调试困难,且缺乏Agent自身的经验沉淀机制。 2026年1月,字节跳动火山引擎团队开源了OpenViking——全球首个专门面向AI Agent设计的上下文数据库。OpenViking摒弃传统RAG的碎片化存储模式,创新性地采用"文件系统范式",将Agent所需的记忆、资源和技能进行统一的结构化组织,通过viking://协议实现分层上下文按需加载、目录递归检索和记忆自迭代。 本文将从工程实践角度,深入解析OpenViking的核心架构,并提供完整的Golang客户端实现。我们将构建一个企业级智能体记忆系统,涵盖以下关键技术点: 1. OpenViking架构解析与Golang客户端实现:理解双存储架构和REST API接口 2. 基于viking://协议的智能体记忆系统构建:实现资源、用户记忆、Agent技能的统一管理 3. 分层上下文(L0/L1/L2)按需加载

By Ne0inhk