阿里重磅上线了 QoderWork,一个真正能干活的 AI Agent

春节假期在家里闲的没事,我打开 Qoder 官网突然发现阿里竟然上线了一款桌面级通用智能体助手 QoderWork,看名字我们就知道它是做什么的了,就是为普通人打造的一款 AI Agent,目的是将 Qoder 的 Agent 能力从代码领域扩展到日常工作场景,描述需求,自动执行,直接交付结果。

不像是 Qoder AI 编程 IDE 或者  Qoder CLI 终端 Agent ,上手有门槛,更像是跟专业程序员使用的。QoderWork 是可视化的 UI 界面,桌面应用,上手超级简单,几乎没有门槛。

image.png

不止聊天,搞定一切

这是 QoderWork 最核心的理念。QoderWork 的定位是「本地运行、自主规划、安全可控的 AI 工作搭子」。

注意这几个关键词:本地运行,自主规划,安全可控。

本地运行意味着它不是一个网页工具,而是装在你电脑上的桌面应用。自主规划意味着你不用一步步告诉它该怎么做,你只要说清楚想要什么结果就行。安全可控意味着你的数据不会被上传到云端,隐私有保障。

这三点加在一起,其实解决了当前 AI 工具的一个核心痛点:我想让 AI 帮我干活,但我不想把数据交出去,也不想当它的人肉指挥官。

传统的 AI 对话是这样的:你问一个问题,它回答你,你再追问,它再补充,来回好几轮,最后你还得自己复制粘贴、整理格式、手动执行。

QoderWork 想把这个流程压缩成一句话:你说你想要什么,它直接给你结果。

比如你说「帮我把这周的会议纪要整理成一份周报」,它不会问你「请问会议纪要在哪里」「周报格式是什么」,而是自己去找文件、分析内容、生成周报、保存到指定位置。整个过程你只需要描述需求,然后等着收结果就行。

这才是 Agent 该有的样子。不是一个等着你喂指令的聊天机器人,而是一个能理解目标、自主规划、独立执行的工作搭子。

能力可扩展,场景无边界

QoderWork 内置了多种主流 MCP(Model Context Protocol),这是一种让 AI 能够调用外部工具和服务的协议。简单说,就是它能连接各种第三方能力,不局限于纯文本对话。

更有意思的是,它支持自定义 Skills。你可以根据自己的工作场景,定制专属的能力模块。比如你是做运营的,可以定制一个「竞品分析」的 Skill;你是做财务的,可以定制一个「报表生成」的 Skill。

这个设计思路很聪明。与其做一个大而全的通用工具,不如提供一个可扩展的框架,让每个人都能把它调教成最适合自己的样子。

工作场景千差万别,没有一个 AI 能覆盖所有人的需求。但如果这个 AI 能让你自己扩展能力,那它就能适应任何场景。

跑了几个 Case,效果很赞

在家闲的没事,所以,我就尝试跑了几个案例,看看效果会不会像是介绍的一样这么好用,说实话,几个案例跑下来,效果超出了我的想象。我给大家看看我跑的几个案例。

央视春晚 PPT 汇总

央视春晚刚播出完,所以,我想看一下 QoderWork 的内容创作与文档分析能力怎么样?所以,我给它布置了一个任务:

2026 年央视春晚已经播放完了,帮我搜集一下 2026 年央视春晚的相关评论和报道,制作成一个 PPT 文档。要包含群众对央视春晚的经典吐槽内容。

它就会开始根据任务工作了,在工作之前还询问我要制作多少页的 PPT ,风格什么样的?都是可视化操作的。

根据需求操作完之后,就开始工作了,一会就把工作做完了。注意:生成的是 PPT ,应该是工具中内置了 PPT Skill ,所以,它先是制作了 22 页的可视化网页, 然后将网页转成了 PPT 文档。整个效果非常经验,排版也非常好看,颜值挺在线的。

image.png

PPT 文档效果如下:

image.png
image.png
image.png
image.png

一共 22 页,内容相当丰富,搜索的资料很多,展示的内容也很多。整体看下来,创作能力和文章的处理能力相当强,超乎想象。大家可以去试试,22 页,做的跟一个报告一样。

写作风格分析

我看可以对接一些 MCP 服务,内置了浏览器的网页抓取的 MCP 服务,所以,我就配置并开启了这个 MCP 服务,让它去抓取我微博的最近 10 条的内容,并分析我的微博写作风格,帮我写一条拜年的祝福语。

帮我爬虫这个博主微博主页前 10 条微博并分析写作风格,微博主页地址 :https://weibo.com/u/5078115336
523ac736933a912067f70f22e732aae8.png
image.png

经过了爬虫、数据的整理和分析等 8  个步骤,最终形成了一份 word 写作分析的报告,这份报告看完我直接惊呆了。大家可以看看。

看完你是不是也感觉很惊讶,从基本画像到数据概览再到主题分析、语言风格、 结构特征等,内容详细到一丝不苟。我仅仅只是说了一句话,分析写作风格,它就能干的这么仔细,终于让我们体会到了一个能干活的 AI 到底应该是什么样。

最后,我说,请基于写作风格分析报告,帮我写一份拜年祝福语,它给出的文案是:

image.png

不得不说,我看完之后,确实感觉有点我的味道。哈哈……

制作拜年祝福语视频

QoderWork 不是内置了各种 Skill 吗?我一看默认 Skill 当中竟然有 Remotion Skill ,那干脆让它把刚才生成的祝福语使用这个 Skill 制作成一个祝福语的拜年视频吧。

image.png
image.png

就这么一条指令,点击回车之后,我们就坐等视频就行了,大家可以看看效果,我感觉非常不错。

image.png

视频如下:

是不是很赞?自带音效和背景音乐和文字动画相得益彰。其实通过这个案例也体现了QoderWork 内置的 coding 模型能力非常强。所以,我就用测试了一个案例,让它制作一个网页应用看看它的 coding 能力到底怎么样?

春节亲戚称呼计算器

我们都知道春节回家最尴尬的是见到各种一年只见一回面的亲戚可能不知道该怎么称呼,我就使用 QoderWork 帮我开发了一个春节亲戚称呼计算器。

我是这么说的:

请帮我开发一个 “春节亲戚称呼计算器” 的单页应用。要求界面设计喜庆、美观,符合春节氛围,同时操作人性化、易用。

不到几分钟,一个非常好看的符合春节调性的春节亲戚计算器就帮你开发完成了。效果如下:

整个页面非常好看,颜值在线,红色主题,顶部还悬挂着灯笼,分别写作福字和春字。支持两种模式,一种是按钮选择模式,一种是直接文字输入的模式,同时支持暗色模式。

所以,代码能力也是很在线。

写在最后

说实话,整个体验下来,我最大的感觉就是:QoderWork 是一个实实在在真正能帮我们干活的 AI Agent 。

真正的 AI Agent,就应该这样。你说目标,它交结果。你掌控方向,它负责执行。

QoderWork 正在往这个方向走。本地运行保证安全,自主规划提升效率,可扩展设计覆盖场景。这三点加在一起,就是一个靠谱的 AI 工作搭子该有的样子。

感兴趣的朋友可以去 Qoder 官网看看,体验一下这个「不止聊天」的 AI Agent。

官网地址:https://qoder.com/qoderwork

Read more

比迪丽AI绘画模型Python爬虫实战:自动化采集艺术素材

比迪丽AI绘画模型Python爬虫实战:自动化采集艺术素材 艺术创作需要灵感,也需要素材。但手动收集图片素材耗时耗力,如何高效获取优质艺术素材并快速进行风格转换?本文将展示如何用Python爬虫结合比迪丽AI绘画模型,搭建一套自动化艺术素材采集与处理流水线。 1. 项目背景与价值 艺术创作过程中,寻找合适的参考素材往往需要花费大量时间。无论是插画师、设计师还是艺术爱好者,都需要不断收集各类图像素材来激发灵感。传统的手动搜索和保存方式效率低下,且难以系统化管理。 比迪丽AI绘画模型的出现为艺术创作带来了新可能,但如何为其提供高质量、多样化的输入素材仍是一个实际问题。通过Python爬虫技术,我们可以自动化地从多个来源采集艺术素材,再结合比迪丽的风格转换能力,快速生成符合需求的艺术图像。 这套方案特别适合需要大量素材的内容创作者、设计团队和教育机构,能够将素材收集时间从几小时缩短到几分钟,让创作者更专注于创作本身而非素材准备。 2. 整体方案设计 我们的自动化艺术素材采集系统包含三个核心模块:爬虫采集模块、数据处理模块和AI风格转换模块。 爬虫模块负责从目标网站获取原始

从 99.8% 到 14.9%:Paperzz 降重 / 降 AIGC 实测,破解知网最新检测的实用指南

从 99.8% 到 14.9%:Paperzz 降重 / 降 AIGC 实测,破解知网最新检测的实用指南

Paperzz-AI官网免费论文查重复率AIGC检测/开题报告/文献综述/论文初稿paperzz - 降重/降AIGChttps://www.paperzz.cc/weight 当知网、维普再次升级 AIGC 检测机制,不少同学的论文初稿被打出 99.8% 的 AIGC 疑似度时,那种 “一夜回到解放前” 的焦虑,想必很多人都深有体会。传统的同义词替换、语序调整早已失效,单纯降重又容易让文本变得口语化、散文化。Paperzz 的 “降重 / 降 AIGC” 功能,正是在这样的背景下,成为了不少人应对学术检测的 “救命稻草”。本文将结合平台界面,为你深度拆解 Paperzz 如何通过 AI 技术与专业服务,帮你安全、高效地通过最新一轮学术检测。 一、检测升级:知网 AIGC

最完整whisperX入门指南:从安装到实现第一个语音识别功能

最完整whisperX入门指南:从安装到实现第一个语音识别功能 【免费下载链接】whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音识别和语音合成引擎,并且能够自定义语音识别和语音合成的行为。 项目地址: https://gitcode.com/gh_mirrors/wh/whisperX 你还在为语音识别工具安装复杂、识别准确率低、时间戳不精准而烦恼吗?本文将带你从零开始,一步步掌握whisperX的安装配置,并实现你的第一个语音识别功能。读完本文,你将能够:搭建稳定的whisperX运行环境、使用命令行和Python API两种方式进行语音识别、获取精准的单词级时间戳、实现多 speaker 区分标注。 whisperX 简介 whisperX 是一个基于 OpenAI Whisper 的语音识别工具,它在 Whisper 的基础上进行了改进,提供了更精准的单词级时间戳和 speaker 区分功能。

解决下载慢问题:国内可用的Stable Diffusion和LLaMA模型镜像站清单

国内可用的Stable Diffusion和LLaMA模型镜像站清单:高效解决下载慢问题 在AI生成内容(AIGC)迅速普及的今天,越来越多开发者、设计师和研究人员开始尝试本地部署Stable Diffusion或微调LLaMA这类大模型。但一个现实问题始终困扰着国内用户——模型下载太慢了。 你有没有经历过这样的场景?打开Hugging Face准备下载一个7GB的SDXL基础模型,进度条爬得比蜗牛还慢,半小时才下完一半,结果网络一断,前功尽弃。更别提训练LoRA时需要频繁拉取不同版本的基础权重,这种体验简直让人崩溃。 这背后的原因并不复杂:主流模型大多托管在境外平台(如Hugging Face、Replicate),而原始文件动辄数GB甚至数十GB,加上跨境链路不稳定、DNS污染、限速等问题,直接导致国内直连下载效率极低,严重拖慢了从环境搭建到实际训练的整体节奏。 好在社区早已意识到这个问题,并催生出一批高质量的国内模型镜像站点。它们通过在国内服务器缓存常用模型文件,提供HTTPS加速链接,极大提升了获取效率。配合LoRA这类轻量化微调技术,如今我们完全可以在消费级显卡上完成