【AIGC】《Generative Agents:Interactive Simulacra of Human Behavior》

【AIGC】《Generative Agents:Interactive Simulacra of Human Behavior》

让 AI 村民组成虚拟村庄会发生什么事?

文章目录

Generative Agents

Park J S, O’Brien J, Cai C J, et al. Generative agents: Interactive simulacra of human behavior[C]//Proceedings of the 36th annual acm symposium on user interface software and technology. 2023: 1-22.

这篇论文由斯坦福大学和 Google 的研究人员(如 Joon Sung Park, Percy Liang 等)共同发表,也就是大名鼎鼎的 “AI 小镇(Smallville)” 论文。鉴于你之前关注“能使用工具的 AI”,这篇文章正是“自主智能体(Autonomous Agents)”领域的开山之作。

核心贡献:提出了一个名为 “生成式智能体架构(Generative Agent Architecture)” 的系统,包含三个关键组件:

  • 记忆流 (Memory Stream):一个长期内存数据库,用自然语言记录智能体的所有经历(观察)。通过相关性、近时性、重要性三个维度进行检索,决定智能体当前该想起什么。
  • 反思 (Reflection):智能体会定期停下来,对记忆流中的碎片化信息进行归纳总结,提取出高层级的观点(例如:某人很友好,或者我下午需要去买菜),这让智能体能够形成更深刻的判断。
  • 规划 (Planning):智能体会制定长、中、短期计划,并根据环境变化(观察到新事物)随时调整计划(Re-planning),保证行为的逻辑连贯性。

点击对应的 NPC,可以看到更多细节

每个角色都有人设

最经典的案例情人节派对,至今还被反复拿出来讨论。
他们只给其中一个叫Isabella的AI下了一个种子指令——“你想在情人节办个派对”。
剩下的事情,人类完全没有插手,然后整个小镇就自发运转起来了。
Isabella开始四处发邀请函,接到邀请的AI们会根据自己的性格决定去不去,甚至有人在派对前一天就开始紧张地讨论该穿什么、要不要带点礼物。
甚至有人帮忙装饰咖啡馆,有人提前规划路线,最后5个AI准时到场,派对办得热火朝天。
整个过程虽然丝滑,却没有一条硬编码规则,全是这群电子小人自己“想”出来的。

Daily requirement 超长

NPC 觉醒,喜欢上了玩家操控的女角色,会发生什么事情呢?

行为说明应该是 ChatGPT 生成的

行为说明转成行为应该基于 program 规则

感知-思考-行动循环:

  • 感知:Agent 观察周围环境并存入记忆流。
  • 检索:根据当前场景检索最相关的记忆。
  • 行动:通过 Prompting 让 LLM 生成下一步动作(对话、移动、操作物体)。

固定的太枯燥了

可以让 Agent 根据外界的信息改变自己的行为

重要性打分,

模型内部的结构,有 plan,有 observation,还有 reflection

因为 no evidence

发现了相互暗恋的情况(Maria 和 Klaus),不排除是上帝把 reflection 塞进来了,因为没有看到 evidence

John 是 Eddy 的爸爸,John 看见 Eddy 后,改变了自己的 plan,开始与 Eddy 去对话

伊莎贝拉计划举办一场情人节派对。她传播了这个信息,在模拟结束时,12 个角色已经知道了这件事。其中 7 个人「犹豫不决」——3 个人已有其他计划,4 个人没有表露想法,这和人类的相处一样。

demo 比较慢,李老师没有看到最后,不知道 Maria 和 Klaus 的对话内容以及情人节活动现场发生的事情

自己注释了一个 happy ending,哈哈哈

实验最令人惊叹的是观察到了涌现出的社会行为 (Emergent Social Behaviors):

  • 信息传播:一个 Agent 决定举办情人节派对,消息通过社交互动在小镇里传开,大家纷纷调整计划参加。
  • 关系演变:智能体之间会建立新的友谊,并根据过去的互动改变对彼此的态度。
  • 协作:多个智能体协调时间,共同出现在同一地点。

论文证明了将 LLM 与架构化的记忆机制结合,可以创造出极具真实感的“数字人类”。

证明了 Agent 的可信度不仅取决于模型本身,更取决于其对过去经历的组织和反思能力

资讯

  1. 「斯坦福AI小镇」创业即获投1亿美元!李飞飞卡帕西都投了(2026-02-14)
    • 当初那个“智能体早期真神”,让25个智能体自己聊天、传八卦、谈恋爱的AI小镇Smallville团队也官宣创业了。
    • 公司名叫Simile,直接拿下了Index Ventures领投的1亿美元融资,连卡帕西、李飞飞也跟了。
  2. 爆火论文打造《西部世界》雏形:25个AI智能体,在虚拟小镇自由成长(2023-04-11)
    • Generative Agents 的架构中心是记忆流—— 一个全面记录智能体经验的数据库。智能体会从记忆流中检索相关记录,以规划智能体的动作行为并对环境做出适当反应,并且每次行为都会被记录以递归合成更高级别的行为指导。Generative Agents 架构中所有的内容都被记录下来并以自然语言描述的形式来进行推理,从而使智能体能够利用大型语言模型的推理功能。
    • 只有当智能体对最近事件的重要性分数总和超过某个阈值,智能体才会开始反思。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

参考

  • https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php
  • https://www.bilibili.com/video/BV18fXbY6Eis/?spm_id_from=333.1387.homepage.video_card.click&vd_source=8e91f8e604278558ec015e749d1a3719
  • https://www.youtube.com/watch?v=G44Lkj7XDsA
  • Demo:https://reverie.herokuapp.com/arXiv_Demo/

Read more

OpenClaw + 本地 Ollama:未来的个人 AI 助手实战教程

OpenClaw + 本地 Ollama:未来的个人 AI 助手实战教程 (参考 MacStories、Starry Hope、OpenClaw 社区 shoutouts) OpenClaw 不只是“一个模型工具”,它是一个让你的电脑真正“懂你、为你做事”的本地 AI 引擎。 一、什么是 OpenClaw?未来 AI 助手的入口 最近最火的个人 AI 助手就是 OpenClaw(前身是 Clawdbot / Moltbot)。它火爆的原因来自几类用户的体验: * 每天自动发送定制日程总结、结合日历/Notion/Todoist 等服务创建智能报告。([MacStories][1]) * 能结合已有工具(例如 RSS / cron)自动完成复杂自动化任务,无云、不订阅。

实测OIIOII AI动画平台:零门槛做动画,附10枚专属邀请码

实测OIIOII AI动画平台:零门槛做动画,附10枚专属邀请码

作为一名深耕AI工具领域的博主,最近挖到了一款专注于AI动画创作的宝藏平台——OIIOII,亲测后发现它把专业动画制作的全流程做了AI化简化,不管是AI爱好者、内容创作者还是想试水动画的小白,都能快速上手。目前平台处于内测阶段,需要邀请码才能解锁全部功能,本文不仅会详细拆解OIIOII的核心特色和实际使用体验,还会分享10枚专属邀请码,助力大家直接开启动画创作,官网地址放这里:https://www.oiioii.ai/home。 一、OIIOII核心特色:把专业动画团队装进AI里 接触过动画制作的朋友都知道,一部完整的动画需要导演、美术、编剧、分镜、音效等多个岗位配合,门槛高、流程繁琐,而OIIOII的核心亮点,就是用AI多智能体协作系统还原了专业动画制作的分工逻辑,让单人就能完成团队级的创作,这也是它和普通AI视频工具最本质的区别。 1. 一站式AI创作团队,覆盖动画全流程 OIIOII内置了虚拟的「AI动画制作团队」,从创意构思到成片输出,每个环节都有对应的AI角色负责,完全不用自己对接多个工具: * 艺术总监:把控整体创作风格和作品质量,确保画面、风格的统一性

AI日报 - 2026年03月31日

AI日报 - 2026年03月31日

#本文由AI生成 🌐 一、【行业深度】 1. 🎧 万象有声开启公测:懒人听书原班人马打造AIGC有声内容“智能工厂” 🔥 热点聚焦: 由前“懒人听书”核心团队创立的万象有声平台正式开启公测,直击有声内容产业长期存在的高成本、低效率与品控难三大痛点。该平台并非单一AI配音工具,而是融合智能画本、录剪一体工作站、AI多播有声剧全自动工作台等模块的全栈式AIGC创作系统,支持双轨制生产——既赋能专业工作室实现后期对轨效率提升500%,又为网文平台中长尾IP提供极低成本、高吞吐量的“准广播剧”级内容生成能力。内测数据显示,传统需30天交付的有声书项目可压缩至5–7天,标志着有声内容正从手工作坊迈入工业化智能生产新阶段。 **⚡ 进展追踪:**平台已全面开放公测注册,官网即刻体验,首批合作方包括多家头部网文平台与有声出版机构。 🔍 影响维度分析: 维度拓展详细分析【技术维度】首次实现“AI多播+自动对轨+智能审听”闭环,突破语音合成在角色区分、情感连贯性与时间精度上的工程瓶颈。【市场维度】有望激活超千万部沉睡网文IP,将有声内容供给规模提升一个数量级,重塑版权方、制作方与平