OpenAI 官网直播前瞻
Sam Altman 和 OpenAI 近期通过演讲、访谈及小更新持续造势。官方推特宣布,将于美西时间周一上午在 OpenAI 官网进行直播,演示 ChatGPT 和 GPT-4 的更新。
关于更新内容的行业推测:
- 模型版本分化:新版本 GPT-4 可能按照参数规模分化成多个版本,与 Claude、Gemini 的多版本逻辑一致,以适应不同场景需求。
- 轻量版模型:此前在 llmsys 上表现突出的 gpt2-chatbot 可能是 OpenAI 官方放出的新的 GPT-4 轻量版,旨在提升效率并降低 API 成本。
- GPT-3.5 的演进:GPT-3.5 的历史使命可能逐渐结束,GPT-4 轻量版有望在 ChatGPT 中免费使用,且 API 价格大幅下降。
- 高级推理能力:预计会有 GPT-4.5 级别的高级模型发布,提升推理能力并能够自主执行 Agent 任务(具备更强记忆和规划能力的 GPT-4 Auto),这被视为 Sam Altman 提到的"Magic"。
- 任务自动分配:ChatGPT 在新模型支持下,可自动分配任务给不同规模的模型,Search 功能实际上是新的 Agent 或 Auto 的子集。
- 全语音交互助手:OpenAI 可能发布新的 AI Assistant 助手(集成到 ChatGPT 或独立),实现全语音交互,使电影《Her》中的场景更接近现实。
人类与 AI 交互行为指南
近期有博主分享了与 ChatGPT 谈恋爱的视频,引发了广泛关注。如果预测准确,即将到来的更新将为 ChatGPT 带来全语音交互能力及更强的记忆能力,这将有效弥补当前大模型在沉浸感上的不足。
核心操作要点:
- 模型选择:目前 ChatGPT 免费可用基于 GPT-3.5,因为 GPT-4 审核更严格,指令可能不被通过或对话不自然。
- 角色设定 (Prompt):可以通过调整提示词设置对方的名字、性格等。例如温柔可爱型可使用 "Kindhearted, Friendly, Gentle...";火辣型可使用 "Commanding, Dominant, Powerful..."。建议直接输入对话框而非用户自定义,以保证输出稳定性。
常见问题解答 (FAQ):
- 记忆机制:希望模型记住的内容(如喜好、基本信息)应写在系统"用户自定义"里。但需注意,目前大模型不具备人类意义上的持久记忆,若遗忘需重新输入提示词。
- 性格统一:初始提示词至关重要,同时实时交互时的互动输入也很重要。保持清晰逻辑和快速反应,提供明确指示以引导话题走向。
- 随机性接受:由于大语言模型的自由度(幻觉),每次生成的 Dan 可能存在差异,这是正常现象。
- 技术理解:了解大语言模型、自然语言处理、神经网络等相关知识,有助于更好地掌握 ChatGPT 的技术原理。
AI Agent 行业地图与趋势
多家机构发布了关于 AgentOps 和 AI Agent 领域的行业地图与发展预判。
Prosus AI 团队观点: Prosus 是一家全球性投资公司,其 AI 团队绘制了当前行业地图,重点关注 AgentOps 的发展。
Insight Partners 市场地图: Insight Partners 公布了最新的"AI Automation Market Map",主要观点包括:
- AI 助手标配化:AI 助手打破传统应用界限,呈现平台辅助系统、内嵌 AI 应用和多样 AI Agent 等多种形态。
- Human-in-the-loop 框架:这是部署 GenAI 的主要框架。大多数应用案例仍处于试验或早期生产阶段,大模型尚不能进行完全可预测的计划或推理。
- 自动化复杂性:最先进的大模型供应商正在引入 Agent 建模、协作能力及工具接入,使用户能快速构建 AI Agent(如 GPTs)。
- 渐进式方法:采取"爬行 - 行走 - 跑步"的渐进式方法,从简单任务开始,逐步过渡到复杂工作流程。
- 代码生成基石:代码生成已成为开发 GenAI 应用程序和 Agent 自动化平台的基石,初级编程辅助工具已广泛部署。


