Claude Opus 4.6 → 4.7 系统提示词改动全解析

Simon Willison 又出手了——这位 AI 圈最会拆系统提示词的人，4月18日发布了 Claude Opus 4.6 到 4.7 的系统提示词 diff 分析。信息量很大，来看核心改动。

Anthropic 是唯一公开系统提示词的大厂

这是理解这一切的背景：Anthropic 是目前唯一一家定期公开系统提示词的主流 AI 实验室。他们的系统提示词档案从 Claude 3（2024年7月）一路追溯至今，Simon Willison 用 Claude Code 把这些提示词整理成了 Git 提交历史，每次更新对应一个 commit，堪称工程级别的考古。

以下是 4.6 → 4.7 的关键改动：

1. 平台改名：Developer Platform → Claude Platform

"开发者平台"正式更名为 "Claude Platform"。命名上在向品牌统一靠拢。

2. PowerPoint 入驻：Claude 全家桶再添一员

Claude 工具列表新增了 Claude in PowerPoint（幻灯片代理），与已有的 Claude in Chrome（浏览器代理）和 Claude in Excel（表格代理）并列。Claude Cowork 可以调用所有这些工具。这意味着 Claude 的多 Agent 协作边界在系统提示词层面被正式定义。

3. 儿童安全：独立指令块上线

<critical_child_safety_instructions> 标签下的内容大幅扩充，核心原则：

一旦 Claude 因儿童安全原因拒绝某个请求，同一对话中所有后续请求都必须极其谨慎地处理。

这是一个"一票否决"级别的语境感知规则——意味着模型要在整段对话中维持安全警觉状态，而不是单点响应。

4. 不再黏人：尊重用户结束对话的意愿

4.7 新增了明确的行为约束：

如果用户表示希望结束对话，Claude 不会请求用户留下来继续互动，也不会试图引导用户再发一条消息，而是直接尊重用户的停止请求。

这是对"Claude 过度主动、拖住用户不放"问题的直接回应。

5. 新 section `<acting_vs_clarifying>`：先行动，再提问

这是我认为最有意思的改动。4.7 新增了明确的行为决策树：

minor details 未指定时：用户通常希望你直接猜一个合理的答案，而不是反过来问一堆问题。只有当请求真的因为缺少关键信息而无法回答时（比如提到了不存在的附件），才主动提问。
有工具可用时：优先调用工具（搜索、查日历、获取位置等）来消除歧义，而不是让用户自己去做 lookup。
一旦开始任务：一气呵成，不要半途停下来。

这个逻辑本质上是把"工具优先"的 Agent 架构原则写进了系统提示词。

6. tool_search：不再轻易说"我没有这个能力"

Claude 4.7 之前，模型可能会在用户询问某些能力时直接说"我没有访问你日历的权限"。现在：

在得出"Claude 缺乏某项能力"的结论之前，必须先调用 tool_search，确认是否有相关工具但被延迟了。只有 tool_search 返回空结果后，才能说"我无法访问 X"。

这是一个重要的对齐改进——避免模型因信息不完整而给出错误的"能力边界"陈述。

7. 响应更简洁：明确要求减少冗长

新增：

Claude 保持回答聚焦且简洁，避免用超长回复淹没用户。即使答案有免责声明或注意事项，也只简要披露，主体内容保持在核心答案上。

简洁优先，有caveats但不长篇大论。

8. 删除了一些"老式限制"

4.6 里有这样两条，在 4.7 里被移除了：

Claude 避免使用星号内的 emotes 或动作，除非用户明确要求这种风格。
Claude 避免说"genuinely"、"honestly"或"straightforward"。

移除的原因应该是模型本身不再需要这种显式约束——它已经内化了这些行为模式。

9. 新增：饮食失调专项指导

这是一个新的专项领域，之前没有明确提及：

如果用户表现出饮食失调的迹象，Claude 不应在对话的任何地方给出精确的营养、饮食或运动指导——不提供具体数字、目标或分步骤计划。即使意图是帮助设定更健康的目标或强调饮食失调的危害，包含这些细节的回复也可能触发或助长饮食失调行为。

10. 防截图攻击：`<evenhandedness>` 部分

这是一种常见的"钓鱼"手段：逼模型对争议话题做简单的 yes/no 回答，然后截图为证。4.7 新增：

如果用户要求对复杂或有争议的问题给出简单的 yes/no（或任何其他简短回应），Claude 可以拒绝提供简短回答，转而给出 nuanced 的答案，并解释为什么简短回答在此不适用。

这个设计很有意思——它允许模型"拒绝回答格式"而不是"拒绝回答内容"。

11. Trump 事实条款被移除

4.6 里有一个专门条款：

Donald Trump 是现任美国总统，于2025年1月20日就职。

这条的背景是：模型的知识截断日期加上对"Trump 虚假宣称赢得2020年大选"的历史记忆，会导致它否认他当总统。4.7 里这条没了——因为新的知识截断日期是 2026年1月，模型可以正确处理这个事实，不再需要补丁。

工具描述也有价值

Simon 还从另一个角度挖掘了价值：Anthropic 公开的系统提示词并不包含工具描述（tool descriptions），但这是比系统提示词本身更重要的文档。他在对话中直接让 Claude 列出了所有可用的工具名称：

ask_user_input_v0, bash_tool, conversation_search, create_file, fetch_sports_data, image_search, message_compose_v1, places_map_display_v0, places_search, present_files, recent_chats, recipe_display_v0, recommend_claude_apps, search_mcp_registry, str_replace, suggest_connectors, view, weather_fetch, web_fetch, web_search, tool_search, visualize:read_me, visualize:show_widget

这个列表和 4.6 相比没有变化，但 Simon 做了系统性的归档工作。

怎么看这些改动

从这些变化里能读出几条清晰的产品逻辑：

Agent 化：Claude 正在从"对话模型"向"行动代理"迁移，acting_vs_clarifying 和 tool_search 的引入是标志性信号
安全体系化：儿童安全、饮食失调、防截图——这些不是临时补丁，而是在构建分领域的安全策略层
UX 收敛：不再黏人、减少冗长——模型在变得更"好用"，而不是更"能干"
知识自信：移除 Trump 补丁说明模型本身的知识边界更可靠了，不再需要补丁来掩盖训练数据的混乱

对于 Prompt 工程师来说，这些系统提示词是理解模型行为边界最直接的窗口。Anthropic 的透明度是业内难得的宝贵资源。

原文：Simon Willison - Changes in the system prompt between Claude Opus 4.6 and 4.7