Simon Willison 又出手了——这位 AI 圈最会拆系统提示词的人,4月18日发布了 Claude Opus 4.6 到 4.7 的系统提示词 diff 分析。信息量很大,来看核心改动。
Anthropic 是唯一公开系统提示词的大厂
这是理解这一切的背景:Anthropic 是目前唯一一家定期公开系统提示词的主流 AI 实验室。他们的系统提示词档案从 Claude 3(2024年7月)一路追溯至今,Simon Willison 用 Claude Code 把这些提示词整理成了 Git 提交历史,每次更新对应一个 commit,堪称工程级别的考古。
以下是 4.6 → 4.7 的关键改动:
1. 平台改名:Developer Platform → Claude Platform
"开发者平台"正式更名为 "Claude Platform"。命名上在向品牌统一靠拢。
2. PowerPoint 入驻:Claude 全家桶再添一员
Claude 工具列表新增了 Claude in PowerPoint(幻灯片代理),与已有的 Claude in Chrome(浏览器代理)和 Claude in Excel(表格代理)并列。Claude Cowork 可以调用所有这些工具。这意味着 Claude 的多 Agent 协作边界在系统提示词层面被正式定义。
3. 儿童安全:独立指令块上线
<critical_child_safety_instructions> 标签下的内容大幅扩充,核心原则:
一旦 Claude 因儿童安全原因拒绝某个请求,同一对话中所有后续请求都必须极其谨慎地处理。
这是一个"一票否决"级别的语境感知规则——意味着模型要在整段对话中维持安全警觉状态,而不是单点响应。
4. 不再黏人:尊重用户结束对话的意愿
4.7 新增了明确的行为约束:
如果用户表示希望结束对话,Claude 不会请求用户留下来继续互动,也不会试图引导用户再发一条消息,而是直接尊重用户的停止请求。
这是对"Claude 过度主动、拖住用户不放"问题的直接回应。
5. 新 section <acting_vs_clarifying>:先行动,再提问
这是我认为最有意思的改动。4.7 新增了明确的行为决策树:
- minor details 未指定时:用户通常希望你直接猜一个合理的答案,而不是反过来问一堆问题。只有当请求真的因为缺少关键信息而无法回答时(比如提到了不存在的附件),才主动提问。
- 有工具可用时:优先调用工具(搜索、查日历、获取位置等)来消除歧义,而不是让用户自己去做 lookup。
- 一旦开始任务:一气呵成,不要半途停下来。
这个逻辑本质上是把"工具优先"的 Agent 架构原则写进了系统提示词。
6. tool_search:不再轻易说"我没有这个能力"
Claude 4.7 之前,模型可能会在用户询问某些能力时直接说"我没有访问你日历的权限"。现在:
在得出"Claude 缺乏某项能力"的结论之前,必须先调用 tool_search,确认是否有相关工具但被延迟了。只有 tool_search 返回空结果后,才能说"我无法访问 X"。
这是一个重要的对齐改进——避免模型因信息不完整而给出错误的"能力边界"陈述。
7. 响应更简洁:明确要求减少冗长
新增:
Claude 保持回答聚焦且简洁,避免用超长回复淹没用户。即使答案有免责声明或注意事项,也只简要披露,主体内容保持在核心答案上。
简洁优先,有caveats但不长篇大论。
8. 删除了一些"老式限制"
4.6 里有这样两条,在 4.7 里被移除了:
Claude 避免使用星号内的 emotes 或动作,除非用户明确要求这种风格。
Claude 避免说"genuinely"、"honestly"或"straightforward"。
移除的原因应该是模型本身不再需要这种显式约束——它已经内化了这些行为模式。
9. 新增:饮食失调专项指导
这是一个新的专项领域,之前没有明确提及:
如果用户表现出饮食失调的迹象,Claude 不应在对话的任何地方给出精确的营养、饮食或运动指导——不提供具体数字、目标或分步骤计划。即使意图是帮助设定更健康的目标或强调饮食失调的危害,包含这些细节的回复也可能触发或助长饮食失调行为。
10. 防截图攻击:<evenhandedness> 部分
这是一种常见的"钓鱼"手段:逼模型对争议话题做简单的 yes/no 回答,然后截图为证。4.7 新增:
如果用户要求对复杂或有争议的问题给出简单的 yes/no(或任何其他简短回应),Claude 可以拒绝提供简短回答,转而给出 nuanced 的答案,并解释为什么简短回答在此不适用。
这个设计很有意思——它允许模型"拒绝回答格式"而不是"拒绝回答内容"。
11. Trump 事实条款被移除
4.6 里有一个专门条款:
Donald Trump 是现任美国总统,于2025年1月20日就职。
这条的背景是:模型的知识截断日期加上对"Trump 虚假宣称赢得2020年大选"的历史记忆,会导致它否认他当总统。4.7 里这条没了——因为新的知识截断日期是 2026年1月,模型可以正确处理这个事实,不再需要补丁。
工具描述也有价值
Simon 还从另一个角度挖掘了价值:Anthropic 公开的系统提示词并不包含工具描述(tool descriptions),但这是比系统提示词本身更重要的文档。他在对话中直接让 Claude 列出了所有可用的工具名称:
ask_user_input_v0, bash_tool, conversation_search, create_file, fetch_sports_data, image_search, message_compose_v1, places_map_display_v0, places_search, present_files, recent_chats, recipe_display_v0, recommend_claude_apps, search_mcp_registry, str_replace, suggest_connectors, view, weather_fetch, web_fetch, web_search, tool_search, visualize:read_me, visualize:show_widget
这个列表和 4.6 相比没有变化,但 Simon 做了系统性的归档工作。
怎么看这些改动
从这些变化里能读出几条清晰的产品逻辑:
- Agent 化:Claude 正在从"对话模型"向"行动代理"迁移,acting_vs_clarifying 和 tool_search 的引入是标志性信号
- 安全体系化:儿童安全、饮食失调、防截图——这些不是临时补丁,而是在构建分领域的安全策略层
- UX 收敛:不再黏人、减少冗长——模型在变得更"好用",而不是更"能干"
- 知识自信:移除 Trump 补丁说明模型本身的知识边界更可靠了,不再需要补丁来掩盖训练数据的混乱
对于 Prompt 工程师来说,这些系统提示词是理解模型行为边界最直接的窗口。Anthropic 的透明度是业内难得的宝贵资源。
原文:Simon Willison - Changes in the system prompt between Claude Opus 4.6 and 4.7