Lazy loaded image
别再用对话的方式指挥 AI Agent:写好任务说明书的 3C 框架 (2026最新)
Words 2182Read Time 6 min
2026-4-22
2026-4-22
type
status
date
slug
summary
tags
category
icon
password
📖
本文是对 matt shumer 的学习笔记。所有观点归原作者所有,建议阅读原文获取完整内容。

💡
💡 聊天机器人负责“回答”,而 Agent 负责“干活”。别再用一句话打发你的 AI 员工了。 这篇文章指出了目前使用 AI Agent 最大的误区:人们还在用给聊天机器人发指令的方式去指挥 Agent。作者 Matt Shumer 提出了 3C 框架(Context、Constraints、Composition),教你如何像给外包人员写需求文档一样给 Agent 下达指令。读完这篇,你就能掌握一套可复用的黄金模板,让 Agent 真正为你产出可以直接用的交付物,而不是一本正经地胡说八道。

核心认知:从“提示词工程”到“任务说明书”

是什么: 提示聊天机器人和提示 Agent 完全是两码事。机器人只会给你一段文字,但 Agent 能读取文件、运行代码、打开浏览器截图,并且能自我迭代直到任务完美。
为什么重要: 聊天机器人如果胡说八道,你几秒钟就能看出来;但 Agent 会采取实际行动,如果它做错了,可能直到报告发给老板或者代码上线时你才会发现,试错成本极高。
怎么用: 不要再给 Agent 发一句简单的话(比如“帮我分析一下客户反馈”),你要把它当成一个从未见过面、不懂你团队标准但工作能力极强的远程外包。你需要写的是一份详尽的任务说明书(Brief)。

Context(上下文):通过“实习生测试”

是什么: 上下文不仅包括背景情况、目标受众和成功标准,更重要的是实际物料。Agent 需要接触的所有东西——上一版的 PPT、数据表格、品牌指南、参考文档,都必须明确告诉它在哪里。
为什么重要: 绝大多数人给的上下文都严重不足。如果你不给上一季度的报告做参考,Agent 就会靠猜。而当 Agent 开始瞎猜时,它通常会在错误的思路上浪费一个小时。
怎么用: 使用作者的实习生测试(Intern test)。想象一个第一天上班的实习生,你把这段提示词扔给他,他能不问任何问题直接开始干活吗?如果不行,说明你的上下文给得不够。你需要明确指出:“分析 /data/feedback.csv 里的数据,参考 /docs/template.md 的格式”。

Constraints(约束条件):把质检变成工作的一部分

是什么: 在 Agent 提示词里,约束条件不是简单的“不要瞎编”,而是验证机制。你要明确告诉 Agent,在干活的过程中应该如何自我检查,以及达到什么标准才算真正做完。
为什么重要: Agent 很少产出明显的垃圾,它们更喜欢产出“看起来很合理”的东西,然后自信地宣布完工(比如引用的链接其实打不开,或者排版文字溢出)。
怎么用: 不要提建议,要给停止条件。把“写完后自己检查一遍”变成具体动作。比如:“生成报告后,打开每一个你引用的 URL,确认原文确实支持你的观点。删除任何无法直接证明的内容,列出你没有核实的部分。”

终极咒语:“Don't finish until”(直到...才算完工)

是什么: 这是指挥 Agent 时杠杆率最高的一句话。它直接重新定义了什么叫作“完成任务”。
为什么重要: 如果没有这句话,Agent 只要把东西做出来就算完工;加上这句话后,它必须确认东西是正确的才算完工。几乎所有 Agent 的翻车,都出在这两者之间的落差里。
怎么用: 疯狂使用这个句式。比如:“直到你打开文件确认排版没有错位才算完工”、“直到每一条引用的来源都被点开验证过才算完工”、“直到测试全绿才算完工”。

Composition(交付物结构):格式直接重塑思考方式

是什么: 明确规定交付物的具体形态。是一页纸的备忘录?是带有对比表格的 Markdown?还是特定字段的 JSON?
为什么重要: 这是最容易被低估的一点。因为格式会改变思考方式。如果你只要求“一份分析报告”,Agent 会给你写一堆废话长文;如果你要求“包含推荐方案、三个支持理由和最强反对意见的一页纸”,它在执行时就会按照这个逻辑去组织思考。
怎么用: 直接给出骨架。比如要求它按照以下结构输出:
我的核心建议
为什么这是最优解
最强烈的反对意见是什么
什么情况下我会改变主意

拿来即用的 Agent 黄金模板

是什么: 作者总结的一个可以套用于几乎所有 Agent 任务的结构化模板。
为什么重要: 每次写提示词都从头构思太反人性,把这个模板存入你的知识库,每次填空即可,能极大降低沟通成本。
怎么用: 严格按照以下五个模块来写你的提示词:
**Context(上下文): ** 交代背景、受众,并附上所有需要处理的文件、数据和参考模板。
**Your task(你的任务): ** 一句话说明你要产出什么。
**Constraints(约束条件): ** 具体的规则(例如:每页只放一个核心数据、字数限制等)。
Verification(验证标准 - 直到...才算完工): 规定它要执行的检查动作(例如:打开文件确认无文字溢出、核对每个数据是否与源文件一致)。
**Output format(输出格式): ** 交付物的具体形态、长度和语气。
📌 关键收获

Grace 可以马上做的事

**把 3C 模板做成 Notion / 键盘快捷键: **
第一步,把上面的“黄金模板”存入你的 Notion,或者设置为输入法快捷语。第二步,下次需要让 Agent 分析独立站销售数据或竞品调研时,直接唤出模板填空,强制自己写清楚文件路径和“实习生测试”级别的背景。
**在内容生产中加入“强制自检”指令: **
下次让 AI 写 SEO 博客或社媒文案时,在提示词最后加上具体的验证动作:“直到你重读一遍草稿,并删除了所有假大空的营销废话才算完工。在交付最终版本时,附上一句话总结你删掉了哪些废话以及为什么删。”
**优化竞品调研的交付格式: **
做跨境电商竞品分析时,不要再用“帮我调研一下这三家竞品”这种废话。第一步,指定具体网址;第二步,规定动作:“访问每个网站并截图定价页作为证据,未在实时页面上验证的内容不要写”;第三步,规定结构:“输出一个对比表格,外加一段总结它们与我们当前定价差异的短文”。
如果没有明确的验收标准,Agent 只要把东西做出来就算完工;加上验收标准后,它必须确认东西是正确的才算完工。几乎所有 Agent 的翻车,都出在这两者之间的落差里。

👉
想了解更多细节? 查看原文 →
上一篇
放弃聊天式 Prompt:用 3C 框架给 AI Agent 派活儿 (2026最新)
下一篇
别只盯SEO了!GEO(生成式引擎优化)正重塑独立站高转化流量池 (2026最新)