Prompt/Context/Harness三大AI工程范式,核心差异在哪?
Prompt、Context和Harness三大AI工程范式的核心差异在于,它们分别解决模型“听不懂”、“没信息”和“反复错”的问题。从优化单次指令到构建完整系统,这三种范式层层递进,共同推动AI从“能说话”到“能干活”。
Prompt Engineering:让模型“听懂”指令
Prompt Engineering的核心是打磨单次输入的表达技巧,让模型理解任务意图。列如,用“思维链”引导模型分步推理,或用“角色扮演”让模型代入特定身份。它的目标很直接:解决模型“听不懂”指令的痛点。在2022到2024年,这曾是AI工程的热点,人们研究如何通过精妙的措辞一次性获得理想输出。
但问题在于,当任务从单轮问答转向多步执行时,光靠一条提示词就不够用了。
Context Engineering:给模型“备齐”信息
随着任务复杂度升级,模型需要更多信息才能决策,Context Engineering应运而生。它关注如何为模型动态构建完整的认知环境,列如动态检索知识库、管理历史对话或定义工具接口。更关键的是,它解决了模型“没信息”的短板——就像发邮件时,确保所有附件和背景资料都已备齐。
不过,当AI进入更长链路、更高复杂度的真实任务时,仅靠信息供给仍不够,由于上下文注意力有限,且难以自动补齐业务场景中的隐性知识。
Harness Engineering:为Agent搭建“办公室”
Harness Engineering则更进一步,它为AI Agent搭建一个能持续、稳定工作的“操作系统”。这不再是优化单次输入或信息环境,而是设计系统级的约束、反馈循环和工具链。同一个模型,换一套运行环境,编程基准的成功率就从42%跳到了78%。Harness包括:

- 系统提示与约束:定义Agent的行为边界。
- 工具与技能集成:如文件系统、代码执行器,让Agent能自主解决问题。
- 反馈循环:用测试工具自动检查输出,让Agent根据结果修正。
LangChain团队就曾固定使用GPT-5.2-Codex模型,仅通过调整harness,将智能体在编程基准上的得分从52.8%提升至66.5%。这标志着工程重点从“调试模型”转向了“调整系统”。

简单来说,Prompt是“基础语言”,Context是“信息补给”,Harness是“运行系统”。低复杂度任务靠Prompt,中复杂度靠Context,高复杂度靠Harness——它们共同构成了AI从模型到实干家的完整链条。
