从提示工程到 Harness,2026年 AI 真正的主战场

内容分享4小时前发布
0 1 0

从提示工程到 Harness,2026年 AI 真正的主战场

一、我研究了三年AI,发现2026年最大的机会藏在这个词里

说个真事。

2023年,我花大量时间研究怎么写好 Prompt。2024年,我又研究怎么设计 RAG、怎么给 AI 喂上下文。2025年,我追各种 Agent 框架,看谁家的工具更强。

结果到 2026 年,我发现一个让人尴尬的实际:

花这么多时间调模型、调 Prompt,结果真正决定 AI 能不能干活的,根本不是模型本身。

是另一个东西。


二、我被”马具”这个词打醒了

前 Hugging Face 工程师 Philipp Schmid 发了一篇文章,里面提了一个词:Harness

翻译过来是”马具”。

你品品这个比喻:

AI Agent 是那匹强壮却野性难驯的骏马。

Harness 不提供动力,却能牢牢牵住方向、稳住步伐。

让这匹烈马既能全力奔驰,又始终走在正确的路上。

我看到这段话的时候,愣了足足五分钟。

这不就是我一直在找的答案吗?


三、为什么模型已经不重大了

这三年,AI 行业经历了两次大迁移:

AI Engineering Evolution

阶段

时间

核心焦点

提示工程

2023-2024

怎么写 Prompt、怎么调格式

上下文工程

2025

怎么喂知识、怎么设计 RAG

Harness

2026

怎么控制AI稳定运行

为什么?

由于大模型的能力已经趋同了。GPT-5、Claude 4、DeepSeek V3,差距越来越小。

但同样是这些模型,有的能稳定跑完一个复杂任务,有的却三天两头崩溃。

差距在哪?Harness。


四、字节悄悄放了个大招

就在上周,GitHub 上有一个项目悄悄火了:

24 小时冲到 Trending 第一

⭐ 目前 47.3k Stars

谁干的?字节跳动。

项目叫 DeerFlow 2.0

它的定位很清晰:Super Agent Harness


五、DeerFlow 是什么?

DeerFlow = Deep Exploration and Efficient Research Flow

最初只是个 Deep Research 框架,但社区用着用着,发现它能做的事远超研究——数据流水线、PPT 生成、Dashboard 搭建、内容自动化…

字节团队干脆从头重构,推出了 2.0。

目前的 DeerFlow 2.0 是一个开箱即用的 Super Agent Harness

它基于 LangGraph + LangChain 构建,配合沙盒、记忆、工具、技能模块、子智能体和消息网关,能处理从几分钟到几小时的任何复杂任务


六、它能做什么?我实际测了

Core Harness Capabilities

✅ 1. 自动拆解复杂任务

我扔给它一个任务:”帮我分析这篇论文,然后生成一份 PPT。”

它自动做了这些:

  1. 召唤一个子 Agent 读论文
  2. 再召唤一个子 Agent 查相关背景
  3. 再召唤一个子 Agent 生成 PPT 大纲
  4. 最后汇总成完整 PPT

我能得到什么:以前要半天的工作,目前 10 分钟搞定。


✅ 2. 沙箱隔离 —— 安全到变态

每个任务都在独立 Docker 容器里运行,拥有完整文件系统。

它可以:

  • 读写和编辑文件
  • 执行 Bash 命令
  • 执行代码
  • ️ 查看图片

整个过程都在沙箱内完成,不同 session 之间不会相互污染

我测试的时候故意跑了一个危险命令,结果它乖乖待在沙箱里,宿主机一点事没有。

我能得到什么:让 AI 放手干活,不用担心它把系统搞崩。


✅ 3. 长期记忆 —— 真正认识你

DeerFlow 能跨会话记住:

  • 我的偏好
  • ✍️ 我的写作风格
  • ️ 我常用的技术栈

而且这些都保存在本地,控制权始终在我手里

我能得到什么:用得越久,它越懂我。


✅ 4. Skills 可扩展

内置的 Skills 包括:

  • 研究
  • 报告生成
  • 幻灯片制作
  • 图文视频创作

可以一键添加、替换、组合,还可以按需渐进加载,不浪费 token。

我能得到什么:想要什么能力,插上去就行。


七、怎么接入?5分钟搞定

Docker 方式(推荐)

# 1. 克隆项目
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

# 2. 生成本地配置
make config

# 3. 配置你的模型(编辑 config.yaml)
models:
  - name: deepseek-chat
    display_name: DeepSeek V3
    use: langchain_openai:ChatOpenAI
    model: deepseek-chat
    api_key: $DEEPSEEK_API_KEY
    base_url: https://api.deepseek.com/v1

# 4. 启动服务
make docker-init
make docker-start

访问 http://localhost:2026,搞定 ✅


Claude Code 集成

# 安装 skill
npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

# 在 Claude Code 里使用
/claude-to-deerflow

直接在终端里跟 DeerFlow 交互,下发研究任务、查看状态、管理 threads。


八、为什么这很重大?

Framework Comparison

过去我们比的是

未来分水岭是

谁用的模型更强

谁能打造更成熟的 Harness

谁 Prompt 写得更好

谁能让 AI 在真实业务中稳定运行

谁 RAG 设计更精妙

谁能在隔离与开放之间找到平衡

从提示工程 → 上下文工程 → Harness,这条路的本质是:

从”教模型如何理解人类”,迈向”为模型构建一个可执行、可信赖、可长期运转的数字世界”。


九、我的判断

DeerFlow 2.0 可能是 2026 年最重大的开源项目之一。

不是由于它技术最牛,而是由于它踩中了正确的方向

当更多像 DeerFlow 这样的 Super Agent Harness 走向普及,AI 将真正进化为:

  • ✅ 能理解
  • ✅ 会规划
  • ✅ 可执行
  • ✅ 敢交付
  • ✅ 长期负责

的成熟生产力形态。


目前你可以

  1. 去 GitHub 看看这个项目:github.com/bytedance/deer-flow
  2. 用 Docker 方式跑通 Demo
  3. 集成飞书,做团队协作
  4. 根据你的业务,定制 Skills

记住:模型是马,Harness 才是缰绳。

© 版权声明

相关文章

1 条评论

  • 头像
    星小星同学 读者

    收藏了,感谢分享

    无记录
    回复