
一、我研究了三年AI,发现2026年最大的机会藏在这个词里
说个真事。
2023年,我花大量时间研究怎么写好 Prompt。2024年,我又研究怎么设计 RAG、怎么给 AI 喂上下文。2025年,我追各种 Agent 框架,看谁家的工具更强。
结果到 2026 年,我发现一个让人尴尬的实际:
花这么多时间调模型、调 Prompt,结果真正决定 AI 能不能干活的,根本不是模型本身。
是另一个东西。
二、我被”马具”这个词打醒了
前 Hugging Face 工程师 Philipp Schmid 发了一篇文章,里面提了一个词:Harness。
翻译过来是”马具”。
你品品这个比喻:
AI Agent 是那匹强壮却野性难驯的骏马。
Harness 不提供动力,却能牢牢牵住方向、稳住步伐。
让这匹烈马既能全力奔驰,又始终走在正确的路上。
我看到这段话的时候,愣了足足五分钟。
这不就是我一直在找的答案吗?
三、为什么模型已经不重大了
这三年,AI 行业经历了两次大迁移:
AI Engineering Evolution
|
阶段 |
时间 |
核心焦点 |
|
提示工程 |
2023-2024 |
怎么写 Prompt、怎么调格式 |
|
上下文工程 |
2025 |
怎么喂知识、怎么设计 RAG |
|
Harness |
2026 |
怎么控制AI稳定运行 |
为什么?
由于大模型的能力已经趋同了。GPT-5、Claude 4、DeepSeek V3,差距越来越小。
但同样是这些模型,有的能稳定跑完一个复杂任务,有的却三天两头崩溃。
差距在哪?Harness。
四、字节悄悄放了个大招
就在上周,GitHub 上有一个项目悄悄火了:
24 小时冲到 Trending 第一
⭐ 目前 47.3k Stars
谁干的?字节跳动。
项目叫 DeerFlow 2.0。
它的定位很清晰:Super Agent Harness。
五、DeerFlow 是什么?
DeerFlow = Deep Exploration and Efficient Research Flow
最初只是个 Deep Research 框架,但社区用着用着,发现它能做的事远超研究——数据流水线、PPT 生成、Dashboard 搭建、内容自动化…
字节团队干脆从头重构,推出了 2.0。
目前的 DeerFlow 2.0 是一个开箱即用的 Super Agent Harness。
它基于 LangGraph + LangChain 构建,配合沙盒、记忆、工具、技能模块、子智能体和消息网关,能处理从几分钟到几小时的任何复杂任务。
六、它能做什么?我实际测了
Core Harness Capabilities
✅ 1. 自动拆解复杂任务
我扔给它一个任务:”帮我分析这篇论文,然后生成一份 PPT。”
它自动做了这些:
- 召唤一个子 Agent 读论文
- 再召唤一个子 Agent 查相关背景
- 再召唤一个子 Agent 生成 PPT 大纲
- 最后汇总成完整 PPT
我能得到什么:以前要半天的工作,目前 10 分钟搞定。
✅ 2. 沙箱隔离 —— 安全到变态
每个任务都在独立 Docker 容器里运行,拥有完整文件系统。
它可以:
- 读写和编辑文件
- 执行 Bash 命令
- 执行代码
- ️ 查看图片
整个过程都在沙箱内完成,不同 session 之间不会相互污染。
我测试的时候故意跑了一个危险命令,结果它乖乖待在沙箱里,宿主机一点事没有。
我能得到什么:让 AI 放手干活,不用担心它把系统搞崩。
✅ 3. 长期记忆 —— 真正认识你
DeerFlow 能跨会话记住:
- 我的偏好
- ✍️ 我的写作风格
- ️ 我常用的技术栈
而且这些都保存在本地,控制权始终在我手里。
我能得到什么:用得越久,它越懂我。
✅ 4. Skills 可扩展
内置的 Skills 包括:
- 研究
- 报告生成
- 幻灯片制作
- 图文视频创作
可以一键添加、替换、组合,还可以按需渐进加载,不浪费 token。
我能得到什么:想要什么能力,插上去就行。
七、怎么接入?5分钟搞定
Docker 方式(推荐)
# 1. 克隆项目
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
# 2. 生成本地配置
make config
# 3. 配置你的模型(编辑 config.yaml)
models:
- name: deepseek-chat
display_name: DeepSeek V3
use: langchain_openai:ChatOpenAI
model: deepseek-chat
api_key: $DEEPSEEK_API_KEY
base_url: https://api.deepseek.com/v1
# 4. 启动服务
make docker-init
make docker-start
访问 http://localhost:2026,搞定 ✅
Claude Code 集成
# 安装 skill
npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow
# 在 Claude Code 里使用
/claude-to-deerflow
直接在终端里跟 DeerFlow 交互,下发研究任务、查看状态、管理 threads。
八、为什么这很重大?
Framework Comparison
|
过去我们比的是 |
未来分水岭是 |
|
谁用的模型更强 |
谁能打造更成熟的 Harness |
|
谁 Prompt 写得更好 |
谁能让 AI 在真实业务中稳定运行 |
|
谁 RAG 设计更精妙 |
谁能在隔离与开放之间找到平衡 |
从提示工程 → 上下文工程 → Harness,这条路的本质是:
从”教模型如何理解人类”,迈向”为模型构建一个可执行、可信赖、可长期运转的数字世界”。
九、我的判断
DeerFlow 2.0 可能是 2026 年最重大的开源项目之一。
不是由于它技术最牛,而是由于它踩中了正确的方向。
当更多像 DeerFlow 这样的 Super Agent Harness 走向普及,AI 将真正进化为:
- ✅ 能理解
- ✅ 会规划
- ✅ 可执行
- ✅ 敢交付
- ✅ 长期负责
的成熟生产力形态。
目前你可以
- 去 GitHub 看看这个项目:github.com/bytedance/deer-flow
- 用 Docker 方式跑通 Demo
- 集成飞书,做团队协作
- 根据你的业务,定制 Skills
记住:模型是马,Harness 才是缰绳。
收藏了,感谢分享