KIMI 和 Hermes办了个比赛，冠军项目很硬核，大白话讲清其中的干货

内容分享2个月前发布

4 0 0

#探寻人工智能# #技能改变生活#

KIMI 和 Hermes 办了一场创意比赛，冠军项目超级硬核。

名字叫 Brut-V。

如果直接解释它是什么，许多读者可能马上就想划走：浏览器端 RISC-V 汇编器、Processing 风格草图框架、6200 行汇编、自我修正 diff/patch 循环、和参考模拟器做到字节级一致……

这些词都太专业了，不钻技术细节。

我想说真正值得看的是项目展示了：

Agent 的价值，已经开始在帮你造出一套能继续产出东西的工具链上体现了。

这是硬干货。

KIMI 和 Hermes办了个比赛，冠军项目很硬核，大白话讲清其中的干货

先说背景：这不是普通小比赛

这次比赛叫“黑客马拉松”，由 Nous Research 和 Kimi_Moonshot 推出，官方一开始就把方向放得很宽：视频、图片、音频、3D、长文写作、创意软件、互动媒体等，都可以用 Hermes Agent 来做。

作品会由 Nous Research 和 Kimi 团队从创意、实用性和展示效果几个维度评选。

今天官方公布，这次一共有 227 个提交作品，最终由 Nous 和 Kimi 员工选出入围和获奖项目。

冠军是 Brut-V，作者是 Louis。这是一个完整的浏览器端 RISC-V 汇编器和 Processing 风格草图框架，Hermes Agent 在其中写了 6200 行汇编，并通过自我修正循环，把 JavaScript 汇编器做到和参考模拟器字节级一致。

看到这里，许多人可能已经头大了。

没关系，我们把它翻译成大白话。

Brut-V 到底做了什么？

你可以把它理解成这样：

作者不是让 Hermes “画一张图”。

他让 Hermes 参与搭建了一个能画图的底层环境。

这个环境里，有自己的图形规则，有自己的运行方式，有自己的汇编器，还能在浏览器里跑。

更重大的是，它不是写完就算了，而是会不断对比标准答案：哪里输出不一样，就找差异，补丁修正，再跑一遍。

这就像什么？

许多人让 AI 做饭，是让它做一道菜。

Brut-V 更像让 AI 参与搭了一间厨房：有炉子、有刀、有菜谱、有质检流程。后来你想做别的菜，不用从零开始。

差别就在这里。

一个是一次性作品。
一个是可重复使用的系统。

冠军项目之所以值得看，不是由于每个读者都要学 RISC-V 汇编，而是由于它把 Agent 的上限往前推了一步：让 Agent 帮人造工具，再用工具继续创造。

KIMI 和 Hermes办了个比赛，冠军项目很硬核，大白话讲清其中的干货

第一个干货：别只让 Agent 做成品，要让它做流程

许多人用 AI，任务是这样写的：

帮我做一个网页。
帮我写一段代码。
帮我生成一张图。
帮我整理一篇文章。

这当然没问题，但这些都偏“一次性产物”。

Brut-V 给我们的启发是：你可以把任务往前推一步，不只让 Agent 交付结果，还让它帮你搭出一套流程。

列如做内容，不只是让 AI 写一篇文章，而是让它建立一个流程：选题判断、资料核查、结构拆解、标题测试、配图清单、最终检查。

列如做小工具，不只是让 AI 写一个脚本，而是让它整理成可重复使用的模板：输入是什么，输出是什么，异常怎么处理，下次怎么复用。

列如做设计，不只是让 AI 出一张图，而是让它沉淀成一套风格规则：颜色、字体、构图、禁忌、参考图、复用提示词。

成品用完就结束。

流程能越用越顺。

Agent 真正变强的地方，往往不是那一次回答多美丽，而是它能不能帮你把经验沉淀下来。

KIMI 和 Hermes办了个比赛，冠军项目很硬核，大白话讲清其中的干货

第二个干货：必定要有“校验循环”

Brut-V 里最有价值的部分，是那个自我修正循环。

大白话讲，就是：

先生成。
再对比标准结果。
发现不一致。
定位问题。
打补丁。
再跑一遍。

这比“让 AI 写完你自己看”高级许多。

由于许多 AI 任务最大的问题，不是它不会写，而是它写完后来没人验。AI 说完成了，不代表真的完成了；它说没问题，不代表真的没问题。

真正靠谱的工作流里，必定要有校验。

写代码，就让它跑测试。
整理数据，就让它抽样核对。
写文章，就让它检查实际和重复。
做图，就让它检查文字是否错、信息是否清楚。
做自动化，就让它跑一个最小样例，看输出是否符合预期。

没有校验，Agent 就容易变成“自信的实习生”。

有校验，它才更像一个能被训练的工作伙伴。

这也是 Brut-V 能打动人的地方：它不是靠一句“我完成了”，而是靠一次次对比和修正，把结果往标准答案上靠。

KIMI 和 Hermes办了个比赛，冠军项目很硬核，大白话讲清其中的干货

第三个干货：Agent 最强的用法，是让它帮你造工具

冠军项目最值得记住的一句话，可以这样说：

工具可以造工具。

但这次冠军项目展示了一个创意用法：让 Agent 参与做一个新工具，而这个新工具后来还能继续帮人创作、学习、展示。

这对我们做日常项目很有启发。

你常常整理资料，就别每次都让 AI 临时整理。让它帮你做一个固定模板。

你常常生成配图，就别每次从头写提示词。让它帮你沉淀一套风格库和检查表。

你常常写同类文章，就别每次靠感觉。让它帮你做选题表、核查表、标题库、配图流程。

你常常处理文件，就别每次手工拖拽。让它帮你写一个小脚本，固定输入输出。

会用 Agent 的人，不会只盯着眼前这一次任务。

他会想：这个任务能不能变成工具？这个工具能不能下次继续用？这次踩的坑能不能写进规则？

这就是差距。

第四个干货：展示也很重大

黑客松作品不是只看“能不能跑”。

官方规则里一开始就写了，评选会看创意、实用性和展示效果。

Brut-V 的作者很懂这一点。

他不只是做了一个硬核底层项目，还做了很强的视觉展示：手机 mockup、黑白风格的代码票据、浏览器 demo、控制流程、图像生成流程。

这点很值得学。

许多项目失败，不是没技术，而是别人看不懂。

你做了一个工具，如果读者不知道它能解决什么问题，那就等于白做。你让 AI 做了一个流程，如果只剩一堆终端截图，普通人也感受不到价值。

所以做项目时，最后必定要问自己三个问题：

它解决了什么？
别人 10 秒内能看懂吗？
有没有一个画面能让人记住？

Brut-V 很硬核，但它没有只停在硬核。它把项目包装成了一个能展示、能演示、能传播的作品。

这也是冠军项目很重大的能力。

KIMI 和 Hermes办了个比赛，冠军项目很硬核，大白话讲清其中的干货

第五个干货：别被专业名词吓住，要学背后的方法

我们不需要每个人都懂 RISC-V。

也不需要每个人都做汇编器。

这篇真正该学的是方法：

第一，把一次性任务变成可复用流程。

第二，给 Agent 加上校验循环，不要只听它说完成。

第三，让 Agent 帮你造工具，而不只是帮你交作业。

第四，展示结果要让人看懂，别把价值藏在技术细节里。

第五，把每次成功经验沉淀下来，下次直接复用。

这些方法可以迁移到许多场景。

写文章可以用。
做图可以用。
整理文件可以用。
做网页可以用。
做自动化可以用。
学习新工具也可以用。

真正有价值的是：看懂它为什么能拿第一，然后把它的思路搬到自己的工作里。

一个可复制提示词

如果你也想照着这个思路用 Hermes 或其他 Agent，可以这样问：

我不想只完成这一次任务。

请你帮我把这个任务设计成一个可复用流程：

1. 先拆出任务的输入、输出和成功标准；
2. 再设计最小执行步骤；
3. 每一步都要有检查方法；
4. 如果结果不对，要能定位是哪一步出错；
5. 最后把这套流程整理成模板，方便我下次复用。

注意：不要一上来就直接做成品，先设计流程和验收标准。

我们把 AI 从“写答案模式”拉到“搭系统模式”。

你要的是长期能力，不是一次美丽输出。