#探寻人工智能# #技能改变生活#
KIMI 和 Hermes 办了一场创意比赛,冠军项目超级硬核。
名字叫 Brut-V。
如果直接解释它是什么,许多读者可能马上就想划走:浏览器端 RISC-V 汇编器、Processing 风格草图框架、6200 行汇编、自我修正 diff/patch 循环、和参考模拟器做到字节级一致……
这些词都太专业了,不钻技术细节。
我想说真正值得看的是项目展示了:
Agent 的价值,已经开始在帮你造出一套能继续产出东西的工具链上体现了。
这是硬干货。

先说背景:这不是普通小比赛
这次比赛叫“黑客马拉松”,由 Nous Research 和 Kimi_Moonshot 推出,官方一开始就把方向放得很宽:视频、图片、音频、3D、长文写作、创意软件、互动媒体等,都可以用 Hermes Agent 来做。
作品会由 Nous Research 和 Kimi 团队从创意、实用性和展示效果几个维度评选。
今天官方公布,这次一共有 227 个提交作品,最终由 Nous 和 Kimi 员工选出入围和获奖项目。
冠军是 Brut-V,作者是 Louis。这是一个完整的浏览器端 RISC-V 汇编器和 Processing 风格草图框架,Hermes Agent 在其中写了 6200 行汇编,并通过自我修正循环,把 JavaScript 汇编器做到和参考模拟器字节级一致。
看到这里,许多人可能已经头大了。
没关系,我们把它翻译成大白话。
Brut-V 到底做了什么?
你可以把它理解成这样:
作者不是让 Hermes “画一张图”。
他让 Hermes 参与搭建了一个能画图的底层环境。
这个环境里,有自己的图形规则,有自己的运行方式,有自己的汇编器,还能在浏览器里跑。
更重大的是,它不是写完就算了,而是会不断对比标准答案:哪里输出不一样,就找差异,补丁修正,再跑一遍。
这就像什么?
许多人让 AI 做饭,是让它做一道菜。
Brut-V 更像让 AI 参与搭了一间厨房:有炉子、有刀、有菜谱、有质检流程。后来你想做别的菜,不用从零开始。
差别就在这里。
一个是一次性作品。
一个是可重复使用的系统。
冠军项目之所以值得看,不是由于每个读者都要学 RISC-V 汇编,而是由于它把 Agent 的上限往前推了一步:让 Agent 帮人造工具,再用工具继续创造。

第一个干货:别只让 Agent 做成品,要让它做流程
许多人用 AI,任务是这样写的:
帮我做一个网页。
帮我写一段代码。
帮我生成一张图。
帮我整理一篇文章。
这当然没问题,但这些都偏“一次性产物”。
Brut-V 给我们的启发是:你可以把任务往前推一步,不只让 Agent 交付结果,还让它帮你搭出一套流程。
列如做内容,不只是让 AI 写一篇文章,而是让它建立一个流程:选题判断、资料核查、结构拆解、标题测试、配图清单、最终检查。
列如做小工具,不只是让 AI 写一个脚本,而是让它整理成可重复使用的模板:输入是什么,输出是什么,异常怎么处理,下次怎么复用。
列如做设计,不只是让 AI 出一张图,而是让它沉淀成一套风格规则:颜色、字体、构图、禁忌、参考图、复用提示词。
成品用完就结束。
流程能越用越顺。
Agent 真正变强的地方,往往不是那一次回答多美丽,而是它能不能帮你把经验沉淀下来。

第二个干货:必定要有“校验循环”
Brut-V 里最有价值的部分,是那个自我修正循环。
大白话讲,就是:
先生成。
再对比标准结果。
发现不一致。
定位问题。
打补丁。
再跑一遍。
这比“让 AI 写完你自己看”高级许多。
由于许多 AI 任务最大的问题,不是它不会写,而是它写完后来没人验。AI 说完成了,不代表真的完成了;它说没问题,不代表真的没问题。
真正靠谱的工作流里,必定要有校验。
写代码,就让它跑测试。
整理数据,就让它抽样核对。
写文章,就让它检查实际和重复。
做图,就让它检查文字是否错、信息是否清楚。
做自动化,就让它跑一个最小样例,看输出是否符合预期。
没有校验,Agent 就容易变成“自信的实习生”。
有校验,它才更像一个能被训练的工作伙伴。
这也是 Brut-V 能打动人的地方:它不是靠一句“我完成了”,而是靠一次次对比和修正,把结果往标准答案上靠。

第三个干货:Agent 最强的用法,是让它帮你造工具
冠军项目最值得记住的一句话,可以这样说:
工具可以造工具。
但这次冠军项目展示了一个创意用法:让 Agent 参与做一个新工具,而这个新工具后来还能继续帮人创作、学习、展示。
这对我们做日常项目很有启发。
你常常整理资料,就别每次都让 AI 临时整理。让它帮你做一个固定模板。
你常常生成配图,就别每次从头写提示词。让它帮你沉淀一套风格库和检查表。
你常常写同类文章,就别每次靠感觉。让它帮你做选题表、核查表、标题库、配图流程。
你常常处理文件,就别每次手工拖拽。让它帮你写一个小脚本,固定输入输出。
会用 Agent 的人,不会只盯着眼前这一次任务。
他会想:这个任务能不能变成工具?这个工具能不能下次继续用?这次踩的坑能不能写进规则?
这就是差距。
第四个干货:展示也很重大
黑客松作品不是只看“能不能跑”。
官方规则里一开始就写了,评选会看创意、实用性和展示效果。
Brut-V 的作者很懂这一点。
他不只是做了一个硬核底层项目,还做了很强的视觉展示:手机 mockup、黑白风格的代码票据、浏览器 demo、控制流程、图像生成流程。
这点很值得学。
许多项目失败,不是没技术,而是别人看不懂。
你做了一个工具,如果读者不知道它能解决什么问题,那就等于白做。你让 AI 做了一个流程,如果只剩一堆终端截图,普通人也感受不到价值。
所以做项目时,最后必定要问自己三个问题:
它解决了什么?
别人 10 秒内能看懂吗?
有没有一个画面能让人记住?
Brut-V 很硬核,但它没有只停在硬核。它把项目包装成了一个能展示、能演示、能传播的作品。
这也是冠军项目很重大的能力。

第五个干货:别被专业名词吓住,要学背后的方法
我们不需要每个人都懂 RISC-V。
也不需要每个人都做汇编器。
这篇真正该学的是方法:
第一,把一次性任务变成可复用流程。
第二,给 Agent 加上校验循环,不要只听它说完成。
第三,让 Agent 帮你造工具,而不只是帮你交作业。
第四,展示结果要让人看懂,别把价值藏在技术细节里。
第五,把每次成功经验沉淀下来,下次直接复用。
这些方法可以迁移到许多场景。
写文章可以用。
做图可以用。
整理文件可以用。
做网页可以用。
做自动化可以用。
学习新工具也可以用。
真正有价值的是:看懂它为什么能拿第一,然后把它的思路搬到自己的工作里。
一个可复制提示词
如果你也想照着这个思路用 Hermes 或其他 Agent,可以这样问:
我不想只完成这一次任务。
请你帮我把这个任务设计成一个可复用流程:
1. 先拆出任务的输入、输出和成功标准;
2. 再设计最小执行步骤;
3. 每一步都要有检查方法;
4. 如果结果不对,要能定位是哪一步出错;
5. 最后把这套流程整理成模板,方便我下次复用。
注意:不要一上来就直接做成品,先设计流程和验收标准。
我们把 AI 从“写答案模式”拉到“搭系统模式”。
你要的是长期能力,不是一次美丽输出。
最后说一句
KIMI 和 Hermes 这次比赛,冠军项目的确 很硬核。
但它真正值得我们学习的,不是 RISC-V、汇编器这些技术词,而是它背后的工作方式。
许多人用 Agent,还停留在“帮我写点东西”。
冠军项目已经展示了另一种方向:让 Agent 帮你搭工具链,帮你建立校验循环,帮你把一次任务变成能反复使用的系统。
这才是未来真正拉开差距的地方。
会让 AI 写代码的人会越来越多。
会让 AI 造工具、搭流程、做校验、沉淀能力的人,才会越来越稀缺。
Brut-V 拿第一,是由于它把这件事做出来了。
