阅读笔记 - 2026-06-21
Cell 细胞:[译] Loop Engineering
要点
- 旧的用户输入 prompt 让 agent 去工作的模式已经过时了,现在利用 harness 把发现工作、分发工作、检查工作、记录完成情况、决定下一步的事情,打包了起来。而 loop engineering 是在 harness 之上,再形成循环,生成 helper 自己喂养自己。
- 一个 loop 需要5个东西:
- automations ,按计划自动触发,自己 discovery 和 triage
- worktrees 能在多 agent 之间并行开发
- skills 记录项目知识
- plugins / connectors 接入工具
- sub agents 分工执行
- 还有可能可以接 memory ,可以是外部的记录系统,比如 linear
方法
- codex app 里可以创建 automations , 定义运行环境,时机,还有某个 worktree, openai 内部会自动处理很多事情,都是天然的工程方法的总结,可以 scheduling 或 hooks 执行
- 利用
/loop 反复执行 cadence
- 利用
/goal 一直执行,直到我写下的条件成真,会由多角色独立判断完成情况
我的观点
- 价值:一个对 loop engineering 的快速介绍,其实也是我们在日常使用中的工作模式的总结,总的来说最大的收获是, codex 现在能自己去判断边界达成,或自动构建更灵活的 loop 了,而不需要像我们以前一样手动构建。
- 风险:对现有工作流是否能替换,替换后是否各项指标会下降
- 适用条件:适合在新项目或新流程中尝试
Kyrie:如何快速提升阅历?把老一辈口中烦人的“经验”拆解为可执行步骤
要点
- 在谈判时,要先看清项目约束,用压力状态等到他压力显露,再用品任职这遇到结构性阻力
- 要判断对方对项目理解的模型,看执行者的思考模式,帮他理顺问题结构,还是处理他的情绪问题
实践哥MinLi:Claude Code 动态工作流: 每个任务都可以有自己的 Harness【译】
要点
- cc 提供了 dynamic workflow 功能,自动的编排脚本,执行 harness 。默认的 cc 写代码不错,但做研究或代码审查等,还不是很合适。这篇文章将如何定制 workflow 达到更好的效果
- workflow 能解决 agent 自动停止、结论的偏好偏差,和目标漂移,通过独立 context + subagent 来做
- dynamic workflow 是 cc 自己根据具体场景量身定制 harness
- 自带 6 种组合模式:分类执行、 fanout 并综合、对抗验证、生成并筛选、锦标赛、循环到完成
- 使用场景:迁移重构、深度研究、深度验证、排序、记忆提取和规则遵守、大规模分类处理、探索、评估、智能路由
方法
- 使用提示词技巧
- 结合 goal 和 loop ,给 workflow 定目标
- 设置 token 预算
- 保存和分享 workflow
我的观点
- 价值:一个快速的对 dynamic workflow 的介绍,确实能自动化很多过去需要手动编排的模式,能极大的提升效率
- 风险:可能与静态的 workflow 的效果有冲突。另外调优 workflow 的成本也不低,对于重复性项目有价值,但实际工作中重复性项目其实也不算主流,所以需要多实践多沉淀。
- 适用条件:新项目,快速构建临时性的项目的 workflow 。
九原客:都在讲 Harness Engineer, 甚至说模型以外都是 Harness ,最近和客户/学员沟通,他们刚半知半解上下文工程,又来这个,而且没有实感,理解很混乱😵💫。 我说下我…
要点
- harness 是两件事: workflow 关注工作流,比如 autoresearch ,是方法论。另一个是 harness infra ,包含沙盒和 skills 等
- 两件事情分开看会更清晰
我的观点
- 价值:清晰的判断,我们工作中确实也遇到了 "harness 团队" 到底是做什么工作的问题,业务团队利用开源 harness infra 也能做 workflow ,那么 harness infra 团队的工作到底是帮业务团队做 workflow 还是做工具呢?还是说应该两者结合?我的认为应该是从实际的不可标准化的部分里生长出 infra 来,其他的都可以用开源构建。
0xMiko:Hermes + Polymarket:如何搭建一个能自学习的 BTC 交易代理,从 100 美元小资金开始跑自动化策略
要点
- 文章讲了如何利用 hermes 和 polymarket 的 btc 赌涨跌盘套利,基本原理都是马尔可夫链对下一个交易机会的 gap 判断,从而决定是否入场和下注概率
- 概率过滤、状态持续性过滤、 gap 过滤、利用 kelly sizing 控制仓位
- 利用 agent 的自学习循环,反复调整各项参数,更新策略
方法
- 进场公式: Δ⁽ʷ⁾ = p̂⁽ʷ⁾ − q⁽ʷ⁾ ≥ ε → ENTER , 其中:p̂ = 模型概率 q = 市场价格 ε = 最小 gap
- Markov persistence threshold: p(j*,j*) ≥ 0.87 ,需要某个状态保持超过 87% 以上才动手
- 仓位管理公式: Kelly f* = p − (1−p)/b ,不让 bot 无脑重仓
我的观点
- 价值:在交易市场中此类胜率是需要对比市场中其他人的策略而得到的,如果胜率不好的情况下,很可能活力都没手续费高。更多是一种方法分享,但是否能用于实践,还是要自己尝试。并不这个行当的,无法评论。
GitHub - yaojingang/yao-meta-skill: YAO = Yielding AI Outcomes. A rigorous engineering, evaluat…
要点
- skills 生成技能,能从开发过程中提取,识别这是一个重复 workflow ,并记录可能的输入输出,生成 skill ,并能进行评测和发布
- 可用于:内容工作流技能、团队审核技能、外部分发技能等
我的观点
- 价值:现在的 ai 工具一大问题,文档又臭又长,黑话又多,又没有重点,光首页的文档就“优势”这个话题反反复复说了好几章,真正重要的如何使用只有一点点内容。本身这个工具值得尝试,前提是调优的代价不高。
Kafka:OpenAI、Anthropic 都开始押注 FDE,FDE 才是 Agent 时代的 PMF 范式?
要点
- FDE 就是 ai 驻场工程师,帮客户在现场识别模式,应用 ai ,并交付 ai 能力
- 对 ai 厂商来说,是识别场景,发现问题,从而优化自己的产品,这和传统的 saas 有相似但又不同,因为客户的 ai 能力越强, ai 厂商的 token 才能卖的越多,而不是通过 fde 的一次性销售完成的收入
- 对客户厂商来说,通过这个过程获得 ai 能力,从而扩大自己的产能,或优化自己的工作流程,其实也是完成了一次咨询。能力转移后这样的模式就可以结束,和传统的外包 fde 也有点不同
- "如果一个问题能被需求文档解决,那它早就被解决了。"
我的观点
- 价值:也是一种对公司内 ai 团队困境的一种良好解答, ai 团队通过入住业务团队实现赋能。但这也要分团队,比如一个技术团队往往自己也有工程能力,谁的方案比谁的更好,其实很难说。对 ai 厂商来说是一种商业模式,但对 ai 团队来说到底如何,很难讲。
ginobefun:阿里这篇关于 AI Native 时代组织研发的思考非常值得一读。它在思路一个非常重要的底层问题:过去两千年的组织形态,都是围绕人的局限建立起来的。 https://t.…
要点
- ai可以替代很多组织功能,但人和人之间隐性的运转模式段时间内无法被 ai 弥补,比如很多口头约定,隐性修补,经验猜测等,在人类组织中都是可接受的复杂度,对 ai 来说就不友好。 ai native 转型的瓶颈,是组织信息形态太旧
- 所以资深工程师和架构师就更重要,可以用更高的杠杆来自定义系统如何解决问题。
- 人的管理会更多变成激励、辅导、冲突处理、身份安顿、文化建设等
- 这样的工作环境会把所有工作都推向透明,但创新工作也需要很多的保护空间,过早暴露很难被长期执行和优化
我的观点
- 价值:有一定道理,但这个是公司战略层面的思考,以及这里其实有很多的理想化的内容,认为 ai 是一种独立设施,或者 ai 能在垂直领域中贯通所有人的边界问题。但其实实际情况是, ai 只能是思维的延申,人会忽略的问题,遗漏的文档或 case 边界, ai 一样也会遗漏, ai 对执行判断的结果也是不融惯的, ai 也会形成一个个小的执行团体。我认为部分价值有道理,但整体还过于理想化。