跳到主要内容

阅读笔记 - 2026-06-21

Cell 细胞：[译] Loop Engineering

原文（x.com）

要点

旧的用户输入 prompt 让 agent 去工作的模式已经过时了，现在利用 harness 把发现工作、分发工作、检查工作、记录完成情况、决定下一步的事情，打包了起来。而 loop engineering 是在 harness 之上，再形成循环，生成 helper 自己喂养自己。
一个 loop 需要5个东西：
- automations ，按计划自动触发，自己 discovery 和 triage
- worktrees 能在多 agent 之间并行开发
- skills 记录项目知识
- plugins / connectors 接入工具
- sub agents 分工执行
- 还有可能可以接 memory ，可以是外部的记录系统，比如 linear

方法

codex app 里可以创建 automations , 定义运行环境，时机，还有某个 worktree， openai 内部会自动处理很多事情，都是天然的工程方法的总结，可以 scheduling 或 hooks 执行
利用 /loop 反复执行 cadence
利用 /goal 一直执行，直到我写下的条件成真，会由多角色独立判断完成情况

我的观点

价值：一个对 loop engineering 的快速介绍，其实也是我们在日常使用中的工作模式的总结，总的来说最大的收获是， codex 现在能自己去判断边界达成，或自动构建更灵活的 loop 了，而不需要像我们以前一样手动构建。
风险：对现有工作流是否能替换，替换后是否各项指标会下降
适用条件：适合在新项目或新流程中尝试

Kyrie：如何快速提升阅历？把老一辈口中烦人的“经验”拆解为可执行步骤

原文（x.com）

要点

在谈判时，要先看清项目约束，用压力状态等到他压力显露，再用品任职这遇到结构性阻力
要判断对方对项目理解的模型，看执行者的思考模式，帮他理顺问题结构，还是处理他的情绪问题

实践哥MinLi：Claude Code 动态工作流：每个任务都可以有自己的 Harness【译】

原文（x.com）

要点

cc 提供了 dynamic workflow 功能，自动的编排脚本，执行 harness 。默认的 cc 写代码不错，但做研究或代码审查等，还不是很合适。这篇文章将如何定制 workflow 达到更好的效果
workflow 能解决 agent 自动停止、结论的偏好偏差，和目标漂移，通过独立 context + subagent 来做
dynamic workflow 是 cc 自己根据具体场景量身定制 harness
自带 6 种组合模式：分类执行、 fanout 并综合、对抗验证、生成并筛选、锦标赛、循环到完成
使用场景：迁移重构、深度研究、深度验证、排序、记忆提取和规则遵守、大规模分类处理、探索、评估、智能路由

方法

使用提示词技巧
结合 goal 和 loop ，给 workflow 定目标
设置 token 预算
保存和分享 workflow

我的观点

价值：一个快速的对 dynamic workflow 的介绍，确实能自动化很多过去需要手动编排的模式，能极大的提升效率
风险：可能与静态的 workflow 的效果有冲突。另外调优 workflow 的成本也不低，对于重复性项目有价值，但实际工作中重复性项目其实也不算主流，所以需要多实践多沉淀。
适用条件：新项目，快速构建临时性的项目的 workflow 。

九原客：都在讲 Harness Engineer，甚至说模型以外都是 Harness ，最近和客户/学员沟通，他们刚半知半解上下文工程，又来这个，而且没有实感，理解很混乱😵‍💫。我说下我…

原文（x.com）

要点

harness 是两件事： workflow 关注工作流，比如 autoresearch ，是方法论。另一个是 harness infra ，包含沙盒和 skills 等
两件事情分开看会更清晰

我的观点

价值：清晰的判断，我们工作中确实也遇到了 "harness 团队" 到底是做什么工作的问题，业务团队利用开源 harness infra 也能做 workflow ，那么 harness infra 团队的工作到底是帮业务团队做 workflow 还是做工具呢？还是说应该两者结合？我的认为应该是从实际的不可标准化的部分里生长出 infra 来，其他的都可以用开源构建。

0x_Miko：Hermes + Polymarket：如何搭建一个能自学习的 BTC 交易代理，从 100 美元小资金开始跑自动化策略

原文（x.com）

要点

文章讲了如何利用 hermes 和 polymarket 的 btc 赌涨跌盘套利，基本原理都是马尔可夫链对下一个交易机会的 gap 判断，从而决定是否入场和下注概率
概率过滤、状态持续性过滤、 gap 过滤、利用 kelly sizing 控制仓位
利用 agent 的自学习循环，反复调整各项参数，更新策略

方法

进场公式： Δ⁽ʷ⁾ = p̂⁽ʷ⁾ − q⁽ʷ⁾ ≥ ε → ENTER , 其中：p̂ = 模型概率 q = 市场价格 ε = 最小 gap
Markov persistence threshold: p(j*,j*) ≥ 0.87 ，需要某个状态保持超过 87% 以上才动手
仓位管理公式： Kelly f* = p − (1−p)/b ，不让 bot 无脑重仓

我的观点

价值：在交易市场中此类胜率是需要对比市场中其他人的策略而得到的，如果胜率不好的情况下，很可能活力都没手续费高。更多是一种方法分享，但是否能用于实践，还是要自己尝试。并不这个行当的，无法评论。

GitHub - yaojingang/yao-meta-skill: YAO = Yielding AI Outcomes. A rigorous engineering, evaluat…

原文（github.com）

要点

skills 生成技能，能从开发过程中提取，识别这是一个重复 workflow ，并记录可能的输入输出，生成 skill ，并能进行评测和发布
可用于：内容工作流技能、团队审核技能、外部分发技能等

我的观点

价值：现在的 ai 工具一大问题，文档又臭又长，黑话又多，又没有重点，光首页的文档就“优势”这个话题反反复复说了好几章，真正重要的如何使用只有一点点内容。本身这个工具值得尝试，前提是调优的代价不高。

Kafka：OpenAI、Anthropic 都开始押注 FDE，FDE 才是 Agent 时代的 PMF 范式？

原文（x.com）

要点

FDE 就是 ai 驻场工程师，帮客户在现场识别模式，应用 ai ，并交付 ai 能力
对 ai 厂商来说，是识别场景，发现问题，从而优化自己的产品，这和传统的 saas 有相似但又不同，因为客户的 ai 能力越强， ai 厂商的 token 才能卖的越多，而不是通过 fde 的一次性销售完成的收入
对客户厂商来说，通过这个过程获得 ai 能力，从而扩大自己的产能，或优化自己的工作流程，其实也是完成了一次咨询。能力转移后这样的模式就可以结束，和传统的外包 fde 也有点不同
"如果一个问题能被需求文档解决，那它早就被解决了。"

我的观点

价值：也是一种对公司内 ai 团队困境的一种良好解答， ai 团队通过入住业务团队实现赋能。但这也要分团队，比如一个技术团队往往自己也有工程能力，谁的方案比谁的更好，其实很难说。对 ai 厂商来说是一种商业模式，但对 ai 团队来说到底如何，很难讲。

ginobefun：阿里这篇关于 AI Native 时代组织研发的思考非常值得一读。它在思路一个非常重要的底层问题：过去两千年的组织形态，都是围绕人的局限建立起来的。 https://t.…

原文（x.com）

要点

ai可以替代很多组织功能，但人和人之间隐性的运转模式段时间内无法被 ai 弥补，比如很多口头约定，隐性修补，经验猜测等，在人类组织中都是可接受的复杂度，对 ai 来说就不友好。 ai native 转型的瓶颈，是组织信息形态太旧
所以资深工程师和架构师就更重要，可以用更高的杠杆来自定义系统如何解决问题。
人的管理会更多变成激励、辅导、冲突处理、身份安顿、文化建设等
这样的工作环境会把所有工作都推向透明，但创新工作也需要很多的保护空间，过早暴露很难被长期执行和优化

我的观点

价值：有一定道理，但这个是公司战略层面的思考，以及这里其实有很多的理想化的内容，认为 ai 是一种独立设施，或者 ai 能在垂直领域中贯通所有人的边界问题。但其实实际情况是， ai 只能是思维的延申，人会忽略的问题，遗漏的文档或 case 边界， ai 一样也会遗漏， ai 对执行判断的结果也是不融惯的， ai 也会形成一个个小的执行团体。我认为部分价值有道理，但整体还过于理想化。

© [2019-2026] [gsj987]