阅读笔记 - 2026-03-28
Justineo/working-with-ai: Working with AI - presentation slides
要点
- 一次公司内的 ai coding 使用分享,是作者本人把想法整理好以后,开源出来的项目,他的可交互版本在 https://working-with-ai.vercel.app/
- 作者认为 ai coding 发展到现在,已经越过帮助人写代码的模式,而是已经达到 ai 主导的模式,而且在 skills 加持下,普通人可以跨领域工作,不过 skill 可能也只是目前的替代方案,在 alpha zero 时刻后, ai 就完全可以自主学习了
- 我们应该完全信任 ai 的编程能力,转而把注意力放到控制 ai 编程流程上,形成他自我编程、 review 和测试的循环
- 人最重要的工作变成了 research 方案,可以结合 gpt 和 claude 做无预设 reaserch ,再结合 codex 或 claude code 的代码理解能力做有预设研究,两者结合能有好结果
- 多花时间研究,慢就是快,很多 ai coding 质量不好或反复犯错的原因是人没有理解根本性的问题或理解项目
- ai coding 了以后,我们讨论应该拿研究成果,拿可交互原型,讨论的结果也应该是可交互式的原型,因为成本很低,而且沟通效率会高的多
- ai agent不仅能用来写代码,他就是通用 ai
我的观点
- 价值:不错的讲演,特别是对 research 这块的理解,说明作者是花了很长时间在上面,这个理解是对的,人应该把时间花在沉思上,而 ai 更多的是把这种沉思贯彻到最细致的过程。另外他关于可交互原型的话题,是值得学习的,应该要用在平日工作中。
数字生命卡兹克:安利一个11万Star的必装插件,能让你的Agent体验直接质变。
要点
- superpowers 的介绍文,他通过 14 个对流程化工作最通用的抽象(规划 - 拆解 - 执行 - 审查 - 复盘),可以用在不仅是编程上,包括营销方案、做 ppt 或数据分析等,也都能使用
- superpowers 其实就是让你在开发前,先把所有的需求细节梳理清楚,把流程都想好,如何验收也想好的一整套方法论。他会一轮轮问,并且自己查资料,生成真正的调研结果
- 通过长时间的对细节的研究,他能充分把握执行细节和验收边界,是真正的标准化的流程方法论
我的观点
- 价值:有价值的分享,和我的工作流设计思路上也很接近,但也充分说明了 superpowers 在细节上的雕琢,每一处能力都是精心设计过,才能有很好的表达效果
- 适用范围:可以尝试用到我的工作流里,或者在 side project 中使用,看能否做更有意思的结合
quailyquaily/coe: A zero-GUI Linux voice input tool. Press a hotkey, speak, press again, and th…
要点
- 一个开源的对 typeless 的复刻,能在 linux 上使用
- 对 mic 说话,然后 llm 整理转写结果,把文本放回当前应用
- 可以增加自己的额外加工流程,比如转给 llm 文本模型做矫正
我的观点
- 价值:其实以前有一个 wisper flow ,我也自己实验过,已经能做到类似的状态了,甚至还有直接能在 emacs 里使用的 whisper.el ,开箱即用。所以我感觉这个也是价值有限。
Harness design for long-running application development \ Anthropic
要点
- Anthropic的实践分享,他们通过生成对抗的方式,让 agent 实现了长时间稳定的工作流
- 分享的两个例子是自动生成高质量前端设计(偏“审美”问题)和自动构建完整应用(偏“工程正确性”问题) 都是长时间、多步骤、复杂任务
- 三个角色:Planner / Generator (写代码) / Evaluator (测试、打分、找问题)
- 评审是需要有客观标准,需要把主观问题变成客观问题进行打分,而且是需要真实执行
- opus 4.6 以后,很多 harness 工具都没用了,因为模型本身的 plan 能力足够强
- 不是 subagent 越多越好,而是这种生成-评审的对抗结构本身就能解决问题
我的观点
- 价值:很棒的分享文章,这种对抗和循环的结构也是我现在自己在实践的4层结构:总控 > 评估 > 编码总控 > 编码执行和校验,而且也能和我的 runbook 项目对的上
- 适用条件:所有条件都合适,但怎么写评审其实是一个难题,我的评审器花费大量的 token 都在解决怎么让执行器稳定的过门禁上了,也就是两者之间怎么对协议的问题
Lonely:工具会过时,框架不会——拆解 autoresearch 背后的迭代方法论【通俗易懂版】
要点
- 作者对 autoresearch 用法的介绍,用的例子也是 skills 的优化,用来评估他的生成的文章是否代有 ai 味,是否有与用户互动的倾向,他做了6个评测标准,让 auto research 做了优化,把 skill 的能力优化了 30% 左右
我的观点
- 价值:普通人也能使用的 ml ,但分享的不是很细致,然而他的6个问题也是自媒体运营可以学习的