跳到主要内容

阅读笔记 - 2026-03-01

目录 · 32 篇

geekjourneyx/jina-cli: A lightweight CLI tool wrapping Jina AI Reader API for AI Agents. Fetch …

要点

  • 一个封装好的 jina ai reader api ,能将任意 url 变成 llm 可读的格式
  • 需要配置 https://github.com/jina-ai/reader 本地部署,或也可以使用云服务,购买 api key
  • 可以直接当 cli 使用,也可以用 skill 的方式让 cc 来使用(其实就是介绍了这个工具怎么安装,有哪些参数)

我的观点

  • 价值:能读 twitter 文章就很有价值,以前 twitter 文章是无法直接被读取的, gpt 就没办法。不过既然他只是封装,其实我直接写一个 jina api 的 skill 也行
  • 风险:不知道用量,以及是否会有人机校验,可能云服务会更合适
  • 适用条件:适合与 openclaw 结合,或与我的工具链结合

TODO 尝试部署一套 jina cli / api skill,并使用在我的 open claw

ykdojo/claude-code-tips: 45 tips for getting the most out of Claude Code, from basics to advanc…

要点

  • step by step 的 claude code 实战教学,适合新手快速上手
  • 有很多实用提示,比如要拆解大任务为小任务,这样 ai 更容易上手,或者保持上下文的干净很重要
  • 有完整的自动化任务的测试技巧,比如提示 ai 用更快的方式做端到端的测试,比 cc 自己默认的方法可能会更快更有效
  • 需要持续投资工作流
  • 如果要跑长时间的任务,一个 container 来隔离会更好
  • 要用多种方式交叉验证 ai 的结果才能保证成功率更高
  • 适当的抽象是 ai 工具有效的关键,也就是说要 methodical agentic coding
  • 需要多花点时间做计划,也同时可以多花点时间做原型,这样成功率会更高

方法

  • 通过各种 whisper 直接和 ai 语音聊天(其实要做这个的话 openclaw 更适合普通人)
  • gemini cli 能绕过大部分的网站访问限制,因为 google 的爬虫更强
  • cc 支持在一个 container 里跑一个 worker 并与主 agent 连接,来分配任务
  • 多使用 background sub agent (cc支持把一个任务放后台运行),并选择不同模型,节省开支
  • 可以多问问 ai ,你为什么这么写代码,这样的设施是必要的吗,可以帮助增加生成代码的稳定性
  • 专注自动化,以及自动化的自动化

我的观点

  • 价值:很适合快速上手,也有很多 insight 值得学习
  • 适用条件:可以分享给新手学习,或在我自己日常中实践

NevaMind-AI/memU: Memory for 24/7 proactive agents like openclaw (moltbot, clawdbot).

要点

  • 一个 memory 系统,不仅仅是存储记忆,还是一个 agentic 的,也就是说他内部有一个语言模型,而不是仅靠外部 llm 给他总结
  • 可以结合 openclaw ,也有云服务

方法

  • memu.so 是云服务,可以更快的部署并使用

我的观点

  • 价值:值得尝试,中心化的将多种工具的记忆集中在一起
  • 风险:没有项目隔离,更多是一个个人用途的记忆工具,可能会在多个不同项目之间串味
  • 适用条件:个人项目值得使用

Panniantong/Agent-Reach: Give your AI agent eyes to see the entire internet. Read & search Twit…

要点

  • 一个聚合的内容抓取工具,包括了前面说的 jina ,以及 youtube 视频下载,小红书,读 twitter 等
  • 同一个功能有多种的适配器,可以插拔,或增加新的功能
  • 本地存储的 cookie ,支持个人部署,也支持多人分享
  • 但各种工具的使用也需要各自的 api key,付费本身也需要独立处理

我的观点

  • 价值:一站式解决,其实如果知道这些工具在哪,我也可以自己收集,总的来说适合一键部署
  • 风险:这个是一个 vibe code 的产品,其实文档输入进去,让 cc 再写一套也没什么问题
  • 适用条件:作为基建一站式部署,但其实也没很大价值

AI资讯速览

要点

  • vibe coding 的 ai 新闻聚合,版式很适合移动端阅读
  • 有翻译,有原文,每天更新,效果很好

我的观点

  • 价值:值得每天阅读,可以让 openclaw 放弃他的爬虫,直接读这个站点的新闻就好
  • 风险:个人项目,可能不久之后会下线
  • 适用条件:适合每天快速阅读

MaxClaw - MiniMax OpenClaw AI 智能体创建平台 | 技能与子智能体

要点

  • 开箱即用的 open claw ,支持与飞书和钉钉结合
  • 给了一台云端的虚拟机,能自动的完成任务

我的观点

  • 价值:适合小白,开箱即用
  • 风险:可能会有个人隐私问题
  • 适用条件:适合分享给小白,让他们快速上手

6551 MCP

要点

  • 一系列的 MCP 工具,能做 web3 钱包监控,能做 news 数据获取, twitter 数据监控,总的来说是比上面做的一系列工具更简单的接入方式
  • 提供了 skills ,支持对 tg 监控等,方便做自动打狗,多池子自动交易等
  • 与上面的 maxclaw 结合,运行成本就很低,在飞书等平台上做自动信息抓取,也是很有价值的

我的观点

  • 价值:本质还是一个自动化 dex ,但因为接了 ai ,所以能接新闻源和 twitter ,自动做行情预测,比传统量化有更多空间,里面的每一项子工具可能是有可以利用的可能性
  • 风险:要连接钱包,自动交易等,风险还是很高的
  • 适用条件:自动化 defi 交易,更多的是撸毛,大规模交易风险高

JimLiu/baoyu-skills

要点

  • 这个项目是宝玉的 skill 库,其中有很多有用的 skill
    • 用 cc 的 skill 自动创建多种风格的海报
    • 支持 40 多种风格和多种版式,可以形成大量的组合
    • 输入编写好的 markdown 文本,就能自动完成创建

方法

  • 他的 skill 编写很规范,除了用法、工具,还有流程控制,步骤控制,防御和相关技能连接,因为对文本内容的理解也可以深入拆解原始文档的内容,可以更好的理解文本才能更好的生成海报
  • 子过程有:
    • 内容分析框架
    • 角色分析模板
    • 故事板模板
  • 整个项目是一个大宝库,适合全部实验和研究一遍,增强对 ai 的理解
  • 生成海报其实用的是 cloud google com

我的观点

  • 价值:很适合快速生成海报,或者自动化在小红书等平台发自动化的帖子,也适合做 ppt 配图
  • 风险:风格有限,在未来很可能会成为烂大街的方案,还是需要仔细研究他的实现
  • 适用条件:自动化或快速分享,不适合投入太多时间的海报设计

TODO test all skills under baoyu-skills

可以找一个网上的平台,快速加载这些 skill 然后尝试,比自己部署环境更快,而且能快速清空,做另外的实验。比如上面的 maxclaw 就很合适。

TODO add the image generating head pic as a workflow of my blog

Ryan Carson:Code Factory: How to setup your repo so your agent can auto write and review 100% o…

要点

  • 一套实践流程,避免让 agent 之间传递需求时产生语义飘逸
  • 提交需求时所有需求证据应保留
  • 在 ci 之前运行 risk-policy-gate 确定评审严格度,对关键需求需要严格评审,简单需求直接过 ci 就行
  • 对 pr 的 review 和 comment 需要用 sha 做唯一标定,通过程序指定评价的对象产物,因为所有修改都在一个 pr 里, review agent 可能会 review 旧的错误的 commit
  • resolve agent 只有在全部 clean 的 rerun 后才能执行
  • 对于所有变更,都要求 agent 在写代码时就提供针对需求的断言:进入的流量存在,使用了预期的入口,产生了正确的内容,代码就要写入, agent 验证也必须对清单
  • 规范传播 agent 也很重要,来检查所有 agent 是否按规范执行了

我的观点

  • 价值:有价值的方法论介绍,实际项目中会很有用

Headless Browser Automation for AI

要点

  • 自动化 llm 工具,可以用于 ai 驱动的自动 web 应用构建
  • 提供了 skills ,能无头使用
  • 使用 tree + ref 引用的测试,比完整的 dom / html / json 输出效率更高,更省 token
  • 先用这个工具跑一遍自然流程,再使用 playwright 跑 e2e ,兼顾了效率和可靠性

我的观点

  • 价值:是一个优化方案,但适合 bdd 。不过现在 web 应用还会流行吗?新的应用分发形式应该是 cli + skills
  • 风险:可能对默认的测试方案来说有点多余, bdd 未必能准确的覆盖所有用例
  • 适用条件:个人项目的自动化快速测试

宝玉:Anthropic CEO Dario Amodei:海啸已在地平线上,但没人在看

要点

  • 每2-3个月 ai 的可能性边界就会扩大一圈
  • 年轻人应该学会围绕人为中心的工作技能,或以物理世界为核心的技能
  • 应该积极拥抱 ai ,而不是尝试抵制他,并学会批判性思维
  • 即使在技能上 ai 比人强,人还是应该去学这个技能,因为这样就能在智识上充实自己,也是社会的大方向

Ray Wang:OpenClaw 记忆管理,从入门到高阶完整实战指南

要点

  • 一套完整的记忆系统实践包括:
    • 短期记忆到长期记忆到冷存储记忆,相互之间的流动
    • 写入机制,记忆分流,crud验证,格式化等
    • 分层索引和信息分级,对事实的再校验
    • 日志的定期总结,健康度分析和遗忘机制
    • 多记忆冲突解决,多 agent 的独立记忆设计
    • 提供 agents 和 skills 让其能更快与 cc 或 obsidian 集成

我的观点

  • 价值:相当扎实的设计,没有复杂的设施,完全文本化的记忆设计,比大部分“项目”更好
  • 风险:大规模使用未必会经过检验
  • 适用条件:适合个人项目,适合我现在在做的项目 Emacs as Agent Runbook

nextlevelbuilder/ui-ux-pro-max-skill: An AI SKILL that provide design intelligence for building…

要点

  • 一个 UI / UX 设计的 skill ,能根据需求文档完成对 ui 设计的整体规划
  • 可以提供传统设计中常用的人因工学,用词语来描述对设计的要求,完成对整套设计方案的定义
  • 与 web 编程工具结合能输出更好 ui 的产品,比 claude 自己那套 tw 方案更漂亮

我的观点

  • 价值:对产品化的项目更有帮助,省去了”去网上找抄袭对象“的时间
  • 风险:效果有待考察
  • 适用条件:个人项目,但说不定也能在规范化下用于公司设计的自动化完成呢?

sachaa/openbrowserclaw: Browser-native personal AI assistant. Zero infrastructure, the browser …

要点

  • 完全运行在浏览器里的 open claw ,不需要任何的本地部署

我的观点

  • 价值:没什么价值,不如 maxclaw

宝玉:Coding Agent 有个甜蜜点,多数人直接跳过了

要点

  • 让 ai 编码需要有参照物,让他自由发挥自然就没有好的结果
  • 要利用好 ai 做重复工作的能力,给他所有足够的测试用例,他能自动完成所有的测试
  • 做好架构设计,分层抽象,让 ai 做填空而不是写作文
  • 人一定要在过程中做决策,而不是让 ai 自动做,人需要观察 ai 的工作方式,并提出调整方式,是否需要小步快跑,是否要调整策略

prateek:The Self-Improving AI System That Built Itself

要点

  • 作者创造了一套可自我迭代的框架,让多个不同 agent 在其中相互配合,人在其中主要负责 review 架构,设计架构,提供构想,解决多 agent 之间的冲突,并不断学习和调整模式
  • 他构建了一整套机制,能自动拉取 ticket ,创建特性, ci ,测试, review ,人在其中主要是提供新思路
  • 本身架构也在自我演化,体现在 cc 会帮助他优化流程,提供更多工具,并提供数据

方法

  • 他把框架开源在了 https://github.com/ComposioHQ/agent-orchestrator
  • 整个架构分为:
    • tracker ,拉取 ticket
    • workspace,能创建独立的工作区
    • runtime,其实就是 tmux 会话
    • agent
    • terminal 网页查看终端状态
    • scm 管理pr,通过上下文补充说明,提供更详细 prd
    • reactions,当遇到事件如 ci 失败时触发的动作
    • notifier 通知人类进行干预
  • 提供了一整套监控设施,包括注意力区间(事务按类型,比如 ci 错误,等待 review 等组合),实时终端(能直接 attach 进去),会话详情(正在编辑的文件,任务数量,pr状态,ci状态等),配置发现等
  • 有通过 tg 或 slack 与人进行任务同步

我的观点

  • 价值:直接参考的实践,其实就是我现在 Emacs as Agent Runbook 想做的事情的一套解决方案
  • 风险:评论里有说,如果方向错误, ai 在错误方向上的迭代速度会很快
  • 适用条件:参考,甚至用于自己的项目

waynesun:烧了百亿Token,非程序视角下的一些感悟

要点

  • 缓解 ai 焦虑的办法就是多用,多尝试
  • 日本公司因为留存了大量工作中间记录,可能更适合 ai
  • 大部分人太高估了自己的水平,以为自己做的事情 ai 替代不了,其实不然, ai 能替代你 95% 的能力
  • 真正不能替代的是人的体验, ai 不会因为你做了个有价值的事情而高兴,但人会,积极传播这种体验是 ai 做不到的。

Introducing npm i chat – One codebase, every chat platform - Vercel

要点

  • vercel 提供的 all-in-one 的聊天工具 api 集合,适合与 ai agent 结合,而不需要再额外开发

我的观点

  • 价值:有价值,但不大,因为这种代码 ai 抄抄就行了,工作量在这个时代不是壁垒,做法才是

pepper 花椒:一分钱不要,即可开始自动化小红书 <> 搬运 <> 推特 只要给你的🦞装备上 pip install playwright && …

要点

  • 通过 playwright + chromuim + xvfb 自动爬取小红书文章,截图,分析并理解爆款文章,方便选题

我的观点

  • 价值:好想法,但更多是一个方面的实践。他的做法相对复杂了,前面已经有不少工具已经支持了。

Notion:Introducing Notion 3.3: Custom Agents

要点

  • notion 推出的 custom agents ,能为任意的工作流程提供 agent ,并参与到工作流中
  • 能通过对文章的回复和任务的安排,执行多种工作
  • 能和 slack , figma 等结合
  • 自动写周报、月报或 okr

我的观点

  • 价值:感觉上就是一套 agent ,只是和 notion 的结合比较深,能做的事情比较多一点。但其实操作对象还是 notion 自己的资源,不能像 claw 一样做更深的功能
  • 适用条件:notion企业用户可能会喜欢

人工智能代理的可验证输出——迈克尔·阿根托著 — Verifiable Outputs for AI Agents - by Michael Argento

要点

  • ai 合规工具,能让 agent 做的任何 api call 都被有效记录,并以可信的方式做审计和回放
  • 非常简单简单的集成方式,就是让 ai 完成任何操作后,往 api commit 一个记录,作为 audit log 记录下来

我的观点

  • 价值:可能对”过程合规“有需求的场景有价值,但很难说
  • 风险: ai 也可能不做这个事情,那是否需要一个 gate 来控制他?
  • 适用条件:可能部分重要操作的场景吧,比如控制关键设备的 agent 需要这样的审计

runesleo/x-reader: Universal content reader — fetch, normalize, and digest content from 7+ plat…

要点

  • 又一个 all in one 的内容抓取工具,其实就是集成了多种平台(主要就是 jina )的能力
  • 开箱即用,可能能减少一些问题,有 skill 和 mcp ,都可以使用

我的观点

  • 价值:价值就是开箱即用,从风格上来说比前面那个务识一点,他做的工作更多是反爬方面的
  • 适用条件:可以尝试

黄赟:OpenClaw + Obsidian 打造个人数字资产生产线

要点

  • 一套使用 obsidian 的方法论,本质上是因为作者开的是 vps 的 openclaw ,所以需要用 syncthing 来同步文件到本地

我的观点

  • 价值:价值不大, obsidian 自己就有同步插件,不用这么麻烦

Leo:我的 AI 外脑:Obsidian + 向量搜索 + Claude Code 上条聊了 Obsidian CLI 的搜索能力,但单 vault 关键词搜只是起点。我需要 AI 能同时…

要点

  • 其实就是拿 QMD 给 obsidian 数据库做了向量索引,这样 agent 在回答问题时也会拿过去的笔记里的内容做帮助

我的观点

  • 价值:不如正经做一套 memory

The Self-Driving Codebase — Background Agents and the Next Era of Enterprise Software Delivery

要点

  • 现在 code agent 已经很成熟了,但整个软件交付流程里光有这一部分提速是不够的,还需要一系列 background agent ,其实就是多 agent 的分工
  • 每个 agent 需要有独立的上下文和由软件或沙盒构建的壁垒,确保他们的分工
  • 有多中创建多 agent 的方式,以及需要永远尝试把人从循环里剥离出去:
    • 定时 agent
    • 事件驱动 agent
    • agnent 军队,由 orchestrator 对任务拆分,然后每个 agent 完成自己独立的工作,产出结果也是独立的
    • agent swarms ,由 orchestrator 拆分,分别做工作的多个环节,最后合成一个结果
    • 移动化,需要与各种 im 结合,确保人能第一时间反馈
  • 最重要的是经常的去找这套体系里的瓶颈,从而优化
  • 不断尝试 scale up ,把整个软件交付流程扩大化

我的观点

  • 价值:一套行之有效的方法论,实践上很成熟,页面做的也很好,很适合传教
  • 风险:缺乏细节,更多是一种理解传播
  • 适用条件:一些思想可以用于 Emacs as Agent Runbook 中

Ernesto Lopez:How our OpenClaw agent "Eddie" helps us make $70k/mo with B2C Apps ( step by step…

要点

  • 用 open claw 做自动的 ppt 式广告,输出稳定有主题的文案和图片,在4个账号推广,获得 CTA 推广费用
  • 自动接触网红,和他们聊合作,价格和合同,接触速度大大增加
  • 自动给客户发邮件,或自动解答用户问题

我的观点

  • 价值:有价值,但分享的东西不多,和我的方向有点远

sitin:我把 OpenClaw 所有内容丢进了 Obsidian,再也不怕丢信息了!

要点

  • 通过 obsidian cli 让 openclaw 把一些研究有价值的文章自动放到知识库里

我的观点

  • 价值:没什么价值,不如好好做 memory

Thariq:Lessons from Building Claude Code: Seeing like an Agent

要点

  • 作者通过给 cc 一系列工具来提升 cc 工作的稳定性,比如在 cc 早期版本中,他搜索代码能力弱,思考能力弱,会忘记任务,作者就给 cc 提供代码向量搜索工具,为他提供 planning 工具,也有让 cc 总是先搜文档再工作的工作流。
  • 总的来说,作者的表达是,应该不停给 cc 提供工具,而不是让他反复自己试错来提升编程稳定性

hesamsheikh/awesome-openclaw-usecases: A community collection of OpenClaw use cases for making …

要点

  • 常见 open claw 的案例收集
  • 其中有一个多 agent 交互的模式可以学习一下,他通过定义 soul.md 给不同人不同的角色,相互之间用 share memory 来共享记忆

abhigyanpatwari/GitNexus: GitNexus: The Zero-Server Code Intelligence Engine - GitNexus is a cl…

要点

  • 对代码库做调用链路的建模,方便 ai 进行搜索和理解
  • 本意是给 cc 这样的 code agent 做快速查询用途的

我的观点

  • 价值:可以作为我现在 org skill 的一个能力提供

Elvis:OpenClaw + Codex/ClaudeCode Agent Swarm: The One-Person Dev Team [Full Setup]

要点

  • 作者用 openclaw 来控制 cc 集群编程,几乎能做到一次提需求就完成整个设计到开发到测试到发布的全过程
  • 因为 open claw 可以记录作者所有的文档,会议内容,客户需求,收集资料,而 cc 做不到

方法

  • 与客户沟通后,让 claw 调用资料库和 cc 对客户需求做细化
  • claw 调集多个 cc 实例开始编码,生成 pr
  • 有一个 cron 定时检查所有 agent 的运行状态,看他们是否在正常工作,有问题时(比如人工确认),会通过 im 通知人来操作
  • 把所有确认项,包括 lint 和 review 都完成,提交 pr
  • 由 agent 来做 review
  • ci 和自动测试
  • 人工测试验收
  • 完成合并
  • 如果某一个 agent 出现异常, claw 会对其关照,会重新生成 prompt 让 agent 保持对目标的专注,确认 agent 的开发和理解方向是正确的,两者产生分歧时引入人类做决策
  • claw 定时总结现在所有进度的状态,早上检查待办项,晚上 review 所有 git 日志,更新日报和 changelog ,推送给人类

我的观点

  • 价值:很有价值的实践,特别是用 claw 这样的全功能 agent 来管理 agent ,值得学习
  • 适用条件:可以作为 Emacs as Agent Runbook 的一种实践方案

Minions: Stripe’s one-shot, end-to-end coding agents | Stripe Dot Dev Blog

要点

  • Stripe 已经开始在公司内部使用内部自研的一套全自动 AI agent 来写代码了,每周能独立完成并被 merge 超过 1300 个 pull request(全 AI 写,人工 review)

方法

  • 工程师在 Slack 里 at bot + 描述任务,或贴上 issue/ticket 链接
  • 系统立即启动一个隔离的 devbox,和人类工程师一样的 AWS EC2 开发环境,预先加载了完整的 Stripe 代码库 + 开发服务
  • 在 LLM 真正开始思考前,就通过内部工具 MCP + Toolshed(400+ 个工具)自动、确定性地拉取上下文, 所有的 ticket ,讨论对话和文档
  • 编码、核心测试和执行
  • CI 通过后,Minions 按 Stripe 标准 PR 模板自动创建 Pull Request 人类工程师 review → 批准 → merge

我的观点

  • 价值:这是大公司内实现 ai 自动编码的实践,值得存档,用于公司内分享