Guides
文章深度分析的交互式 HTML 版本,适合浏览器阅读。
Lindy 把 Claude 换成 DeepSeek,砍 90% 成本
Lindy 把托管 agent 模型从 Claude Sonnet 迁移到 DeepSeek v4 Flash,推理成本砍 90%。拆解七阶段迁移流水线、GEPA prompt 优化、供应商量化陷阱与原文沉默的地缘风险。
美国电网约束:到 2028 年表后数据中心 40GW+?
电网有效容量增速被物理和制度双重锁死,AI 电力需求被迫内化到数据中心自家院里,BTM 设备市场将迎 50GW/年盛宴——但建筑在三个它不愿深谈的假设上。
Loops 详解:Claude、GPT、Mira 与真正有效的东西
拆解 AI loop 五大部件与成本陷阱,识破 Mira 软广。
LinkedIn QA Agent:用 VLM + System 1/2 把自主测试做到生产级
VLM + 多模型分工 + System 1/2 混合架构,350 测试/30 分钟自主跑。拆运行时模型与评测基建。
如何在一天内修复你的人生 · Dan Koe 翻译解读
Dan Koe 爆款长文翻译解读:三把刀(身份先于行为、所有行为都是目标、反愿景驱动)真有料,但一天翻盘是营销、时间够久什么都能解决是精英幻觉。
斯坦福 STORM 方法:如何让 Claude 像 PhD 一样做研究
去检索化的 STORM 本质是 persona-prompting;4 个核心 prompt 正文未给出;但多视角框架作为思考工具确实有用
当 AI 拿走一切之后
Airing 从三封陌生同行的来信切入,用珍妮纺纱机、卢德分子、柏拉图与存在主义,回答'当 AI 接管执行,人还剩什么'。判断力、品味、推演——三样不可替代,而最硬的立场是:慢一点可以,标准一寸不让。
智能体编程与专业知识的持续回报 — Anthropic 研究解读
Anthropic 用 40 万份 Claude Code 会话证明:决定 Agent 使用效果的不再是编程能力而是领域知识。数据可信,但成功定义偏软、排除了程序员主战场,需审慎读 framing。
没有生态系统的前沿是不稳定的 — Satya Nadella 翻译解读
微软CEO给AI时代重写资产负债表:人力资本+代币资本。框架立住了,但叙事藏着一层为微软战略定位服务的动机,和一个它自己警告过却回避的空心化矛盾。
地图聚类不是我的最爱:后DOM时代的一封技术债宣战书
地图聚类是2005年浏览器约束下的技术债,现代GPU栈已瓦解该约束。Greg说对一半——性能理由死了,认知理由还活着。
波拉尼奥《牙科医生》解读:在两条人行道之间流淌的秘史
一个牙医、一个失恋文人和一个十六岁印第安农民少年的三天三夜。波拉尼奥证明:艺术和生活不是两条人行道,它们汇成同一条你看不见的暗流——那条河叫秘史。
Loopcraft:叠加循环的艺术
Steipete/Boris/Karpathy 这周同时说'我不再 prompt agent,我写 loop'。swyx 借机把 loop stacking 上升成世纪命题。含工程级拆解和压力测试。
如何做好研究 — Vivek (Anthropic AI) 翻译解读
Vivek (Anthropic AI 研究员) 写了 44 万人阅读的研究方法论长文:选题、输入、记录、迭代、漫游、协作、复利——7 个可训练的子技能。
Loop Engineering:不再自己 Prompt,而是设计系统来 Prompt
Addy Osmani (Google Cloud AI 总监) 提出 Loop Engineering 概念:不再手动 prompt 编码 agent,而是设计自主循环系统。五大构建模块:Automations、Worktrees、Skills、Plugins、Sub-agents,加上跨会话记忆。
WTF Is a Loop? — AI 编程 Loop 争议深度解读
一条六个词的推文让220万人争论'Loop'到底是什么。从 ReAct 到编排 Loop 的五阶段演进,以及为什么 Loop 而不是模型成了成本最高的部分。
Inside Notion:一个十年老公司如何在 AI 浪潮中重生
Colossus 深度报道:Notion 如何从前 GPT 时代的笔记应用转型为 AI-native 公司。
How LLMs Actually Work — LLM 入门科普翻译解读
100 万+ 阅读的 LLM 入门科普文翻译解读。'自动补全'叙事的诱惑与陷阱、训练三阶段的遗漏、幻觉的真相、内容营销的底层逻辑。
软件测试的新纪元 — antirez 深度解读
Redis 作者 antirez 提出:AI 写代码有质量妥协,但在 QA 领域没有。一个 Markdown 文件 + SSH 连接信息,就是完整的 AI QA 方案。
AI 2027:超级智能时间线 — 翻译解读
Scott Alexander, Daniel Kokotajlo 等人预测超级智能 AI 在 2027-2030 年间的具体路径,包含 Agent 进化时间线、对齐危机和两种结局。
现代 Engineering 价值观 — Christoph Nakazawa 翻译解读
Jest 作者分享 AI Agent 时代的六大工程价值观:Strong Ownership、Taste、Guardrails、Context in Repo、Own your Stack、Option Value。
我所知道的所有 Agentic Engineering 技巧(2026 年 6 月)
Matt Van Horn 的 22 个 Agentic Engineering hack 全解析:从 plan.md 到双引擎并行构建。
云端 Agent 基础设施深度解读 — CREAO 的两个核心教训
CREAO CTO 详解云端 Agent 的两个核心设计:环境冻结+Runner 300ms热交换解决快慢变更耦合问题;API Bridge + per-run JWT + IP allowlist 三层安全解决凭证外置。含代码级细节、竞品对比(OpenAI/Cloudflare/Google)、DIY框架和选型决策。
Claude Code Slash Commands 完全指南 — 从入门到生产级命令库
7个开箱即用命令模板 + 深度分析推文缺失的Skills系统、动态注入、Hooks等高级玩法,附行动建议。
隔夜新闻能否解释隔夜收益?— 哥伦比亚商学院论文深度解读
240万篇路透社新闻 + 200个Branching LDA主题,首次从NLP角度系统性解释美股30年隔夜收益之谜。两个独立通道(新闻分布时间变化 + 市场反应时段差异)同时驱动。发现跨公司新闻溢出效应:GM的隔夜收益通过共享主题暴露传导到次年的Nucor。2010模型样本外验证与2020模型几乎一致。
Google Agentic RAG:不再差不多的企业级 RAG — Sufficient Context Agent 深度拆解
Google Gemini Enterprise Agent Platform 的 Agentic RAG 框架深度拆解:Sufficient Context Agent 三重检查机制、五阶段流水线、Cross-Corpus Routing。FramesQA 基准测试准确率提升 34%,跨 4 数据源准确率 90.1%。竞品对比 LangGraph/CrewAI/Microsoft Agent Framework。
2026 Agent Readiness 现状报告:99% 的网站还没准备好迎接 AI 客户
ora research 扫描数千网站,用真实 Agent(ChatGPT/Claude/OpenClaw)评估 110 项检查,得出 99% 网站对 Agent 不友好的结论。报告系统性地画出了 Agentic Web 协议栈全景图(Discovery → Identity → Auth → Integration → UX),但存在供应商利益关联。Relevance-aware 评分机制是亮点,排行榜的绝对可比性是弱点。
The Agent-Readiness Gap: What Procurement AI Adoption Data Actually Shows
Adversarial claim verification: '49% piloting, 4% deployed' is REFUTED. Real deployment rate is 8-20%. The pilot-to-production gap is real (3-5x, not 12x) but the bottleneck is infrastructure (data, integration, risk), not AI capability. Agent-ready commerce standards don't exist yet.
全球生育率下降:人类史上最大的沉默革命
翻译解读 OWID 关于全球总和生育率从 5 降到 2.3 的深度分析,涵盖三大驱动力、一胎化政策迷思、东亚低生育率陷阱。
每个任务都需要一个 Harness:Claude Code 动态工作流深度解析
Anthropic 把 agent 编排计划从 context window 搬进 JavaScript 脚本,用代码确定性替代模型实时判断。深度解析运行时拓扑、三个强化机制、竞品横向对比、Multi-Agent 性能陷阱(-70%)、~15x token 成本、历史类比。
翻译解读:每个任务都需要一个 Harness — Claude Code 动态工作流全解析
Thariq 和 Sid 揭示 Claude Code 下一层编排抽象:把计划从 Claude 的 context window 搬到 JavaScript 脚本里,用 runtime 驱动数十到数百个 sub-agent 的并发协调。工程级解读覆盖运行时拓扑、阶段屏障语义、手搓版对比、选型决策框架和诚实限制。
翻译解读:一个 App 可以是一顿家常菜 — Robin Sloan
Robin Sloan 为四口之家做了一个消息 App,五年不更新却仍在运行。这篇文章重新定义了'成功的软件'——不是用户量,而是主权、完成和回家的感觉。
4-Agent Pipeline: The Seductive Trap of "Ship While You Sleep"
四个 AI Agent 的 Planner-Coder-Tester-Reviewer 流水线真正擅长的是小任务。Token 成本 4-7x 基线、无 feedback loop、silent failure 系统性存在。Anthropic 官方立场直接矛盾。学术背刺:14 种 multi-agent 失败模式。
RAG的数学死刑:Sign-Rank定理与结构记忆的崛起
Sign-rank 定理形式化证明 Embedding-based RAG 有数学天花板。SOTA 模型在 50K 文档上 recall 不到 20%,PoisonedRAG 用 5 个毒文档 90% 操纵检索。出路:图拓扑和 Schema 结构替代几何邻近。
4-Agent Pipeline:让 AI 团队在你睡觉时交付功能
四个专职 AI Agent(Planner/Coder/Tester/Reviewer)通过交接文件组成串行 pipeline,实现自动化功能交付。工程级解读覆盖运行时模型、架构拆解、DIY 对比、选型决策和诚实限制。
Context as Topology: 为什么你的 Agent 记忆终将遗忘
arXiv 论文形式化证明主流 RAG/Vector DB 记忆架构在规模化时必然遗忘和编造。出路:用 Schema annotation 存储结构化意义而非几何邻近,一个 Schema 同时做检索索引、生成模具、验证契约。
Range and Depth on Demand — AI 时代的专才与通才
Salman Mian 长文解读:AI 不选边站专才或通才,它攻击的是交接税。按需的广度与深度才是新技能,构建者证明胜过学历。
Anthropic 如何用 Claude 实现 95% 自助数据分析自动化
Anthropic Data Science 团队分享如何用 Skill 系统将分析准确率从 21% 提升到 95%,核心洞察:准确率是上下文问题不是代码生成问题。
Claude Code Dynamic Workflows: 从单兵到千军万马的编排革命
Anthropic Dynamic Workflows 全面解读:脚本驱动千军万马的编排架构,性能提升 90.2%,token 成本暴涨 15 倍。三层编排对比、竞品横向分析、历史类比、成本现实与关键风险。
AI 原生工程组织:当 agentic coding 成为默认工作方式
Claude Code 团队分享 agentic coding 成为默认工作方式后的流程变革——JIT 规划、信任但验证的代码审查、角色模糊化,以及三个关键追踪指标
MAI-Thinking-1:微软造了一台爬坡机
微软 AI 从零训练 35B/1T MoE 推理模型的技术报告解读——架构拆解、RL 爬坡工程、Self-Distillation 关键技术与诚实限制
Claude Code 动态工作流深度分析:当 AI 学会给自己写调度器
Anthropic 发布 Claude Code 动态工作流的全面深度分析:技术架构、平台战略、竞争格局、历史类比和个性化实操建议。
微软 ASSERT:用自然语言给 AI Agent 写行为测试
微软开源评估框架 ASSERT:规范驱动的 AI 行为测试。自然语言→测试用例→OTel 追踪→LLM 评分。框架无关,10 分钟从零到有覆盖。
The Orchestration Tax — Addy Osmani 翻译解读
Addy Osmani 用 GIL 和 Amdahl's Law 解释 AI Agent 编排税:人类注意力是不可并行化的串行资源。
Claude Code Dynamic Workflows 深度调研 — AI Agent 编排的新范式
Anthropic 发布 Dynamic Workflows:JS 脚本编排 10s-100s 并行 agent,对抗性审查,断点续跑。Bun 750K 行 Zig→Rust 旗舰案例。竞品对比:脚本级编排 + 自检收敛的独特组合。
AI Agent 的零信任安全框架 — Anthropic 博客翻译解读
Anthropic 发布 AI Agent 零信任框架指南。三层架构 + 八阶段实施 + Agentic SOAR。压力测试:商业动机与真实威胁的分离。
2026 年 4-5 月时间线总结
两个月 9 周:从造工具到全自动。App 开发、Skill 体系、发布管线、翻译解读、基础设施治理全记录。
AI Psychosis — 当整个公司集体陷入 AI 妄想
Mitchell Hashimoto 警告科技公司陷入 AI 迷思
AI Value Capture:当话语权从基础设施层转移到模型层
AI 价值链从基础设施层向模型层转移。Anthropic ARR 从 $9B 飙到 $44B,Nvidia 和 TSMC 还没涨价。SOCAMM 内存定价 + One Chart to Rule Them All 框架。
Perplexity Agent Skills 设计方法论深度分析
业界首套 Agent Skills 工程化方法论。三层渐进式加载、Description 路由触发器、Gotchas Flywheel 持续精炼闭环。