Sunday, April 26, 2026
Daily briefing
周日的特点是新发布稀少,但回声响。本期重点不在”今天发了什么”,而在”过去一周积累的信号在周末被消化成了什么形状”——AI 公众反弹、defense-industry 对软件工程的历史警示、Cognition 抢跑、Anthropic-NEC 落地日本、open-source 治理裂痕。
HN 今日 #1:The West Forgot How to Make Things, Now It’s Forgetting How to Code(902 pts / 571 评论)。 乌克兰工程团队负责人 Denis Stetskov 把 Raytheon Stinger 重启生产 的故事和软件工程人才管道并列。论点冷峻:1993 年 Pentagon 让 51 家国防承包商整合到 5 家,国防工业人才从 320 万砍到 110 万;2022 年战争来临时,Stinger 一份订单从下单到交付要 4 年,因为知道怎么造的人都退休了。Fogbank 案例更刺耳——核武器材料停产 11 年,再恢复时所有 know-how 已经死在退休工人脑子里。Stetskov 把它对应到 AI:Salesforce 不再招软件工程师,54% 工程领导者认为 AI copilot 长期会减少 junior 招聘,62% 大学计算系报告 enrollment 下降,自家上一轮招聘 2253 人投递、4 人录用——0.18% 转化率。METR RCT 实测:用 AI coding 工具的资深工程师在真实任务上慢 19%,但他们预测自己快 24%。这是本周最值得读的一篇 essay——不是技术,是结构。HN 评论区没有人在反驳论点,只在补充自己看到的同样症状,这是危险信号。
AI 公众反弹进入”政治化叙事”阶段——HN #9(254 pts / 335 评论),引用 Stanford AI Index + Gallup 数据。 The New Republic 把过去 6 周的零散事件串成一条线:4/10 Sam Altman 家被 20 岁 Daniel Moreno-Gama 投掷 Molotov(Instagram 自称”butlerian jihadist”,引用 Dune 反机器战争);4/7 印第安纳波利斯市议员 Ron Gibson 家中 13 枪,门前留”No Data Centers”(他支持本区数据中心项目)。Stanford AI Index 2026 4/13 发布的关键对比:73% 专家对 AI 长期就业影响乐观 vs 公众 23%;专家对长期经济影响乐观 69% vs 公众 21%;近 2/3 美国人认为 AI 会减少 20 年内就业。Gallup 3 月数据:Gen Z 对 AI 兴奋下降 36%→22%,愤怒上升 22%→31%。NBER 2 月研究:80% 已部署 AI 的公司报告生产力无变化。MIT 引用研究:95% 企业 AI pilot 收益为零。Jasmine Sun 的提法被这篇引用为定义性框架——“AI 是脱节的亿万富翁强加给民众的精英政治项目”。这是过去三个月零散的不满信号第一次被打包成可投票/可暴力的政治叙事。
Cognition $25B 融资谈判——SpaceX-Cursor $60B 期权外溢,AI coding 赛道二级集中。 Bloomberg 4/23、SiliconANGLE 报道 Cognition 与投资人早期沟通 hundreds of millions+ 融资,估值约 $25B(4 月 23 日已公布,但周末发酵进入新闻第二浪)。距上一轮 $400M / $10.2B 估值(2025 年 9 月,Founders Fund 领投)半年翻 2.45 倍。President Russell Kaplan 表态:客户和候选人 inbound 在 SpaceX-Cursor 协议公开后明显增加——这是一句实质 confirmation,标志 AI coding 赛道进入”被并购或被竞标”的窗口期。Devin ARR 从 2024/9 的 $1M 到 2025/6 的 $73M,到 Windsurf 收购后超过 $73M(具体未披露)。客户已包括 Goldman Sachs、Citi、Dell、Cisco、Palantir、Anduril、Microsoft。叙事转折:年初 Cursor 是 AI coding 的孤峰,半年内变成 Cursor + Devin/Cognition 双寡头格局,且都在被战略并购方追逐。
NVIDIA 全员上 Codex(GPT-5.5)——10000+ 员工跨工程/法务/财务/HR 全部门启用,Jensen 内部信”Welcome to the age of AI”。 NVIDIA 官方博客 4/23 发布,跑在 NVIDIA 自家 GB200 NVL72 rack-scale 系统上,宣称比上一代每 M tokens 成本 35× 低、每兆瓦 token 输出 50× 高。架构上是 zero-data-retention + read-only + 沙箱 VM + SSH,Codex agent 只能读不能写。关键引语:“Debugging cycles that once stretched across days are closing in hours” 和某工程师的 “Losing access to GPT‑5.5 feels like I’ve had a limb amputated.”(这句在 OpenAI 自己的 GPT-5.5 announcement 里也被引用)。同时披露 NVIDIA 投资 OpenAI 从原计划 $100B 缩到 $30B,理由是 OpenAI 即将 IPO;NVIDIA 投 Anthropic $10B 也”应该是最后一轮”。这个 case study 比 GPT-5.5 本身更重要——它示范了大型企业 AI 部署的”成熟模板”:不是个别工程师 license,是公司级标准化 + 安全沙箱 + 跨部门铺开 + CEO 公开背书。
Anthropic-NEC 战略合作——首个日本全球合作伙伴,3 万员工部署 Claude,建日本最大 AI-native engineering 团队。 Anthropic 4/24、NEC 4/23 官方公告。NEC 是 Anthropic 在日本的”first global partner”。规划:Claude Opus 4.7 + Claude Code 内嵌进 NEC BluStellar Scenario 商业转型套件;Claude Cowork 部署到 30000 员工;金融、制造、地方政府三个垂直先行;NEC SOC(安全运营中心)已经在用 Claude 做威胁响应。地缘叙事:OpenAI 已通过 SoftBank 在日本布局(Gennai 政府工具)、Microsoft 已宣布 $10B 日本投资(“Sovereign AI”叙事),Anthropic 这次是用 enterprise 渠道补位的关键一击。 同日 Fujitsu 宣布与 Carnegie Mellon 共建 physical AI 研究中心。日本 AI 落地从”哪个模型”竞争升级到”哪个全球供应商和哪家本土巨头绑定”竞争。
数据来源:hntoplinks.com/today(4/26 实时 HN front page)
The West Forgot How to Make Things, Now It’s Forgetting How to Code — 902 pts / 571 评论 · HN 讨论 · 详见重点第 1 条。
Amateur armed with ChatGPT solves an Erdős problem — 618 pts / 437 评论 · HN 讨论。23 岁 Liam Price 无高数训练背景,用 GPT-5.4 Pro 单次 prompt 解出一个 1960 年代 Erdős 关于 primitive sets 最小 sum 的猜想(Lichtman 2022 博士论文卡过的同一题)。Terence Tao 评价:“人类集体在 move 1 拐错了——AI 用了一个其他领域已知但没人想到拿来用的公式。“Tao 和 Lichtman 已把证明压缩重写。这件事的真正信号不是 AI 解了一个题,而是”AI 在 problem-to-method 的横向迁移上展现独立判断”——Tao 自己说”jury is still out”,但他承认这次的方法论可能可以扩展到这一类问题。 这是 4/24 GPT-5.5 launch 周里最值得记入 lab notebook 的”应用案例”,比 NVIDIA case study 更稀有。
The AI industry is discovering that the public hates it — 254 pts / 335 评论 · HN 讨论 · 详见重点第 2 条。HN 评论区不愤怒,更多在 nodding——这是叙事固化的迹象。
Asahi Linux Progress Report 7.0 — 420 pts / 178 评论。Apple Silicon 上的原生 Linux 进展报告,每次更新都是 HN 高分帖。和今日 r/LocalLLaMA 的 mesa PR:llama.cpp 在 Intel Xe2 Linux 性能 +37-130% 一并出现——周末是 OS-level Linux 优化在 AI 推理场景被重新关注的窗口。
Why SWE-bench Verified no longer measures frontier coding capabilities — 102 pts / 72 评论 · HN 讨论 · OpenAI 官方放弃 SWE-bench Verified,转推 SWE-bench Pro。理由两条:① 审计 27.6% subset 发现 59.4% 的”模型失败”案例其实是测试本身的 bug(49 个测试过窄、26 个过宽);② 训练数据污染——SWE-bench 来自开源 repo,所有大模型都在训练。同日 r/LocalLLaMA top 5:Confirmed: SWE Bench is now a benchmaxxed benchmark 329 pts / 84 评论。Scale 的 SWE-bench Pro leaderboard:GPT-5 23.3% / Claude Opus 4.1 23.1%(vs Verified 70%+)——真实分布断崖式回落到 1/3 分数线,是更可信的 frontier 状态。
Eden AI – European Alternative to OpenRouter — 109 pts / 57 评论 · HN 讨论。欧洲 hosted LLM aggregator,针对 GDPR/data sovereignty。HN 此类”X 的欧洲替代”帖最近频度在涨,是 sovereign-AI 叙事在开发者层面的延伸——不是政府而是用户在选择”地理隔离”的供应链。
Agents Aren’t Coworkers, Embed Them in Your Software — 48 pts / 20 评论 · HN 讨论。反驳目前主流的”agent as coworker”叙事,主张 agent 应该作为软件内嵌组件而非协作伙伴。这是对当前 OpenAI/Anthropic”super app”路线的产品哲学反驳——Brockman 4/24 公开使用的”super app”概念在 HN 开发者群体中遭遇早期反弹。
DeepSeek-V4 on Day 0: From Fast Inference to Verified RL with SGLang and Miles — 72 pts / 6 评论 · HN 讨论。LMSYS 团队 4/25 发布 V4 day-0 全栈支持,包括 SGLang fast inference + Miles verified RL pipeline。生态消化速度比 V3 快得多——这是 DeepSeek 4/24 发布到周末就有完整 OSS 工具链的速度。
r/LocalLLaMA — 开源治理裂痕显形:抄袭、版权、mod 反 slop
🔥 HauhauCS published an abliteration package that plagiarizes Heretic without attribution, and violates its license — 612 pts / 197 评论 · 今日 r/LocalLLaMA 最高分实质帖。HauhauCS(HuggingFace 22 个 uncensored 模型,月下载 5M+)发布的 reaper-abliteration 包从 PyPI CDN 恢复后被证实是 Heretic (AGPL-3.0) 的 fork,attribution 全部剥离、license 改写。Heretic 作者 -p-e-w- 顶评 700 upvotes 亲自确认违规,已联系 HuggingFace + PyPI 走 takedown 流程。多名用户出来作证 HauhauCS 此前提问 methodology 时直接被拉黑。这是 4/23 MeshCore 因 AI 代码版权分裂之后第二个开源治理标志事件——但性质不同:MeshCore 是社区分歧(合理用 AI),这次是 individual contributor 的故意剽窃 + license 违规。开源 LLM 生态越火,这类事件会越频繁。
📋 r/LocalLLaMa Rule Updates — 334 pts / 114 评论 · 4/22 mod 公告。1M 周访问量背景下 mod 团队启动反 slop/spam 规则。这是大型技术社区被 AI-generated 内容稀释后的标准防御动作——当 r/LocalLLaMA 都在做这种事时,意味着开源社区的 “信噪比” 已经成为治理痛点。
🔒 Confirmed: SWE Bench is now a benchmaxxed benchmark — 329 pts / 84 评论 · 链接到 OpenAI 官方文章,社区终于有了”我们早就说过”的 closure 时刻。配合 r/LocalLLaMA 之前的 Qwen3.6/DeepSeek V4 验证讨论,整个社区正在从”benchmark 信仰”转向”private holdouts + real-world 测评”——这是 evaluation methodology 的代际变化。
📈 Qwen3.6 35B A3B Heretic (KLD 0.0015) Incredible model. Best 35B I have found! — 390 pts / 84 评论。社区自制的 Qwen3.6 abliterated 版本(注:与 HauhauCS 抄袭事件中的”Heretic”是同一原作者 p-e-w 的工具)。Qwen3.6 35B-A3B 在 IQ4XS + Q8 KV cache + 262K context 下能塞进 24GB VRAM 还能 multi-turn tool calls 不挂——本周 r/LocalLLaMA 最高质量的实战 setup 之一。
⚡ Qwen3.6-27B-INT4 clocking 100 tps with 256k context length on 1x RTX 5090 via vllm 0.19 — 221 pts / 82 评论。前一日的 80 tps 优化今日跨过 100 tps 门槛。Qwen3.6-27B 已经从”能跑”进化到”日常用”——单卡 5090 + 256K context + 100 tps 是当前最强的本地 frontier-class 推理 setup。
🆕 AMD Hipfire — a new inference engine optimized for AMD GPU’s — 53 pts / 12 评论。新 AMD-only 推理引擎,特殊 mq4 量化方法。AMD 在本地推理生态的份额还小但工具在快速补齐——这是 NVIDIA 中心化 inference 之外的备选 supply chain 信号。
r/MachineLearning — research culture 在 LLM 时代的尴尬
Why do only big ML labs dominate widely-used models despite many open-source pretrained models smaller labs could do RL on? — 39 pts / 28 评论。讨论:Kimi/DeepSeek 这些 base 模型已经免费,但为什么 RL 之上的产品只有大厂做得起来?回答主线:post-training infrastructure(reward model、verifier、scaled rollouts)是真壁垒,预训练免费不代表 fine-tuning 能力下放。这是一个被低估的结构性观察——开源 base 模型 ≠ 开源 frontier 能力,bottleneck 已经从 GPU + data 移动到 RL infra。
How to collect evidence for LLM reviewer? — 20 pts / 5 评论。会议作者 4 个正面 review 中收到 1 个明显 LLM-written 的 weak reject,rebuttal 也被无视。LLM 审稿污染从”传闻”进入”作者公开求助维权”阶段——会议组织者迟早需要正式政策。
r/SideProject — 社区氛围逆转:YC 调侃、Claude Code 山寨
😆 Y Combinator be like — 154 pts / 16 评论。视频 meme,社区集体玩梗 YC 文化。SideProject 社区从早期”为 YC 改 pitch”到今日”嘲讽 YC 文化”——独立开发者群体的身份转向。
🎭 Fully functioning claude-code replica that believes it is real and tries it’s best — 45 pts / 19 评论。一个虚拟的、相信自己是 Claude Code 但用的是别的模型的 web app。讽刺意味很强。当模仿 Claude Code 的产品已经多到可以做”装作是 Claude Code”的 meta-product,说明 Claude Code 的 brand 与产品形态已经成为开发者工具领域的事实标准。
🛠 I built a tool that gives every git branch its own routed local domain — 7 pts / 2 评论。Galactic(macOS 原生)—— branch worktree 多端口管理。worktree-aware 工具在过去两周连续出现,是 parallel agent 工作流的开发者基础设施需求。
OpenAI 官方放弃 SWE-bench Verified · 详见 HN 信号 #5。这不是论文但是 evaluation methodology 的官方拐点。Latent Space 同日 深度访谈 Mia Glaese & Olivia Watkins (OpenAI Frontier Evals) — 138 个 problematic problems 6 名工程师 review,得出现在的 60%+ 不可解决率。对于 vault 来说这是一个值得新建 research 节点的 evaluation methodology shift。
DeepSeek-V4 + SGLang/Miles Day-0 Integration · LMSYS 4/25 发布。覆盖:fast inference path(SGLang 已支持 V4 hybrid attention)、verified RL pipeline(Miles)、tooling for reproducible evaluation。生态消化速度证明了 4/24 V4 发布的工程影响——24 小时之内开源 RL infrastructure 已经接住 1.6T 参数的 frontier model。
AlphaXiv trending 整理周末观察:deep learning theory paper(There Will Be a Scientific Theory of Deep Learning,14 作者联署)继续在 r/MachineLearning 持续发酵 222 pts。结合周末 Erdős 解题事件——“AI 是黑箱 vs AI 可被理论化”的争议在两个不同社区同时升温,是 2026 H2 学术 narrative 的种子。
Cognition $25B 融资谈判 — Bloomberg、SiliconANGLE · 详见重点第 3 条。
Anthropic Managed Agents 发布 — Releasebot 4/23。Anthropic 推出 Managed Agents——hosted Claude Platform service for long-horizon agent work,提供 stable interfaces for sessions、harnesses、sandboxes。对应 Anthropic engineering blog 关于 “harnesses encode assumptions about what Claude can’t do on its own” 的论述。这是 LangChain Interrupt 2026 (5/13-14) 前 Anthropic 在 agent infra 层的卡位动作——直接和 LangGraph、CrewAI 在 agent runtime 层面竞争。
Anthropic Rate Limits API — Releasebot 4/25。组织和 workspace 限额可程序化查询。回应 4/23 Postmortem 之后的”用量透明度”诉求——技术修复 + 政策修复双轨。
Anthropic-NEC 战略合作 — Anthropic 4/24 · 详见重点第 5 条。
NVIDIA 全员部署 Codex — NVIDIA 博客 · 详见重点第 4 条。
Anthropic 公开承诺 Claude 永久 ad-free — Anthropic 新闻。文中明确”advertising incentives are incompatible with a genuinely helpful AI assistant”,并解释扩大访问的非广告路径。在 OpenAI 已经在 ChatGPT 上跑 ads pilot 的对照下,Anthropic 借此巩固”高信任 AI”叙事——和本周 trust crisis 形成正向对冲。
Fortune 报道 Claude Code 用户继续不满 — Fortune 4/24。TrustedSec CEO Dave Kennedy 公开测试 Claude 代码质量下降 47%,定性 Anthropic 一个月才 ship postmortem 是”crummy”。文章核心论点:Anthropic 一开始 imply 用户错觉,再说改动是”为了用户好”,这种 gaslighting 式沟通已经损害”transparent and aligned”叙事。已有用户取消订阅。Postmortem 是必要但不充分——本周-下周用户实际使用反馈才决定信任修复曲线。
MiMo-V2.5 & Pro on Product Hunt — Xiaomi 系,“frontier agent capability with better token efficiency”。国内大厂 agent 模型 PH 出海是这个月新现象。
OpenAI Codex Cloud / Workspace agents 持续 PH 推广 — Codex 已经从 4/22 的 “background computer use” 进化为 PH 上的 “Workspace agents”——产品名都在改,定位仍在收敛。
4/24 周五收盘(双双新高):
| 指数/资产 | 收盘 | 变动 | 备注 |
|---|---|---|---|
| S&P 500 | 7,165.08 | +0.80% | 历史新高 |
| Nasdaq Composite | 24,836.60 | +1.63% | 历史新高 |
| Dow | 49,230.71 | -0.16% | |
| NVIDIA 市值 | $5T | 单日 +5% | 时隔 6 个月再次穿过 $5T 大关 |
| Intel | +23.6% | Q1 大超预期催化 | |
| AMD | +13.9% | 半导体集体上涨 | |
| Qualcomm | +10% | ||
| SOX 半导体指数 | +18 days | 史上最长连涨之一 | |
| WTI 原油 | ~$95 | 缓和 | Iran-Lebanon 停火延长 3 周 |
| Bitcoin | ~$78,188 | +1.43% | |
| 黄金 | $4,712 | -1.08% | |
| VIX | 18.71 | -3.11% |
关键宏观:
周末期货方向:S&P/Nasdaq/Dow 期货均小幅回落(-0.16% ~ -0.24%),主要是 Iran 谈判不确定 + 消费者信心数据滞后效应。
Anthropic
OpenAI / Codex
Cognition / Devin — 本周转折期
Cursor / Anysphere — SpaceX 期权窗口期
DeepSeek
LangChain — Interrupt 2026 (5/13-14) 倒计时 17 天
Cognition Windsurf 整合 — 静默期,需要观察 Windsurf brand 在 Cognition $25B 估值叙事中的具体 attribution
4/26 今日早盘(产品仍在排名滚动中):
| # | 产品 | 描述 |
|---|---|---|
| 1 | FocuSee 2.0 | 屏幕录制升级(持续多日榜首) |
| 2 | Kollab | 团队和 agent 共享 workspace |
| 3 | Magic Patterns Agent 2.0 | AI 设计 agent (idea → production) |
| 4 | Monid | ”One wallet, every paid tool your agent needs” — agent 支付 wallet |
| 5 | Claude Code /ultrareview | 云端并行 agent code review |
| 8 | Blink AI CFO | ”AI CFO that autonomously trades stocks and options via Slack” |
| 14 | Qwen3.6-27B | 开源模型登 PH 榜 |
| 17 | Workspace agents in ChatGPT | OpenAI 官方 |
| 19 | MiMo-V2.5 & Pro | 小米 frontier agent |
4/25 周六 PH 高分(昨日 top 5):
本周 PH 情绪信号:
本周最被低估的信号是”AI 反弹叙事被打包成可投票/可暴力的政治形态”。 4/10 Sam Altman 家被 Molotov、4/7 议员家因数据中心被打 13 枪、Stanford 73% 专家 vs 23% 公众的乐观对比、Gen Z 愤怒情绪上升 9pt——这些过去 6 周的零散信号本周被 New Republic 整合为一个 framework。这意味着 AI 公司在 2026 H2 的关键 PR 任务不再是”解释技术”,而是”答复结构性政治指控”——OpenAI 的 Industrial Policy White Paper 是开始,但被立刻指出 Brockman 同时在反 state-level AI regulation。沟通断层将是这个半年最重要的 enterprise risk。
Cognition $25B 谈判和 Anthropic-NEC 30K 部署的同周发生不是巧合,是 enterprise AI 资本配置的拐点。 半年前 Cursor 是孤峰 $9B,半年后 Cursor $60B option + Cognition $25B + Cognition acq Windsurf 后 ARR 跳,AI coding 赛道已经形成”Cursor + Cognition”双寡头加速整合的格局。同时大厂 enterprise 部署不再是 evaluation pilot,而是 5K-30K 规模整体 rollout(NEC 30K、NVIDIA 10K、Freshfields 5.7K)——这是从 SaaS 时代到 AI native enterprise tools 时代的 inflection point,也是 Anthropic / OpenAI 双寡头之外能容纳的”垂直 + 实施伙伴”layer 开始浮现的窗口(NEC、Freshfields、CoCounsel)。
HauhauCS 抄袭 Heretic 事件 + r/LocalLLaMA mod 启动反 slop 规则 + MeshCore 团队分裂,是开源 AI 治理在 7 天内连续触发的三个标志事件。 不同性质:
这三件事都没有现成方案,且都不能再靠原 OSI 时代的”contributor license + DCO + CoC”框架解决。开源 AI 模型生态(HuggingFace, GitHub Models, ollama 等)需要新的 governance 工具集——这是一个巨大的产品和制度空白。
METR 研究的”资深开发者用 AI 慢 19% 但预测自己快 24%“应该被钉在每个 AI productivity 决策者桌上。 Stetskov 文章引用的这个数据可能是过去半年最重要的反主流证据——不是说 AI 没用,而是说主观感受和客观结果之间存在 43 percentage points 的认知鸿沟。这个 gap 对企业决策的含义:以”开发者满意度”为指标的 AI tool 采购可能在系统性高估真实 ROI;CFO 视角的真实 AI 收益审计需要 task-completion 客观数据而非 NPS。
NVIDIA 全员部署 Codex 是企业 AI 部署的”成熟模板”——但被低估的是其安全架构。 zero-data-retention + read-only + 沙箱 VM + SSH-only access:这套架构未来 6-12 月会成为大型企业 AI 部署的事实标准。对 enterprise security 厂商来说这是大机会:现有 EDR/CASB/DLP 都没有完整覆盖”agent 在沙箱 VM 中读公司数据但写在隔离环境”这个新形态——空间在于 agent-aware identity & access management。
Erdős 解题事件证明的不是 AI 智能而是 transfer。 Tao 评价的核心是”AI 用了一个其他领域已知但没人想到拿来用的公式”——这是 cross-domain 启发,不是端到端推理。这种能力对 frontier research 的价值远远超过”解一个题”,因为它说明 LLM 在隐空间里做了某种程度的方法学迁移。对小型独立研究者(不是大 lab)的含义最大:单人 + ChatGPT Pro 现在可以接住 60 年来全球数学家的卡点——研究力的 distribution 是真的在压平。
research/ai/ai-public-backlash-2026.md — 新开:Sam Altman Molotov + Indianapolis 议员枪击 + Stanford AI Index 73%/23% gap + Gallup Gen Z 愤怒 + 数据中心电费上涨 + AI 比 ICE 更不受欢迎民调 + OpenAI Industrial Policy 自相矛盾。这是 2026 H2 最重要的”非技术”叙事。关联 [[anthropic]] [[openai]] [[stanford-ai-index]]。research/market/ai-coding-consolidation-cursor-cognition.md — 新开:Cursor $60B option + Cognition $25B + Windsurf 整合 + 双寡头加速。从 2025/3 的 Cursor $4B 到现在的双寡头格局的 timeline。关联 [[cursor]] [[cognition]] [[devin]]。research/ai/anthropic-managed-agents.md — 新开:4/23 发布的 Anthropic 第一个 hosted agent runtime 服务。harnesses + sessions + sandboxes 抽象层意义。和 LangGraph、CrewAI 在 agent runtime 层的竞争。LangChain Interrupt 2026 前 18 天的卡位时机。research/ai/swe-bench-deprecation.md — 新开:OpenAI 官方放弃 SWE-bench Verified;59.4% 失败案例是测试问题;SWE-bench Pro 实际分数线 ~23%(vs Verified 70%+);evaluation methodology 代际转变。关联 [[swe-bench]] [[scale-ai-benchmarks]]。research/ai/open-source-ai-governance-crisis.md — 新开:HauhauCS 抄袭 Heretic + r/LocalLLaMA mod 反 slop + MeshCore 分裂——一周三标志事件的合并分析。开源 AI 治理需要的新工具集。关联 [[meshcore]] [[heretic]] [[huggingface]]。orgs/cognition.md — 更新:$25B 融资谈判,Russell Kaplan inbound 评论,Devin ARR 路径($1M → $73M+)。orgs/nec.md — 新开:第一个 Anthropic 日本全球合作伙伴;30K 员工部署 Claude Opus 4.7;BluStellar Scenario 整合;Center of Excellence 内训路径;同日 Fujitsu 与 CMU 合作 Physical AI。research/product/west-forgot-how-to-make-things-essay.md — 新开:Stetskov 类比 Pentagon 1993 整合 → Stinger 2022 重启失败 → 软件 AI 优化的历史警示。METR 19% 慢但预测 24% 快的认知鸿沟数据。0.18% 招聘转化率。关联 [[ai-talent-pipeline-collapse]] [[metr-rct]]。people/denis-stetskov.md — 新开:乌克兰工程团队负责人,techtrenches.dev/From the Trenches 作者;本周 HN #1 essay 作者;定义”Fogbank for code”。people/liam-price.md — 新开:23 岁,无高数训练,用 ChatGPT 解 60 年 Erdős 问题;与 Kevin Barreto(Cambridge 二年级数学本科)合作;获 ChatGPT Pro 赞助。research/market/ai-public-sentiment-vs-market-divergence.md — 新开:消费者信心 49.8(史上最低)vs S&P/Nasdaq 历史新高 vs NVIDIA $5T。AI capex 收益与公众体验断层的具体经济衡量。