If you have great ideas,
Let's talk!

Thursday, March 26, 2026

Feed

Daily briefing


2026-03-26 Thursday Briefing

重点

  1. Gemini 3 Deep Think 升级版发布(HN 777 分 / 497 评论)——ARC-AGI-2 得分 84.6%,Humanity’s Last Exam 48.4%,Codeforces Elo 3455。Google 正面挑战 reasoning model 赛道,直接对标 GPT-5.4 和 Claude。API 首次开放给企业。
  2. US 2 月意外减少 92,000 个就业岗位(HN 499 分 / 679 评论)+ tech 就业率跌破 2008/2020 衰退水平(742 分 / 501 评论)。双数据叠加——这不是 “tech winter” 而是结构性转变。AI 自动化 + 地缘冲突 + 高油价三重压力。
  3. Wikipedia 遭大规模管理员账号入侵,一度进入只读模式(1032 分 / 374 评论)。互联网基础设施的脆弱性再次暴露,与本周 GitHub Issue 供应链攻击(603 分)构成安全主题。
  4. Anthropic vs Pentagon 裁定可能今日出炉。法官 Rita Lin 称 Pentagon 行动 “troubling”,Hegseth 在 X 上的帖子 “far beyond what the law allows”。法律专家普遍看好 Anthropic 胜诉。
  5. Cursor “十字路口”——Fortune 封面故事曝光生存压力。Claude Code $2.5B ARR 侵蚀、Composer 2 自研模型求独立、“Cursor is dead” 叙事兴起。$29.3B 估值下增长放缓。

笔记

跳过昨日已覆盖:Sora 关闭、Arm AGI CPU、Harvey $11B、Apple Business、Wine 11、oil trading BBC 调查、Video.js v10、Gemini 视频嵌入、Epic 裁员、pest control SaaS、Hypura、TurboQuant(研究进展见 Reddit 新条目)、missile defense NP-complete、Ring-Flock、Polis、Omnara Launch。


📡 HN 信号

法官下令退还 $130B+ 关税(1050 分 / 755 评论)

WSJ 报道联邦法官下令政府开始退还超过 1300 亿美元关税。HN 上罕见的非 tech 帖破千分,反映开发者社区对宏观政策的关注度已系统性提升。WSJ · HN

Wikipedia 只读模式——大规模管理员账号泄露(1032 分 / 374 评论)

Wikipedia 因多个管理员账号被入侵进入只读模式。这是继 LiteLLM 供应链攻击后又一基础设施安全事件。Wikimedia Status · HN

GitHub Issue 标题入侵 4000+ 开发者机器(603 分 / 189 评论)

AI coding tool Cline 的 GitHub Issue 标题被植入恶意 prompt,用户打开时自动执行。命名为 “Clinejection”,利用了 AI agent 对 UI 文本的隐式信任。直接映射 SAFE-MCP 中 prompt injection 的 TTP。grith.ai · HN

Gemini 3 Deep Think 大升级(777 分 / 497 评论)

面向科学/研究/工程的 reasoning mode。关键数据:HLE 48.4%(无工具),ARC-AGI-2 84.6%(ARC 基金会验证),Codeforces Elo 3455。首次通过 Gemini API 向企业开放。Rutgers 数学家用它发现了通过人工同行评审的逻辑缺陷。Google Blog · HN

GPT-5.3-Codex-Spark(655 分 / 266 评论)

OpenAI 与 Cerebras 合作的首个产品。小模型 + 晶圆级推理芯片 = 1000+ tokens/sec。定位是 Codex 的 “实时协作模式”,对标 Claude Code 的 agentic 长任务模式。WebSocket 持久连接减少 80% 往返延迟。OpenAI · HN

“Improving 15 LLMs at Coding — Only the Harness Changed”(624 分 / 239 评论)

核心论点:不是模型差,是 harness(测试框架)差。仅改进调度和上下文管理就让 15 个模型同时提升编码表现。对 agent 编排有直接参考价值。blog.can.ac · HN

Tech 就业率跌破 2008/2020 水平(742 分 / 501 评论)

经济学家 Joseph Politano 数据——tech sector 就业萎缩程度已超过上两次衰退。同日 BBC 报道 2 月非农减少 92K(499 分 / 679 评论)。两帖合计 1241 分 / 1180 评论。Twitter · BBC · HN #1 · HN #2

其他高信号帖:


🔬 Reddit 脉搏

r/LocalLLaMA

r/MachineLearning

r/SideProject


🚀 Product Hunt 信号

3/25 数据:

#产品票数评论信号
1Agentplace AI Agents41776创建特定任务的 AI agent
2Auto Mode by Claude Code3309Anthropic 连续第二天上榜
3Pendium22019帮 AI agent 推荐你——GEO/AEO 品类
4TurboQuant2072Google 压缩算法,学术驱动
5LayerProof Matte17012社交媒体内容重新包装

3/24 最终(vs 昨天快照): Claude Computer Use 618(+71),Cekura 454(+63),Kitty Points 426(+34)。

PH 情绪分析:


📊 宏观市场

3/26 盘中: S&P 500 ~6,535(-0.8%),Dow -0.5%,Nasdaq -1.1%。

关键动态:

判断: 市场在 “和平预期落空 + 油价重新走高 + 就业恶化” 的三重压力下。昨日反弹已完全回吐。如果周六停火未延长,下周可能测试 S&P 6,400 支撑。


💰 融资动态

本周无新重大 AI 融资(上周密集期已过)。值得回看的关键背景:


👀 Watchlist 更新


想法

  1. “The Harness Problem” 可能是 2026 年最重要的 AI 工程洞察。624 分的 HN 帖证明:同一模型在不同编排框架下性能差异巨大。这直接验证了 agent orchestration 的价值——不是换更好的模型,而是写更好的 harness。对 coding agent 工具链有重大含义。

  2. 开源语音全栈一天补齐。Mistral Voxtral TTS(3B,开源)+ Cohere Transcribe(2B,Apache 2.0)同日发布。TTS + STT 都有了高质量开源选项。本地语音 agent 的技术栈正在快速成型——结合 Nvidia PersonaPlex 的全双工语音,完整的本地 voice agent 已经触手可及。

  3. AI agent 安全事件从 “供应链” 蔓延到 “UI 文本”。Clinejection(GitHub Issue 标题注入)是新的攻击面——AI agent 信任屏幕上的任何文本。这不同于传统的代码注入,而是 prompt injection 的 UI 层变体。SAFE-MCP TTP catalog 需要覆盖这类 “视觉层 prompt injection”。

  4. LeCun 的 $1B 反 LLM 赌注正在改变学术讨论。r/MachineLearning 228 票认真讨论 “autoregressive LLM 是否撞墙”。不管 JEPA 能否成功,资本层面的信号会推动更多研究转向 world models / planning-first 架构。这可能在 12-18 个月内重塑 agent 设计范式。


值得创建 vault 文件的:

Archive
Archive
May 10, 2026
May 7, 2026
May 3, 2026
May 2, 2026
May 1, 2026
Apr 30, 2026
Apr 29, 2026
Apr 28, 2026
Apr 27, 2026
Apr 26, 2026
Apr 24, 2026
Apr 23, 2026
Apr 22, 2026
Apr 19, 2026
Apr 18, 2026
Apr 17, 2026
Apr 16, 2026
Apr 15, 2026
Apr 14, 2026
Apr 13, 2026
Apr 12, 2026
Apr 11, 2026
Apr 10, 2026
Apr 6, 2026
Apr 4, 2026
Apr 3, 2026
Apr 2, 2026
Apr 1, 2026
Mar 29, 2026
Mar 28, 2026
Mar 27, 2026
Mar 26, 2026
Mar 25, 2026
Mar 24, 2026
Mar 23, 2026
Mar 22, 2026
Mar 22, 2026
Mar 20, 2026
Mar 18, 2026
Mar 17, 2026
Mar 14, 2026
Mar 13, 2026
Mar 12, 2026
Mar 11, 2026
Mar 9, 2026
Mar 8, 2026
Mar 7, 2026
Mar 6, 2026
Mar 5, 2026
Mar 4, 2026
Mar 3, 2026
Mar 2, 2026
Mar 1, 2026
Feb 28, 2026