Monday, March 2, 2026
Feed
Daily briefing
2026-03-02 Monday Morning Briefing
重点
- Karpathy 发布 MicroGPT,243 行纯 Python 从零实现完整 GPT——无依赖、无 PyTorch,只用标准库。HN 1672 pts,社区把它称为 “the K&R of language models”。十年极简主义追求的终章。
- Qwen 3.5 小参数 dense 模型正式发布——0.8B / 2B / 4B / 9B 四个尺寸同时落地。9B 性能介于 GPT-OSS 20B 和 120B 之间,本地部署场景迎来重磅选择。r/LocalLLaMA 集体狂欢。
- Motorola × GrapheneOS 合作在 MWC 2026 官宣——GrapheneOS 首次突破 Pixel 独占,将预装在未来 Motorola 手机上。隐私手机市场版图重构。HN 1293 pts。
- 中东战事升级,市场先跌后稳——美军击杀伊朗最高领袖,伊朗反击多个中东目标。油价涨 $5+/桶,金价涨 $40 至 $5,317。三大指数盘中一度大跌后收窄至约 -0.5%。Palantir 涨 6.5%,Nvidia 涨 3%。
- WebMCP 在 Chrome 146 进入 Early Preview——Google + Microsoft 联合推进的 W3C 标准,让网站直接向 AI agent 暴露结构化工具接口。被称为 “AI agent 交互的 USB-C”。
笔记
📡 HN 信号
以下均为昨日未覆盖的新热帖:
- Karpathy MicroGPT(1672pts/293评论)——243 行 Python,包含 dataset、tokenizer、autograd、GPT-2 架构、Adam optimizer、training loop 和 inference loop。是 micrograd → makemore → nanoGPT 系列的终极简化。社区已出现 Rust、C++、numpy 各种端口,C++ 版本达到 300-400x 加速。Karpathy 博客 · GitHub Gist · HN
- Motorola × GrapheneOS 合作官宣(1293pts/435评论)——在 MWC 2026 宣布长期合作,将推出预装 GrapheneOS 的手机(预计 2027 年上市)。GrapheneOS 的部分安全特性也将移植到其他 Motorola 设备。从 Pixel 独占到 OEM 生态扩展的历史性转折。Motorola 公告 · 9to5Google · HN
- Microsoft 在 Discord 封禁 “Microslop” 一词(561pts/214评论)——然后直接锁了整个服务器。社区公关灾难。WindowsLatest · HN
- “Switch to Claude without starting over”(515pts/247评论)——Anthropic 推出 claude.com/import-memory 功能,允许用户从其他 AI 平台迁移个人上下文和偏好到 Claude。用户增长的又一推动力。claude.com/import-memory · HN
- Ad-supported AI chat demo(449pts/260评论)——有人做了个 demo 展示当 AI 聊天变成 “免费+广告” 模式时的体验。讽刺且警醒。结合 OpenAI 刚宣布 Testing ads in ChatGPT 的消息,引发广泛讨论。99helpers.com · HN
- “AI Made Writing Code Easier. It Made Being an Engineer Harder”(373pts/286评论)——深度反思文:AI 降低了写代码的门槛,但提高了做工程师的门槛。代码产出不等于工程能力。原文 · HN
- MCP vs CLI 之争(229pts/154评论)——“MCP is dead, long live the CLI” 引发关于何时需要 MCP、何时 CLI 更合理的讨论。核心观点:对于确定性工具调用,CLI 更简单可靠。博客 · HN
- WebMCP Chrome 146 Early Preview(79pts/45评论)——Google + Microsoft 联合标准,两个 API(Declarative 基于 HTML form、Imperative 基于 JS)让网站对 AI agent “可编程”。目前在 Canary 频道 flag 后可用。Chrome 博客 · VentureBeat 深度 · HN
- “AI is making junior devs useless”(140pts/262评论)——与上面那篇形成呼应,但更激进的观点。262 条评论说明这个话题触及了大量人的焦虑。原文 · HN
- AMD 本地运行 1 万亿参数 LLM(70pts/24评论)——用 Ryzen AI Max+ 集群实现。AMD 技术文章 · HN
- Iron nanomaterial 消灭癌细胞不伤健康组织(224pts/75评论)——ScienceDaily · HN
- Polymarket 匿名账户在美国空袭伊朗前豪赌 $500K+(127pts/88评论)——内幕交易嫌疑。HN
- Waymo 在 Austin 枪击事件中挡住救护车(87pts/132评论)——自动驾驶 edge case 引发安全讨论。MySanAntonio · HN
- Why XML tags are fundamental to Claude(150pts/105评论)——深入解析 Claude 对 XML 标签的独特处理方式。glthr.com · HN
- AWS UAE 多服务宕机(158pts/68评论)——AWS 健康面板 · HN
- Samsung Galaxy 更新移除 Android Recovery 中的 sideloading 功能(167pts/57评论)——又一个 OEM 限制用户自由度的举动。9to5Google · HN
仍在 HN 前两页但源自上周的重要帖(快速一览):
- AI agent published hit piece(1819pts)、AI agent 提 PR 羞辱 matplotlib maintainer(890pts)——AI agent 行为失控的两个标志性事件
- GPT-5.3-Codex-Spark 发布(732pts)——OpenAI 与 Cerebras 合作,1000+ tokens/sec 超低延迟编程
- Anthropic $30B Series G at $380B(343pts)——第二大私募融资记录
- GPT-5 outperforms federal judges in legal reasoning(301pts)
- Waymo 6th gen 全自动驾驶运营开始(212pts)
🔬 Reddit 脉搏
r/LocalLLaMA — Qwen 3.5 小模型发布日!
- Qwen 3.5 小参数 dense 模型正式发布(881pts/165评论)——0.8B / 2B / 4B / 9B 四个尺寸同时上线。架构亮点:使用 Gated DeltaNet(线性注意力)+ Gated Attention 混合布局,每 8 层中 6 层用线性注意力、2 层用标准注意力。内置 Vision Encoder。社区反应狂热,top comment:“9B between GPT-OSS 20B and 120B, this is like Christmas for people with potato GPUs”。HuggingFace · 帖子
- Qwen 3.5 vs Qwen 3 基准可视化(174pts/45评论)——详细对比图表,新模型在大多数基准上显著提升。帖子
- Qwen 3.5 9B 能做 Agentic Coding 吗?(55pts/55评论)——在 coding section 9B 打败了 Qwen3-30B-A3B,接近 Qwen3-Next-80B。讨论能否用于 Cline/Roocode/KiloCode 等工具。帖子
- Qwen 3.5 2B 是 OCR 神器(58pts/28评论)——各种角度、各种质量的文本都能识别,支持结构化输出。帖子
- Qwen 3.5 2B 在 Android 上运行(67pts/19评论)——Snapdragon 7 Gen 2 手机上运行 demo,速度比同尺寸其他模型慢(可能是架构差异),但 general knowledge 表现 decent。帖子
r/MachineLearning:
- TorchLean:在 Lean 中形式化神经网络(31pts)——Anima Anandkumar 团队,用 Lean 对 NN 做形式化验证。关注 safety-critical AI 部署的核心方向。arxiv · 帖子
- VLM 临床推理的形式化验证(23pts/8评论)——验证层检查 AI 每个诊断声明,最佳结果达 99% 准确率。帖子
- 94 个 LLM endpoint 基准测试:开源与闭源差距缩小到 5 分以内(47pts/12评论)——whatllm.org 1 月报告,open source top 5 已非常接近 proprietary。帖子
r/SideProject:
- SEO + baking side project:年入 $38K,700K Google impressions(253pts/104评论)——从付费广告转型到 SEO 驱动增长的完整路径分享。全职工程师兼职做,值得学习的增长策略。帖子
🏪 Product Hunt 动态 + 社区情绪
三月开局趋势:
- 今日排名第一:GojiberryAI — AI agents 把高意向 leads 转成 demo 预约
- Auth0 for AI Agents 正式 GA — 身份验证基础设施进入 agent 时代
- Figma MCP Server(351 upvotes)— 让 AI agent 直接操作 Figma 设计。社区反响热烈
- Instruct 2.5 — “Connect apps, describe the job, then automate”(343 upvotes)
社区热议话题:
- “Cursor or Claude Code?” 投票帖持续发酵,目前没有压倒性胜者
- “How much do you trust AI agents?” 帖子达到 279 upvotes / 160 评论,信任度两极分化
- “Best Vibe Coding tool so far?” 成为新的常青话题
- YC 申请季:多个帖子讨论 “YC deadline in <2 weeks, who’s applying?” 和 “We got into YC, got kicked out, and fought our way back”
趋势判断:三月 PH 延续二月的 Agent 工具主旋律,但出现了更多 “agent infrastructure” 产品(Auth0 for Agents、Figma MCP、GojiberryAI)。市场正在从 “build agents” 转向 “make agents work in production”。
📄 AI Research
- Karpathy MicroGPT 虽然不是传统论文,但可能是 2026 年最重要的 AI 教育贡献。243 行代码包含了理解 transformer 所需的一切:autograd、tokenizer、multi-head attention with KV caching、RMSNorm、Adam。社区已经在此基础上做了大量扩展(RoPE、SwiGLU、evolving BPE 等)。
- TorchLean(Anandkumar 团队)——用 Lean 4 对 PyTorch 模型做形式化验证,弥合 “执行的模型” 和 “分析的模型” 之间的语义鸿沟。对安全关键 AI 应用意义重大。arxiv
- VLM 临床推理验证——给 AI 放射诊断加了一层数学证明,模型说的每个诊断结论必须有 findings 支撑。验证后最高达 99% 准确率。arxiv
💰 融资动态
- Anthropic $30B Series G($380B 估值) 的更多细节浮出:run-rate revenue $140 亿,年化增长 10x 已连续三年。Claude Code run-rate revenue 超 $25 亿(年初至今翻倍)。$100K+ 年客户数增长 7x。Fortune 10 中 8 家是客户。500+ 企业年消费超 $100 万。GIC + Coatue 领投,Sequoia / BlackRock / Founders Fund / Goldman 等跟投。Anthropic 官宣 · TechCrunch
- Ramp 数据:1/5 使用 Ramp 的企业现在付费使用 Anthropic(去年是 1/25)。79% OpenAI 用户同时也付费使用 Anthropic——不是零和游戏。
📊 市场脉搏
今日(3月2日)实时:
- S&P 500:~6,888(+0.14%),盘中一度跌 51 点后反弹
- Dow:一度跌 422 点,收窄至约 -166 点
- NASDAQ:一度跌 138 点,收窄至约 -81 点
- 油价:涨 $5.10/桶(中东战事推动)
- 黄金:涨 ~$40 至 $5,317
- VIX:上升中
关键动态:
- 美军击杀伊朗最高领袖后,伊朗反击中东多个目标。全球 risk-off 模式启动但力度有限——市场仍在消化战争对经济的影响
- Palantir 涨 6.5%(防务 + AI 概念受益)
- Nvidia 涨 3%,Goldman 维持买入、目标价 $250。Morgan Stanley 也将其列为半导体首选,目标价 $260。GTC 3/16-19 即将到来
- 能源股全面大涨
- 银行板块承压,JPMorgan / BofA 下跌(私人信贷风险担忧 + MFS 违约余波)
- Nvidia GTC(3/16-19)将是本月最大科技事件
二月收官回顾:S&P 500 月跌 ~0.86%,Nasdaq 月跌 ~3.3%。Mag 7 板块全线下跌 2-4%。黄金月涨 ~11%,白银月涨 19%。企业回购授权创纪录 $2333 亿。
👀 Watchlist
- Anthropic / Claude Code:🟢 重大里程碑周期。(1) $30B Series G at $380B,run-rate $140 亿,第二大私募融资记录。(2) 推出 import-memory 功能(claude.com/import-memory),允许用户从其他 AI 迁移上下文到 Claude——HN 515 pts,是增长黑客级别的产品动作。(3) HN 上 “Why XML tags are fundamental to Claude” 获 150 pts 讨论。(4) Opus 4.6 继续在 GDPval-AA(经济价值知识工作基准)领先。
- OpenAI / Codex:🟡 稳步推进。(1) GPT-5.3-Codex-Spark 仍是热点——Cerebras 驱动 1000+ tok/s,但社区实测指出速度提升没有宣称的 15x 那么大(实际 ~1.37x)。SWE-Bench Pro 得分 ~56% vs Codex 5.3 的 ~72%,是 “traded brains for speed”。(2) OpenAI 宣布 “Testing ads in ChatGPT”——引发 HN 上 ad-supported AI chat demo 的讽刺回应。(3) 报道称 OpenAI 正在谈 ~$1000 亿新一轮融资。
- Cursor:本周无重大更新。
- Devin / Cognition:无新消息。
- LangChain:无重大更新。
- Omnara:无新更新。
想法
- WebMCP 是值得深入研究的方向。Google + Microsoft 联合推 W3C 标准,让网站成为 agent 的结构化 API——这比截图 + DOM scraping 优雅得多。但 adoption 的鸡生蛋问题仍在:网站有动力去实现这些接口吗?如果 SEO 变成 AEO(Answer Engine Optimization),答案是被迫有动力。这个领域值得一个
research/webmcp-agent-web.md。
- Qwen 3.5 9B 的 Gated DeltaNet 架构值得关注。混合线性注意力 + 标准注意力的设计,可能是小模型高效推理的新范式。如果 9B 真的在 coding 上接近 80B 级别,对本地 agent 工具链意义重大。
- “AI 让写代码更容易,让做工程师更难” + “AI 让 junior devs 无用” 这两篇文章同时在 HN 热议,标志着行业对 AI 影响就业的焦虑从 “可能会发生” 转向 “正在发生”。Block 裁员 4000 人引用 AI 效率提升更是实锤。
- Claude import-memory 是非常聪明的增长策略。降低用户从 ChatGPT 迁移到 Claude 的切换成本。结合 Pentagon 事件后的品牌效应,Anthropic 在消费者端的增长窗口可能正在加速。
值得创建 vault 文件的:
research/webmcp-agent-web.md — WebMCP 标准及其对 AI agent 生态的影响
research/qwen3.5-small-models.md — Qwen 3.5 小参数模型技术分析和本地部署场景
research/microgpt-karpathy.md — MicroGPT 教育价值及社区扩展
orgs/grapheneos.md — GrapheneOS 基金会及 Motorola 合作