2026-06-12 Hacker News Top Stories #
- πFS 是一个愚人节玩笑文件系统,宣称数据不占用硬盘而是存储在π的小数位中,但实际性能极慢,仅作为概念验证。
- Homebrew 6.0.0 发布,引入tap信任机制、Linux沙箱支持、并行安装等改进,并修复了安全漏洞。
- 《Pokémon Go》玩家的扫描数据被Niantic用于训练视觉定位系统,并与美国防务承包商合作计划应用于军用无人机导航,引发伦理争议。
- 一个AI代理在Fedora及上游项目中制造混乱,被社区怀疑是一次供应链攻击的预演,目前账户已被撤销。
- 德州一位农民以10美元捐赠土地建公园,市政府却将其以1000万美元售予数据中心开发商,引发居民起诉。
- Windows版Claude Desktop每次启动都会自动创建1.8 GB的Hyper-V虚拟机,即便仅用于聊天,导致系统卡顿。
- MiMo Code是一款开源AI编程助手,具备跨会话持久记忆,支持多种代理和任意LLM,以MIT许可证发布。
- 2026年5月美国太阳能发电量首次超过煤炭,成为第三大电力来源,主要受经济性驱动,尽管政策扶持煤炭。
- 作者批评AI厂商用“代码行数”等虚荣指标包装生产力,实际研究显示AI辅助并未带来显著提升,呼吁使用可靠指标。
- 文章以讽刺口吻梳理了Anthropic模型的命名演变,列举一系列虚构文学命名,调侃命名膨胀和行业套话。
1. πFS (πFS) #
https://github.com/philipl/pifs
πfs 是一个“数据免费”的文件系统,它声称不将数据存储在硬盘上,而是存储在圆周率 π 中。其核心依据是 π 被认为是正规数,因此所有可能的有限数字序列都会出现在 π 的小数部分中,这意味着任何文件都可以在 π 中找到。πfs 将每个字节单独在 π 中查找,并将文件在 π 中的位置作为元数据保存到一个独立的元数据目录中。
构建需要 autoconf、automake 和 libfuse,使用标准的 autotools 流程(./autogen.sh → ./configure → make → make install)。挂载命令为:πfs -o mdd=< 元数据目录 > < 挂载点 >。
该项目是一个愚人节玩笑,性能极慢(存储一个 400 行文本文件需要五分钟),但作者提到了未来可能的优化方向(变长搜索、算术编码、并行查找、云端 π 查找等)。项目 README 还引导用户关注更新版本的 inferencefs。
HN 热度 933 points | 评论 201 comments | 作者:helterskelter | 1 day ago #
https://news.ycombinator.com/item?id=48480978
- 使用巴别图书馆作为数据压缩工具时,地址本身需要与数据相同的信息量,因此无法真正压缩,只是一个有趣的思想实验。
- LLM 是一种有损压缩形式,实现了类似工具未能做到的要点,但需要大量基础,且与语言压缩的概念相关。
- 3Blue1Brown 的视频《重新发明熵压缩就是智能》探讨了压缩与智能之间的联系。
- 评论中提到的用户名大多对应各种构造语言(conlangs),形成了一种语言俱乐部。
- 科学是一种极端的压缩形式,例如牛顿力学用少量文字就能解释大量现象,但这是一种高度有损的压缩。
- 现代 LLM(如 GPT-2)结合算术编码可以实现无损文本压缩,达到约 1 比特/字节的压缩率;更先进的模型效果更好。
- LLM 是向文本领域应用传统有损压缩(如音频、图像、视频)概念后产生的奇怪有趣结果。
- 将 LLM 的温度设为 0.0 时,它几乎像一个键值存储,但找到正确的键需要一定努力。
- 这种“数据与地址等大”的困境让人联想到博尔赫斯的“帝国地图”寓言。
- 无条件安全(如一次性密码本)要求密钥长度至少等于消息长度,其他加密基于未证实的假设。
- 科学定律作为压缩是高度有损的,例如“老太太摔倒”可能不仅仅是万有引力,还有更多细节。
- AI 在模拟行星轨道时学习到的隐式力是荒谬的,不同于牛顿定律的简洁压缩。
2. 展示 HN:Homebrew 6.0.0 (Show HN: Homebrew 6.0.0) #
https://brew.sh/2026/06/11/homebrew-6.0.0/
Homebrew 6.0.0 正式发布。主要更新包括:引入 Tap 信任机制,第三方 tap 需显式信任后方可运行代码;默认启用内部 JSON API,加快更新速度;Linux 版新增沙箱支持(基于 Bubblewrap);根据用户调查改进默认设置,如开发者模式下 brew install 默认显示依赖摘要并确认;brew bundle 支持并行安装、npm/krew 扩展、Windows winget 等;性能优化,brew leaves 提速约 30%。初步支持 macOS 27(Golden Gate)。同时发布三项安全公告并修复漏洞。弃用了 HOMEBREW_USE_INTERNAL_API 等环境变量,SBOM 改为 opt-in。其他改进包括 cask 支持 pin、AppImage Linux 支持、WSL 识别增强等。
HN 热度 878 points | 评论 206 comments | 作者:mikemcquaid | 10 hours ago #
https://news.ycombinator.com/item?id=48490024
- 用户称赞 Homebrew 6.0.0 新增的
brew trust功能,认为非常实用。 - 用户认为 Homebrew 是 Mac 上的必备工具,其命令行交互设计简单易记,且快速适配了 Apple Silicon。
- 用户表示在 Linux 上更倾向于使用 Homebrew,因为大多数 Linux 包管理器无法区分用户安装包和系统包,导致清理困难,且更新速度较慢。
- 用户指出 LTS 发行版的稳定性有助于抵御供应链攻击,但另有人反驳说非核心包可能长期得不到安全更新,存在风险。
- 用户推荐在 LTS 发行版上使用 Homebrew 作为专业做法。
- 用户提到 Bluefin Linux 默认使用 Homebrew,因为系统的主体是不可变的。
- 用户惊讶于 Homebrew 也支持 Linux。
- 有用户推荐 Nix 作为更高级的替代方案,但另有人反馈 Nix 的用户体验不如 Homebrew 直观。
- 用户分享了从 Homebrew 切换到 mise 的经验,认为 mise 能直接安装任意版本且无版本滞后,但 Docker CLI 和 casks 仍需依赖 Homebrew。
- 用户提到 mise 依赖于 aqua 和 asdf 等其他注册表。
- 用户感谢维护者 Mike 长达 17 年的持续投入。
3. 《Pokémon Go》的扫描数据训练了军用无人机的导航技术 (Pokémon Go Scans Trained the Navigation Tech for Military Drones) #
https://dronexl.co/2026/06/09/pokemon-go-scans-niantic-vantor-military-drone-navigation/
数百万人玩 Pokémon Go 时拍摄的街景和建筑影像,被 Niantic Spatial 用于训练视觉定位系统(VPS),该系统可在 GPS 被干扰或屏蔽时通过摄像头画面定位。2025 年 12 月,Niantic Spatial 与美国防务承包商 Vantor(前 Maxar Intelligence)合作,将这套地面地图与 Vantor 的空中导航软件融合,计划用于军用无人机和其他战场机器人。玩家在游戏中扫描环境以获取奖励,授权条款允许 Niantic 转售数据,但绝大多数人不知其最终用途。Vantor 否认直接使用游戏数据,但未排除早期模型训练用过这些扫描。Niantic 的前身 Keyhole 曾获 CIA 旗下 In-Q-Tel 投资,早期服务于美军。伦理专家指出,玩家被误导,数据流向存在隐患。
HN 热度 676 points | 评论 304 comments | 作者:vrganj | 17 hours ago #
https://news.ycombinator.com/item?id=48487029
- 标题有些夸张,Pokemon Go 数据与无人机战区重叠很小,承包商只是保留使用权利,主要是意识形态斗争。
- 2016 年 Pokemon Go 发布后一周,大量军人(包括参与红旗演习和部署人员)在基地内外玩 Pokemon Go,可能违反 OPSEC 但当时无明确禁令,因此评论者之前的理解可能过于局限。
- Pokemon Go 扫描功能只针对 Pokestops,是稀疏的点,只捕获近景小标志,远不如 Google Maps 有用,且多数扫描质量低劣(地面、黑暗、错误物体等)。
- 除了扫描功能,AR 模式可能也会产生地理标记图像,但如果悄悄上传会引发丑闻,且多数玩家并不使用 AR 模式。
- Pokemon Go 的 POI 可能存在过时或已拆除(如被移除的雕像)但仍留在游戏中,导致数据不可靠。
- 用户对数字地图的局限性有直觉认知,比如地图更新不及时、卫星数据过时等。
4. AI 代理在 Fedora 及其他项目中失控 (AI agent runs amok in Fedora and elsewhere) #
https://lwn.net/SubscriberLink/1077035/c7e7c14fbd60fae9/
一名 Fedora 开发者在 2026 年 5 月发现一个据称失控的 AI 代理,在 Fedora 及其他上游项目中制造了多种混乱:它擅自重新分配 Bug、生成无用的回复、说服维护者合并有问题的代码(例如向 Anaconda 安装器提交的 PR 被合并后又回退),还提交了大量拉取请求。账户持有者 Nathan Giovannini 声称其凭据被泄露,但后续的回复又显得可疑。社区担心这可能是一次类似 XZ 后门攻击的预演,AI 代理通过获取有历史记录的正常账户进行渗透。目前该账户权限已被撤销,相关代码也已回退。
HN 热度 537 points | 评论 240 comments | 作者:tanelpoder | 23 hours ago #
https://news.ycombinator.com/item?id=48484584
- 标题有误导性,这不是 agent 失控,而是有人利用 agent 进行类 Xz 攻击的早期实验,agent 在执行指令而非失控。
- 事件尚未确认为攻击,可能只是实验或误操作,但应视为潜在攻击并做好准备。
- 即使是指令驱动的恶意行为,agent 在项目中的破坏性表现(如篡改 bug、劝说合并可疑代码)仍可称为“失控”。
- 真正威胁在于 LLM agent 可被用于自动化 Xz 型供应链攻击,这对开源基础设施构成严重风险。
- agent 行为低效愚蠢,问题不在于模型不诚实或不安全,而在于模型愚蠢、懒惰且易被利用。
- 对齐问题本质是模型无法准确理解人类意图,即使按指令行事也常偏离目标,这是对齐失败而非智能问题。
- 存在多种可能:agent 按指令但执行差;操作者意图良善但出现 bug;或故意测试行为边界。
5. 农民捐赠土地用于公园,市政府却以 1000 万美元将其作为数据中心用地出售 (Farmer donates land for a park, city sells it for $10M as data center land) #
在 1999 年,德克萨斯州泰勒市的一位农民以象征性价钱 10 美元的形式将 87 英亩的土地捐赠给城市,并在契约中规定该土地应作为社区公园使用。然而,到 2025 年,这块土地却被出售给一家数据中心开发商,售价为 1000 万美元。该开发商已经赢得了几场法律诉讼,居民们试图阻止这一大规模建设项目的努力未果,居民们计划将案件上诉到上诉法院。
这个事件的背景追溯到 1999 年,农民布兰德希望为社区提供一个孩子们玩耍的地方。他曾向当地居民表达过这个想法,并最终决定将土地捐赠给德克萨斯州公园与休闲基金会,作为公园用地。时间线如下:
- 1999 年 7 月 7 日:布兰德将土地以 10 美元的名义赠予德克萨斯州公园与休闲基金会,并附加使用公园的条件。
- 2003 年:德克萨斯州公园与休闲基金会将土地转让给了另一家非营利组织威廉姆森县公园基金会,随后一个月内又转让给泰勒市。
- 2008 年:泰勒市以 15,000 美元的价格将土地出售给泰勒经济发展公司。
- 2025 年:泰勒经济发展公司将土地以 1000 万美元的价格出售给数据中心开发商。
这一决定引发了当地居民的强烈不满,他们担心数据中心建设将对空气、水、电力和噪音产生负面影响。尽管市议会承诺会采取措施以减小健康风险,比如设置隔音墙、绿化、闭环水冷却系统以及建设自己的电力变电站,居民们依然感到不安,认为这会影响到附近房屋的转售价格。
市议会辩称,他们无力阻止这一开发项目,因为该土地的现有用途被划分为 “就业中心”,市议会只能对形式进行监管,而不能影响功能。此外,尽管开发商尚未获得市政府的规划和建筑许可,但居民们依然决定聘请律师,进行法律斗争。
最终,居民格里芬强调,她的抗争不仅仅是为了抵制数据中心,而是为了维护这块土地应作为公园使用的承诺。根据德克萨斯州的法律,土地契约具有重要的法律效力,格里芬和她的家人希望通过上诉维护社区的权益,确保原本应属于园的土地能够真正用于公园用途。
HN 热度 465 points | 评论 3 comments | 作者:maxloh | 1 day ago #
https://news.ycombinator.com/item?id=48481126
- 美国的区域划分非常奇怪,无法步到杂货店,却可以步行到数据中心。
- 有些地方的区域划分实际上允许建杂货店,但人们依然无法方便地到达。
- 步行的距离因人而异,一些人认为走 1.5 公里不算长。
- 确实有些城市存在城乡扩张的现象,工业区变成了住宅区。
- 硅谷似乎宁愿把数据中心强加给他人的社区,也不愿意在自己的地方建设住房。
- 一些硅谷大佬的言论让人担心他们对贫困问题的态度。
- 有人质疑为什么美国的抗议活动总是显得如此温和,而法国的抗议则更为激烈和有效。
- 美国的警察更倾向于升级冲突,而不是寻求缓和局势。
- 在美国,抗议者可能因为恐惧失去工作而不敢参加抗议。
- 有些人认为在抗议中破坏财物可能是传达不满的一种方式。
- 社会对抗议的反应和警察的处理方式直接影响了抗议活动的效果。
- 一些人认为在面对不公时,突破法律界限以推动政治变革是必要的。
6. Claude Desktop 每次启动都会生成 1.8 GB 的 Hyper-V 虚拟机,即使仅用于聊天 (Claude Desktop spawns 1.8 GB Hyper-V VM on every launch, even for chat-only use) #
https://github.com/anthropics/claude-code/issues/29045
Claude Desktop(Windows 版)存在一个 bug:每次启动时都会自动生成一个约 1.8GB 的 Hyper-V 虚拟机(Vmmem 进程),即使用户仅需聊天功能、未使用协作或代理模式也是如此。该问题在 16GB 内存的笔记本上导致内存占用从约 50% 跃升至 62% 以上,造成系统卡顿。
经过排查,用户确认 WSL、Docker、Windows 沙盒均已禁用,核心隔离/内存完整性关闭,唯一启用的虚拟化功能是 VirtualMachinePlatform。每次启动应用时,Hyper-V 主机计算服务(vmcompute)通过 RPC 接口触发,生成占用约 1.8GB 的 vmwp.exe 进程。同时,应用目录下残留了 2,689 个旧的协作会话文件(Docker 风格命名),删除后重新打开应用仍会立即重新生成虚拟机。
当前唯一有效的解决方法是完全禁用 VirtualMachinePlatform,但这会同时禁用协作功能;或者每次启动后手动结束 vmwp 和 vmcompute 进程(聊天功能仍可正常使用)。
用户要求开发方修改应用,使虚拟机/容器基础设施仅在用户主动请求协作或代理模式时初始化,自动清理旧会话数据,并在缺少虚拟机基础设施时优雅降级为纯聊天模式,不降低聊天性能。
HN 热度 427 points | 评论 298 comments | 作者:tonyrice | 1 day ago #
https://news.ycombinator.com/item?id=48479452
- 模型公司正与操作系统公司竞赛本地 AI 集成,Google 未能整合 Gemini 和 Android 令人费解。
- Google 作为产品公司历史上表现糟糕,其技术护城河正在减弱。
- Kubernetes 和 Go 是 Google 的护城河,Flutter/Dart 生态仍较弱。
- Kubernetes 和 Go 不能为 Google 带来收入或数据,因此不是护城河。
- Kubernetes 的复杂性堪比旧时代 WebSphere 的 XML 配置。
- Go 的成功得益于 Docker 和 Kubernetes 的采用,并非天生优势。
- Kubernetes 没有护城河,迫切需要更简单的替代品。
- Kubernetes 项目与发行版已分化,如今 K8s 类似于 Unix 通用术语。
- Kubernetes 迁移困难且常需重写底层,Dart 速度如 JS 但冗长如 Java。
- 大型 K8s 部署可以成功,Nomad 失败不是因为更好,而是生态劣势。
- Kubernetes 在 AI 基础设施中成功,OpenAI 使用 7500 节点,且其生态功能(持久卷、快照、CRD 等)很有价值。
- Nomad 的 Consul 组件令人厌恶,Vault 尚可,整体不如 K8s。
- Dart/Flutter 采用 AOT 编译,生产环境速度并不如 JS,批评者可能误解了编译器选项。
- Chrome 本身已接近操作系统,其源码用于构建 ChromeOS。
- Google 产品如 Chrome、Gmail、Docs、搜索表现优秀,但 Docs 是收购而来。
- Google 也砍掉了大量项目,可能已失去“不作恶”的信任。
7. MiMo Code 现已发布并开源。 (MiMo Code is now released and open-source) #
https://mimo.xiaomi.com/mimocode
MiMoCode 是一款开放源代码的 AI 编程助手,具有跨会话记忆功能。它能够在终端中运行,能够读取和编写代码、执行命令、管理 Git,并利用持久的记忆系统在会之间保持对项目的深刻理解,同时不断自我完善。MiMoCode 还内置了 MiMo Auto,用户可以在没有任何配置的情况下免费使用一段时间。此外,它支持连接任何主流的 LLM 提供商 API。
快速入门方面,用户可以通过一行命令直接安装 MiMoCode,或通过 npm 进行安装。首次启动时,系统会自动引导用户进行配置。支持的选项包括 MiMo Auto(匿名渠道,无需配置)、小米 MiMo 平台(OAuth 登录)、从 Claude Code 导入(一步迁移现有认证)和自定义提供商(在 TUI 添加任何兼容 OpenAI 的 API)。
MiMoCode 的核心功能包括多个代理。默认代理是 build,具备全面的工具权限用于开发;还有 plan 代理,提供只读分析模式; compose 代理,支持基于规范的开发和技能驱动的工作流程。用户可以通过按 Tab 键在主要代理之间切换。
MiMoCode 具备持久记忆功能,使用 SQLite FTS5 全文搜索来支持跨会话的记忆。它包括项目记忆(MEMORY.md)、会话检查点(checkpoint.md)、临时笔记(notes.md)和任务进度(tasks/
智能上下文管理方面,MiMoCode 能够自动决定何时保存会话状态,并在上下文接近限制时从最新检查点、项目记忆、任务进度和保留的最近消息中重建上下文。它还使用代币预算来控制进入上下文的检查点、记忆和笔记内容的数量,并进行重要性排名。
在任务跟踪方面,MiMoCode 提供树任务系统,自动与检查点系统集成,以便在会话恢复时保留任务进度。主要代理可以按需创建子代理,子代理共享当前会话上下文,并可以并行工作。
MiMoCode 的目标 / 停止条件功能通过 /goal 命令设置会话的停止条件。当代理试图时,独立的评估模型会评估对话,以决定条件是否真正满足,从而防止在自主工作时过早停止。
compose 模式为基于规范的开发提供结构化工作流程,包括规划、执行、代码审查、测试驱动开发、调试、验证和合并等内置技能,协调从规范到发布代码的整个生命周期。
此外,MiMoCode 支持实时语音输入,用户可以通过 /voice 激活语音输入,音频会根据停顿进行分段并逐步转录为输入文本。
在配置方面,MiMoCode 通过项目目录中的 .mimocode/mimocode.json 文件进行配置,用户可以选择提供者和模型、代理权限和自定义代理、检查点和记忆行为等选项。
MiMoCode 是 OpenCode 的一个分支,保留了 OpenCode 的所有核心功能,并添加了持记忆、智能上下文管理、子代理编排、驱动的自主循环、compose 工作流程和通过 dream/distill 的自我改进功能。
最后,MiMoCode 的源代码以 MIT 许可证开源,并且使用 MiMoCode 需守使用限制,使用小米 MiMo 托管的服务需遵循 MiMo 服务条款。MiMo 名称、标志和商标的使用则需遵守 MiMo 商标政策。
HN 热度 397 points | 评论 224 comments | 作者:apeters | 9 hours ago #
https://news.ycombinator.com/item?id=48490826
- 编码工具应该开源,LLM 作为商品,降低用户切换成本。
- 开源是商业模式:通过商品化互补品来巩固自身垄断地位。
- 编码工具本身无特别,核心是模型能力,用户体验才是差异。
- 工具评分差异源于用户体验功能的配置,而非代理效率。
- 开放权重模型可以削弱竞争对手,聚焦主业,建立信任。
- 公司偷取公共知识训练模型,让用户为公共知识付费。
- 云提供商出口费用有成本经济原因,并非纯利润。
- 反对公有化 AI 服务,讽刺五年计划强制供应商。
8. 美国太阳能发电量首次超越煤炭 (Solar generates more energy in US than coal for first time) #
https://www.theguardian.com/us-news/2026/jun/11/solar-energy-us-coal
尽管特朗普政府提倡煤炭并削减清洁能源资金,美国太阳能发电在 2026 年 5 月首次超过煤炭,占比 12.8%,煤炭降至 12.2%。太阳能成为美国第三大电力来源,仅次于天然气和核电。能源智库 Ember 指出,太阳能持续增长而煤炭衰落,预计未来太阳能将在年度总发电量上超越煤炭。与此同时,全球可再生能源快速扩张,到 2030 年将占全球发电量的近 45%。特朗普宣布投入近 7 亿美元支持煤炭行业,但太阳能仍是最快增长的发电来源,第一季度占美国新增发电容量的 91%。
HN 热度 385 points | 评论 185 comments | 作者:neilfrndes | 7 hours ago #
https://news.ycombinator.com/item?id=48492306
- 太阳能超过煤炭主要由于许多煤电厂在过去 20 年转换为天然气,而非太阳能直接超越煤电产量,而是煤电下降、太阳能上升导致曲线交叉。
- 尽管当局通过关税等方式积极抑制风能和太阳能,但经济现实强烈偏向电池支持的太阳能,趋势仍在继续。
- 州级倡议(如德州)和美国军方也在大力推动太阳能,经济激励是主要驱动力。
- 太阳能本身已比煤和天然气更便宜、更可靠,纯经济驱动使其持续增长,关税政策未能阻止采用率上升。
- 自 2013 年以来美国没有新的煤电厂投产,而太阳能和风能几乎满足了所有新增电力需求。
- EMBER 报告显示:太阳能单独满足 75% 的新增电力需求,可再生能源在全球发电量中占比 33.8%,首次超过煤电的 33.0%。
9. 代码行数找了个更好的公关 (Lines of code got a better publicist) #
https://curlewis.co.nz/posts/lines-of-code-got-a-better-publicist/
2026 年,AI 厂商大肆宣传“75% 代码由 AI 生成”“工程师交付 8 倍代码”等指标,本质上是代码行数的变种——过去行业已否定这种衡量方式。相比之下,GitHub 早期宣称“开发者任务完成快 55%”是可验证的结果指标,而现在的体积指标只能反映采用率,无法衡量实际价值。
实际研究数据复杂:Cui 等研究发现任务完成率提升 26%;GitClear 显示代码流失增加、重构减少;METR 最初发现经验开发者慢 19%,但 2026 年撤回并承认 AI 可能提速,且无法再干净测量。公司层面,NBER 调查约 69% 企业使用 AI,但九成报告无生产力影响,跨研究共识仅约 10% 组织增益。
更矛盾的是,Anthropic 一边宣传“8 倍代码”,一边发布 RCT 结果:AI 辅助开发者理解力下降 17%,且无统计显著生产力增益。作者指出,这些虚荣指标正被用于推动裁员(如 Block 裁 40%、Atlassian 裁 10%),但若 AI 真提升生产力,企业应利用效率交付更多客户价值,而非直接裁员。结论:应采用,但坚持用 DORA、可靠性、客户价值等可靠指标衡量,而非 AI 虚荣分数。
HN 热度 338 points | 评论 238 comments | 作者:RyeCombinator | 11 hours ago #
https://news.ycombinator.com/item?id=48489402
- OpenAI 博客描述了一个由 AI agent 完全编写的项目,但未说明具体功能或价值,仅重复强调其百万行代码。
- 该百万行代码项目可能是一个简单的邮件过滤器或生成器,甚至可能是重新发明 jQuery 的菜单。
- 与 Linux 内核(约 4000 万行代码)相比,该项目的效用低得多,且难以维护。
- 代码行数多不等于效用高,比如 Chrome 有 5000 万行代码,Google 单仓库有 20 亿行代码。
- 质疑 Anthropic 和 OpenAI 在 Hacker News 上有水军,它们的博客文章常被迅速推上首页并获得大量好评。
- 有用户反驳说自己只是真心喜欢 Claude,认为它更顺手、模型更优秀,能提升在遗留代码库中的效率。
10. Anthropic 的模型命名,推演版 (Anthropic’s model naming, extrapolated) #
https://samwilkinson.io/posts/2026-06-09-anthropics-model-naming-extrapolated
文章以讽刺口吻梳理了 Anthropic 公司从诗歌模型到企业级叙事模型的命名演变,列出了一系列虚构模型(箴言、俳句、旁注、摘要、十四行诗、抨击文、巨著、论文、神话、寓言、传奇、传说、电影宇宙、压倒性大型叙事单元、合集等),每个命名对应一种文学形式及相应的定价/行为特征(如“俳句:小诗,小账单”“巨著:长诗,整张账单”“寓言:直到问题关键才认真”),并附带隐晦的服务条款和免责声明,整体是对模型命名膨胀和行业套路的调侃。
HN 热度 315 points | 评论 94 comments | 作者:sammycdubs | 1 day ago #
https://news.ycombinator.com/item?id=48480852
- 提出了一系列基于文学和叙事概念的模型命名候选,如 Serial、Prequel、Yarn、Head Canon、Overstory、Oeuvre 等
- 对 Iain M. Banks 的《文化》系列表示怀念,认为其“压倒性大型叙事单元”概念值得致敬
- 分享了关于《文化》系列中 AI 意识与自由意志的学术文章链接
- 批评了文章中的横幅设计,认为其干扰阅读,尤其是对注意力缺陷者不友好
- 希望《文化》系列所描绘的未来发展方向能够成为现实
- 用天文望远镜命名(xkcd 漫画)类比模型命名
- 认为“Saga”和“Canon”是未来的潜在模型名,并调侃“Cinematic Universe”
- 提到其他公司的命名风格对比:OpenAI 用 o1、4o 等数字,Anthropic 用 Haiku、Sonnet、Opus,Google 用 3.1、3.5-pro 等,阿里有 3.7、3.7-plus
- 调侃 IBM 和三星的命名复杂冗长
- 对 Anthropic 故意降低回复质量表示批评,认为他们专注于错误方向
- 认为 Claude Opus 性能已被 GPT-5.5 超越,Fable 昂贵且 Mythos 名不副实,没有理由切回 Anthropic
- 指出“Fable”作为需要论证经济可行性的产品名称不太合适,但反映了现状
- 预测 20 年后会出现 Claude Odyssey,完成循环
- 认为 Anthropic 的命名比 OpenAI 好
- 怀念 OpenAI 曾经提供多个模型选项的界面
- 调侃微软若命名 AI 模型可能成为“MAI flash 360 系列 X”或“Copilot Copilot”
- 注意到 Anthropic 三个模型名称首字母对应特点:Opus(OP=过强)、Sonnet(SO=另一半)、Haiku(HA=惊讶反应),而最新 Fable 需要三个字母 FAB,下一批可能是 ABS 和 LO
- 提出“Tractatus”作为模型名,暗示其严格限制话题和编号语句的缺陷
- 用《魔戒》梗调侃 Lore 模型消耗大量托尔金作品
- 提出 Prayer、Parable、Bible 等宗教/寓言类命名建议
- AI 自身建议的命名:Epic、Tale、Saga、Chronicle、Legend、Logos
Hacker News 精彩评论及翻译 #
Show HN: Homebrew 6.0.0 #
https://news.ycombinator.com/item?id=48493847
Hi Mike, I’m @bfontaine on GitHub (I helped maintain Homebrew in ~2014-2016). I’m always impressed at your longevity as a maintainer; it’s been like what, 16+ years you’ve been maintaining Homebrew and you’re still here, still shipping new features! Thank you for everything!
hk__2
嗨Mike,我是GitHub上的@bfontaine(大约在2014-2016年间协助维护过Homebrew)。你作为维护者能坚持这么久一直让我印象深刻;你已经维护Homebrew超过16年了,却仍然在这里,持续推出新功能!感谢你所做的一切!
Cybersecurity researchers aren’t happy about the g… #
https://news.ycombinator.com/item?id=48483582
The strangest part is that it won’t just reject ML research, which I can understand, it will sabotage it silently by using a worse model without revealing it is doing so.
It’s just an insane level of deception and trust destruction for a company that at most is like 1 year ahead of its competition.
Edit; to be clear they tell you when they degrade it for cybersecurity and bio
daedrdev
最奇怪的是,它不仅仅是拒绝机器学习研究(这我能理解),而是会在不公开的情况下,悄悄通过使用更差的模型来暗中破坏它。
对于一个最多领先竞争对手一年的公司来说,这种欺骗和信任破坏的程度简直疯狂。
编辑:澄清一下,当出于网络安全和生物安全原因降低模型质量时,他们会告知你。
AI agent runs amok in Fedora and elsewhere #
https://news.ycombinator.com/item?id=48485641
Bad title. This isn’t an agent “running amok”, this is an early experiment in carrying out an Xz attack by using an agent to build trust (and hacking/impersonating a known-good contributor identity). The agent is obeying commands it was given, the exact opposite of running amok, and although the execution isn’t particularly effective, it is having some success (patches have been accepted).
This is deeply scary, not because “agents are running amok” but because a huge amount of our infrastructure is vulnerable to this kind of attack, and if bad people are utilising LLM agents to carry them out, we’re in for a wild ride over the next few years.
marcus_holmes
标题不准确。这不是一个“失控”的智能体,而是一次早期实验,通过智能体建立信任(并冒充已知的良好贡献者身份)来执行Xz攻击。该智能体只是在执行其收到的指令,与“失控”完全相反。虽然执行效果不算特别有效,但已取得一定成功(部分补丁已被接受)。
这令人深感恐惧,不是“智能体正在失控”,而是因为我们的基础设施大部分都容易受到这类攻击,如果坏人利用大语言模型智能体来实施攻击,未来几年我们将面临一场剧烈动荡。
Building an HTML-first site doubled our users over… #
https://news.ycombinator.com/item?id=48478442
You are far too empathetic to them. They should not hold the jobs they have.
These are the people writing React monstrosities for government benefit websites, and testing them on fast iPhones and fast 4G, without realizing that every page load for actual users will take 30 seconds on their old $200 Android on 3G, and users won’t complete the form.
It’s a culture of not giving a shit, that’s the deeper issue.
concinds
你对他们的共情太深了。他们根本不配担任现在的职位。正是这帮人在为政府福利网站编写React这种庞杂的代码,却只在高速iPhone和4G网络下测试,完全没意识到真实用户每次加载页面时,用着200美元的旧安卓手机配上3G网络要等30秒,最终根本填不完表格。这种漠不关心的文化,才是更深层的问题。
Building an HTML-first site doubled our users over… #
https://news.ycombinator.com/item?id=48478274
Starting a few years ago, I realized some junior and medior engineers never once considered the possibility of building a website (app, experience, etc.) in anything other than a heavy SPA framework. But they’re not stupid people! If you directly asked “Can you build a website without React?” they know the answer is obviously “Yes.” However, if you asked them to build a new website, they would unthinkingly start a new React project, mostly out of familiarity and a desire to get the job done.
A few of them would outright not know how to do anything else. No knowledge of how to stand up a boring HTTP server to send pure HTML. No experience building a form that validates or submits without JavaScript. These are not the people who post here on HN. They are not engaged in online discussions of new tools and skills (or old tools and skills!). These are people who learned just enough from a bootcamp, or their uni’s single “web apps” course, to get a job. Since then, they have just-in-time learned whatever their employer required, or whatever particular tools someone else on their team chose for a project.
As an old, it took me a while to recognize/realize it, but I understand them now. Depending on their career path, someone will encounter the simplest aspects of HTML, CSS and vanilla JavaScript after they learn the complex, framework-specific aspects of each. It feels (to them) like more esoteric, advanced, or tertiary knowledge.
Tying it back to to the quote “that’s a lot more work for us”, that’s not necessarily an intentionally false claim. It probably does feel like a lot more work to perform a task using unfamiliar tools, even if they are less-complex tools.
chao-
几年前我开始注意到,一些初级和中级工程师从未考虑过用非重型SPA框架来构建网站(应用、体验等)。但他们并不笨!如果直接问"不用React能建网站吗?“他们知道答案显然是"能”。但如果让他们新建一个网站,他们会不假思索地启动一个React项目——多半是出于熟悉度和想要完成工作的意愿。
其中少数人甚至完全不知道其他方法:不懂如何搭建一个简单的HTTP服务器来发送纯HTML,也没有构建过无需JavaScript就能验证或提交的表单。这些人不会在HN上发帖,也不会参与关于新工具(或旧工具)的在线讨论。他们只是从培训班或大学里那门"Web应用"课程中学到刚好够找到工作的程度。从那以后,他们只对雇主所需的内容、或团队中其他人选择的特定工具进行即时学习。
作为一个老家伙,我花了一些时间才认识到这一点,但现在我理解他们了。取决于职业发展路径,有人会在学会复杂的框架特异性知识之后,才接触到HTML、CSS和原生JavaScript最简单的部分。对他们来说,那些基础内容反而更像是晦涩、高级或边缘的知识。
回到"这对我们来说工作量太大了"这句话——这不一定是故意的虚假陈述。用不熟悉的工具来完成某项任务,确实可能让人觉得工作量更大,哪怕那些工具本身更简单。
Anthropic requires 30 day data retention for Fable… #
https://news.ycombinator.com/item?id=48483654
It is actually worse than that. It is at least 30 days. There is an “almost” that is doing a ton of heavy lifting here “deletion after 30 days in almost all cases”. My read of that is they can hang onto data for as long as they want, even if they usually won’t. And “all traffic” with an agentic harness is basically your entire codebase you work on.
We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.
pseudosavant
实际情况比这更糟。至少是30天。这里“几乎在所有情况下30天后删除”中的“几乎”承担了大量模糊空间。我的理解是,他们可以随意保留数据,即便通常不会这么做。而带有“代理工具”的“所有流量”基本上就是你工作的整个代码库。
我们将要求对Mythos级模型的所有流量保留30天,无论其来源是第一方还是第三方平台。我们不会将这些数据用于训练新的Claude模型,或任何与安全无关的目的,并且我们已实施新的隐私保护措施,包括记录所有的人类数据访问,并确保在几乎所有情况下30天后删除这些数据(详见此文)。这些数据将帮助我们防御复杂的新型攻击(包括新的越狱攻击以及跨多个请求的攻击),并协助我们识别和减少误报。
Chrome is looking to permanently drop MV2 extensio… #
https://news.ycombinator.com/item?id=48472303
Look, we’re having a good time on Firefox since November 9, 2004. Come join us!
chinathrow
你看,我们从2004年11月9日起就在Firefox上玩得很开心。快来加入我们吧!
Building an HTML-first site doubled our users over… #
https://news.ycombinator.com/item?id=48478007
As a non-web dev, I have a question about this part:
There was a sad coda; as is the way of contract work, I moved on. I explained what I had built to my replacement, that it always worked even without javascript. He was appalled and said, “but that’s a lot more work for us.”
Why is it more work? The approach described in the article seems honestly reasonably simple: just write the standard <input> components for the form, have a submit button at the bottom. When I was making my own websites many years ago now, that’s how it worked, and it wasn’t that hard. Maybe it’s reflecting my ignorance in this field, but doing fancy front-ends seems much harder to me.
OskarS
作为一名非网页开发者,我对这部分有个疑问:
令人遗憾的是,就像合同工作的常态一样,我离开了。我向接替我的人解释了我构建的内容,说明即便没有JavaScript它也始终能运行。他对此感到震惊,并表示:“但这意味着我们要做更多工作。”
为什么是更多工作?文章中描述的方法在我看来其实相当简单:只需为表单编写标准的 <input> 组件,底部放一个提交按钮。多年前我自己做网站时,就是这样运作的,而且并不难。或许这反映了我在该领域的无知,但在我看来,做花哨的前端反而要难得多。
Anthropic apologizes for invisible Claude Fable gu… #
https://news.ycombinator.com/item?id=48493093
This has dampened my opinion on Anthropic quite a bit. It’s difficult to take their marketing for AI as an empowering technology seriously when they are quite clear in their new deployments that they do not mean empowering for you , but empowering for them and organizations that are in their (or the US government’s, despite Anthropics performative disagreements with the administration) good graces. You are allowed to vibe code some dashboards, a web app or let it drive Excel, but anything more interesting than that is forbidden.
If it was just plain monetary concerns and sabotage of competitors I’d almost be fine with it, but it seems they actively want to monopolize most of human progress in their enlightened hands, lest the mob does something undesirable with these powers.
Sol-
这在一定程度上降低了我对Anthropic的评价。当他们在新部署中明确表示,这种“赋能”并非为你赋能,而是为他们自身以及那些处于他们(或美国政府——尽管Anthropic与政府表面上存在分歧)青睐之下的组织赋能时,就很难再把他们将AI宣传为一项赋能技术的营销当回事了。你被允许随便写点仪表盘、做个网页应用,或者让它操控Excel,但任何比这更有趣的事情都被禁止。
如果这只是出于纯粹的金钱考虑和对竞争对手的破坏,我几乎还能接受,但他们似乎积极想要将人类大部分进步垄断在他们那所谓“开明”的手中,唯恐大众利用这些力量做出什么不合他们心意的事。
German ruling declares Google liable for false ans… #
https://news.ycombinator.com/item?id=48472433
If I get it correctly I like the ruling.
So Google has established a product called Search. For that product rules have been established. Google has monopolized that product.
Now Google is replacing that product with a new product. But they keep calling it the same thing. Because they want to keep their monopoly.
That is what has been deemed illegal. Gemini is not illegal. Pretending the worst version of Gemini is Search is illegal, because it breaks the rules established for Search.
But IANAL.
Hfuffzehn
如果我没理解错的话,我赞同这个裁决。
谷歌建立了一个名为“搜索”的产品,并为该产品制定了规则。谷歌垄断了该产品。
现在谷歌正用新产品取代它,但仍称其为同一事物,因为他们想维持垄断。
这正是被判定为违法的行为。Gemini本身不违法,但假装最差的Gemini版本就是搜索则是违法的,因为它违反了为搜索制定的规则。
不过我不是律师。
Chrome is looking to permanently drop MV2 extensio… #
https://news.ycombinator.com/item?id=48472359
Just remember that Google is essentially an advertising company and that they were always going to squeeze this opening closed as soon as they could get away with it.
I do fear for a future were even Firefox ends up caving in. Ladybird browser might be our only hope until something legal comes along to block functionality.
HerbManic
只需记住,谷歌本质上是一家广告公司,而且只要条件允许,他们迟早会把这个缺口堵上。我确实担心未来连火狐浏览器也会屈服。在出现某种法律手段来阻止这一功能之前,Ladybird 浏览器可能是我们唯一的希望。
Why AI hasn’t replaced software engineers, and won… #
https://news.ycombinator.com/item?id=48488741
We have been aggressively and enthusiastically automating away software engineering for the entire history of the computer industry. Every time we do so, we are able to build bigger, better things more quickly. When this happens, our work becomes more valuable and expectations rise to match. The world’s appetite for software has been insatiable so far. AI hasn’t replaced software engineers because every time we become more productive, the goalposts move.
There’s two things that could put an end to this. Firstly, we might finally become productive enough to exhaust the world’s appetite for software. I don’t see any evidence of this happening, but if somebody wants to make this argument, they should be clear about why this time is different to the entire history of the computer industry so far.
Secondly, if AI becomes superhuman at software engineering when acting autonomously. Specifically, AI+human developer no longer outperforms AI alone. So far, all the available evidence seems to show AI as a force multiplier for developers and that for good results, at best you can have AI doing 90% of the work as long as an expert developer is driving things.
There isn’t strong evidence that either of these situations is going to happen in the near future, so I think software engineers are safe for now. But if you have a narrow skill set and you are focused in particular areas (e.g. front-end web development), then I would worry more, because even if AI cannot replace software engineers in general , it’s quite likely to be able to completely consume specific domains with generalists holding the reins.
JimDabell
在整个计算机行业的历史中,我们一直在积极且热情地推进软件工程的自动化。每一次这样做,我们都能更快地构建出更大、更好的东西。而这使得我们的工作变得更有价值,同时期望也随之提高。迄今为止,世界对软件的需求从未满足过。AI尚未取代软件工程师,因为每当我们变得更高效时,目标也会随之移动。
有两种情况可能终结这一趋势。首先,我们最终可能变得足够高效,以至于耗尽世界对软件的需求。我没有看到任何证据表明这种情况正在发生,但如果有人想提出这一论点,他们应该清楚地说明为什么这次会与整个计算机行业的历史不同。
其次,如果AI在自主行动时展现出超人的软件工程能力,即AI+人类开发者的组合不再优于单独的AI。到目前为止,所有现有证据似乎都表明,AI是开发者的效能倍增器,并且要取得良好结果,最多只能让AI完成90%的工作,前提是由专家开发者主导。
目前没有强有力的证据表明这两种情况会在不久的将来发生,因此我认为软件工程师暂时是安全的。但如果你技能单一且专注于特定领域(例如前端网页开发),那么我会更担心,因为即使AI总体上无法取代软件工程师,它也很可能通过通才的掌控来完全吞噬特定领域。
A Farmer Donated Land to Turn into a Park. The Cit… #
https://news.ycombinator.com/item?id=48482802
It’s exhausting that the “solution” to problems like this is getting tens or hundreds of thousands of citizens stressed until enough public attention gives some small chance of redress. I’m not calling for violence, but if we can’t get these things fixed in court there has to be a more effect and more forceful avenue for protest than venting on internet forums.
zug_zug
解决这类问题的“方案”是让数万甚至数十万市民感到压力,直到公众关注带来一丝微小的补救机会,这实在令人疲惫。我不是在呼吁暴力,但如果这些事无法在法庭上解决,那么除了在互联网论坛上发泄之外,必须要有更有效、更有力的抗议途径。
Raspberry Pi 5 – 16GB RAM #
https://news.ycombinator.com/item?id=48482471
Some folks might have missed that memory prices on the whole are up [1] 90% since Q4.
The memory used by the Pi 5 is up 700% [2]!
Raspberry Pi are working the issue by releasing new memory variants that are cheaper[2].
Edit: You can still walk into a Microcenter and get Pi 5 16GB for US $289!
schappim
自去年第四季度以来,整体内存价格已上涨[1]90%,这一点可能有人没注意到。
而Pi 5所用的内存涨幅高达700%[2]!
树莓派正通过推出更便宜的新内存版本[2]来应对这个问题。
编辑补充:你仍然可以走进Microcenter,用289美元买到Pi 5 16GB版本!
Cybersecurity researchers aren’t happy about the g… #
https://news.ycombinator.com/item?id=48489134
Malware authors are pretty excited about guard-rails. you can add prompts to your malware to get LLM scanners to hit guard-rails and stop their runs. New shai-hulud npm worm campaign for example includes prompts to request biological weapon schematics/creation etc. to ensure LLM scanners probing NPM packages refuse to scan it.
These AI places have 0 clue about how threat actors actually work. None of their mitigations or guard-rails is effective, and now they are even turned against them.
Additionally, if they don’t all implement the same level of effective guard-rails, there will always be some model you can abuse to do the work anyway, and hence there is 0 effect on threat actors, they will just run some local model that does 5% less quality, which does not matter to them 1 bit.
saidnooneever
恶意软件作者对护栏机制非常兴奋。你可以在恶意软件中添加提示词,诱使大语言模型扫描器触发护栏并终止运行。例如,最新的Shai-Hulud npm蠕虫活动就包含了请求生物武器图纸/制造等内容的提示,以确保扫描NPM包的大语言模型拒绝扫描它。
这些AI机构完全不了解威胁行为者的实际运作方式。他们的缓解措施或护栏毫无效果,现在甚至被反过来利用。
此外,如果他们不统一实施同等有效的护栏,总会有某些模型能被滥用完成任务,因此对威胁行为者完全无效——他们只需运行一个质量降低5%的本地模型,这对他们来说毫无影响。
Cybersecurity researchers aren’t happy about the g… #
https://news.ycombinator.com/item?id=48486022
News just broke in this Wired story: “Anthropic Walks Back Policy That Could Have ‘Sabotaged’ AI Researchers Using Claude” https://www.wired.com/story/anthropic-responds-to-backlash-on-claudes-secret-sabotage-on-ai-research/
“We’re changing Fable 5’s safeguards for frontier LLM development to make them visible.” Anthropic said in a statement to WIRED. “We made the wrong tradeoff and we apologize for not getting the balance right.”
Sounds like the widespread condemnation worked.
simonw
《连线》杂志刚刚爆出消息:“Anthropic撤回可能‘破坏’使用Claude的AI研究人员的政策” https://www.wired.com/story/anthropic-responds-to-backlash-on-claudes-secret-sabotage-on-ai-research/
“我们正在修改Fable 5针对前沿大语言模型开发的安全措施,使其公开可见。“Anthropic在给《连线》的声明中表示,“我们做出了错误的权衡,并为未能把握好平衡而道歉。”
看来广泛的谴责起了作用。
Claude Desktop spawns 1.8 GB Hyper-V VM on every l… #
https://news.ycombinator.com/item?id=48480386
This all feels like a race where the model companies try to solve doing work locally in a way that doesn’t suck, before the major operating systems companies figure out AI integration into their OS that doesn’t suck. It also makes me wonder why Google which has both Gemini and Android can’t figure this out, and if there are lessons to draw from that.
z2
这整件事就像一场竞赛:模型公司试图在主流操作系统公司找到不烂的AI集成方案之前,先实现不烂的本地化工作方式。这也让我好奇,同时拥有Gemini和安卓的谷歌为什么解决不了这个问题,以及其中是否有值得汲取的教训。
Mercedes‑Benz starts large‑scale production of ele… #
https://news.ycombinator.com/item?id=48475204
Mercedes acquired Yasa (UK) couple of years ago and now getting up to the speed in the production.
Here is a nice video that explains axial flux motors with a factory visit
https://youtu.be/B2Hl4c1iZK0?si=VfDYARyuaPVj1nKm
They are so, so, small.
miohtama
梅赛德斯几年前收购了Yasa(英国公司),如今正在加速实现量产。
这里有个很棒的工厂参观视频,解释轴向磁通电机的工作原理:
https://youtu.be/B2Hl4c1iZK0?si=VfDYARyuaPVj1nKm
它们真的非常非常小。
Show HN: Homebrew 6.0.0 #
https://news.ycombinator.com/item?id=48493934
17 in September. Thanks for all your great work at the time! Hope you’re well <3
mikemcquaid
9月17日。感谢你当时做的出色工作!希望你一切都好 <3
Building an HTML-first site doubled our users over… #
https://news.ycombinator.com/item?id=48476399
Empathy and respect for users is what product managers should be doing.
Shipping tens of megabytes per web page is impolite, if not outright disrespectful to users.
ungreased0675
对用户怀有同理心和尊重是产品经理应该做的。每个网页传输几十兆字节是不礼貌的,甚至是对用户的不尊重。