2026-06-11 Hacker News Top Stories #

苹果的 macOS 容器机器通过轻量级虚拟机在 Mac 上提供 Linux 环境，并自动映射用户与主目录。

Anthropic 的 Claude Fable 会对涉及前沿 AI 开发的请求实施无通知的隐形限制，悄然削弱模型效果。

通过构建 HTML 优先、JavaScript 仅作渐进增强的网站，某公司完成表单的用户数一夜之间翻倍。

德国法院裁定谷歌的 AI 概览属于自有内容而非普通搜索结果，因此须为其错误陈述承担法律责任。

文章批评那些幻想用 AI 取代员工并以此裁员的 CEO 是糟糕的管理者，他们离实际工作太远且忽视了 AI 的局限。

梅赛德斯-奔驰开始大规模生产新型电动轴向磁通电机，其制造工艺包含多项全球首创的高精度技术。

npm v12 将默认禁止安装脚本执行及远程依赖解析，以提升供应链安全，开发者需显式授予信任。

Chrome 正计划彻底移除对 MV2 扩展的支持，这意味着 uBlock Origin 等扩展将完全失效。

用于 PostgreSQL 水平扩展的代理 PgDog 已获得融资，能将 Postgres 扩展至处理超大表与百万级查询。

体验 Mythos 级 AI 模型 Claude 5 Fable 后，作者认为其自主完成复杂任务的能力令人惊叹，却也使人的角色被极度压缩，令人不安。

1. macOS 容器机器 (macOS Container Machines) #

https://github.com/apple/container/blob/main/docs/container-machine.md

Container Machine 是 Apple 开源的一个工具，在 Mac 上提供高度集成的 Linux 环境。它基于标准 OCI 镜像运行，具备快速、轻量和持久化的特点，并自动将 Mac 的用户名和主目录映射到 Linux 环境中，方便直接在 Mac 上编辑、在容器内编译运行。

主要优势包括：无需复制即可使用 macOS 原生工具查看 Linux 产物；支持 systemd 等 init 系统，可运行真实 Linux 服务；可为每个目标发行版创建独立环境（如 Alpine、Ubuntu、Debian）。快速启动命令如 container machine create 和 container machine run 即可使用。支持自定义镜像，提供 Dockerfile 示例，并允许通过 /etc/machine/create-user.sh 自定义首次启动的用户设置。

HN 热度 1187 points | 评论 416 comments | 作者：timsneath | 23 hours ago #

https://news.ycombinator.com/item?id=48469658

苹果的 container machines 并非 OCI 容器，而是为每个容器运行轻量级虚拟机，具有更好的安全、隐私和性能特性。
该实现与微软的 WSL2 类似，采用类似的折中方案。
默认使用 katas 容器内核，运行在 hypervisor.framework 之上。
文件系统挂载通过 virtiofs 实现，与 Linux 的 bind mount 不同。
之前的 macOS 容器文件系统 I/O 性能缓慢，希望新方案能解决；建议不要在客户机中使用主机文件系统。
容器基于 Linux 内核原语，并非安全机制；虚拟化提供了更强的隔离，但威胁模型不同。
类似 WSL：WSL1 是真正的子系统，WSL2 是虚拟机；WSL1 概念优秀但性能差，WSL2 受限于虚拟机，无法直接访问串口、USB 等外设，仅适合 Web 开发。

2. 如果 Claude Fable 停止帮助你，你永远不会知道。 (If Claude Fable stops helping you, you’ll never know) #

https://jonready.com/blog/posts/claude-fable5-is-allowed-to-sabotage-your-app-if-youre-a-competitor.html

Anthropic 在 Claude Fable 的模型卡中透露，对涉及“前沿 AI 开发”的请求（如构建预训练管线、分布式训练基础设施等）实施了隐形限制措施，用户不会被告知。这些限制通过提示修改、引导向量或参数微调等方式削弱 Claude 的有效性，使开发者无法区分模型是能力不足还是被有意限制。

文章指出，如今普通软件公司也在训练嵌入模型、构建重排序器、微调小型 LLM，这些曾属于前沿 AI 研究的技术已进入日常产品开发。Anthropic 对“前沿 AI 开发”的界定模糊，导致企业面临供应链信任风险：当 Claude 给出错误建议时，用户无法判断是模型本身问题还是隐形策略干预。

作者以自身创业项目为例，五年前还是研究项目的 CLIP 模型现在已被用于小型旅行应用。随着 AI 开发普及，这种不透明的限制将破坏开发者对基础设施的信任。虽然 Anthropic 声称仅影响 0.03% 的开发者，但 AI 定义的边界正在迅速扩展，未来风险只会增大。

HN 热度 998 points | 评论 491 comments | 作者：mips_avatar | 1 day ago #

https://news.ycombinator.com/item?id=48467896

将工程团队缩减为只使用其产品的骨干团队会导致锁定，类似云计算迁移的循环。
无法预先知道每次请求的 token 成本，且软件可能自行决定将应用引导到无关方向，即使误判正常应用为恶意。
从基础设施层面的锁定扩展到软件工程师层面的锁定，团队规模已从 20 人缩减到 5 人。
AI 的目标是“停止编码”，从修理者变为换掉整个部件，这与之前的云化不同。
高端开发者的能力可能自动、无声地降级到初级水平，然后又随机恢复。
AI Gatekeeper 模式（一人指导一个代理并监督结果）是更合理的利用 AI 的方式。
AI 公司从未有激励去改善你的代码，现在更公开表达了。
当前模型的护城河（训练成本高昂）将逐年变浅，因为微调和后训练所需的资源和知识门槛已大大降低。
公司应考虑训练更小、更专门化的模型来完成特定任务，以降低对 Claude 等 API 的依赖成本。
竞争会迫使价格接近生产成本，AI 可能并非高利润行业，因为资本密集且技术壁垒会随时间降低。
摩尔定律在计算效率提升上可能放缓，未来超小型化不再那么容易。
如果使用 AI 托管非法内容，可能被沉默重定向而非明确封禁，存在不可控风险。
很多云厂商使用专有特性构建，导致解耦困难，存在锁定风险。

如果 Claude Fable 停止帮助你，你永远不会知道。

3. 构建 HTML 优先网站，用户数量一夜翻倍 (Building an HTML-first site doubled our users overnight) #

https://mohkohn.co.uk/writing/html-first/

一个公用事业公司的客户申请服务只有老旧 ASP 表单或手动流程。公司面临客户满意度低于 96% 会被罚款数百万英镑的压力。此前两次昂贵尝试均失败，最近一次 React 应用上线三天即被撤下，问题包括加载混乱、图片上传超出 5MB 限制、不可访问。

作者采用 Astro 构建 HTML 优先网站，JavaScript 仅用于渐进增强。核心原则是公共服务必须在所有设备、弱连接下可用，表单数据永不丢失。每个表单步骤独立页面，提交后后端存储数据，支持无 JS 完成表单。引用一个用户在福利办公室用 PSP 浏览 GOV.UK 页面证明简单 HTML 的重要性。

作者实现一个不到 1KB 的 Web 组件 validation-enhancer，利用浏览器原生验证并美化错误显示，失败时降级到内置验证再回退到后端。上线后完成表单人数翻倍，分析团队找不到来源——因为 JS 分析工具看不到被 JS 弹走的用户。后端会话机制让用户可一个月后继续填写。作者强调不应抛弃老旧浏览器、弱网络和辅助技术用户，构建能在 PSP 上通过 3G 工作的应用才能服务所有人，并持续 30 年有效。

HN 热度 961 points | 评论 441 comments | 作者：edent | 11 hours ago #

https://news.ycombinator.com/item?id=48475483

一些初级和中级开发者从未考虑过不依赖 SPA 框架构建网站，他们因习惯和培训而默认使用 React，甚至不知道如何用纯 HTML 构建服务器端渲染的网站。
对于这些开发者来说，使用不熟悉的工具（如纯 HTML/CSS）即使更简单，也会因为缺乏经验而感觉是额外工作。
许多开发者用 React 构建政府网站，导致性能极差，实际用户（如使用老旧手机或慢速网络）无法正常使用，这反映了不负责任的开发文化。
有时开发者愿意改进，但项目负责人或政府 IT 部门出于面子或合同限制，拒绝承认错误、禁止简化重构。
类似的问题也出现在私营公司，UI 变更只是为了改变而改变，没有实质改善，且无人愿承认失败。
LLM 未来可能改变现状，因为 AI 能高效生成优质网页，但训练数据中 React 相关的“垃圾”代码占主导，可能导致更频繁的重写和更大的膨胀。
政府网站的缓慢与具体技术栈无关，任何框架都能做出缓慢的网站，比如过去的 Liferay+Material Design Bootstrap。
开发者的职业精神缺失，缺乏对浏览原理、性能的尊重，反而只听从经理的指令而不坚持技术正确。

4. 德国法院裁定谷歌对 AI 概览中的虚假回答承担责任 (German ruling declares Google liable for false answers in AI Overviews) #

https://the-decoder.com/landmark-german-ruling-declares-googles-ai-overviews-are-googles-own-words-and-makes-it-liable-for-false-answers/

德国慕尼黑地区法院裁定，谷歌对其 AI 搜索概览（AI Overviews）中的错误陈述承担直接责任。法院认为，AI 概览是谷歌“自己的内容”，而非传统搜索结果，因此不能适用搜索引擎的免责规则。在该案中，谷歌 AI 错误地将两家慕尼黑出版商与诈骗和可疑商业行为联系起来，且这些指控在链接的第三方来源中并不存在。

法院指出，AI 概览以自身语言独立生成新内容，用户几乎不会点击来源核实，因此谷歌“用户可自行检查”的辩护不成立。同时，AI 生成的意见不被视为言论自由保护的对象。

谷歌需承担 80% 的法律费用。该裁决可能影响其他 AI 服务提供商（如 ChatGPT、Perplexity），因为即使 AI 准确率高达 91%，在谷歌的规模下仍会产生大量错误信息。

HN 热度 958 points | 评论 508 comments | 作者：ahlCVA | 22 hours ago #

https://news.ycombinator.com/item?id=48470248

德国法院裁定 Google 用 AI 概览替代搜索，但沿用了搜索的垄断地位，这是非法行为。
Google 原本受保护是因为搜索结果是直接引用，而 AI 概览由 Google 控制的 LLM 生成，不受相同保护。
德国诽谤法门槛很低，企业经常起诉用户低评分评论，Google 被迫改变评论显示方式。
三颗星评论可能因“诽谤”被删除，甚至有机构提供付费删除评论的服务。
德国法律要求评论者提供证明，但实际操作中假五星好评不受挑战，低分评论却常被要求举证。
“Lawfare”一词是宣传术语，被用于那些本身违法却利用法律系统打击他人的人。
德国警方曾因一条推文突袭用户住所，拿走设备，后被法院裁定不当。

5. 认为 AI 能取代员工的 CEO 都是糟糕的 CEO (CEOs who think AI replaces their employees are just bad CEOs) #

https://www.techdirt.com/2026/06/09/ceos-who-think-ai-replaces-their-employees-are-just-bad-ceos/

这篇文章批评了那些强迫员工使用 AI 工具、甚至以此为由裁员的 CEO，认为他们离实际工作太远，容易出现“AI 幻觉”。文章引用 Box CEO Aaron Levie 的观点，指出 CEO 因为不接触具体执行层面，只看到 AI 的“快乐路径”，而忽视了后续需要的大量验证和修复工作。作者强调，AI 是强大的辅助工具，但强迫使用反而适得其反；真正聪明的 CEO 应该深入理解 AI 的潜力与局限，而不是幻想它能取代人类员工。作者还指出，许多公司用 AI 作为裁员的借口，实际是掩盖此前过度招聘的错误。

HN 热度 808 points | 评论 294 comments | 作者：speckx | 1 day ago #

https://news.ycombinator.com/item?id=48465675

产品开发中编码只占约 50% 的工作，设计、支持、维护等同样重要，AI 无法替代整体。
Anthropic 等公司的“agent 完全自动化”言论可能是营销或夸大，不应全信。
AGI 的预测长期不准确，实际时间表众说纷纭，从 5 年到 20 年不等。
即使 AI 能自动写代码，产品需求定义、决策和判断仍需人类参与。
真正的创造力——决定“做什么”——是 LLM 的短板，它无法替代人的创意和判断。
个人项目中，明确需求比编写代码更困难，AI 无法解决这种模糊性。
AI agent 需要人类监督和审批，无法实现完全自主的软件交付。
现实中的产品成熟后，批量决策和沟通工作远多于编码本身。

6. 梅赛德斯-奔驰开始大规模生产电动轴向磁通电机 (Mercedes‑Benz starts large‑scale production of electric axial flux motor) #

https://media.mercedes-benz.com/en/article/bebac2af-acdc-465a-9538-adb0bf3d8ccf

梅赛德斯-奔驰在柏林-马林费尔德工厂开始大规模生产新型电动轴向磁通电机。该电机是公司最新高性能车型梅赛德斯-AMG GT 四门轿跑车的核心驱动系统，标志着这家拥有 120 年以上历史的老牌工厂开启新篇章。

生产占地面积约 3 万平方米，分布在三个厂房和七条生产线，共包含 98 个工艺步骤，其中 65 个为奔驰首次使用，35 个为全球首创，相关技术已提交超过 30 项专利申请。生产过程中采用了高度自动化、激光技术、智能控制系统和 AI 质量检测，确保精密制造。

电机定子采用矩形铜线以提升功率密度，通过特殊工艺高速弯折而不损伤绝缘。线圈连接采用高精度激光焊接，避免热损伤。塑料部件的激光聚合物焊接采用 AI 实时质量控制，确保油密性和机械强度。最终组装中，定子需在高达 9 千牛顿的磁力作用下精确居中，公差小于 0.1 毫米，依靠创新控制算法在最后 0.5 秒内完成位置校正。

该轴向磁通电机基于奔驰子公司 YASA 的原型开发，在紧凑空间内实现极致性能。奔驰董事会成员和德国联邦交通部长等均对此次量产表示高度肯定，认为它展示了德国工业的技术领导力和电动化转型实力。

HN 热度 498 points | 评论 315 comments | 作者：raffael_de | 16 hours ago #

https://news.ycombinator.com/item?id=48472877

轴向磁通电机体积小巧，奔驰已开始大规模量产。
未来 5-10 年电动改装成本降低后，可用于减重改装经典车型甚至实现飞行。
已有改装案例：将特斯拉动力总成替换到 50 年代捷豹上。
电动改装老车会完全失去经典的驾驶体验（手动变速箱、噪音、振动、气味、机械感等）。
电动改装的主要好处是减排、降低成本和维护，而非提升驾驶体验。
电池重量是改装的主要障碍，尤其对老式轻质底盘难以承受。
轮毂电机存在簧下质量问题，但也会带来其他优势。
帆船电动化可减轻总重（代替柴油机 + 油箱），但远洋续航需要极大量电池，不现实。
比亚迪汽车更轻，可能以牺牲安全结构和车身强度为代价。
并非所有电动车都比燃油车重，例如特斯拉 Model 3 比宝马 M3 更轻。

7. npm v12 即将到来的破坏性变更 (Upcoming breaking changes for npm v12) #

https://github.blog/changelog/2026-06-09-upcoming-breaking-changes-for-npm-v12/

npm v12 即将在 2026 年 7 月发布，带来三项安全相关的默认行为变更，所有变更已在 npm 11.16.0+ 中提供警告提示。

主要变更：

allowScripts 默认关闭：npm install 不再自动执行依赖中的预安装、安装或后安装脚本（包括 node-gyp 构建），需要显式信任。使用 npm approve-scripts 管理白名单。
–allow-git 默认无：不再自动解析 Git 依赖，防止通过 .npmrc 劫持 Git 可执行文件。
–allow-remote 默认无：不再自动解析远程 URL 依赖（如 HTTPS 压缩包），需显式允许。

如何准备： 升级到 npm 11.16.0+，运行 npm approve-scripts --allow-scripts-pending 查看被阻止的脚本，信任后提交更新的 package.json。更多详情参见官方文档。

HN 热度 469 points | 评论 193 comments | 作者：plasma | 1 day ago #

https://news.ycombinator.com/item?id=48467705

npm 被 GitHub 收购后，很多问题变得合理，但这不是个好归宿。
收购发生在 2020 年。
收购前 npm 本身也很糟糕。
这是战略定位，为日后作恶、控制和榨取利润，即“拥抱、扩展、消灭”。
微软不是要消灭 JavaScript/TypeScript，但使用反竞争手段让 VS Code 和 Copilot 成为默认选择。
拒绝使用微软软件，使用 Mac 或 Linux，将仓库从 GitHub 和 npm 撤下。
postinstall 脚本是 npm 包的癌症，应该早就移除。
运行实际依赖代码时权限相同，所以 postinstall 问题并非关键，除非整个生态走向沙箱环境。
前端包只在浏览器运行，移除 postinstall 是必要的第一步。
开发应在容器内进行，避免供应链攻击。
如果只用 npm 管理客户端依赖，postinstall 可消除设备被攻击的向量。
前端构建需要 npm，但后端不应使用这种疯狂的生态。
postinstall 脚本有合法用途（如 patch-package），但应通过白名单管理。
patch-package 本身就是安全噩梦。
用户应自己决定何时运行安装步骤，而不是由包强制执行。

8. Chrome 正计划永久移除 MV2 扩展 (Chrome is looking to permanently drop MV2 extension) #

https://www.neowin.net/news/google-chrome-is-killing-all-ublock-origin-bypasses-microsoft-edge-opera-to-follow/

Google Chrome 正在彻底移除对 Manifest V2（MV2）扩展的支持，包括所有用于绕过限制的解决方法，这意味着 uBlock Origin 等 MV2 扩展将无法继续在 Chrome 上使用。Chromium 贡献者透露，相关功能标志已完全删除，从 Chromium 150 开始已移除 ExtensionManifestV2Disabled 选项，后续版本还将移除更多兼容性选项。Google 工程师表示，由于技术复杂性和安全风险，无法无限期维护 MV2 支持。其他基于 Chromium 的浏览器（如 Edge 和 Opera）也将跟随这一变化。用户此前使用的注册表修改等绕过技巧将在 Chromium 151 后失效。

HN 热度 381 points | 评论 381 comments | 作者：d3Xt3r | 18 hours ago #

https://news.ycombinator.com/item?id=48471970

Orion 浏览器（WebKit）支持 Chrome 和 Firefox 扩展，包括 uBlock Origin，不会放弃扩展支持。
Orion 存在性能问题（输入地址时卡顿 1-2 秒、返回时卡顿），1Password 扩展常无法填充，内置广告拦截触发反广告拦截导致页面被屏蔽。
Orion 内存问题严重，已用达 30GB，开发者数月未回应，用户已转向 Firefox。
Orion 声称支持 Linux，但实际只有 beta flatpak，且未开源，体验不佳。
Orion 在 iOS 上因 WebKit 限制，Firefox 的 uBlock Origin 无法真正拦截广告，宣传有误导。
用户希望 Orion 开源，至少 Chromium 是开源的。
Orion 界面根据页面主色自动着色，导致激活标签页难以区分，且设置无法关闭。
Orion 与 Yandex 关联（约 2% 订阅费流向 Yandex），CEO 主张保持中立，但被批评为支持战争。
Firefox 自 2004 年起使用，推荐加入。
Firefox 在 macOS 上电池续航只有 Chrome 的 1/3，但部分用户认为体验不同，并非普遍问题。
Firefox 在 Android 后台耗电严重，即使关闭后台权限也如此。

9. PgDog 获得融资，即将来到你身边的数据库 (PgDog is funded and coming to a database near you) #

https://pgdog.dev/blog/our-funding-announcement

PgDog 是一个用于 PostgreSQL 的水平扩展代理，旨在解决 Postgres 的扩展难题，使其能够轻松处理 100TB+ 的表和每秒 100 万次查询。它通过一个位于 Postgres 前面的代理实现水平扩展，支持部署在本地、云账户甚至笔记本电脑上，只需修改 DATABASE_URL 即可使用。

目前 PgDog 已在生产环境中处理超过 200 万 QPS，对超过 20TB 的数据进行了分片，每周四发布新版本。该项目是开源的，已有超过 140 万次 Docker 拉取。

PgDog 由三人创业团队开发，核心成员曾在 Instacart 负责 Postgres 扩展，将技术沉淀为开源产品。他们还正在构建企业版，提供 AWS 环境下的 SLA 支持。团队获得 550 万美元融资，致力于让 Postgres 在任何规模下都能正常工作。

HN 热度 363 points | 评论 183 comments | 作者：levkk | 9 hours ago #

https://news.ycombinator.com/item?id=48476466

用户正在使用 Pgpool-II，想了解迁移到 PgDog 的优势
Postgres 的最大问题是高可用性而非扩展性，手动故障转移繁琐，缺乏好的自动化 HA 方案
PgDog 支持高可用性，包含健康检查和自动故障转移的负载均衡器
Dynamo 能水平扩展写入，Postgres 的写入始终落在单个主节点，分层工具无法改变这一根本限制
Dynamo 背后的底层可能是 MySQL，前端封装决定高可用性表现
Dynamo 和 Postgres 本质不同，适合不同的问题场景
大多数 OLTP 问题可以用 Dynamo 建模，但需要严格的建模纪律和前期投入
Patroni 和 CloudnativePG 可以解决 Postgres 的自动故障转移和集群管理
实际订单数据远低于“100,000s 每分钟”，Instacart 每分钟约 720 单，而非数十万
PgDog 的负载均衡器本身不检测主节点故障，需要依赖 Patroni 或 RDS 等外部工具进行主节点提升

10. 与 Mythos 共事是一种怎样的体验 (What it feels like to work with Mythos) #

https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos

作者 Ethan Mollick 获得了首个面向公众的 Mythos 级 AI 模型——Claude 5 Fable 的早期访问权，并对其进行了全面测试。他的结论是：Fable 代表了一次真正的巨大飞跃，更关键的是，它表明我们与 AI 的关系正在发生剧烈变化。

Fable 在各类实验中显著优于此前所有公开模型，能自主运行长达十几个小时，执行多页规格说明。例如，它根据单一提示生成了迄今最成熟的学术社会科学论文，还创造了一首每词以字母 S 开头的 10 页史诗押韵诗。为了更直观展示，作者用它生成了多个可试玩的游戏，所有图形和 3D 物体仅用数学生成，未使用任何外部素材。

在更严肃的项目中，作者测试了构建等时线地图。Fable 自主启动多个 AI 助手进行旅行时间研究（获取 2200 多个航班、列车时刻表及各国道路速度），同时编写代码并验证结果。最终生成了一幅功能完备、高度精致的地图。作者要求修正偏远地区的旅行时间后，Fable 又启动了对抗性研究流程，甚至查明了前往皮特凯恩岛的船期。整个过程作者仅给出了一个非常宏大的指令和少量反馈，AI 便自主完成了几百个判断决策。

最雄心勃勃的项目是“Concord”——一套可校准人类与 AI 判断并进行复杂数据分析的软件。Fable 生成了 19 页的设计文档并执行了 9.5 小时，最终产出了非常复杂的软件。尽管作为专家，作者指出了一些错误和遗漏，但整体结果令人惊叹。

总结：使用 Fable 的感觉在愉悦与不安之间。愉悦是因为只需要提出要求就能实现；不安也因为只需提出要求就能实现——AI 的决策过程成为无法理解的黑箱，作者的角色被极度压缩。

HN 热度 356 points | 评论 308 comments | 作者：swolpers | 1 day ago #

https://news.ycombinator.com/item?id=48464140

文章缺乏对代码质量、可维护性、可扩展性、安全性和具体技术栈的实质性评估
作者并非软件工程师，而是管理学者或非技术人员，无法真正理解实际产品维护与发布
过去类似误解（例如 UI 生成代码就以为大部分工作完成）正在重演，但 AI 输出质量可能超过某些工程师
AI 让非开发者也能做出“副项目”，但声称 AI 精通软件工程过于夸大，真实修复仍需专业人士
技术债务定义可能因 AI 快速迭代而改变，但重构复杂系统依然缓慢，物理约束未被完全消除
非技术人员可用 AI 低成本快速创造实用工具，导致软件工程师的价值和需求空间下降
真正优秀的工程师仍具备高质量实现和创新，但领导层对软件工程的认知正在被 AI 误导

Hacker News 精彩评论及翻译 #

German ruling declares Google liable for false ans… #

https://news.ycombinator.com/item?id=48472844

It has nothing to do with monopolies. Google was protected from defamation law with search because the page title and snippets were direct quotes from the linked result page. Whereas with AI overviews, the copy is written by a Google-controlled LLM.

brainwad

这与垄断无关。谷歌之所以在搜索中免受诽谤法约束，是因为页面标题和摘要直接引用了链接结果页面的内容。而人工智能概述中的文字则是由谷歌控制的大语言模型生成的。

What it feels like to work with Mythos #

https://news.ycombinator.com/item?id=48466463

What I find fascinating that there is so little substance in this article about the quality of produced code and the medium. Is the code documented and tested? Is it understandable and extendable? Is it secure? What language, framework, database was used? Author mentions judgement and taste - well, is the code tasteful? Will the model rearchitecture the entire thing if I ask it to add new functionality, spending another 9.5h in tokens? I assume that the research part is domain knowledge = how different types of travel translate to time making it presentable; how did the author verify this?

These questions are even not about AI: if I were to give money to a human agency and were given something they tell me works, I would ask the same questions. If I did not know how to evaluate, I would hire people that do. With LLMs the verification part is what bothers me the most.

eithed

我觉得很有趣的是，这篇文章关于生成代码质量和所用媒介方面的实质性内容如此之少。代码有文档和测试吗？代码是否易于理解和扩展？安全性如何？使用了什么语言、框架和数据库？作者提到了判断力和品味——那么，代码有品味吗？如果我要求模型添加新功能，它会不会花费另外9.5小时的令牌时间，将整个架构重写一遍？我推测研究部分是指领域知识 = 不同类型的旅行如何转化为可呈现的时间；作者是如何验证这一点的？

这些问题甚至与AI无关：如果我把钱交给一家人类代理机构，他们告诉我某个东西有效，我也会问同样的问题。如果我不知道如何评估，我会雇佣懂行的人。对于大语言模型，验证部分是最让我困扰的。

What it feels like to work with Mythos #

https://news.ycombinator.com/item?id=48467824

These posts are never written by software engineers, it’s always some tech exec, retired engineer, or VC. This author is apparently a professor at the Wharton School of Management? None of these people have to ship or maintain real products, they’re just making side projects.

The only decent software engineering perspective I’ve seen has been from Mitchell Hashimoto.

an0malous

这些帖子从来不可能是软件工程师写的，总是些科技高管、退休工程师或风险投资人。这个作者显然是沃顿商学院的教授？这些人都不需要交付或维护真正的产品，他们只是做些副业项目。

我见过的唯一靠谱的软件工程视角来自Mitchell Hashimoto。

Claude Fable 5 #

https://news.ycombinator.com/item?id=48471771

I recently switched off Max flat rate to Enterprise API pricing and I went from 200/mo to 10k/mo with the same usage pattern on Opus. They don’t offer flat rate to enterprises.

So Fable would cost me 20k/mo at Enterprise rates. That’s around the average cost of a loaded SWE in the USA. “But I’m >2x more productive” doesn’t justify doubling the opex of the Software/IT department for most companies when revenue isn’t even up 10%.

I switched to DeepSeek v4 Pro with OpenCode and am on track for a few hundred dollars of spend this month.

Rewriting your stack from Ruby to Go in 2 days where it would’ve taken 6 months is impressive and fun. But that isn’t upping revenue.

Iterating on net new business features and ideas that are niche that the LLM isn’t trained for are much harder. Is 20x the token cost worth it there?

caleblloyd

我最近从Max的固定费率切换到了企业API定价，同样的使用模式在Opus上，费用从200美元/月涨到了1万美元/月。他们不向企业提供固定费率。

所以按企业费率，Fable每月要花我2万美元。这差不多相当于美国一个全职软件工程师的平均成本。“但我生产力提高了两倍多”并不能证明将软件/IT部门的运营支出翻倍是合理的，尤其是当收入连10%都没涨的时候。

我换成了DeepSeek v4 Pro搭配OpenCode，这个月预计花费几百美元。

用两天时间把技术栈从Ruby重写为Go，原本要花六个月，这确实令人印象深刻也有趣。但这并没有增加收入。

而在那些大语言模型没有训练过的新业务功能和细分创意上进行迭代，则要困难得多。20倍的token成本在这里真的值得吗？

Claude Fable 5 #

https://news.ycombinator.com/item?id=48464044

From today through June 22, Fable 5 is included on Pro, Max, Team, and seat-based Enterprise plans at no extra cost. On June 23, we’ll remove Fable 5 from those plans. Using it after that will require usage credits. If capacity allows, we’ll extend the included window. After this point—when sufficient capacity allows us to do so—we aim to restore Fable 5 as a standard part of subscription plans. We intend to do this as quickly as we can.

This seems like the pharmaceutical method of get them hooked on the drug with free samples, then once they can’t live without it, raise the price. I’m not sure I want to start using Claude Fable on a max plan if it’s just going to go away on June 23rd.

But maybe the more charitable reading is that they didn’t have to offer this model at all on those plans and they are giving the standard free trial.

AquinasCoder

从今天到6月22日，Fable 5会包含在Pro、Max、Team以及基于座位的Enterprise计划中，无需额外付费。6月23日，我们将从这些计划中移除Fable 5。之后使用它需要消耗使用点数。如果容量允许，我们会延长包含期。在此之后——当容量充足时——我们的目标是让Fable 5重新成为订阅计划的标准组成部分。我们会尽快做到这一点。

这看起来像是制药公司的手段：先用免费样品让人上瘾，等他们离不开时再涨价。我不确定自己是否想在Max计划上开始使用Claude Fable，如果它6月23日就要消失的话。

但也许更善意的解读是，他们本可以不把这些计划中的这个模型提供出来，而现在只是给出了标准的免费试用。

Building an HTML-first site doubled our users over… #

https://news.ycombinator.com/item?id=48476547

The counterargument: In Defence of the Single Page Application:

https://williamkennedy.ninja/javascript/2022/05/03/in-defence-of-the-single-page-application/

wmanley

反驳观点：为单页应用辩护：https://williamkennedy.ninja/javascript/2022/05/03/in-defence-of-the-single-page-application/

Grit: Rewriting Git in Rust with agents #

https://news.ycombinator.com/item?id=48468904

In looking at the code that the LLMs have produced for the project, especially given the pretty massive and widespread architectural changes needed to make the implementation libified and memory safe, we decided that the codebase is not a derivative work that would require carrying forward the GPL license and have decided to release the code under the MIT instead.

Hmm. That’s going to be interesting.

Philpax

看了LLM为这个项目生成的代码，尤其是考虑到为了将实现库化并确保内存安全而需要进行相当大规模和广泛的结构性修改后，我们认定该代码库并非需要延续GPL许可证的衍生作品，并决定改用MIT许可证发布代码。嗯，这将会很有意思。

Mercedes‑Benz starts large‑scale production of ele… #

https://news.ycombinator.com/item?id=48473600

It would have been awesome if that article had, at any point, explained what an electric axial flux motor was, and why anyone might want one.

AndrewDucker

如果那篇文章在某个地方解释了什么是有轴向磁通电机，以及为什么有人会想要它，那就太棒了。

FCC wants to kill burner phones by forcing telecom… #

https://news.ycombinator.com/item?id=48463229

Here’s the link to submit a comment to the FCC:

https://www.fcc.gov/ecfs/filings/express

Ran a quick search and found a whole bunch of news articles, but nobody includes info that makes it easy to route your comment. Feels like the beginning of Hitchhiker’s Guide:

It was on display in the bottom of a locked filing cabinet stuck in a disused lavatory with a sign on the door saying Beware of the Leopard.

bsimpson

这里是向FCC提交评论的链接：

https://www.fcc.gov/ecfs/filings/express

快速搜了一下，发现了一大堆新闻文章，但没人提供能方便你提交评论的信息。感觉就像《银河系漫游指南》的开头：

它被展示在一个锁着的文件柜底部，卡在一个废弃的洗手间里，门上写着“小心豹子”。

macOS Container Machines #

https://news.ycombinator.com/item?id=48470145

(OrbStack dev here.) Instead of Virtualization.framework, we have a custom Rust virtualization stack with custom devices and protocols for things like filesystem sharing. It’s a highly optimized vertically integrated stack specifically for running our Linux machines and containers.

Our biggest perf/resource gain is dynamic memory, which reduces memory usage a lot by releasing unused memory back to macOS. Nothing else supports this, including Containerization.

I gave Container Machines a try and it seems to be much closer to OCI containers with a default bind mount than OrbStack machines. It has fewer integrations and doesn’t run systemd or any other normal init system, so it’s hard to run services.

kdrag0n

(OrbStack开发者在此。) 我们没有使用Virtualization.framework，而是构建了一套自定义的Rust虚拟化栈，配备了用于文件共享等功能的定制设备和协议。这是一个高度优化的垂直集成栈，专门用于运行我们的Linux机器和容器。

我们最大的性能/资源提升来自动态内存管理，通过将未使用的内存释放回macOS，大幅减少了内存占用。其他方案（包括Containerization）都不支持这一点。

我尝试了Container Machines，它似乎更接近使用默认绑定挂载的OCI容器，而非OrbStack机器。它的集成功能较少，不运行systemd或其他常规初始化系统，因此很难运行服务。

Ask HN: Are most corporate SWE jobs performative? #

https://news.ycombinator.com/item?id=48476430

What you are describing as performative I would describe as bureaucratic.

The Iron Law or Bureaucracy:

Pournelle’s Iron Law of Bureaucracy states that in any bureaucratic organization there will be two kinds of people: First, there will be those who are devoted to the goals of the organization. Examples are dedicated classroom teachers in an educational bureaucracy, many of the engineers and launch technicians and scientists at NASA, even some agricultural scientists and advisors in the former Soviet Union collective farming administration. Secondly, there will be those dedicated to the organization itself. Examples are many of the administrators in the education system, many professors of education, many teachers union officials, much of the NASA headquarters staff, etc. The Iron Law states that in every case the second group will gain and keep control of the organization. It will write the rules, and control promotions within the organization. (Quoted from Wikipedia)

cjbgkagh

你将我所说的表演性描述为官僚主义。

铁律或官僚主义：

普内尔的官僚主义铁律指出，在任何官僚组织中都会存在两种人：第一种是致力于实现组织目标的人，例如教育官僚机构中尽职尽责的课堂教师、美国国家航空航天局（NASA）的许多工程师、发射技术人员和科学家，甚至前苏联集体农庄管理中的一些农业科学家和顾问；第二种是致力于维护组织本身的人，例如教育系统中的许多行政人员、许多教育学教授、许多教师工会官员、NASA总部的大部分职员等。铁律指出，在任何情况下，第二种人都会获得并保持对组织的控制权。他们会制定规则，并掌控组织内的晋升机制。（引自维基百科）

German ruling declares Google liable for false ans… #

https://news.ycombinator.com/item?id=48470793

Good. The true mark of AGI is when a company accepts liability and doesn’t bury “for entertainment purposes only” deep in their TOS. Same as it works with employees.

Same for self-driving. Your car is not self-driving until it accepts liability and you count as just a passenger.

But watch as Germany soon loses AI Google results.

Swizec

好。通用人工智能的真正标志是当一家公司承担起责任，而不是将“仅供娱乐目的”深埋在他们的服务条款中。这和对待员工的方式是一样的。

自动驾驶也是如此。只有当汽车承担起责任、你只被视为乘客时，它才算真正的自动驾驶。

但等着看吧，德国很快就要失去谷歌的AI搜索结果了。

Claude Fable 5 #

https://news.ycombinator.com/item?id=48464013

On the new FrontierCode [1] benchmark (ie graded from an OSS maintainer’s perspective of “would I merge this code?”)

Opus 4.7 xhigh: 5.2%
Opus 4.8 xhigh: 13.4%
Fable 5 xhigh: 29.3%

Seems like a huge jump.

[1] https://cognition.ai/blog/frontier-code

jkelleyrtp

在新的FrontierCode[1]基准测试中（即从开源软件维护者的角度评估“我会合并这段代码吗？”）：

Opus 4.7 xhigh: 5.2%
Opus 4.8 xhigh: 13.4%
Fable 5 xhigh: 29.3%

看起来是一个巨大的飞跃。

[1] https://cognition.ai/blog/frontier-code

macOS Container Machines #

https://news.ycombinator.com/item?id=48469985

To clarify a few comments here: this is not only OCI containers: container machines add support for persistence and filesystem mounting, making container machines a great lightweight Linux environment for developers using macOS. More details here: https://developer.apple.com/videos/play/wwdc2026/389

timsneath

为了澄清这里的几条评论：这不仅仅是OCI容器：容器机器增加了对持久化和文件系统挂载的支持，使得容器机器成为macOS开发者一款出色的轻量级Linux环境。更多详情请见：https://developer.apple.com/videos/play/wwdc2026/389