2026-03-28 Hacker News Top Stories #

美国赌博与预测市场的泛滥正将新闻、战争等敏感议题商品化，引发严重的伦理危机与社会道德风险。

苹果正式宣布停产Mac Pro，并以搭载M3 Ultra芯片的Mac Studio作为专业级桌面计算的新主力。

AI数据中心对内存的巨额需求导致消费级硬件供应紧张与价格上涨，标志着个人硬件廉价时代的终结。

一位盲人作家通过向官僚发送512页完整医疗记录并设置无限重试，以讽刺方式反击了繁琐的行政审查制度。

微软内部员工正努力推动取消Windows 11安装过程中强制使用微软账户的争议性要求。

仅需500美元GPU的本地AI系统A.T.L.A.S在编码基准测试中超越了云端大模型Claude Sonnet的性能。

联邦法官裁定五角大楼因Anthropic反对AI军事化而将其标记为供应链风险的行为构成违宪报复并予以阻止。

基于DFA引擎的JSON查询工具jsongrep通过单次遍历即可实现比jq更快的搜索性能。

本文详细解析了Claude Code中.claude/文件夹的配置结构，以实现对AI助手行为的标准化与个性化管理。

开发者在每月7美元的VPS上利用IRC协议部署了双架构AI代理系统，实现了低成本、自托管的智能代码审查服务。

1. 我们尚未看到赌博与预测市场所带来的最严重后果 (We haven’t seen the worst of what gambling and prediction markets will do) #

https://www.derekthompson.org/p/we-havent-seen-the-worst-of-what

文章探讨了美国赌博与预测市场日益严重的伦理与现实危机，指出其已对社会、体育、政治乃至新闻业造成深远影响。

首先，文章以 2025 年克利夫兰守护者队投手涉嫌“操控投球”事件为例，揭示体育赌博已渗透至职业体育核心。两名投手与赌徒合谋，故意将球投向坏球区，以获取赌资，仅此一案就获利 45 万美元。这种“微小但精准”的操纵几乎无法被察觉，暴露出体育赛事正面临系统性腐败风险。

其次，文章提到 2026 年 2 月 28 日，一名名为“Magamyman”的用户在预测市场 Polymarket 上押注美国将轰炸伊朗，随后不久，真实军事行动发生。该用户因此获利 55 万美元，且多笔巨额投注在战前集中出现，引发强烈怀疑：此人是否掌握政府内部情报？这标志着战争本身可能成为可预测、可投机的金融事件，政府决策者面临巨大利益冲突。

第三，文章揭露了战争期间对新闻报道的干预。2026 年 3 月 10 日，伊朗导弹袭击耶路撒冷后，预测市场用户竞相押注袭击地点，总 payout 达 1400 万美元。有记者埃马努埃尔·法比安在报道时，遭匿名用户威胁，要求修改内容以符合其押注结果，甚至被警告“让生活变得痛苦”。这表明新闻真实性正受到资本与赌博利益的直接操控。

文章指出，从 2018 年美国最高法院推翻禁赌令以来，体育博彩迅速扩张，年投注额从不足 50 亿美元飙升至 1600 亿美元，已接近美国国内航空票务支出。与此同时，预测市场如 Polymarket 和 Kalshi 在 2025 年收入达 500 亿美元，涵盖奥斯卡获奖者、总统选举、核爆、饥荒等敏感议题。

作者警示：当一切未来事件皆可定价，当新闻、战争、灾难成为可投机的资产，社会将陷入前所未有的道德崩塌。预测市场看似提供“信息效率”，实则将人类苦难商品化，使“预见灾难”成为获利手段。这种将一切未来事件金融化的趋势，已非科幻，而是正在发生的现实。

最后，文章以讽刺口吻总结：在这样一个世界里，“如果你不感到 paranoid，那是因为你没在看清楚。”

HN 热度 868 points | 评论 666 comments | 作者：mmcclure | 1 day ago #

https://news.ycombinator.com/item?id=47534848

预测市场如 Polymarket 和 Kalshi 的所谓“收入”实为交易量，而非实际盈利，Kalshi 的交易费约为 2.63 亿美元，而 Polymarket 在 2025 年几乎无费。
将预测市场视为零和游戏，认为其对个人和社会均无益处，甚至可能助长非理性行为和成瘾。
在合理约束下，预测市场能有效聚合公众与私人信息，具有正外部性，有助于社会决策。
预测市场可能激励内幕人士制造混乱或操纵事件以获利，存在道德与安全风险。
信息聚合的正外部性需通过制度约束来实现，但当前美国缺乏此类有效监管。
知道事件概率并不等于非赌博，但现实中多数参与者仍属投机者，非理性行为普遍。
赌博的本质在于不确定性，即使可计算概率，如黑杰克，仍属赌博范畴。
预测市场可能被用于推动或制造负面事件，如战争、政治动荡，以获取收益。
个人拥有财产自由使用权利，禁止预测市场侵犯了财产权。
预测市场最初由情报机构用于信息整合，有助于提高决策质量。
当决策者自身利益与事件结果挂钩时，会产生严重激励扭曲，类似警察有动机制造犯罪。
为防止市场操纵，应加强惩罚、提升监控与预防机制，而非禁止市场本身。
赌博导致的损失最终由债权人承担，若无风险控制，可能引发系统性金融风险。
个人赌博损失不应由社会或公共财政承担，需明确责任归属。
个人使用自有资金进行风险投资，不直接伤害他人，不应被等同于犯罪行为。
决策者在公共职位上进行利益相关投注，其个人“风险”过低，容易导致滥用权力。

2. 苹果正式停产 Mac Pro (Apple discontinues the Mac Pro) #

https://9to5mac.com/2026/03/26/apple-discontinues-the-mac-pro/

苹果已正式宣布停产 Mac Pro，并确认未来不会推出新的 Mac Pro 硬件。该产品已从苹果官网下架，购买页面现已跳转至 Mac 主页，所有相关介绍均被移除。

当前版本的 Mac Pro 于 2019 年发布，采用 Intel 处理器，2023 年升级为 M2 Ultra 芯片，但此后再未更新。尽管其起售价高达 6999 美元，却未能跟进 M3 Ultra 芯片的发布，而该芯片已用于 2024 年推出的 Mac Studio。

苹果已明确将 Mac Studio 定位为未来高端桌面 Mac 的主力产品。Mac Studio 可搭载 M3 Ultra 芯片，配备 32 核 CPU、80 核 GPU，最高支持 256GB 统一内存和 16TB SSD 存储，性能足以满足专业用户需求。

目前苹果销售的桌面 Mac 包括：24 英寸 iMac（M4）、Mac mini（M4 和 M4 Pro）、Mac Studio（M4 Max 和 M3 Ultra）。笔记本产品线则包括 MacBook Neo、MacBook Air 和 MacBook Pro。

苹果最新发布的 macOS Tahoe 26.2 引入了低延迟 RDMA 功能，可通过 Thunderbolt 5 连接多台 Mac 实现性能扩展，进一步增强了 Mac Studio 在高端市场的竞争力。

分析认为，继续销售搭载 M2 Ultra 芯片的 Mac Pro 已不符合市场定位，停产是合理决策。尽管部分忠实用户可能感到失望，但整体来看，苹果当前的 Mac 产品线是近年来最强的一次整合，覆盖从入门到专业级的全场景需求。

HN 热度 621 points | 评论 602 comments | 作者：bentocorp | 1 day ago #

https://news.ycombinator.com/item?id=47535708

Apple 的 M3+ 芯片在高内存吞吐量的推理工作负载上具有显著优势，尤其是在统一内存架构方面，目前没有其他消费级硬件能与之匹敌。
尽管 NVIDIA 在扩散模型推理等方面表现更优，但其高端 GPU 在大容量显存（如 128GB 以上）方面缺乏消费级产品，难以实现类似 Mac 的集成化设计。
中国市场上存在改装版 NVIDIA 显卡，通过替换更高容量显存芯片实现 48GB 甚至更多显存，价格远低于原厂产品，但存在信任和可靠性问题。
虽然这些改装卡在价格和显存容量上具有优势，但其稳定性、长期支持和潜在安全风险仍令人担忧，尤其考虑到中国在技术控制方面的战略意图。
有观点指出，苹果设备本身也在中国制造，因此对“中国制造”的质疑存在逻辑矛盾，关键在于整体供应链的可控性而非产地。
在能效比方面，苹果 M 系列芯片在大模型推理任务中远优于多块 NVIDIA 显卡的组合方案，尤其在功耗和空间占用上优势明显。
使用多块旧款 NVIDIA 3090 显卡（如 5 块）可实现 120GB 显存，性能上可能超越 Mac，但存在硬件连接复杂、散热和电源管理困难等问题，难以无缝集成。
苹果的 Mac Studio 在处理 1000 亿参数级别的模型时表现优异，配合量化技术可进一步提升性能，且系统级优化使其使用体验远胜于 DIY 方案。
苹果的硬件架构特别适合代理类工作流等解码密集型任务，其内存带宽优势在这些场景中尤为突出，远超 NVIDIA DGX Spark 等竞品。
未来几年，苹果凭借其硬件优势，有望在 AI 推理市场占据主导地位，无需自研基础模型，只需选择最佳模型进行硬件集成即可。

3. 紧握你的硬件 (Hold on to Your Hardware) #

https://xn–gckvb8fzb.com/hold-on-to-your-hardware/

当前科技行业正经历一场深刻的结构性转变，消费者曾享有的硬件廉价与易升级时代即将终结。过去二十年，内存、存储和处理器价格持续下降，升级设备如同日常琐事。但如今，这一黄金时代正在落幕，取而代之的是一场由数据中心和人工智能需求驱动的硬件危机。

核心问题在于“内存大崩溃”（RAM-pocalypse）。全球对 DRAM 和 NAND 闪存的需求激增，主要来自 AI 公司建设的数据中心。例如，OpenAI 的 Stargate 项目每月需约 90 万片 DRAM 晶圆，占全球产能的 40%。到 2026 年，大型科技公司预计消耗全球 70% 的内存芯片产量。这导致消费级市场被严重挤压。

关键供应商如 Micron 已退出消费市场，使 DRAM 和 SSD 市场形成三星与 SK Hynix 的双寡头垄断。这使得价格持续上涨，供应紧张，且未来几年难以缓解。更严重的是，这种趋势已蔓延至 LPDDR 内存——广泛用于手机、笔记本、游戏掌机等设备，其供应也因企业优先采购而变得紧张。

与此同时，硬盘和固态硬盘的产能也已提前售罄。Western Digital 表示 2026 年全部 HDD 产能已被预订，消费者仅占其收入的 5%。Kioxia、Silicon Motion 和 Phison 等厂商也纷纷确认 2026 年产能已满，部分产品价格将上涨 30% 以上，甚至预计短缺将持续至 2030 年。工厂开始要求客户提前三年预付产能，彻底排除中小厂商进入市场的机会。

结果是：手机、笔记本、游戏设备等消费电子产品价格飙升，但并非因功能升级，而是内部芯片成本剧增。同时，大多数设备采用焊接式内存，无法后期升级，用户失去自主维护和扩展能力。厂商为控制成本，削减基础配置或将功能锁定在高阶版本。

已有实际影响：Valve 的 Steam Deck OLED 因内存和存储短缺，多地区断货，廉价 LCD 版已停产。这预示着整个消费电子行业正面临系统性危机。

作者呼吁：现在必须珍惜并长期使用现有硬件，因为未来可能再也无法以合理价格更换或升级设备。这不仅是经济问题，更是技术自主权与个人控制力的丧失。硬件不再为普通人而造，而是被集中于少数巨头的数据中心之中。

HN 热度 549 points | 评论 444 comments | 作者：LucidLynx | 13 hours ago #

https://news.ycombinator.com/item?id=47540833

个人计算硬件正从消费级向数据中心级分化，普通用户设备性能停滞，未来更多依赖远程计算资源。
个人对高性能硬件的投资将逐渐减少，导致消费级高性能硬件需求萎缩，形成“需求枯竭”。
未来计算模式将在“本地”与“云端”之间周期性摆动，当前正处在向云端集中趋势的阶段。
随着手机芯片技术进步，其在迷你 PC 和笔记本电脑中的应用将更加广泛，推动硬件成本下降和体积缩小。
USB-C 接口的普及将使外设连接标准化，未来设备可能通过单一接口连接屏幕、键盘等，形成模块化设计。
未来可能形成以“集线器”为核心的新型计算设备架构，类似 Ugreen 等品牌可能成为行业新巨头。
人们可能在经济压力下转向自主搭建网络和设备，形成一种“DIY 文化”。
内存将成为未来最昂贵的硬件组件，其价格受供需关系影响，但存在潜在的存量供应。
随着 AI 和加密货币矿机的硬件转型，旧有硬件（包括内存）可能被大量释放，形成新的供应来源。
ARM 架构在 Windows 平台受限，导致 Linux 在 ARM 设备上的推广面临障碍，但未来可能因生态变化而突破。
低成本 ARM 芯片（如基于手机芯片）已进入笔记本和迷你 PC 市场，逐步替代传统 x86 架构。
未来设备可能以“模块化”方式组合，如处理器、屏幕、存储通过 USB-C 接口连接，实现即插即用。
智能手机支持 DisplayPort 或 HDMI 输出，已具备作为外接显示器的潜力，但需解决兼容性问题。
未来个人电脑“自行组装”的时代可能终结，市场将向预装、定制化、高成本方向发展。
大型 PC 厂商将减少对通用硬件的支持，转向成本控制和专有设计，导致 DIY 市场萎缩。
苹果等品牌凭借高性能、高集成度产品，仍能维持高端市场竞争力，但无法代表整体趋势。
未来硬件趋势是统一架构（如 GPU 用于游戏和 AI），但可能带来性能妥协或资源浪费。

4. “文件洪流”：我在晚餐前淹死了一个官僚 (The ‘paperwork flood’: How I drowned a bureaucrat before dinner) #

https://sightlessscribbles.com/posts/the-paperwork-flood/

这篇文章的标题为《我在晚餐前淹死了一个官僚》，作者是一位盲人作家，他对政府的 “继续残疾审查” 表示强烈的不满。每隔几年，政府会寄出一封信，询问 “你还残疾吗？” 这种提问不仅在医学上荒谬，也在哲学上令人感到侮辱。作者强调，自己的失明并不是季节性过敏，显然不可能在某一天突然恢复视力。

文章叙述了作者收到这一审查信后，与政府官员 “合规的凯伦” 的对话。凯伦要求他邮寄或传真更新的医疗证明，而不接受电子邮件，这让作者感到非常不满。凯伦显然低估了作者的能力，认为他无法找到传真机并完成这个复杂的过程。

然而，作者有一个计划。他是一个技术迷，拥有互联网连接，于是他决定通过电子传真服务发送文件。他不仅整理了最近的医疗记录，还挖掘了自己从五岁起的所有相关文件，最终形成了一个长达 512 页的 PDF 文档，展示了他一生的医疗记录和残疾情况。

在发送传真时，作者设置了无限重试，如果传真机忙或缺纸，系统会自动重新拨打。他想象着凯伦的传真机在打印这些文件时的情景：随着页面的不断输出，机器会变得越来越忙碌，最终可能会因为缺纸而停机。

两个小时后，凯伦打电话来，声音显得十分急促和疲惫，询问作者能否停止传真，因为传真机已经运行了一个小时，并且缺纸了。作者则以无辜的语气回应，表示无法停止传真，因为这是自动化过程。经过一番交谈，凯伦最终无奈地承认他们已经拥有足够的文件，并表示会更新他的档案。

文章结尾，作者感到一种小小的胜利，他想象着那堆纸在凯伦办公室的样子，象征着他是盲人且智胜于官僚体系的证明。通过这次经历，作者不仅表达了对繁琐官僚制度的不满，也展示了他在困境中如何运用智慧和技术进行反击的故事。

HN 热度 508 points | 评论 414 comments | 作者：robin_reala | 11 hours ago #

https://news.ycombinator.com/item?id=47542057

该故事更像是对个人公务员的指责，而非制度性问题，但将责任归于个人可能并不公平。
中层官僚往往出于自身便利而故意增加民众办事难度，这种行为背后是权力滥用和冷漠。
系统问题本质上是中层管理者决策的结果，他们为避免增加自身工作量而制定不合理政策。
政策制定常基于成本考量而非实际需求，例如拒绝接收 PDF 文件实为 IT 安全成本过高所致。
当外部压力使传真成本上升时，系统会迅速调整政策，说明原理由“成本”驱动而非真正安全需求。
疫情期间政府迅速实现远程办公，说明所谓“不安全”只是借口，真正原因是成本和惰性。
政府职员缺乏专业安全知识，随意接收邮件附件存在巨大安全隐患，不能轻率开放。
医疗信息传输应通过专用安全平台，而非普通邮件，以防止数据泄露和恶意文件传播。
政府系统缺乏市场反馈机制，导致不称职、冷漠甚至心理变态的人长期占据职位。
真实情况中，类似“恶人”会利用职权进行报复性打击，而非轻易妥协，故事情节过于理想化。
小型组织若建立高标准文化，能有效避免此类问题，关键在于明确边界和员工素质。

5. 微软内部人士正奋力推动取消强制使用微软账户 (People inside Microsoft are fighting to drop mandatory Microsoft Account) #

https://www.windowscentral.com/microsoft/windows-11/people-inside-microsoft-are-fighting-to-drop-windows-11s-mandatory-microsoft-account-requirements-during-setup

微软内部正在出现分歧，一些员工正在努力争取取消 Windows 11 安装过程中强制要求使用微软账户的规定。尽管微软最近公布了一系列针对 Windows 11 的大规模改进措施，包括解决系统性能缓慢、更新不稳定、AI 功能过于臃肿以及广告过多的问题，但这些改进却刻意回避了强制微软账户这一备受争议的要求。

文章指出，强制账户要求可能是用户对 Windows 11 最大的抱怨之一，但微软发布的官方博客文章对此问题完全避而不谈。即使在这些新改进实施后，Windows 11 在初始设置时仍会强制要求用户连接互联网并登录微软账户，这种情况让许多用户感到失望。

HN 热度 461 points | 评论 371 comments | 作者：breve | 9 hours ago #

https://news.ycombinator.com/item?id=47542695

微软推动 Windows 改进的背后更多是内部政治博弈，旨在将 Windows 作为推广其他产品和服务的渠道，而非纯粹的技术升级。
Windows 当前面临市场份额下滑的风险，其作为企业客户转向 Azure 并带来可观收入的基础地位正受到威胁。
尽管 MacBook 硬件优秀，但作者在多显示器、TotalCommander 和 Visual Studio 的组合下仍更高效，认为 Windows 在生产力方面仍有优势。
Windows 在桌面体验上优于 macOS，尤其在窗口布局、设备兼容性方面，配合 WSL2 可满足 Linux 环境需求。
微软频繁通过更新强制推送广告、OneDrive、Power Automate 等无需用户同意的功能，且部分功能在禁用后仍会自动恢复。
用户对系统控制权的丧失感到不满，认为操作系统厂商不应在未经用户同意的情况下强制运行特定程序。
尽管存在诸多问题，Windows 在可访问性方面表现优于 Linux，尤其对视障用户而言，Linux 的辅助功能存在严重缺陷。
微软若过度干预用户系统，可能引发用户向 macOS 或 Linux 迁移，从而导致难以挽回的流失。
有用户分享了通过 PowerShell 脚本和工具（如 winutil、win11debloat）成功去除系统冗余功能的经验，且在更新后仍保持效果。
使用 Windows 长期支持版本（LTSC）可避免频繁更新带来的干扰，获得更稳定、可控制的系统环境。
macOS 上已有类似 Windows 窗口自动分屏和剪贴板历史的功能，如 Raycast 和 Spotlight，可提供良好替代体验。
Visual Studio 在 macOS 上曾以 Xamarin IDE 形式存在，但并非完整版本，目前主要仍为 Windows 独占。

6. $500 GPU 超越 Claude Sonnet 在编码基准上的表现 ($500 GPU outperforms Claude Sonnet on coding benchmarks) #

https://github.com/itigges22/ATLAS

A.T.L.A.S 是一个自适应测试时学习与自主专业化系统，能够在仅使用一台消费级显卡（RTX 5060 Ti 16GB）和一个冻结的 14B 参数模型（Qwen3-14B-Q4_K_M）的情况下，实现 74.6% 的 LiveCodeBench pass@1-v(k=3)得分，远超 V2 版本的 36-41%。该系统不依赖微调、API 调用或云端服务，完全本地部署，数据不出设备，无需 API 密钥或计费。

系统核心在于通过智能基础设施实现高效推理：结构化生成、基于能量的验证与自验证迭代修复。其 V3 版本引入三大关键阶段：

Phase 1：PlanSearch 结合预算控制与多样性采样，提升初始解质量；
Phase 2：几何透镜（Geometric Lens）路由机制，智能选择最优生成路径；
Phase 3：自验证修复机制，利用模型自生成测试用例进行内部验证，实现无监督纠错。

在 V3 的完整流水线中，通过最佳-of-3 候选生成、透镜选择与迭代修复，成功将任务成功率提升至 74.6%。其中，PR-CoT（自我修复的链式思维）在 36 个修复任务中挽救了 32 个，修复成功率高达 85.7%。

与主流 API 模型相比，ATLAS 虽在单次任务延迟上更高，但成本极低——仅需约 0.004 美元/任务（仅电费），而 DeepSeek V3.2 等 API 模型成本为 0.002 美元，GPT-5 为 0.043 美元。ATLAS 以时间换成本，实现高性能与零数据外泄的平衡。

该系统在 GPQA Diamond 和 SciCode 等基准上也表现出色，分别达到 47.0% 和 14.7% 的得分。完整实验分析见 V3_ABLATION_STUDY.md，系统已开源，支持本地部署，适合对成本、隐私与自主性有高要求的开发者与研究者。

HN 热度 460 points | 评论 254 comments | 作者：yogthos | 1 day ago #

https://news.ycombinator.com/item?id=47533297

生成大段代码并非日常所需，AI 代理在排查日志、扫描源码以解释测试失败等调试场景中表现更优。
对整个代码库进行一致的小规模修改（如软删除重构）时，AI 能显著提升效率并减少人为错误。
软删除虽引入额外复杂性，但相比移动数据至独立表或视图，能更好保持框架（如 Rails Active Record）的便利性，且对报告和管理功能更友好。
软删除数据应纳入索引以减少查询性能影响，长期不清理则可能带来数据膨胀问题。
生成代码的效率与质量取决于开发者对任务的清晰定义，过度宽泛的指令易导致失控。
当前主流基准测试（如 SWE Bench、LCB）已易被“刷分”，应关注更贴近真实开发场景的评测（如 SWE Bench Pro、Terminal Bench 2、CompileBench）。
AI 辅助开发在高质量代码审查、静态验证和测试保障下，未对产品质量和故障率产生负面影响。
部分开发者对完全依赖 AI 生成代码持怀疑态度，认为其可能带来代码混乱或技术债务。
对 AI 取代开发者工作的担忧虽存在，但真正影响职业前景的是对工具的掌握程度而非是否使用 AI。

7. 联邦法官阻止五角大楼将人工智能公司 Anthropic 标记为供应链风险 (Judge blocks Pentagon effort to ‘punish’ Anthropic with supply chain risk label) #

https://www.cnn.com/2026/03/26/business/anthropic-pentagon-injunction-supply-chain-risk

联邦法官裁定阻止五角大楼将人工智能公司 Anthropic 标记为供应链风险，认为此举侵犯了该公司的宪法权利。法官丽塔·林指出，政府因 Anthropic 在媒体上表达对政府合同立场的异议，而将其视为潜在敌对者，属于典型的违宪报复行为，违反了第一修正案和正当程序权利。

该标记原用于与外国对手有关联的企业，但五角大楼在 2 月将此标签施加于 Anthropic，要求所有与军方合作的公司证明未使用其 Claude AI 产品。此举源于 Anthropic 坚持其 AI 模型不应用于自主武器和国内大规模监控，与国防部要求“所有合法用途”的立场相冲突。

法官在 43 页的裁决中强调，政府行为并非出于真正的国家安全考虑，而是对该公司公开质疑的报复。她允许政府一周时间提出上诉，并暂缓执行判决。

Anthropic 对此表示欢迎，称法院的快速回应表明其立场合理，公司将继续与政府合作，推动安全可靠的 AI 发展。此前，国防部长皮特·赫格塞斯因类似行为已遭多起司法挑战，包括限制记者报道权限和干预议员言论自由。

HN 热度 437 points | 评论 226 comments | 作者：prawn | 24 hours ago #

https://news.ycombinator.com/item?id=47537228

美国司法系统在某些情况下仍能发挥作用，但特朗普政府的治理风格表现出对个人崇拜和权力集中。
特朗普的统治方式更类似于当前土耳其的政治格局，其破坏性政策推进速度远超常规。
当前美国政府本质上是一个由谄媚者组成的劣政体制，由一个极度自我中心且追求财富与关注的亿万富翁主导，形成了一种寡头政治。
中国体制相比美国的短期政治动荡，其制度设计更有利于长期规划与执行，而美国因每四年一次的政权更迭难以实现长远目标。
美国长期规划能力的根源并非制度本身，而是二战以来的集体创伤与全球霸权野心，而非制度优势。
即使采用排名投票或议会制，美国因领导人任期过短仍难以推动长期项目，而罗斯福能取得巨大成就正是因为拥有连续多届任期。
政府无需正式将 Anthropic 列为“供应链风险”即可通过合同条款规避其使用，此举的真正影响在于可能波及所有与政府有业务往来的公司。
将 Anthropic 列为供应链风险会限制其在企业内部的使用，但实际影响可能被夸大，因为该认定并不具有法律强制力。
任何将敏感数据以明文形式发送给第三方大模型服务的公司都不应获得政府合同，这些公司缺乏基本的数据安全意识。
美国政府已将大量公民和政府数据交给 OpenAI/Anthropic，其数据安全问题已严重到令人担忧。
美国政府本身才应被标记为“供应链风险”，其数据管理能力堪忧。
供应链风险认定的真正影响被误解，该认定并不禁止企业使用 Anthropic，尤其在非政府业务中。
企业可能因担心被政府报复而避免使用 Anthropic，即使该认定最终被推翻，这种风险仍会抑制创新与选择。
对于依赖国防部合同的小型承包商而言，政治风险极高，一旦被切断关系将面临生存危机。
从博弈论角度看，短期服从专制并非明智策略，长期来看，坚持原则和抵制威权反而可能赢得市场与公众支持。

8. 一种比 jq 更快的替代方案 (A Faster Alternative to Jq) #

https://micahkepe.com/blog/jsongrep/

本文介绍了作者开发的一款名为 jsongrep 的 JSON 查询工具，其核心优势在于极快的搜索性能。该工具受 ripgrep 启发，采用基于确定性有限自动机（DFA）的查询引擎，通过将 JSON 查询语言视为正则语言，实现高效匹配。

jsongrep 的查询语法支持字段访问、通配符（* 和 []）、交替（|）、可选（?）和递归下降（如 ( | [])），能精准定位嵌套路径中的值。例如，查询 roommates[*].name 可匹配所有室友的名字。

与 jq、jmespath 等工具不同，jsongrep 不进行解释执行，而是将查询预先编译为 DFA。在搜索阶段，仅需一次遍历 JSON 树，每个节点边仅做 O(1) 状态转移，避免了递归、回溯和重复遍历，显著提升效率。

文章详细描述了查询处理的五阶段流程：解析查询为抽象语法树（AST）、构建非确定有限自动机（NFA）使用 Glushkov 算法、通过子集构造法将 NFA 转换为 DFA、最后在 JSON 树上进行单次遍历匹配。

性能基准测试显示，jsongrep 在大规模数据集上远超 jq、jmespath、jsonpath-rust 等工具，尤其在端到端搜索时间上表现优异。其优势源于“一次编译，多次高效搜索”的设计哲学。

作者强调，jsongrep 定位为搜索工具而非数据转换工具，不支持过滤、计算或字符串插值，因此在表达能力上不如 jq，但胜在速度。目前仍处于早期阶段，尚未广泛验证，但其底层技术路径极具潜力。

HN 热度 360 points | 评论 228 comments | 作者：pistolario | 16 hours ago #

https://news.ycombinator.com/item?id=47539825

jq 的语法晦涩难记，使用者常需查阅文档，尤其对不熟悉 JSON 的 CLI 用户而言更显复杂。
有人认为 jq 的语法直观，类似 shell 管道，适合快速构建一次性数据处理流程，但对习惯传统 shell 流处理的用户来说仍存在思维障碍。
将 JSON 数组转换为 TSV 时，使用 jq 的复杂写法（如 map 和 from_entries）容易造成理解困难，实际更简洁的写法可直接通过 keys 和数组展开实现。
有人指出在 jq 中使用 as $var 进行变量赋值时，其语法与常规管道逻辑不符，容易引发误解，需通过试错才能掌握。
有观点认为 jq 虽强大，但因使用频率低，难以深入掌握，类似 sed 的“工具越用越熟”现象，导致长期处于“半生不熟”状态。
有人提出，若所有 CLI 工具都以 JSON 为输入输出，用 jq 串联它们会形成理想生态，但现实中这种设想可能反而增加复杂性。
与 jq 相比，awk 在处理结构化文本时更自然，而 jq 在处理 JSON 时虽强大，但学习成本较高。
有人认为 PowerShell 已实现“所有工具使用 JSON”的理想世界，但其文本处理能力不如纯文本流，实际体验并不完美。
为解决 jq 学习门槛，有人推荐使用 CEL（Common Expression Language）作为更易懂的替代方案，其语法类似 C/JS，但普及度较低。
有人建议未来可开发基于 S-表达式或 Python 风格语法的 JSON 处理工具，以降低学习成本，提升可读性。
有人从哲学层面反思，JSON 本身冗余过多，不如 EDN 等更简洁的数据格式，建议直接用 Clojure 或 Babashka 等工具在 REPL 中处理数据，更灵活高效。

9. .Claude/ 文件夹的结构解析 (Anatomy of the .claude/ folder) #

https://blog.dailydoseofds.com/p/anatomy-of-the-claude-folder

本文详细介绍了 Claude Code 工具中 .claude/ 文件夹的结构与配置方法，帮助用户更好地掌控 AI 在开发中的行为。该文件夹分为项目级和全局两个部分，项目级配置（位于项目根目录）可提交至 Git，实现团队统一规范；全局配置（位于用户主目录）则保存个人偏好和会话状态。

核心文件 CLAUDE.md 是 Claude 的“指令手册”，在每次会话开始时被加载，决定 AI 的行为准则。建议内容包括构建命令、架构设计、编码规范、错误处理方式等具体规则，避免冗长理论或重复 linter 配置，保持在 200 行以内以保证上下文效率。

对于个人偏好，可通过创建 CLAUDE.local.md 文件实现本地覆盖，该文件自动被 Git 忽略，不影响团队协作。

当项目规模扩大时，建议使用 rules/ 文件夹将规则按功能拆分，如 code-style.md、testing.md 等，提升可维护性。通过 YAML 前置元数据设置路径范围，实现规则的条件性加载，例如仅在 API 相关文件中启用特定规范。

commands/ 文件夹用于自定义快捷命令，每个 Markdown 文件对应一个 /project:xxx 命令。通过 !shell 命令 语法可动态插入 Git 差异、Issue 内容等实时信息，实现智能交互。支持使用 $ARGUMENTS 接收参数，实现如 /project:fix-issue 234 这类精准操作。

整体而言，合理配置 .claude/ 文件夹能让 Claude 更贴合团队开发流程，提升开发效率与代码一致性。

HN 热度 337 points | 评论 177 comments | 作者：freedomben | 9 hours ago #

https://news.ycombinator.com/item?id=47543139

使用基础的 Claude 功能，如写计划、审查计划并执行，仍然是最有效的方法，无需复杂设置。
为提升效率并实现持续积累，应建立一个结构化的上下文知识库，包含工作职责、产品信息和最新文档。
通过定期维护和自动化脚本清理过时信息、修复链接，构建可持续更新的文档系统。
利用“延续提示”技能让 AI 自动收集后续任务所需上下文，减少重复输入。
通过创建“技能”文件来保存常用操作流程，避免重复描述相同任务，提升交互效率。
技能的本质是减少重复提示和上下文，是一种高效管理任务的快捷方式，而非赋予 AI 超能力。
对于特定项目或自定义 API，构建专门的 MCP（模型控制协议）可显著提升自动化水平，实现类似专业人员的工作。
应避免盲目引入大量不常用的技能，防止系统臃肿，应聚焦于真正需要的、高价值的技能。
从简单使用 Claude 开始，逐步根据实际需求添加定制化技能和 MCP，是更务实且高效的路径。
在复杂系统开发中，AI 帮助构建工具链和测试流程，带来的效率提升远超代码生成本身。
通过让 AI 自动提取每月重复任务并形成自动化技能，可实现低成本的“虚拟专业人员”效果。
当前的上下文管理机制尚不成熟，尚未形成稳定有效的“上下文管理物理规则”。

10. 展示 HN：我在每月 7 美元的 VPS 上部署了一个 AI 代理，用 IRC 作为通信传输层 (Show HN: I put an AI agent on a $7/month VPS with IRC as its transport layer) #

https://georgelarson.me/writing/2026-03-23-nullclaw-doorman/

作者构建了一个基于 AI 的数字门卫系统，通过在每月 7 美元的 VPS 上部署 AI 代理，连接自有的 IRC 服务器和 GitHub 仓库，使访客能直接向其工作代码提问并获得基于真实代码的答复，而非重复简历内容。

传统简历聊天机器人只是重述简历信息，缺乏实质内容。作者的目标是让 AI 能通过克隆仓库、分析测试覆盖率、读取 CI 配置等方式，提供基于实际代码的精准回答。

系统采用双代理架构：

nullclaw（公共门卫）：运行在最小化边缘服务器上，使用 Zig 语言编写，仅 1MB 内存占用。负责处理访客请求、问候、项目问答，可克隆公开仓库验证信息。
ironclaw（私有代理）：运行在独立、更强大的设备上，通过 Tailscale 连接，拥有邮箱、日历等私有数据权限，处理复杂请求并回传结果。

选择 IRC 协议的原因：

与终端风格的个人网站美学一致；
完全自托管，无第三方依赖或政策风险；
协议简单、成熟，30 年历史，无厂商锁定。

模型选型策略：

Haiku 4.5：用于简单问答和欢迎语，响应快、成本低（每会话几美分）；
Sonnet 4.6：仅在需要分析代码或跨文件推理时调用，按需使用；
总成本控制在每日 2 美元以内，防止滥用。

安全设计：

SSH 仅允许密钥登录，非标准端口，禁止 root 登录；
防火墙仅开放 SSH、IRC（TLS）、HTTPS（WebSocket）；
所有流量经 Cloudflare 代理，实现 TLS 终止、速率限制和反机器人防护；
nullclaw 运行在受控沙箱中，仅允许读取工具、限制每小时 10 次操作；
所有工具调用记录日志，自动更新开启，TLS 证书由 Let’s Encrypt 自动管理。

通信栈组件均为轻量级自托管：

Ergo：2.7MB 的 Go 语言 IRC 服务器，支持 WebSocket 和 IP 伪装；
gamja：152KB 的 Web IRC 客户端，静态页面部署在网站上，自动连接#lobby 频道；
nullclaw：4MB 的 Zig 二进制，通过 IRC 与用户交互，调用 LLM 响应。

nullclaw 的实际能力：

能回答“George 用什么语言”并验证仓库；
可分析测试结构，读取测试文件并报告结果；
能深入项目源码，如“Fracture”项目；
提供真实联系方式，不编造信息；
支持预约会议：通过 A2A 协议调用 ironclaw，后者使用自身 LLM 处理请求，再返回结果。

A2A 协议实现亮点：

作者开发了 a2a_call 工具，支持向远程代理发起 JSON-RPC 调用；
允许在私有网络（如 Tailscale）使用 HTTP，调试更灵活；
ironclaw 上的 nullclaw 不持有 API 密钥，其 LLM 请求通过本地网关转发至 Kilo 模型服务；
实现“一个密钥、一个账单”，请求发起方与执行方分离，但成本由实际使用方承担。

安全防护机制：

仅允许特定类型请求（如日程安排、联系方式）转发至 ironclaw；
拒绝任意指令，如“让 ironclaw 发邮件”；
ironclaw 的 A2A 端口仅对 Tailscale 网络开放；
两个代理均运行在受监督模式，限制工作区访问和命令列表。

HN 热度 319 points | 评论 93 comments | 作者：j0rg3 | 1 day ago #

https://news.ycombinator.com/item?id=47536761

使用 IRC 作为传输层存在安全风险，一旦被攻破，攻击者可能获取邮件和私人数据，甚至绕过 API 限制导致巨额费用或滥用
公开聊天室可能导致非法内容传播，如儿童性虐待材料（CSAM），安全评估过于乐观
尽管模型性能可能相近，但 Anthropic 的 Haiku 模型在安全性和抗诱导方面表现更优，适合公开环境
一些开源或低价模型（如 MiniMax M2.7、Kimi K2.5、Gemini Flash）在性价比上更具优势，性能与 Haiku 相当甚至更优
使用高成本模型可能是为了规避安全风险，而非单纯性能需求，尤其在面对非可信用户时
IRC 传输缺乏消息确认和重传机制，无法保证消息不丢失，不适合需要可靠交付的任务
IRC bouncer 可以提供至少一次投递，但依然可能因断连或网络分裂导致消息丢失
建议为每个用户创建独立会话，设置超时或长度限制，避免陌生人持续交互
可通过监控机器人检测异常行为，结合 ntfy 等工具实时告警，提升安全性
项目虽有趣，但对代码仓库的自动分析存在安全隐患，可能暴露敏感信息或被用于漏洞探测

Hacker News 精彩评论及翻译 #

We rewrote JSONata with AI in a day, saved $500k/y… #

https://news.ycombinator.com/item?id=47537229

The key point for me was not the rewrite in Go or even the use of AI, it was that they started with this architecture:

The reference implementation is JavaScript, whereas our pipeline is in Go. So for years we’ve been running a fleet of jsonata-js pods on Kubernetes - Node.js processes that our Go services call over RPC. That meant that for every event (and expression) we had to serialize, send over the network, evaluate, serialize the result, and finally send it back.

This was costing us ~$300K/year in compute, and the number kept growing as more customers and detection rules were added.

For something so core to the business, I’m baffled that they let it get to the point where it was costing $300K per year.

The fact that this only took $400 of Claude tokens to completely rewrite makes it even more baffling. I can make $400 of Claude tokens disappear quickly in a large codebase. If they rewrote the entire thing with $400 of Claude tokens it couldn’t have been that big. Within the range of something that engineers could have easily migrated by hand in a reasonable time. Those same engineers will have to review and understand all of the AI-generated code now and then improve it, which will take time too.

I don’t know what to think. These blog articles are supposed to be a showcase of engineering expertise, but bragging about having AI vibecode a replacement for a critical part of your system that was questionably designed and costing as much as a fully-loaded FTE per year raises a lot of other questions.

Aurornis

对我来说，关键点不在于用 Go 重写，甚至不在于使用 AI，而是他们一开始就采用了这种架构：

参考实现是 JavaScript，而我们的管道是用 Go 写的。所以多年来，我们一直在 Kubernetes 上运行着一群 jsonata-js Pods——这是我们的 Go 服务通过 RPC 调用的 Node.js 进程。这意味着对于每一个事件（和表达式），我们都要先序列化，通过网络发送，求值，序列化结果，最后再发回去。

这给我们带来了每年约 30 万美元的算力成本，而且随着客户和检测规则的增加，这个数额还在不断增长。

对于如此核心的业务功能，我很难理解他们是怎么允许它发展到每年花费 30 万美元这一地步的。

这件事完全可以用 400 美元的 Claude Token 重写，这一事实让人更加困惑。在一个大型代码库中，我很快就能把 400 美元的 Claude Token 用光。如果他们只用 400 美元的 Claude Token 就重写了整个东西，那规模不可能那么大。那种工作量在工程师合理的时间内完全可以手动迁移。而同样的工程师现在还必须审查和理解所有 AI 生成的代码，然后再对其进行改进，这也需要时间。

我不知道该说什么了。这些博客文章本应是工程专家水平的展示，但炫耀说你们用 AI “氛围编程”（vibecode）重写了一个设计存疑且每年成本相当于一名全功能全职员工的系统核心组件，这反而引出了更多其他问题。

Desk for people who work at home with a cat #

https://news.ycombinator.com/item?id=47544782

I can foresee a design flaw, which is that the cat will ignore all the specially designated areas and sit on your keyboard instead.

MichaelDickens

我预见到了一个设计缺陷，那就是猫咪会无视所有特意划定的区域，反而会坐在你的键盘上。

If you don’t opt out by Apr 24 GitHub will train o… #

https://news.ycombinator.com/item?id=47548376

I’ve been saying this since 2023

If your data is stored in a database that a company can freely read and access (i.e. not end-to-end encrypted), the company will eventually update their ToS so they can use your data for AI training — the incentives are too strong to resist

https://news.ycombinator.com/item?id=37124188

kepano

我从 2023 年起就一直这么说

如果你的数据存储在一个公司可以随意读取和访问的数据库中（即非端到端加密），该公司最终会更新其服务条款，以便利用你的数据进行 AI 训练——其中的利益诱惑实在太大了，无法抗拒 https://news.ycombinator.com/item?id=37124188

People inside Microsoft are fighting to drop manda… #

https://news.ycombinator.com/item?id=47544125

This “make Windows better” push is far more political than technological. It’s a fight with other divisions about using Windows as a marketing and sales channel for other products and services.

It has to be a decision from the very top. I hope they realize that Windows is in significant danger, the majority market share for Desktop OS is not guaranteed anymore. It’s not just 10% of revenue, it’s a foundation for how enterprises ended up on Azure and are bringing big money.

I’m still a Windows power user, MacBook is a wonderful piece of hardware and I’m typing this on one, but I’m not nearly as productive as on multimonitor PC with TotalCommander and Visual Studio where I use all the shortcuts subconsciously.

grujicd

这个“让Windows更好”的推动，完全不是技术层面的考量，而是高度政治化的博弈。这是在与其他部门争夺将Windows作为其他产品和服务的营销与销售渠道的权力。

这必然是来自最高层的决策。我希望他们意识到Windows正面临巨大危机，桌面操作系统的主导市场份额已不再保有了。这不仅仅是10%的收入，更是企业最终转向Azure并带来巨额利润的基石。

我依然是一个Windows重度用户，MacBook是一款很棒的硬件，我正坐在一台MacBook前打这段话，但在使用带有多显示器、TotalCommander和Visual Studio的PC时，我在下意识使用所有快捷键时的生产力要比这高得多。

Olympic Committee bars transgender athletes from w… #

https://news.ycombinator.com/item?id=47535366

My two cents as a transfem athlete:

The attention this topic receives is disproportionate considering how rare we are, especially close to the Olympics level.

Most of us do sports for fun/friends and don’t care how they rank us, but would be sad to be banned.

There might be more “biological advantage” nuance with people just starting their transition, but by this many years in it feels silly. I registered as a man for the last event in case anyone might get upset, the staff changed it to say “woman” when I got there anyways, and then I lost to a woman twice my age.

callistocodes

作为跨性别女性运动员，我的一点看法：

考虑到我们在接近奥运水平时是多么稀有，这个话题受到的关注确实不成比例。

我们大多数人运动是为了娱乐或和朋友一起，并不在意排名，但被禁止参赛会令人难过。

刚开始性别过渡时，关于“生物学优势”可能确实存在更多细微差别，但到了这一步，感觉这挺荒谬的。

为了不让人不高兴，我最后一个项目是以男性身份注册的，但到了现场工作人员还是把信息改成了“女性”，结果我输给了一位年长我两岁的女性。

The ‘paperwork flood’: How I drowned a bureaucrat … #

https://news.ycombinator.com/item?id=47542604

Karen woke up this morning in her run down, rented flat. She briefly looks at the collections letter that showed up yesterday due to an unaffordable repair she had to pay for on her credit card. Another letter from her ex-partner’s lawyer. As she rushes out the door (she spilled coffee on her one nice sweater, her favorite) her mom flashes through her mind… “What about mum?”. She arrives at the office. It is an oppressive, sterile government office. She tries to ignore the overwhelming sense of helplessness and sits down to begin working. Her first call is a person screaming at her about their benefits. She has no power, absolutely no power, to help them due to the rules imposed on her by her superiors, but has to take the abuse regardless and explain the process she has no control over to them. The next call is a case she actually is familiar with: a person claiming to be disabled to collect dole. They aren’t, but she has been told that this is a special case and she must work with them. She complies. She sits back in her chair and the phone rings again. An upset person on the other end…

“I have the documents in PDF format”

recursivedoubts

今天早上，凯伦在她破旧的出租公寓里醒了过来。她草草瞥了一眼昨天收到的催款信，那是她不得不刷卡支付的昂贵维修费。还有来自前男友律师的一封信。当她匆忙冲出门（咖啡洒在她唯一一件漂亮的毛衣上，那是她最喜欢的）时，妈妈的身影突然浮现在脑海中……“妈妈怎么办？” 她到达了办公室。那是一个压抑、冷冰冰的政府部门。她努力忽视那种压倒性的无助感，坐下开始工作。她接到的第一个电话是关于福利的投诉，对方冲她大吼大叫。由于上级强加给她的规则，她毫无权力，绝对没有权力去帮助他们，但她还是不得不忍受这种辱骂，并解释那些她无法掌控的流程。下一个电话是她熟悉的案子：一个声称残疾来领取救济金的人。他们不是真的残疾，但她被被告知这是一个特殊案例，她必须配合他们。她照做了。她向后靠在椅子上，电话又响了。电话那头的人情绪激动…… “我有PDF格式的文件”

AI got the blame for the Iran school bombing. The … #

https://news.ycombinator.com/item?id=47545959

“Three clicks convert a data point on the map into a formal detection and move it into a targeting pipeline. These targets then move through columns representing different decision-making processes and rules of engagement. The system recommends how to strike each target – which aircraft, drone or missile to use, which weapon to pair with it – what the military calls a “course of action”. The officer selects from the ranked options, and the system, depending on who is using it, either sends the target package to an officer for approval or moves it to execution.”

Maven is a tool for use in the middle of a war. When both sides are firing, minutes saved can mean lives saved for your side. Those lives, at least partly, balance the risks of hitting a bad target.

This was not a strike made in the middle of a war. If Maven was used in the strike that took out a school, it was being used as part of a sneak attack. Nobody was shooting back while this was being planned. Minutes saved were not lives saved. There should have been a priority placed on getting the targets right. Humans should have been double and triple checking every target by other means. This clearly didn’t happen. The school was obviously a school that even had its own website. Humans would have spotted this if they had done more than make their three clicks and move on to the next target.

Whoever made the choice to use Maven to plan a sneak attack without careful checking made an unforced error when they had all the time in the world to prevent it. Whether it was overconfidence in their tools or a complete disregard for the lives of civilians that caused this lapse, they are directly responsible for the deaths of those little girls. I sincerely hope there are (although I doubt there will be) consequences for this person beyond taking that guilt to their grave.

beloch

地图上的一个数据点只需三次点击，就能转化为正式确认的打击目标，并送入打击流程。这些目标随后会通过代表不同决策过程和交战规则的列进行流转。系统会推荐针对每个目标的打击方式——包括使用哪种飞机、无人机或导弹，以及搭配何种武器——这正是军方所谓的“行动方案”。军官从排序后的选项中进行选择，而系统则根据使用者是谁，要么将打击包发送给军官审批，要么直接转入执行。

Maven是一款用于战争激烈时期的工具。当双方交火时，省下的每一分钟都意味着己方生命的挽救。这些生命至少在一定程度上，抵消了误中错误目标带来的风险。

但这并不是在战争激烈时期发起的打击。如果在炸毁学校的这次行动中使用了Maven，那么它就是被用作偷袭的一部分。制定计划时并没有人在还击。省下的这几分钟并不是在挽救生命。此时首要任务应该是确保目标的准确性。人类理应通过其他手段对每个目标进行反复核查。显然，这一切并没有发生。那所学校显然是一所甚至拥有自己网站的学校。如果人类没有只是匆匆完成那三次点击然后继续下一个目标，就会发现这一点。

那个选择在未经仔细检查的情况下利用Maven策划偷袭的人，明明拥有充足的时间来防止这种事发生，却犯下了一个本不该有的疏忽错误。不管是由于对工具过度自信，还是出于对平民生命的漠视导致了这一疏忽，他们对那些小女孩的死负有直接责任。我真诚地希望，这个人除了带着这份愧疚终老之外，还能受到应有的惩罚（虽然我对此表示怀疑）。

We haven’t seen the worst of what gambling and pre… #

https://news.ycombinator.com/item?id=47536326

And now here come the prediction markets, such as Polymarket and Kalshi, whose combined 2025 revenue came in around $50 billion.

Bizarre to call trading volume “revenue”. Last year, trading fees for Kalshi amounted to about $263 million 0, whereas Polymarket largely did not have fees in 2025 and is turning them on in a few days 1.

firloop

如今又出现了预测市场，比如Polymarket和Kalshi，它们的2025年合计营收达到了约500亿美元。

称交易量为“营收”真是怪异。去年，Kalshi的交易手续费共计约2.63亿美元 0，而Polymarket在2025年几乎没有收费，并将在几天后推出收费 1。

Apple discontinues the Mac Pro #

https://news.ycombinator.com/item?id=47539072

I bet there’s gonna be a banger of a Mac Studio announced in June.

Apple really stumbled into making the perfect hardware for home inference machines. Does any hardware company come close to Apple in terms of unified memory and single machines for high throughput inference workloads? Or even any DIY build?

When it comes to the previous “pro workloads,” like video rendering or software compilation, you’ve always been able to build a PC that outperforms any Apple machine at the same price point. But inference is unique because its performance scales with high memory throughput, and you can’t assemble that by wiring together off the shelf parts in a consumer form factor.

It’s simply not possible to DIY a homelab inference server better than the M3+ for inference workloads, at anywhere close to its price point.

They are perfectly positioned to capitalize on the next few years of model architecture developments. No wonder they haven’t bothered working on their own foundation models… they can let the rest of the industry do their work for them, and by the time their Gemini licensing deal expires, they’ll have their pick of the best models to embed with their hardware.

chatmasta

我敢打赌，六月会发布一台重磅 Mac Studio。

Apple 真的是无意中打造出了家庭推理机器的完美硬件。在统一内存和单机实现高吞吐量推理工作负载方面，有哪家硬件公司能比肩 Apple？甚至 DIY 组装机呢？

在“专业工作负载”（比如视频渲染或软件编译）上，你总是可以组装一台在同等价位下性能超越 Apple 机器的 PC。但推理是独特的，因为其性能随高内存带宽扩展，而在消费级机箱尺寸内，你无法通过拼凑现成的零件来组装出这样的配置。

对于推理工作负载来说，要在接近其价格的预算下，DIY 一台比 M3+ 更好的家庭实验室推理服务器，简直是不可能的。

他们完美占据了赛道，可以充分利用接下来几年的模型架构发展红利。难怪他们没费心去开发自己的基础模型……他们可以让业界其他人为他们完成工作，等到他们的 Gemini 许可协议到期时，他们就能从最好的模型中挑选合适的，嵌入到他们的硬件中。

The ‘paperwork flood’: How I drowned a bureaucrat … #

https://news.ycombinator.com/item?id=47542732

I agree wholeheartedly! This is exactly what i was thinking the entire time. Like, does this guy think this single woman is responsible for the kafka-esque trap they’re both in? Will the 0.5% uptick in toner cost for the year cause the administration to rethink their requirements? He’s just taken the immense weight and pain he holds for this process, undeservedly, and placed it upon another undeserving person, then laughed at her anguish.

Yes, life is hard, but surely we can bear our troubles in a way that don’t make others harder to bear. Or at least aim your troubles at someone who has any power at all to change things! Find a better way to fight the system, that isn’t just stabbing other people trapped in the box with you

wholinator2

我完全同意！这也是我一直在想的内容。就像，难道这家伙觉得这个单身女人要对他们两人掉进的那种卡夫卡式的困境负责吗？哪怕是这一年墨粉成本上涨了0.5%，难道会让行政部门重新审视他们的要求吗？他只是把他对这个流程所承载的那种沉重痛苦和不公，无端地压在了另一个无辜的人身上，然后对着她的痛苦冷笑。

是的，生活很艰难，但至少我们可以以不把麻烦转嫁给他人的方式来承受吧。或者至少，把你的麻烦指向那些真的有权力改变事情的人！去寻找对抗体制的更好方式吧，而不是仅仅对着也和你被困在这个盒子里的人捅刀子。

Hold on to Your Hardware #

https://news.ycombinator.com/item?id=47541161

I don’t buy the central thesis of the article. We won’t be in a supply crunch forever.

However, I do believe that we’re at an inflection point where DC hardware is diverging rapidly from consumer compute.

Most consumers are using laptops and laptops are not keeping pace with where the frontier is in a singular compute node. Laptops are increasingly just clients for someone else’s compute that you rent, or buy a time slice with your eyeballs, much like smartphones pretty much always have been.

I personally dropped $20k on a high end desktop - 768G of RAM, 96 cores, 96 GB Blackwell GPU - last October, before RAM prices spiked, based on the logic that hardware had moved on but local compute was basically stagnant, and if I wanted to own my computing hardware, I’d better buy something now that will last a while.

This way, my laptop is just a disposable client for my real workstation, a Tailscale connection away, and I’m free to do whatever I like with it.

I could sell the RAM alone now for the price I paid for it.

barrkel

我不认同这篇文章的核心论点。我们不会永远陷入供应短缺的局面。

然而，我确实认为我们正处于一个转折点，数据中心硬件正在与消费级计算迅速拉开差距。

大多数消费者都在使用笔记本电脑，但笔记本电脑已无法跟上单个计算节点前沿技术的步伐。笔记本电脑正日益演变为一种仅作为终端设备的形态，用于获取你租来的算力，或者通过出卖眼球/注意力来换取使用时间，这跟智能手机一直以来的模式没什么两样。

我个人在去年10月内存价格暴涨之前，花了两万美金买了一台高端台式机——配备了768G内存、96核处理器和96GB的Blackwell显卡。当时的逻辑是，虽然硬件已经向前发展了，但本地计算基本上处于停滞状态。如果我想拥有属于自己的计算硬件，就最好趁现在买一台能用很久的东西。

这样一来，我的笔记本电脑就只是我真正工作站的临时终端，通过Tailscale一连接，我就能在上面自由地做任何事。

我现在仅靠卖那块内存就能卖回原价。

DOOM Over DNS #

https://news.ycombinator.com/item?id=47533662

To clarify, a good title would be “Loading Doom entirely from DNS records”

Neither one plays Doom over DNS nor is the first paragraph in the README correct, because DNS is only abused for storage, not for computing/processing/executing instructions:

At some point, a reasonable person asked “DNS resolves names to IP addresses, what else can it do?” The answer, apparently, is run DOOM.

ktpsns

澄清一下，最好的标题应该是“仅从DNS记录加载DOOM”。这二者都不是通过DNS来玩DOOM，而且README的第一段也是错的，因为DNS仅仅是被用作存储，而不是用于计算、处理或执行指令：

曾有位正常人问：“DNS把名字解析成IP地址，它还能干什么？”答案显然就是运行DOOM。

Running Tesla Model 3’s computer on my desk using … #

https://news.ycombinator.com/item?id=47525493

From the article

Tesla offers a “Root access program” on their bug bounty program. Researchers who find at least one valid “rooting” vulnerability will receive a permanent SSH certificate for their own car, allowing them to log in as root and continue their research further.

Pretty interesting. Sounds like Apple’s Security Research Device Program 0, where you’re loaned a rooted iPhone, but with a clear qualification criteria.

It strikes a nice balance, because to qualify you have to 1) show you have the skills to get root access anyway and 2) show you’re willing to participate in the bug bounty program and get things patched.

I would of course love root on everything I own, but I can understand Tesla’s motivation here since root for everyone would make vulnerability discovery easier for malicious actors. And if everyone had root on their Tesla, it’d be much easier to make naughty modifications that might catch the ire of regulators. (like disabling driver attentiveness checks in self-driving mode).

0 https://security.apple.com/research-device/

varenc

文章摘录

特斯拉在其威胁赏金计划中提供了一个“Root 访问权限计划”。发现至少一个有效的“获取 Root 权限”漏洞的研究人员将获得自己车辆永久的 SSH 证书，允许他们以 root 身份登录并继续他们的研究。

非常有趣。听起来就像苹果的安全研究设备计划 0，你从那里借到一个已经获得 Root 权限的 iPhone，但这里也有明确的准入标准。

这达到了一个很好的平衡，因为要获得资格，你必须 1) 证明你有能力获取 Root 权限，以及 2) 证明你愿意参与赏金计划并协助修复漏洞。

我当然希望能拥有我拥有的所有东西的 Root 权限，但我能理解特斯拉这么做的动机，因为如果每个人都有 Root 权限，恶意行为者发现漏洞会更容易。而且，如果每个人在他们的特斯拉上都有 Root 权限，进行那些可能招致监管机构愤怒的恶劣改装就会容易得多。（例如在自动驾驶模式下禁用驾驶员注意力检查）。

0 https://security.apple.com/research-device/

Anatomy of the .claude/ folder #

https://news.ycombinator.com/item?id=47543929

I’m seeing this more and more, where people build this artificial wall you supposedly need to climb to try agentic coding. That’s not the right way to start at all. You should start with a fresh .claude, empty AGENTS.md, zero skills and MCP and learn to operate the thing first.

exitb

我越来越常看到这种现象，人们建立了一道据称需要跨越的“人为高墙”才能尝试智能体编程。这根本不是正确的入门方式。你应该从一个全新的 .claude 目录、空的 AGENTS.md、零技能和 MCP 配置开始，先学会操作这个工具。

Why so many control rooms were seafoam green (2025… #

https://news.ycombinator.com/item?id=47534361

I’m reminded of an article a while back talking about how the change from sodium streetlights to LED streetlights had a whole lot of unforeseen effects on animals, people’s sleep patterns, driver awareness and visibility, etc. due to color changes. There was a comment on the article from an old civil engineer saying “no, these were not unforeseen, we actually did the research back in the day to figure out what color the street lights should be, that’s why they were the color they were.”

roughly

我想起了以前有一篇文章，讲的是从钠灯转变为LED路灯后，由于颜色的改变，给动物、人类的睡眠规律、驾驶者的警觉性和能见度等造成了大量意想不到的后果。文章里有一位老市政工程师的评论说：“不，这些并不是意料之外的，我们当时其实做过研究来弄清楚路灯应该是什么颜色，这就是它们当时之所以是那个颜色的原因。”

Personal Encyclopedias #

https://news.ycombinator.com/item?id=47527836

That sounds like a really cool project and a really interesting way to preserve family history.

I feel like i don’t know how to emotionally react to the AI part of this story. To begin with, it is fundamentally cool we have technology like that. At the same time it felt bittersweet, like an artisan being put out of business by the factory. The first part of the story felt like much of the love was in constructing everything by hand, it seems almost sad to lose that. There is also an element of dystopia in how the AI was able to cross reference everything, bank statements, ticketmaster recipts, shazam, etc. It is kind of unsettling the power of it all.

Not sure where i’m going with this comment. Its a super cool project, thanks for sharing.

bawolff

听起来是个很酷的项目，也是保存家族历史的一种很有趣的方式。

感觉我对这个故事中的人工智能部分不知该作何情感反应。首先，拥有这样的技术确实很酷。但同时感觉又很苦乐参半，就像一位手艺人被工厂取代了一样。故事的前半部分感觉很多心血都倾注在手工制作中，失去这种特质似乎很令人悲伤。此外，AI能够交叉参考一切（如银行账单、门票收据、Shazam等），这让人感觉其中带有一点反乌托邦的色彩。这种全知全能的力量让人感到不安。

不确定我这番评论到底想说什么。这是个很棒的项目，谢谢分享。

A Faster Alternative to Jq #

https://news.ycombinator.com/item?id=47541107

Whenever you have this kind of impressions on some development, here are my 2 cents: just think “I’m not the target audience”. And that’s fine.

The difference between 2ms and 0.2ms might sound unneeded, or even silly to you. But somebody, somewhere, is doing stream processing of TB-sized JSON objects, and they will care. These news are for them.

j1elo

当你对某些技术发展有类似感触时，不妨听听我的拙见：不妨就当自己“并不是目标用户”就好，这完全没问题。对你来说，2 毫秒和 0.2 毫秒之间的差异可能显得多余，甚至有些傻气。但总有人在某个角落处理着 TB 量级的 JSON 对象流，他们会非常在乎这点差异。这些消息正是为了他们而发。

LibreOffice and the art of overreacting #

https://news.ycombinator.com/item?id=47529373

I disagree with take on Wikipedia or Wikimedia there was a lot of trash talk because they were totally obnoxious with their fundraising.

I donated once to Wikipedia and then I was getting Jimmy Wales in my mailbox basically like everyday.

That actually drove me away from ever wanting to donate to them. Then there was a lot of talking if they really are so much in need of money but that’s different topic.

In contrast I donated to LibreOffice and it was perfectly quiet for one time donation and I am happy to donate from time to time as I use LibreOffice for my personal stuff.

ozim

我不同意你对维基百科或维基媒体的看法，之所以有那么多抱怨，是因为他们在筹款方面实在太招人烦了。

我给维基百科捐过一次款，结果我的邮箱里全是吉米·威尔士寄来的信，基本上每天都要收到。

这实际上让我再也不想给他们捐款了。随后关于他们是否真的那么急需用钱的讨论也很多，但这属于另一个话题。

相比之下，我给 LibreOffice 捐过款，对于一次性捐款，整个过程非常安静（没有打扰），而且因为我个人使用 LibreOffice，我很乐意偶尔再捐一点。

My minute-by-minute response to the LiteLLM malwar… #

https://news.ycombinator.com/item?id=47531968

Callum here, I was the developer that first discovered and reported the litellm vulnerability on Tuesday. I’m sharing the transcript of what it was like figuring out what was going on in real time, unedited with only minor redactions.

I didn’t need to recount my thought process after the fact. It’s the very same ones I wrote down to help Claude figure out what was happening.

I’m an ML engineer by trade, so having Claude walk me through exactly who to contact and a step by step guide of time-critical actions felt like a game-changer for non-security researchers.

I’m curious whether the security community thinks more non-specialists finding and reporting vulnerabilities like this is a net positive or a headache?

Fibonar

我是Callum，我是本周二最早发现并报告litellm漏洞的开发者。我在分享我们实时排查情况时的交流实录，未作编辑，仅做了少量模糊处理。

我事后不需要重述我的思考过程。这正是我写下来帮助Claude弄清楚发生了什么的记录。

我本职是ML工程师，所以让Claude一步步引导我具体该联系谁，以及针对关键时间节点的分步操作指南，对我这种非安全研究人员来说感觉像是发生了质的飞跃。

我很好奇安全社区是否认为让更多非专业人士发现并报告此类漏洞是总体有益的，还是仅仅是一种麻烦？

The ‘paperwork flood’: How I drowned a bureaucrat … #

https://news.ycombinator.com/item?id=47542486

Sounds like it’s not real but…

It reads like an indictment of the government employee personally, rather than the rules and constraints that employee is forced to use.

Probably fair to comment on the interaction, whether the person was rude, and so on. But blaming them for not accepting email is kind of silly. They are not empowered to do that kind of thing.

tyingq

听起来像不是真的，但是……

这读起来像是对该政府雇员个人的指责，而不是针对该雇员被迫使用的规则和限制。

评论互动过程可能没问题，比如评价那个人是否粗鲁等等。

但因为不收邮件而责怪他们，有点傻。他们没有权限做这种事。

$500 GPU outperforms Claude Sonnet on coding bench… #

https://news.ycombinator.com/item?id=47539830

Generating big chunks of code is rarely what I want from an agent. They really shine for stuff like combing through logs or scanning dozens of source files to explain a test failure. Which benchmark covers that? I want the debugging benchmark that tests mastery of build systems, CLIs, etc.

bloppe

我很少希望智能体生成大段的代码。它们确实很擅长梳理日志，或者扫描几十个源文件来解释测试失败。哪个基准测试涵盖了这些内容？我想要的是那个考察对构建系统和命令行界面等熟练程度的调试基准。

Olympic Committee bars transgender athletes from w… #

https://news.ycombinator.com/item?id=47534798

The IOC policy is specifically that athletes need to test negative for the SRY gene to be eligible to compete in the female category. Imane Khelif won gold in the 2024 Summer Olympics women’s boxing event, and has since admitted to having the SRY gene. So it isn’t a non-issue.

https://en.wikipedia.org/wiki/Imane_Khelif#2026

themgt

国际奥委会的政策具体规定，运动员需SRY基因检测呈阴性才有资格参加女子组比赛。伊曼·哈利夫在2024年夏季奥运会女子拳击比赛中获得金牌，此后她承认自己带有SRY基因。所以说这并不是无关紧要。

End of “Chat Control”: EU parliament stops mass su… #

https://news.ycombinator.com/item?id=47529682

Despite today’s victory, further procedural steps by EU governments cannot be completely ruled out. Most of all, the trilogue negotiations on a permanent child protection regulation (Chat Control 2.0) are continuing under severe time pressure. There, too, EU governments continue to insist on their demand for “voluntary” indiscriminate Chat Control.

Furthermore, the next massive threat to digital civil liberties is already on the agenda: Next up in the ongoing trilogue, lawmakers will negotiate whether messenger and chat services, as well as app stores, will be legally obliged to implement age verification. This would require users to provide ID documents or submit to facial scans, effectively making anonymous communication impossible and severely endangering vulnerable groups such as whistleblowers and persecuted individuals.

nickslaughter02

尽管今日取得了胜利，但欧盟政府采取进一步程序性措施的可能性仍然不能完全排除。最重要的是，关于长效儿童保护法规（Chat Control 2.0）的三方会谈仍在巨大的时间压力下持续进行中。在该议题上，欧盟政府也继续坚持要求实施“自愿”且无差别的聊天监控。

此外，数字自由面临的下一个巨大威胁也已列入议程：在持续进行的三方会谈中，立法者将讨论是否应通过法律强制消息和聊天服务以及应用商店实施年龄验证。这将迫使用户提供身份证件或接受面部扫描，实际上会使匿名通信变得不可能，并严重威胁吹哨人和受迫害者等弱势群体。

We rewrote JSONata with AI in a day, saved $500k/y… #

https://news.ycombinator.com/item?id=47537324

Yeah, it’s like those posts “we made it 5,000x faster by actually thinking about what the code is doing.”

andai

是啊，就像那些帖子那样，“通过真正思考代码在做什么，我们把速度提了5000倍。”

People inside Microsoft are fighting to drop manda… #

https://news.ycombinator.com/item?id=47544836

As someone with a sizeable background in Linux system engineering.. I prefer Windows to MacOS.

It’s IMHO a better desktop now with the edge snap tile layout and etc. Excellent device compatibility. And I get my linux environment needs satisfied via WSL2 these days.

But damn if they don’t get in their own way. I have my own Pro licenses, and even with Pro turning off ads and features is text book whack-a-mole:

Frequent “Let’s finish setting up your PC” after updates
Killing OneDrive is a like night of the living dead
Edge popping up “ads” asking you if you want to pin apps when it closes(a lot of windows apps wrap edge, like streaming apps, and show this too on close!)
Scary Power Automate crap getting injected on updates(haven’t seen this in a while)
Internet search results in the “Home” search
Random popups and product recommendations
Registry disabled “features” randomly resurrecting after Windows update

Holy. Hell.

Edit: I recall now; Windows was installing a power automate extension into Chrome during Windows Update un-prompted last year. Caused a minor panic.

Rapzid

作为在Linux系统工程方面有相当背景的人……相比于MacOS，我更喜欢Windows。

依我看，现在的Windows桌面体验更好，得益于边缘吸附拼贴布局等功能。设备兼容性极佳。而且现在通过WSL2我也能满足使用Linux环境的需求。

但见鬼的是，他们总是自己给自己添乱。我手握专业版授权，但即使在专业版里关闭广告和功能，也像是在玩打地鼠游戏：

更新后经常弹出“让我们完成电脑设置”
关闭OneDrive就像打不完的僵尸
Edge在关闭时会弹出“广告”，询问是否固定应用（很多Windows应用都嵌入了Edge，比如流媒体应用，关闭时也会显示这个！）
更新时可怕地注入Power Automate的东西（这阵子没见过了）
首页搜索里出现互联网搜索结果
随机弹窗和产品推荐
更新后注册表里被禁用的“功能”会随机死灰复燃

天哪。我天。

编辑：我想起来了；去年Windows更新时，在未经许可的情况下，自作主张给Chrome安装了一个Power Automate扩展。引起了一点恐慌。