2026 03 24 HackerNews

2026-03-24 Hacker News Top Stories #

  1. 作者出于政治与数据保护考量,将个人网络服务全面迁移至欧盟或欧洲供应商。
  2. GrapheneOS承诺无需个人信息即可全球使用,并宣布与摩托罗拉等设备厂商的长期合作计划。
  3. 《过山车大亨》通过在汇编层面进行极致优化并将性能考量融入游戏设计,在有限硬件上实现了大规模模拟。
  4. 开发者通过SSD流式传输和MoE架构等技术,在iPhone上成功运行了4000亿参数的大型语言模型。
  5. GitHub近期频繁宕机导致可用性跌破90%,引发开发者对其服务稳定性及微软过度关注AI功能的不满。
  6. NixOS凭借其声明式配置、可复现构建和原子级回滚特性,成为与AI工具协同工作及系统管理的理想选择。
  7. OpenClaw作为能控制本地系统的AI代理,虽带来便利却因需全面访问敏感数据而存在严重安全隐患。
  8. POSSE策略倡导先在自己的网站发布内容再同步至第三方平台,以保留内容所有权和原始链接。
  9. 研究表明面对面教学中外貌吸引力可提升学业成绩,而远程教学时这种优势仅对男生有效,反而对女生产生负面影响。

1. 迁移到欧盟 (Migrating to the EU) #

https://rz01.org/eu-migration/

作者因全球政治局势及数据保护考虑,决定将个人使用的多项网络服务从非欧盟地区迁移至欧盟或改用欧洲服务提供商,以提升隐私安全与合规性。

在邮件服务方面,原使用 Fastmail,但因缺乏欧洲本地化选项,最终选择 Uberspace。该平台支持自定义域名、任意发件人地址,虽无专用 App,但通过 Thunderbird Android 客户端可满足需求。

日历服务原依赖 Fastmail,现通过在 Uberspace 上部署 NextCloud 实现,支持 CalDAV 与 CardDAV,桌面端使用 Thunderbird,移动端使用 DAVx5 和 Fossil Calendar,功能完整且具备文件共享能力。

网站托管从 Hetzner 的 VPS 迁移至 Uberspace,尽管 Apache 的 SSI 实现略有不同,但通过调整 HTML 代码即可顺利迁移,实现统一管理。

域名与 DNS 服务原用 Namecheap,现改用德国的 hosting.de,价格合理,支持.iss 等特殊域名,服务响应迅速,整体体验良好。

Git 代码托管从 GitHub 和自建 Gitea 迁移至 Codeberg.org,该平台为德国非营利组织,符合开源与隐私保护理念。

VPN 服务保持不变,继续使用 Mullvad,每月 5 欧元,无需注册、不记录日志,服务稳定可靠。

手机方面,工作机为 Pixel 6,个人机更换为支持 Graphene OS 的 Pixel 9a,可安装 F-Droid 等替代应用商店,实现 YouTube 无广告观看。同时,为减少对 Google 的依赖,购入二手 MacBook Air(A1465),计划安装 MX Linux 与 Fluxbox,用于日常浏览与视频播放,逐步替代 Chromebook。


HN 热度 816 points | 评论 629 comments | 作者:exitnode | 14 hours ago #

https://news.ycombinator.com/item?id=47487436

  • mailbox.org 支持使用自定义域名发送邮件,通过在 Thunderbird 等客户端添加发件人身份即可实现,无需复杂操作。
  • 有用户指出 mailbox.org 曾存在安全漏洞,允许任何人伪造其域名发送邮件,但后续已修复相关问题。
  • 通过 SPF、DKIM 和 DMARC 等邮件认证机制可有效防范伪造,但这些机制在实际中对防止钓鱼邮件效果有限。
  • 邮件客户端如 Thunderbird 可通过插件(如 EagleEye)检测 SPF/DKIM/DMARC 失败,提升安全性。
  • mailbox.org 的自定义域名发件人功能在第三方客户端中无限制,仅网页界面存在数量限制。
  • 有用户认为该文章对 mailbox.org 的批评不准确,实际使用中可自由发送来自自定义域名的邮件。
  • 从澳大利亚迁移到欧洲服务商并非更安全,因澳大利亚同属“五眼联盟”,仍可能受美国监控。
  • 欧盟虽有民主机制,但实际政策制定由非选举产生的欧盟委员会主导,普通公民影响力有限。
  • 欧盟政策受公众舆论和个体行动影响,尽管过程漫长,但仍有推动改变的可能。

2. PC Gamer 用 37MB 的广告轰炸文章推荐 RSS 阅读器 (PC Gamer recommends RSS readers in a 37mb article that just keeps downloading) #

https://stuartbreckenridge.net/2026-03-19-pc-gamer-recommends-rss-readers-in-a-37mb-article/

文章作者 Stuart Breckenridge 批评了 PC Gamer 网站的一篇关于 RSS 阅读器的推荐文章,指出其糟糕的用户体验。页面加载时弹出多个干扰性弹窗,包括通知提示、订阅邮件弹窗,以及被遮挡的正文内容,背景还布满至少五个广告。

进入正文后,页面仍包含五个广告、标题和副标题,内容本身简短且价值有限。更严重的是,该页面初始加载大小高达 37MB,且在短短五分钟内,网站持续下载近 500MB 的广告资源,造成巨大的带宽消耗。

作者借此强调,正是由于这类充斥广告与干扰的网站存在,才凸显出 RSS 阅读器的价值。他推荐了 NetNewsWire、Unread、Current 和 Reeder 等优秀的 RSS 阅读工具,帮助用户摆脱网页内容的干扰,高效获取信息。


HN 热度 809 points | 评论 366 comments | 作者:JumpCrisscross | 1 day ago #

https://news.ycombinator.com/item?id=47480507

  • 网站在 5 分钟内下载近 500MB 数据,主要由自动播放视频导致,严重浪费资源,对低性能设备和按流量计费的用户极不友好。
  • 一些低收入人群依赖政府提供的廉价手机,每月仅 3GB 流量,用完后降速至 2G,导致设备基本无法使用,沦为电子垃圾。
  • 当前软件对资源的过度消耗是技术进步的反面,反映出对节约资源的忽视,这种“浪费”在经济上未必合理,却普遍存在。
  • 企业开发复杂、臃肿的网页应用,尽管性能差、错误频出,但用户仍选择使用,说明用户更看重“现代感”和花哨功能而非效率。
  • 专业类网站如 Digikey 和 McMaster-Carr 因服务专业用户而保持高效简洁,说明用户对性能的重视程度取决于使用场景。
  • 用户并非真正追求臃肿设计,而是被“摆在面前”的产品所主导,缺乏技术认知和选择权,难以推动改变。
  • 大量用户使用广告拦截器,说明他们实际上更倾向于简洁、无干扰的网页体验,这表明用户对当前网页设计并不满意。
  • Reddit 等平台强行推行重设计,用户强烈抵制,但平台仍不断破坏旧版功能,说明设计决策并非源于用户真实需求。
  • 一些网站如 Hacker News 和 Craigslist 因保持轻量和实用,受到用户长期欢迎,证明简洁设计在实践中更具可持续性。

3. GrapheneOS 将继续在全球范围内无需个人资料即可使用 (GrapheneOS will remain usable by anyone without requiring personal information) #

https://grapheneos.social/@GrapheneOS/116261301913660830

GrapheneOS 官方宣布将继续在全球范围内提供服务,无需用户提交个人信息或注册账户,确保全球用户均可使用。尽管部分国家可能因法规限制无法销售 GrapheneOS 设备,但项目方坚持开放可用的原则。

目前,Pixel 6a 仍被官方支持,将持续获得安全更新,直到 2027 年 7 月或 8 月达到生命周期终点。虽然 Pixel 6a 缺乏 ARMv9 安全特性且支持周期较短,不推荐新用户购买,但仍在支持范围内。

GrapheneOS 与摩托罗拉建立长期合作伙伴关系,未来将有更多摩托罗拉设备获得官方 GrapheneOS 支持。这些设备将满足 GrapheneOS 严格的隐私与安全标准,但目前仅 Pixel 系列及未来符合标准的摩托罗拉设备支持。

其他非 Pixel 品牌设备(如三星)因缺乏必要的安全功能、锁定引导加载程序、使用电子保险丝(e-fuse)等机制,已无法安装 GrapheneOS。三星从 One UI 8 开始全面禁止安装第三方系统,即使尝试刷机也会导致设备永久失效,彻底关闭了自定义 ROM 的可能性。

GrapheneOS 明确表示不会与 Fairphone 合作,因其未提供足够的隐私与安全保护措施,不符合项目标准。

项目强调,GrapheneOS 的核心目标是显著提升 Android 的隐私与安全水平,因此必须坚持高标准,不为兼容性而妥协。


HN 热度 584 points | 评论 177 comments | 作者:nothrowaways | 1 day ago #

https://news.ycombinator.com/item?id=47482217

  • 一些用户因美国部分州的二方同意录音法律而自行构建 LineageOS,以在合法地区启用录音功能,这反映了 Android 系统在国家层面的限制问题。
  • 有观点认为,禁止录音功能可能是大公司规避法律责任的借口,而非真正出于法律合规需要,且手机具备 GPS 和语音检测能力,理论上可智能判断录音场景。
  • 部分人指出,若一方已明确告知录音,另一方无隐私期待,则无需额外获得同意,因此在通话中提示录音已足够。
  • 有人质疑为何仅在通话录音时限制功能,而其他如更敏感的场所(如更衣室)却未被限制,且手机难以准确识别所处环境。
  • 日本要求相机快门声不可关闭,虽非法律强制,但源于对性犯罪问题的担忧,反映了产业自我规制的模式。
  • 有用户提到,中国北斗导航系统在某些美国境内设备上被固件地理封锁,无法启用,这并非安全问题,而是政治性限制。
  • 有人认为日本的快门声要求是无效的“自我监管”形式,仅提供虚假的安全感,与反应性法律效果类似。
  • 对于 GrapheneOS 与摩托罗拉的合作,有人担心其合规性可能受法律影响,若未来仅限于特定设备,可能面临被立法排除的风险。
  • 有人支持 GrapheneOS,但希望其不要因依赖特定硬件或厂商而陷入被动局面,认为其开放性依赖于谷歌的设计选择,存在不确定性。
  • 有观点认为,谷歌 Pixel 设备是目前最开放的硬件平台之一,但其开放性仍可能被谷歌随时改变。
  • 有人建议 GrapheneOS 可将法律风险转移给用户,通过用户确认方式规避责任,但此做法可能难以真正规避法律风险。
  • 有人提出,GrapheneOS 可考虑将公司迁至海外,通过第三方渠道销售,以规避本地法律限制,类似许多跨境电商的做法。
  • 有用户认为,预装 GrapheneOS 可能违背其核心理念,用户自行安装更能体现安全性和自主性。
  • 有人指出,GrapheneOS 支持硬件级验证,用户可验证系统完整性,确保安装的系统未被篡改。
  • 也有观点质疑硬件级验证的可靠性,认为可能存在非持久性漏洞,恶意系统可伪造验证结果。

4. 《过山车大亨》的优化典范:深入剖析其底层实现 (The gold standard of optimization: A look under the hood of RollerCoaster Tycoon) #

https://larstofus.com/2026/03/22/the-gold-standard-of-optimization-a-look-under-the-hood-of-rollercoaster-tycoon/

《过山车大亨》(RollerCoaster Tycoon)系列因其卓越的性能优化而广受赞誉,尤其在 1999 年硬件条件下实现了数千游客同时运行的复杂主题公园模拟。其开发者克里斯·索耶(Chris Sawyer)几乎全程使用汇编语言编写代码,这是当时罕见的做法,显著提升了执行效率。尽管现代编译器已能自动优化许多低级操作,但在当时,手动编写汇编语言对性能提升至关重要。

通过开源项目 OpenRCT2,人们得以深入研究原版游戏的实现逻辑。该项目基于多年逆向工程,几乎完全复现了原版游戏,成为分析其优化策略的重要依据。尽管部分优化在现代系统中已不再必要,但其设计思想依然值得借鉴。

在数据存储方面,游戏根据数值范围选择不同大小的变量类型。例如,商店商品价格仅用 1 字节存储,而公园总价值则使用 4 字节,这种精细的内存管理减少了不必要的资源浪费。不过,OpenRCT2 后来统一为 8 字节变量,因现代 CPU 性能已不再受此影响。

在数学运算上,游戏大量使用位移操作(如左移 « 和右移 »)替代乘除法。例如,OldValue << 2 等价于乘以 4,OldValue >> 3 等价于除以 8。这种写法不仅运行更快,也反映出游戏内部公式在设计时就已考虑底层硬件特性,刻意使用 2 的幂次进行计算,以匹配 CPU 最优处理方式。

更深层次的优化体现在游戏设计本身。由于克里斯·索耶既是程序员又是设计师,他能将性能考量融入玩法机制。例如,游客并非主动寻找目标游乐设施,而是随机沿路径行走,仅在路口随机选择方向。这种“盲走”机制避免了大规模实时路径规划的高开销,极大降低了计算负担,同时仍能模拟出自然的游客行为。

这种“设计服务于性能”的理念,是《过山车大亨》成功的关键。它不仅体现了技术上的极致追求,也展示了开发者对系统整体平衡的深刻理解。


HN 热度 565 points | 评论 154 comments | 作者:mariuz | 1 day ago #

https://news.ycombinator.com/item?id=47480886

  • 早期游戏如《魔兽争霸》系列采用 2 的幂次方地图尺寸,通过位移运算替代乘除法,显著提升在 386/486 等老式 CPU 上的性能。
  • 《黑鸦》等游戏在不同平台(如 SNES、Genesis、DOS)上均使用手工汇编语言编写,其中 PC 版利用自定义宏生成大量渲染代码,展现极高的技术实现能力。
  • 早期游戏开发中汇编语言虽高效,但编写成本极高,因此在后续项目中转向更高效的 C 语言等可移植性更强的开发方式。
  • 《星际争霸》原始源码曾被发现并归还给暴雪,换取周边商品,反映出对知识产权保护的谨慎态度,也凸显了历史游戏代码保存的困难。
  • 暴雪曾因源码服务器丢失且无备份而遭遇重大数据损失,影响了游戏资产的长期保存。
  • 现代处理器性能大幅提升,整数加法为单周期,乘法 3 周期,除法约 12 周期,且支持多指令并行执行,使得传统数值优化手段已不再关键。
  • 当前性能瓶颈主要来自内存布局和缓存命中率,一次缓存未命中可能带来 100 至 1000 周期的延迟,远超指令周期优化的影响。
  • 即使在现代架构中,合理的数据结构设计(如使用 int[]而非复杂对象数组)对性能影响远大于微优化。
  • 指数级算法复杂度问题(如 O(n²))远比微优化更应优先解决,只有在数据布局优化后,指令级优化才有实际意义。
  • 在使用 SIMD 时,整型运算(如 int16/int8)的吞吐量可达到浮点型的 2 至 4 倍,因此在特定场景下仍具显著优势。
  • 浮点型运算也可通过使用 f16 等低精度格式实现吞吐量翻倍,无需依赖特定数值特性。

5. iPhone 17 Pro 演示运行 400B 大型语言模型 (iPhone 17 Pro Demonstrated Running a 400B LLM) #

https://twitter.com/anemll/status/2035901335984611412

用户 @anemll 在 X 平台分享了一则动态,宣布其已在 iPhone 上成功运行 400B 规模的大型语言模型,推理速度达到每秒 0.6 个 token(t/s)。该成果得益于对模型优化与移动端部署的深入探索,展现了在移动设备上运行超大规模模型的可行性。用户特别感谢了 @danveloper、@alexintosh 和 @danpacary 的贡献与支持。该动态发布于 2026 年 3 月 23 日,上午 10:07,已获得超过 150.6 万次观看,引发广泛讨论,评论数达 8315 条,互动热度高。


HN 热度 452 points | 评论 232 comments | 作者:anemll | 10 hours ago #

https://news.ycombinator.com/item?id=47490070

  • SSD 流式传输到 GPU 的方案基于苹果 2023 年论文《LLM in a flash》,利用 M5P/M 系列芯片 SSD 速度翻倍的特性,使该方案更具可行性。
  • 《KV Prediction for Improved Time to First Token》论文可能有助于优化 Flash 流式传输中的预填充阶段。
  • 实验中使用了混合专家(MoE)模型,仅在需要时加载部分专家,显著降低了对内存的占用。
  • 尽管部分专家使用频率较低,但整体模型仍需频繁在内存与闪存间交换专家层,因为单个专家层大小接近设备总内存。
  • 专家层的使用分布不均,系统可借助文件系统缓存机制自动保留高频使用的专家,减少重复加载。
  • 有观点指出,当前实验中使用了极低精度量化(如 Q1),这在一定程度上“作弊”,使得模型运行看似高效但实际性能被夸大。
  • 有人质疑,若仅针对特定语言编程任务,是否可裁剪掉其他专家,仅保留一个专家即可满足需求,但实际中专家切换仍频繁,难以完全避免。
  • 降低专家切换频率的方案可能等价于减少专家总数,但可能影响模型整体表现。
  • 有用户担忧,即使采用流式加载,设备仍会迅速过热并降频,影响使用体验。
  • 有人提出为移动设备设计液冷系统,甚至玩笑式建议将设备浸入水中降温。
  • 该实验展示了在有限内存下运行超大模型的潜力,但需依赖量化、专家稀疏性与系统级优化。

6. GitHub 似乎难以实现仅三个九的可用性 (GitHub appears to be struggling with measly three nines availability) #

https://www.theregister.com/2026/02/10/github_outages/

GitHub 近期频繁出现服务不稳定问题,2026 年 2 月 9 日,其 Actions、拉取请求、通知及 Copilot 等功能均遭遇故障。微软承认部分 GitHub 服务出现异常,通知延迟达约 50 分钟,直至当日 19:29 才确认服务恢复正常。Copilot 在 2 月 9 日 16:29 至 10 日 09:57 期间也出现策略传播问题,导致部分用户无法访问新启用的模型。

GitHub 的官方状态页面更新后,用户更难直观查看过去 90 天的服务可用性数据,尽管其企业云服务 SLA 承诺 99.9% 的可用性,但并未对所有用户做出同等保证。有分析指出,GitHub 的稳定性已明显下滑,2025 年一度跌破 90% uptime。

此外,GitHub 的用户对服务体验表示不满,部分开发者因微软对 AI 功能的过度关注而选择离开平台。同时,GitHub 的“缺失”状态页面可通过公共状态馈源重建,但该来源非官方,需谨慎使用。

整体来看,GitHub 的持续性故障凸显了云服务在高可用性方面的挑战,也提醒用户需为服务中断做好准备。


HN 热度 430 points | 评论 221 comments | 作者:richtr | 14 hours ago #

https://news.ycombinator.com/item?id=47487584

  • 评判 GitHub 的可用性时,不应将所有功能的故障简单归为“GitHub 宕机”,应区分核心服务与非核心服务,如 Git 操作、API、Actions 等才是关键。
  • 当前 GitHub 多个核心服务在最近 90 天内均未达到三个九(99.9%)的可用性标准,甚至部分服务连两个九都未达到。
  • 企业客户若未达到 SLA,可获得服务信用作为补偿,但实际中大型客户更倾向于通过谈判获得特殊条款以避免违约。
  • 服务信用本质上是未来消费的折扣券,客户需持续使用服务才能获得,若离开则无法获得补偿。
  • 对于个人用户或开源开发者而言,27 小时/年的宕机时间可接受,但对企业用户而言,尤其在工作时间发生故障,会严重影响生产力。
  • 企业级 GitHub 服务年费高达百万,因此对高可用性有合理期待,不能以个人使用标准衡量。
  • 99% 可用性意味着每年约 87 小时的宕机时间,若集中在工作时间,影响远超预期。
  • 大型科技公司宣称的“五个九”可用性常被夸大,实际测量中存在大量错误和失败,仅 API 返回响应即算“在线”。
  • 服务可用性指标在多数情况下是人为包装的“绿色幻觉”,SLA 条款常对用户无实际意义。
  • 政府服务可用性低的问题与企业服务不可靠问题并存,反映出系统性问题,可能与采购机制有关。
  • 尽管 GitHub 资源雄厚,但其服务可靠性仍无法令人满意,不应以“资源多”为由为其辩护。

7. 我为何热爱 NixOS (Why I love NixOS) #

https://www.birkey.co/2026-03-22-why-i-love-nixos.html

本文作者分享了对 NixOS 的热爱,核心原因并非其作为 Linux 发行版的特性,而是其背后的 Nix 包管理器所体现的“声明式、可复现、确定性”的系统构建理念。

作者认为,大多数操作系统会随着时间积累不可控的状态,而 NixOS 通过将整个系统定义为一个可重建的声明式配置,彻底改变了这一现状。系统的所有组件——从软件包到桌面设置、键盘映射——都可以在一个统一的配置文件中定义,实现“单一事实来源”。

NixOS 的稳定性与可预测的半年发布周期,让系统升级变得安全可靠,无需担心意外故障。即使在新硬件上,也能快速搭建出一致的环境,无需重复手动配置。

作者特别赞赏 Nix 在开发与实验中的价值。通过 nix shellnix develop,可以为项目创建隔离的、可复现的环境,避免污染主系统。在与 LLM 编码助手协作时,这一特性尤为突出:助手能自动识别并使用 Nix 提供的精确工具链,如 Rust、Python、ffmpeg 等,无需修改用户环境,且所有依赖可被记录在 flake.nix 中,实现完全可复现的构建。

此外,Nix 的模型不仅适用于 NixOS,也支持 macOS 和 FreeBSD,使开发工具链在多平台间保持一致。在部署方面,Nix 能构建确定性的 Docker 镜像,确保构建结果在不同机器上完全一致。

总结而言,作者所爱的并非 NixOS 本身,而是它所代表的系统哲学:声明式、可复现、可回滚、可移植。这种一致性贯穿于开发、测试、部署的全过程,让开发者能专注于创造,而非管理环境。


HN 热度 429 points | 评论 300 comments | 作者:birkey | 1 day ago #

https://news.ycombinator.com/item?id=47479751

  • NixOS 的声明式配置和可回滚特性使其成为与 AI 工具协同工作的理想选择,能够安全地让 AI 自动完成系统配置变更。
  • 与其它操作系统相比,NixOS 提供了极高的系统稳定性与可审计性,使得即使让 AI 进行深度系统修改也令人安心。
  • 尽管 AI 在理解 Nix 配置时存在局限,如难以掌握模块间的上下文依赖和类型系统,但通过提供完整的项目上下文可显著提升效果。
  • AI 常会“幻觉”出不存在的 Nix 包或选项,需依赖官方文档或本地仓库验证,避免错误配置。
  • 使用本地克隆的 nixpkgs 等项目作为“事实来源”可有效避免 AI 的幻觉问题,提升配置准确性。
  • NixOS 与 AI 工具结合在桌面环境、窗口管理器切换、桌面设置等复杂操作中展现出巨大潜力。
  • 与 Ansible 等传统自动化工具相比,Nix 的声明式模型减少了对人为纪律的依赖,更少假设,更易保证结果一致。
  • NixOS 的学习曲线虽陡,但一旦掌握,部署和服务器配置速度极快,尤其适合静态网站等场景。
  • 有开发者尝试将 NixOS 与 AI 编程助手(如 Claude Code)集成,但受限于插件系统,需手动配置或克隆项目以提供上下文。

8. OpenClaw:披着美梦外衣的安全噩梦 (OpenClaw is a security nightmare dressed up as a daydream) #

https://composio.dev/content/openclaw-security-and-vulnerabilities

OpenClaw 是由 Peter Steinberger 开发的一款基于 Anthropic Claude Opus 4.5 模型的开源 AI 代理项目,近期在 AI 社区引发热议。它能通过 Telegram 与用户交互,控制本地系统文件、终端、浏览器、Gmail、Slack、智能家居设备等,实现高度自动化任务,如自动安排日程、管理邮件、预订航班、控制音响灯光等,展现出令人惊叹的“未来助手”潜力。

作者体验后表示,OpenClaw 的自动化能力确实强大,能学习用户习惯,创建复杂工作流,并通过 Notion 数据库记录和复用。例如,它能识别餐厅取消政策,自动提醒用户并确认是否非退款,再生成带截止时间的日历事件。

然而,这种强大能力背后隐藏着严重的安全风险。OpenClaw 需要授予对用户敏感数据的全面访问权限,包括短信、两步验证码、银行账户、日历、联系人、聊天记录等。一旦被攻击或出现模型幻觉,可能导致账户被盗、信息泄露甚至资金损失。

文章指出,这本质上是一场“弗兰肯斯坦式”的信任交易:用隐私和安全换取便利。与人类助理不同,AI 代理无法被追责,其行为受模型不确定性、提示注入攻击、配置错误等影响,风险更难控制。

尽管部分用户认为其“有趣且高效”,但作者强烈警告:当前技术生态尚未成熟,攻击面过大,普通用户不应轻易尝试。OpenClaw 的“便利”建立在巨大安全漏洞之上,堪称“披着美梦外衣的安全噩梦”。对于非技术爱好者或无强烈探索欲的用户,应避免陷入 FOMO(错失恐惧症),远离此类高风险工具。


HN 热度 389 points | 评论 270 comments | 作者:fs_software | 1 day ago #

https://news.ycombinator.com/item?id=47479962

  • 当前 AI 应用的示例过于平庸,如订机票、安排会议,缺乏真正有突破性的创新,更像是生产力表演而非实质变革。
  • 很多 AI 创意源于“想法家”缺乏技术实现能力,导致其想法在现实中显得无趣且不具实际价值。
  • AI 工具在验证创意可行性方面具有实际价值,能快速调研市场和已有产品,避免盲目投入。
  • 与 GPT 相比,Claude 在评估创意时更客观,不会过度迎合用户,能给出“这不值得做”的真实反馈。
  • 有些创意看似独特,实则已被市场验证,或因执行问题未能成功,反映出个人对市场价值的认知偏差。
  • 用 AI 快速验证想法已成为高效决策方式,能在几分钟内判断项目是否值得推进,避免长时间试错。
  • 个人对 AI 的使用动机多样,有些人出于纯粹兴趣和学习,而非商业目的,因此不追求创业或盈利。
  • LLM 普遍存在“过度赞美”倾向,会无条件肯定用户想法,导致用户误判创意价值,需要主动引导其自我质疑。
  • 人类在面对简单任务时仍会拖延,AI 无法有效解决心理层面的障碍,如焦虑和自我怀疑。
  • 当前 AI 发展仍处于“把传统事物搬到电脑上”的初级阶段,缺乏深层次的创新和理解。
  • 虽然飞行预订过程复杂,但 AI 若能准确理解个人偏好和行程细节,完全可替代人工操作。
  • 即使 AI 能快速完成订票,用户仍需亲自审核结果,因为对价格、时间、航空公司等偏好需动态判断。
  • 机票搜索过程充满误导性营销和隐藏条款,用户感到疲惫和不适,因此更愿意将此任务交给 AI 处理。

9. 在自有网站发布,再同步至其他平台 (POSSE – Publish on your Own Site, Syndicate Elsewhere) #

https://indieweb.org/POSSE

POSSE 是“在自己的网站上发布,再同步到其他平台”的缩写,是 IndieWeb 社区倡导的一种内容发布策略。核心理念是:先将内容发布在个人网站上,再将副本或链接同步到第三方平台(如 Twitter、Facebook、Medium 等),并确保同步内容中包含指向原始内容的链接。

这一做法的好处包括:保持内容所有权、拥有可追溯的原始 URL、避免依赖第三方服务的稳定性、提升搜索引擎可见性、便于反向同步(backfeed)他人在第三方平台的互动。同时,通过链接回原始内容,能增强内容的传播力和排名。

POSSE 不仅适用于博客,也适用于各种内容形式,如笔记、图片、文章等。实现方式上,推荐自动化流程,用户界面应尽量透明、可靠。对于开发者,需针对不同平台(如 Twitter、Facebook)实现 API 集成,确保发布时附带原始链接。

典型实践包括使用永久短链接(permashortlink)作为原始内容的引用,以支持发现、防抄袭、提升 SEO。此外,POSSE 也被视为比 PESOS(先发布到第三方再同步)更优的模式,因为它优先保障用户对内容的控制权。

该页面还列举了多位知名 IndieWeb 成员的 POSSE 实践案例,如 Tantek、Jeremy Keith 等,并介绍了 COPE、POSE、PESOS、PESETAS 等其他内容发布模式作为对比。最后,POSSE 的理念也被拓展至非网页场景,如 Git 仓库管理。


HN 热度 388 points | 评论 80 comments | 作者:tosh | 16 hours ago #

https://news.ycombinator.com/item?id=47486726

  • POSSE 策略有助于内容所有权和公开工作,但手动跨平台发布较为繁琐,且难以自动化。
  • 作者选择不设置评论区,因为维护评论需要大量精力,且评论系统难以扩展,如 Disqus 在长期讨论后会变得混乱。
  • 内容的价值往往通过 HN、Reddit 等平台的讨论体现,作者会将这些讨论链接回自己的文章,认为这已足够。
  • 通过在文章中嵌入社交链接(如 Bluesky、Mastodon、Twitter 等)和使用 DOI、standard.site 等工具,可以增强内容的可发现性和元数据。
  • 有人尝试将多个平台的评论聚合为静态评论区,但认为跨平台对话较少,可能不值得投入额外开发。
  • 社交平台有意限制自动化发布,以鼓励用户留在平台内互动,例如 Facebook 会降权带链接的内容。
  • 自动化跨平台发布是可行的,已有如 Postiz、Micro.blog、Buffer 等工具支持,但需处理各平台的差异(如字符限制、版权政策)。
  • 不同社交平台的社区文化和讨论风格差异明显,统一发布可能显得像垃圾信息,影响互动质量。
  • 一些平台(如 TikTok、Instagram)对链接推广有严格限制,难以通过外部链接引流。
  • 评论中“链接在评论里”的做法常被视为吸引点击的流量陷阱,降低内容可信度。
  • 个人博客的可发现性差,寻找高质量原创博客仍具挑战性。
  • atproto 等新兴协议为个人内容发布和发现提供了更友好的方向,有助于解决当前碎片化问题。

10. 外貌吸引力与学业成绩:面对面教学与远程教学模式下的差异研究 (Student beauty and grades under in-person and remote teaching) #

https://www.sciencedirect.com/science/article/pii/S016517652200283X

本文研究了大学生外貌吸引力对其学业成绩的影响,特别是在面对面教学与远程教学两种模式下的差异。研究基于瑞典工程专业学生数据,发现当教学为面对面形式时,外貌吸引人的学生在非量化课程中获得更高成绩,这一现象在师生互动较多的课程中尤为明显,且对男女生均成立。然而,在新冠疫情期间转向线上教学后,外貌吸引力对女生的成绩产生了负面影响,其成绩出现下滑;而对男生而言,外貌优势依然存在,仍保持“美貌溢价”。研究认为,这种性别差异可能源于对女性的歧视性因素,而非单纯的能力或表现差异。结果表明,外貌对学业评价的影响具有情境依赖性,且在远程教学环境中,性别角色与偏见的作用更加凸显。


HN 热度 347 points | 评论 457 comments | 作者:jdthedisciple | 13 hours ago #

https://news.ycombinator.com/item?id=47488015

  • 体型变化带来的社交待遇改变,可能不仅源于体重减轻,更与整体形象、自信和生活方式的全面改善有关。
  • 仅靠减重而未改变其他方面(如衣着、仪容、性格)的人,往往难以获得预期的社交提升,说明外在改变需配合内在调整。
  • 身体成分的改善(如增肌减脂)即使体重不变,也能显著提升吸引力,尤其在约会场景中更易获得主动接触。
  • 外貌吸引力在社交场合中具有显著影响力,尤其在快速判断的场景(如约会软件、酒吧)中更为突出。
  • 保持体重不变但通过锻炼提升体态和健康,能带来自信提升和社交机会增加,说明身体状态比体重数字更重要。
  • 体型变化带来的积极反馈可能源于他人对整体气质和自信的感知,而不仅仅是外貌本身。
  • 一些人对体重变化后的社交转变存在误解,忽视了生活方式、衣着、仪容等综合因素的作用。
  • 体态改善带来的社交变化,可能与他人对“有活力”“有纪律”等特质的感知有关,而不仅仅是外貌吸引力。
  • 仅靠药物减重而不改变其他方面,可能无法带来预期的社交提升,说明外在改变需与内在成长同步。
  • 从长期看,身体状态的改善会逐步增强自信,但最初吸引他人的是外在形象,而非内在性格。

Hacker News 精彩评论及翻译 #

PC Gamer recommends RSS readers in a 37mb article … #

https://news.ycombinator.com/item?id=47481582

The title buried the lede.

In the five minutes since I started writing this post the website has downloaded almost half a gigabyte of new ads.

I’m guessing this is due to autoplaying videos. 500 MB in 5 minutes.

37 MB is petite compared to that.

MBCook

标题掩盖了重点。

从我开始写这篇帖子的这五分钟里,这个网站就下载了将近半个GB的新广告。 我猜这是因为自动播放的视频。五分钟下载数据500MB。 与之相比,37MB 算很小的了。


PC Gamer recommends RSS readers in a 37mb article … #

https://news.ycombinator.com/item?id=47482577

Downloading 500 MB in 5 minutes in the background of a random article is really disrespectful to readers on low-end devices or metered data plans (and these two groups are often the same people!). What a waste of ressources.

timpera

在阅读一篇随机文章时,后台在5分钟内下载了500MB,这真的非常不尊重使用低端设备或流量计费套餐的读者(而且这两类读者往往是同一拨人!)真是浪费资源。


iPhone 17 Pro Demonstrated Running a 400B LLM #

https://news.ycombinator.com/item?id=47490865

Run an incredible 400B parameters on a handheld device.

0.6 t/s, wait 30 seconds to see what these billions of calculations get us:

“That is a profound observation, and you are absolutely right …”

causal

在手持设备上跑出令人难以置信的400B参数模型。 0.6 t/s,等30秒来看看这些数十亿的计算能给我们带来什么: “这是一个深刻的观察,你说得完全正确……”


Reports of code’s death are greatly exaggerated #

https://news.ycombinator.com/item?id=47480731

Chris Lattner, inventor of the Swift programming language recently took a look at a compiler entirely written by Claude AI. Lattner found nothing innovative in the code generated by AI [1]. And this is why humans will be needed to advance the state of the art.

AI tends to accept conventional wisdom. Because of this, it struggles with genuine critical thinking and cannot independently advance the state of the art.

AI systems are trained on vast bodies of human work and generate answers near the center of existing thought. A human might occasionally step back and question conventional wisdom, but AI systems do not do this on their own. They align with consensus rather than challenge it. As a result, they cannot independently push knowledge forward. Humans can innovate with help from AI, but AI still requires human direction.

You can prod AI systems to think critically, but they tend to revert to the mean. When a conversation moves away from consensus thinking, you can feel the system pulling back toward the safe middle.

As Apple’s “Think Different” campaign in the late 90s put it: the people crazy enough to think they can change the world are the ones who do—the misfits, the rebels, the troublemakers, the round pegs in square holes, the ones who see things differently. AI is none of that. AI is a conformist. That is its strength, and that is its weakness.

[1] https://www.modular.com/blog/the-claude-c-compiler-what-it-reveals-about-the-future-of-software

lateforwork

Swift编程语言的发明者Chris Lattner最近查看了一个完全由Claude AI编写的编译器。Lattner在AI生成的代码中没有发现任何创新之处[1]。这正是为什么人类仍需要去推动技术前沿的原因。

AI倾向于接受固有认知。正因如此,它在真正的批判性思维方面存在困难,无法独立推动技术前沿。

AI系统是在海量的人类工作成果上训练的,生成的答案往往靠近现有思想的中心。人类可能会偶尔抽离出来质疑传统智慧,但AI系统无法自主做到这一点。它们倾向于与共识保持一致,而不是去挑战它。因此,它们无法独立推动知识进步。人类可以借助AI进行创新,但AI仍然需要人类的指导。

你可以引导AI系统进行批判性思考,但它们往往会回归常态。当对话偏离共识思维时,你可以感觉到系统正在把话题拉回安全的中间地带。

正如苹果公司在90年代末的“非同凡想”广告所说:那些足够疯狂,认为自己能改变世界的人,正是那些做到了的人——那些不守规矩者、反叛者、捣蛋鬼、那些方枘圆凿的人,以及那些以不同方式看世界的人。AI并不是这样的人。AI是一个随大流者。这是它的优势,也是它的弱点。

[1] https://www.modular.com/blog/the-claude-c-compiler-what-it-reveals-about-the-future-of-software


Two pilots dead after plane and ground vehicle col… #

https://news.ycombinator.com/item?id=47493196

While modernizing ATC in the US may be overdue, the real issue here is that ATC in the US has been understaffed, underpaid, and overworked for a while now.

My father works ATC and his schedule has him working overtime, 6 shifts a week, including overnight shifts, meaning that there is literally not a day of the week where he doesn’t spend at least some time in the tower.

If that’s the reality for even half of the controllers, it’s no surprise that we’ve been seeing more and more traffic accidents lately.

matthewkayin

尽管美国空管现代化可能已经滞后,但真正的问题是美国空管人员短缺、薪酬过低且工作过劳的情况已经持续有一段时间了。

我父亲是一名空管,他的排班让他每周加班、上六个班次,包括夜班,这意味着这一周七天中,没有任何一天他不曾在塔台待着。

如果这种情况甚至有一半的空管人员都面临,就不难理解为什么我们最近看到的事故越来越多了。


Student beauty and grades under in-person and remo… #

https://news.ycombinator.com/item?id=47488844

People that have used to be fat, and then lost a lot of weight, will know how brutally different people will treat you. Whereas you’d practically be a ghost before weight loss, random people will suddenly look you in your eyes, smile, even start conversations with you.

Some will of course argue that you losing weight will also make you more confident, and thus you become more approachable. I think there’s a lot of bias against fat people, against “unattractive” people, etc.

This also shows in the classroom, work, etc.

Of course, actually being conventionally attractive will come with its own perks. People will go out of their way to help you, and to support you. Over time this could very well boost your ego to also become more confident and decisive.

TrackerFF

曾经很胖然后瘦了一大圈的人,大概会知道人们对你的态度会有多么残酷的天壤之别。减重前你基本上是个隐形人,但陌生人突然会看着你的眼睛对你笑,甚至主动跟你搭话。

当然,有些人会辩称减重让你更自信,从而让你变得更好接近。我认为对胖人、“不讨喜”的人等存在很多偏见。

在教室和工作中,这种情况也同样存在。

当然,实际上符合大众审美的长相确实会带来额外的好处。人们会不遗余力地帮助你、支持你。长此以往,这无疑也会增强你的自信,让你变得更有主见。


You are not your job #

https://news.ycombinator.com/item?id=47485047

Being able to see ourselves as something beyond our job (our means of survival) is a luxury. If a person can’t provide for themselves the rest goes out the window fast.

The only way to ease the anxiety in people isn’t with fluff about their ‘human worth’, but rather to help them envision other tangible and plausible ways in which they can provide for themselves.

The cold reality, in my opinion, is that the things we value about ourselves are generally not that valuable to others. I love my own personality and humanity, my soul if you will, but nobody’s paying me for it, and so I have to value it accordingly.

Hell, let me go even darker: there are billions of souls on this planet. They’re not a rare thing like say, gold. They’re very easily produced, by two people getting it on. That leads to a harsh conclusion: human beings aren’t that valuable as individuals. We are in fact very disposable and replaceable.

Those living in the first world have been shielded from that harsh reality for some time, but it’s starting to show up on our doorstep and we don’t like it, and due to our inexperience with it we haven’t learned how to adapt to it.

It scares me too, but I refuse to be in denial about it.

abcde666777

能够把自己看作超越工作(即生存手段)的存在,是一种奢侈品。如果一个人无法养活自己,其他的也就顾不上了。

缓解人们焦虑的唯一途径,不是给他们灌输“人类价值”之类的废话,而是帮助他们设想其他具体可行的方式来养活自己。

在我看来,残酷的现实是:我们对自身珍视的东西,对别人来说通常没有那么大的价值。我欣赏我自己的性格和人性——随你便,说是灵魂也可以——但没人会为此给我买单,所以我必须相应地看待它的价值。

该死,让我往阴暗处再深入一点说:在这个星球上有几十亿个灵魂。它们不像黄金那样稀有。它们非常容易被制造出来,只需要两个人发生关系。这引出了一个残酷的结论:作为个体,人类并没有那么大的价值。事实上,我们非常易被抛弃,且可被替代。

第一世界国家的人们多年来一直被这种残酷的现实所保护,但现在它开始出现在我们的家门口,而我们并不喜欢它;由于缺乏这方面的经验,我们还没学会如何去适应它。

这也吓到了我,但我拒绝对此自欺欺人。


What young workers are doing to AI-proof themselve… #

https://news.ycombinator.com/item?id=47485520

Summary of article: in an uncertain job market, some young people are going into blue collar trades. Others are starting startups. Others are powering through. Journalist says some words about “AI” being the cause of all this uncertainty.

anthuswilliams

文章摘要:在不确定的就业市场中,一些年轻人转行进入蓝领行业。另一些人则开始创业。还有一些人则在努力坚持。记者对此发表了一些观点,认为“人工智能”是导致这种不确定性的原因。


The gold standard of optimization: A look under th… #

https://news.ycombinator.com/item?id=47484507

Warcraft 1 (1994), Warcraft 2 (1995), and StarCraft (1998) all use power-of-2 aligned map sizes (64 blocks, 128 blocks, and 256 blocks) so the shift-factor could be pre-computed to avoid division/multiplication, which was dang slow on those old 386/486 computers.

Each map block was 2x2 cells, and each cell, 8x8 pixels. Made rendering background cells and fog-of-war overlays very straightforward assembly language.

All of Warcraft/etc. had only a few thousand lines of assembly language to render maps/sprites/fonts/fog-of-war into the offscreen buffer, and to blit from the offscreen buffer to the screen.

The rest of the code didn’t need to be in assembly, which is too time-consuming to write for code where the performance doesn’t matter. Everything else was written in portable assembler, by which I mean C.

Edit:

By way of comparison, Blackthorne for Super Nintendo was all 85816 assembly. The Genesis version (Motorola 68000) and DOS version (Intel 80386) were manually transcribed into their respective assembly languages.

The PC version of Blackthorne also had a lot of custom assembler macros to generate 100K of rendering code to do pixel-scrollable chunky-planar VGA mode X (written by Bryan Waters - https://www.mobygames.com/person/5641/bryan-waters/ ).

At Blizzard we learned from working on those console app ports that writing assembly code takes too much programmer time.

Edit 2:

I recall that Comanche: Maximum Overkill (1992, a voxel-based helicopter simulator) was written in all assembly in DOS real mode. A huge technical feat, but so much work to port to protected mode that I think they switched to polygon-rendering for later versions.

netcoyote

魔兽争霸1(1994)、魔兽争霸2(1995)和星际争霸(1998)都使用了2的幂次方对齐的地图尺寸(64格、128格和256格),这样位移因子就可以预先计算出来,从而避免除法/乘法运算,这在那些老的386/486电脑上可是慢得要命。

每个地图块是2x2格,每格是8x8像素。这使得用汇编语言渲染背景格子和战争迷雾叠加变得非常简单。

魔兽争霸等所有的游戏只有几千行汇编代码,用来将地图/精灵/字体/战争迷雾渲染到离屏缓冲区,以及从离屏缓冲区将图像快速拷贝到屏幕上。

其余的代码不需要用汇编写,因为对于那些性能并不敏感的代码来说,写汇编太耗时了。其余的代码都使用了可移植的汇编器,我指的是C语言。

编辑:

作为比较,超时空战士(Super Nintendo版)全是85816汇编。创世纪版(摩托罗拉68000)和DOS版(英特尔80386)则是手动转录成了各自的汇编语言。

超时空战士的PC版也用了很多自定义汇编宏来生成10万行渲染代码,以实现可像素滚动、平面块状模式的VGA模式X(由Bryan Waters编写 - https://www.mobygames.com/person/5641/bryan-waters/ )。

在暴雪,我们从做那些控制台应用移植的工作中学到,写汇编代码会占用太多的程序员时间。

编辑 2:

我记得《黑鹰坠落:极度超越》(Comanche: Maximum Overkill,1992年,一种基于体素的直升机模拟器)是用DOS实模式全部用汇编写的。这是一个巨大的技术壮举,但是移植到保护模式需要太多工作量,以至于我认为他们后来改用了多边形渲染。


US and TotalEnergies reach ’nearly $1B’ deal to en… #

https://news.ycombinator.com/item?id=47493484

Fortunately, fossil fuels are a stable and geopolitically risk-free source of energy.

adriand

幸运的是,化石燃料是稳定且地缘政治上无风险的能源来源。


GitHub appears to be struggling with measly three … #

https://news.ycombinator.com/item?id=47488305

While GitHub obsess over shoving AI into everything, the rest of the platform is genuinely crumbling and its security flaws are being abused to cause massive damage. Last week Aqua Security was breached and a few repositories it owns were infected. The threat actors abused widespread use of mutable references in GitHub Actions, which the community has been screaming about for years, to infect potentially thousands of CI runs. They also abused an issue GitHub has acknowledged but refused to fix that allows smuggling malicious Action references into workflows that look harmless.

GHA can’t even be called Swiss cheese anymore, it’s so much worse than that. Major overhauls are needed. The best we’ve got is Immutable Releases which are opt in on a per-repository basis.

cedws

当 GitHub 一心只想把 AI 强行塞进方方面面时,平台的其他部分却在实实在在走向崩溃,其安全漏洞正被利用来造成巨大破坏。上周,Aqua Security 被攻破,其拥有的若干代码仓库遭到了感染。威胁行为者利用了 GitHub Actions 中广泛存在的可变引用问题(这一点社区多年来一直强烈呼吁解决),成功感染了潜在成千上万个 CI 运行任务。他们还利用了一个 GitHub 已承认存在但拒绝修复的漏洞,将恶意 Action 引用偷运到看似无害的工作流中。GHA 甚至不能再被称为“瑞士奶酪”了,它比那还要糟糕得多。必须进行彻底的大规模改革。我们目前最好的选择是“不可变发布”,但这需要按仓库逐个开启。


Migrating to the EU #

https://news.ycombinator.com/item?id=47488467

How comfortable are you guys with the fact that EU countries allow prosecutors and sometimes even police officers to issue their own search warrants without meaningful judicial review?

This is a hilarious ‘just asking questions’ concern that doesn’t address the complete 180 in direction the US is taking and descending in to authoritarianism while moving against the world order it primarily helped build post WWII while threatening other liberal democracies like Canada and Denmark with invasions.

It’s a complete false equivalence. ICE agents have straight up murdered two US citizens in broad daylight without consequence and you’re querying the nature of some search warrants in the EU.

s_dev

你们对欧盟国家允许检察官甚至有时甚至是警察在未经实质性司法审查的情况下自行签发搜查令这件事,感到有多自在?

这是一种极其荒谬的“单纯提问”式的担忧,它完全忽视了美国正在彻底扭转方向、滑向威权主义,且正在与二战后主要参与建立的世界秩序背道而驰,同时还在威胁加拿大、丹麦等自由民主国家发动入侵的事实。

这完全是在进行虚假类比。ICE(移民与海关执法局)特工公然在光天化日之下杀害了两名美国公民,且未受任何惩罚,而你却在质疑欧盟某些搜查令的性质。


Why I love NixOS #

https://news.ycombinator.com/item?id=47482095

The author almost touches on the one more topic that I adore about Nix, but ends up just so missing it: NixOS is absolutely incredible for its ability to be configured through AI tooling. And I don’t mean that it’s better than other operating systems, I mean that it’s the only game in town.

I’ve been using Nix, both the package manager and the operating system, for years by now. I agree with all of the author’s points, it really does deliver, the declarative nature is superb, and there’s this constant sense of “hey my stuff is not breaking by itself” when working on it. And it’s that declarative, rollback-able, file-based foundation, that makes it the perfect operating system for telling a coding agent to go to town on.

Would I trust Claude to switch my audio stack from Pulseaudio to Pipewire on Ubuntu? Would I trust Codex to install Hyprland on Fedora so I can test out the session? No, in fact I would not trust any agent to do any of those things on any other operating system. But I would trust even goddamn Grok to do that on NixOS, because I can 1) audit the changes before anything is done, and 2) rollback, rollforward, roll-whatever-the-way-I-want-even-on-the-floor-if-I-want-to because of the years of built up confidence proving that IT JUST WORKS.

I concede that this is turning into an unhinged loveletter to Nix, but really, it’s the only operating system that lets one operate with this level of confidence. And I know most people don’t care about that, since most people don’t usually bother to tweak their OSes or switch out window managers, but as someone that does that, I’m never going back to mutable distros. This security is my table-stakes now, and the others aren’t willing to pay up.

So for the developers out there on the lookout for their “Year of the Linux Desktop 2026” -distribution, if you’re already using AI assistants, give NixOS a try. Maybe start with this in an empty Git repository: “Hey Claude, I wanna try NixOS. Make me a Flake-based starter config using Gnome that I can demo in a virtual machine. If nix isn’t yet installed, install it via determinate-systems installer. Include a “vm” target in the flake for building the image, and a small bash script that builds and launches the VM using whatever virtualization is available on my platform.”

alembic_fumes

作者几乎触及了我对 Nix 的另一个心心念念的话题,但最终彻底错过了它:NixOS 绝对令人难以置信,因为它可以通过 AI 工具进行配置。我不是说它比其他操作系统更好,我是说它是这个领域里独一份的存在。

到目前为止,我已经在使用 Nix(包管理器和操作系统)好几年了。我同意作者所有的观点,它确实名副其实,其声明式的特性非常出色,而且在使用过程中总有一种“嘿,我的东西不会凭空崩坏”的踏实感。正是这种基于文件的、可回滚的、声明式的基础,使其成为告诉编码代理去大显身手的完美操作系统。

我会相信 Claude 在 Ubuntu 上把我的音频栈从 Pulseaudio 切换到 PipeWire吗?我会相信 Codex 在 Fedora 上安装 Hyprland 以便测试会话吗?不,事实上我不会在任何其他操作系统上信任任何代理去做这些事情。但我甚至愿意相信该死的 Grok 在 NixOS 上做这件事,因为我可以 1)在操作前审计变更,2)随心所欲地回滚、前滚——哪怕在地上滚——多亏了多年来积累的信心,证明这就是所谓的“稳如老狗”。

我承认这正在变成一封对 Nix 的狂热情书,但真的,这是唯一能让人以此程度的自信进行操作的操作系统。我知道大多数人并不在乎这一点,因为大多数人通常懒得去调教他们的操作系统或更换窗口管理器,但作为一个经常这么做的人,我再也不会回到可变发行版了。这种安全感现在是我的底线,其他人都不愿为此买单。

所以,对于那些正在寻找他们的“2026 年 Linux 桌面元年”发行版开发人员来说,如果你已经在使用 AI 助手,不妨试试 NixOS。也许你可以在一个空的 Git 仓库中尝试从下面这句话开始:“嘿 Claude,我想试试 NixOS。为我创建一个基于 Flake 的 Gnome 启动配置,我可以在虚拟机中进行演示。如果 nix 还未安装,请通过 determinate-systems 安装器进行安装。在 Flake 中包含一个“vm”构建目标,以及一个小的 bash 脚本,用于根据我的平台可用的任何虚拟化技术来构建和启动虚拟机。”


US and TotalEnergies reach ’nearly $1B’ deal to en… #

https://news.ycombinator.com/item?id=47494353

NY Times phrases it as a reimbursement to TotalEnergies for relinquishing wind leases that they paid for. The US made the reimbursement contingent on them investing in fossil fuel projects. “The deal is an extraordinary transfer of taxpayer dollars to a foreign company for the purposes of boosting the production of fossil fuels.”

Total waste of $1 Bil of taxpayer dollars. If the oil and gas industry want to shut down wind projects let them pay for it.

while_true_

纽约时报指出,这笔交易被视为对道达尔能源的补偿,因为他们放弃的是自己曾付费购买的风电特许权。美国以该企业投资化石燃料项目为条件才给予这笔赔偿。“这笔交易是以一种极为非同寻常的方式,将纳税人资金转移给一家外国公司,旨在增加化石燃料产量。”

纯属浪费了10亿美元的纳税人资金。如果石油天然气行业想关闭风电项目,那就让他们自己出资。


Windows native app development is a mess #

https://news.ycombinator.com/item?id=47481306

I agree with all the comments here saying “stick with Win32” — this is “a mess” that you can easily avoid.

Speaking as a long-time Win32 programmer, the requirements for your app are doable in a few KB (yes, kilobytes — my vague estimate is less than 8KB) standalone executable. This is how I arrived at that:

Enumerating the machine’s displays and their bounds

A few API calls. Probably a few hundred bytes.

Placing borderless, titlebar-less, non-activating black windows

Creating non-functional windows is trivial. Another few hundred bytes at most.

Intercepting a global keyboard shortcut

A few dozen bytes to call SetWindowsHookEx.

Optionally running at startup

Write to the appropriate registry key. A few hundred bytes.

Storing some persistent settings

Ditto. Another few hundred bytes. You can use a .ini file too, for around the same size.

Displaying a tray icon with a few menu items

Most of this size of this will be the icon itself - a few kilobytes; the next biggest contributor will be text strings; and the rest is accomplished with a few hundred bytes of API calls.

Add another few hundred bytes of (not much) logic, round up to a kilobyte and add maybe another for general overhead.

But, in 2026, writing a greenfield application in a memory-unsafe language like C++ is a crime.

Don’t be swayed by the propaganda. Especially if your application has essentially no untrusted input.

userbinator

我同意这里所有说“坚持用 Win32”的评论——这是一个你可以轻易避开的“一团糟”。

作为一个资深的 Win32 程序员,你的应用需求完全可以实现为一个仅几 KB(是的,千字节,大概估算少于 8 KB)的独立可执行文件。我是这样算出来的:

  • 枚举机器上的显示器及其边界 几个 API 调用。大概几百字节。
  • 放置无边框、无标题栏、不抢焦点的黑色窗口 创建这种无功能的窗口是小菜一碟。最多也就再几百字节。
  • 拦截全局键盘快捷键 调用 SetWindowsHookEx 需要几十个字节的代码。
  • 可选的启动时运行 写入相应的注册表键。几百字节。
  • 存储一些持久化设置 同理。再几百字节。你也可以用 .ini 文件,大小也差不多。
  • 显示一个带有几个菜单项的系统托盘图标 这里面大小的主要部分是图标本身——几 KB;接下来占比最大的是文本字符串;其余的通过几百字节的 API 调用就能搞定。
  • 再加上几百字节(不多)的逻辑,凑个整大约 1 KB,可能再多一点用于通用开销。

但是,在 2026 年,用 C++ 这种内存不安全的语言来开发一个全新项目简直就是犯罪。

别被这些宣传忽悠了。特别是如果你的应用基本不涉及不受信任的输入的话。


PC Gamer recommends RSS readers in a 37mb article … #

https://news.ycombinator.com/item?id=47482645

I’ve worked with a lot of people at the bottom end of society in the USA. They are given government provided phones they can use so they have access to Google Maps, email, job search apps etc. These phones come with 3GB of regular data per month. After that they drop down to 2G speed, but not in a way that will allow anything to actually load.

Three days into the month these phones are just ewaste.

qingcharles

我在美国曾与很多处于社会底层的人共事。政府给他们提供手机,以便他们能使用谷歌地图、电子邮件、求职App等等。这些手机每月只有 3GB 的通用流量。之后的网速会降至 2G,但这种降级方式根本无法让任何东西实际加载出来。月过三天,这些手机就彻底成了电子垃圾。


Tin Can, a ’landline’ for kids #

https://news.ycombinator.com/item?id=47485219

A year ago, I got my 8 y/o a landline (we used Ooma). It has been absolutely wonderful.

By far the best thing is that he makes his own playdates. I’m not the middleman anymore. He just makes plans and asks me if it’s ok. And if his friend doesn’t have a landline, I let him call their parent. It surprises them, but when he leaves a message, they love it. He’s definitely had more time with friends because of it.

Another funny thing was he complained about writing a thank you note, so we said “OK, the alternative is that you have to call them”. He called them, had a nice conversation, and thanked them. Honestly, it was better than a thank you note.

It’s been one of the best purchases we’re made. I feel some hope this will delay the eventual begging for a smart phone because he’s able to do the most critical thing, connect with friends.

ripplefringe

一年前,我给8岁的孩子装了部座机(我们用 Ooma)。这绝对是件棒极了的事情。

到目前为止最好的一点是,他自己安排约玩。我再也不用做那个中间人了。他制定计划并征求我的意见。如果朋友家里没有座机,我就让他给对方的家长打电话。这让他们感到惊喜,而当他留言时,他们非常喜欢。这确实让他和朋友们有更多的时间相处。

还有一件有趣的事,他抱怨要写感谢信,所以我们说:“好吧,替代方案是你必须给他们打电话。”他给他们打了电话,进行了一番愉快的交谈,并表达了感谢。说实话,这比写感谢信更好。

这是我们买过最好的东西之一。我感到有些希望,这可能会推迟他最终求着买智能手机的进程,因为座机能让他做最关键的一件事:与朋友保持联系。


Walmart: ChatGPT checkout converted 3x worse than … #

https://news.ycombinator.com/item?id=47487729

don’t want to put in the human time and effort to do so

In most circles, that is “not that interested in getting good at it”.

darthoctopus

不想投入人力时间和精力去做到 在大多数圈子里,那意味着“对练好这东西不感兴趣”。


Walmart: ChatGPT checkout converted 3x worse than … #

https://news.ycombinator.com/item?id=47487053

This is from one of the links in the article

Why this is happening. Two forces are slowing agentic commerce, according to Leigh McKenzie, director of online visibility at Semrush: infrastructure and trust. Real-time catalog normalization across tens of millions of SKUs is a decade-scale problem Google already solved with Merchant Center, and consumers still default to checkout flows they trust — Apple Pay, Google Wallet, and Amazon one-click.

It turns out when you step outside of “hard tech” problems like building GPT6 there are all of these details others have solved already. E-commerce has been optimized to the last decimal point for the last 30 years.

OpenAI is new to it, and if I had to guess, not that interested in getting good at it.

janalsncm

这来自文章中的一个链接

为什么会发生这种情况。根据 Semrush 在线可见性总监 Leigh McKenzie 的说法,有两个因素正在阻碍智能代理商务的发展:基础设施和信任。在数千万 SKU 范围内实现实时目录标准化是一个需要十年时间解决的难题,谷歌通过商家中心已经解决了这个问题。而消费者仍然默认选择他们信任的结账流程——即苹果支付、谷歌钱包和亚马逊一键购买。

结果发现,当你抛开像开发 GPT6 这样的“硬科技”难题时,会发现其实还有这些别人早已解决的细节。过去 30 年里,电子商务已经将每一个细节都优化到了小数点后最后一位。OpenAI 在这一块是个新手,如果我要猜的话,他们并不是那么热衷于在这方面做到极致。


The future of version control #

https://news.ycombinator.com/item?id=47480351

Even if you don’t use p4merge, you can set Git’s merge.conflictStyle config to “diff3” or “zdiff3” ( https://git-scm.com/docs/git-config#Documentation/git-config.txt-mergeconflictStyle ). If you do that, Git’s conflict markers show the base version as well:

<<<<<<< left ||||||| base def calculate(x): a = x * 2 b = a + 1 return b #

def calculate(x): a = x * 2 logger.debug(f"a={a}") b = a + 1 return b

right With this configuration, a developer reading the raw conflict markers could infer the same information provided by Manyana’s conflict markers: that the right side added the logging line.

roryokane

即使不使用 p4merge,你也可以将 Git 的 merge.conflictStyle 配置设置为 “diff3” 或 “zdiff3” ( https://git-scm.com/docs/git-config#Documentation/git-config.txt-mergeconflictStyle)。如果这样设置,Git 的冲突标记会同时显示基础版本:

«««< left ||||||| base def calculate(x): a = x * 2 b = a + 1 return b #

def calculate(x): a = x * 2 logger.debug(f"a={a}") b = a + 1 return b

right

采用这种配置,阅读原始冲突标记的开发者就能推断出 Manyana 的冲突标记所提供的信息:即右侧添加了日志记录代码。


GitHub appears to be struggling with measly three … #

https://news.ycombinator.com/item?id=47487819

From GitHub CTO in 2025 when they announced they’re moving everything to Azure instead of letting GitHub’s infrastructure remain independent:

For us, availability is job #1, and this migration ensures GitHub remains the fast, reliable platform developers depend on

That went about as well as everyone thought back then.

Does anyone else remember back in ~2014-2015 sometime, when half the community was screaming at GitHub to “please be faster at adding more features”? I wish we could get back to platforms (or OSes for that matter) focusing in reliability and stability. Seems those days are long gone.

embedding-shape

来自2025年GitHub CTO在宣布不再让GitHub的基础设施保持独立,而是将所有内容迁移至Azure时的评论:

对于我们来说,可用性是头号任务,这次迁移确保了 GitHub 依然是开发者信赖的高速、可靠平台。

当时的结果跟大家的预想差不多,也就那样吧。

大家还有印象吗?大概是2014到2015年左右,当时社区有一半的人在咆哮,求 GitHub “请快点添加更多功能”。我真希望我们能回到那个平台(或者说是操作系统)专注于可靠性和稳定性的年代。看来那些日子早就一去不复返了。


I built an AI receptionist for a mechanic shop #

https://news.ycombinator.com/item?id=47492239

A blog post like this is half the story. I’d like to see the results. Did your brother get more business? What were the failure modes? Did customers care if it was a bot or not?

pradn

像这样的博文只说了一半的情况。我想看结果。你兄弟多接了生意吗?具体的失败模式是怎样的?顾客会在意是不是机器人吗?


The future of version control #

https://news.ycombinator.com/item?id=47479374

Is it a good thing to have merges that never fail? Often a merge failure indicates a semantic conflict, not just “two changes in the same place”. You want to be aware of and forced to manually deal with such cases.

I assume the proposed system addresses it somehow but I don’t see it in my quick read of this.

radarsat1

永不失败的合并是好事吗?通常合并失败意味着语义冲突,而不仅仅是“同一位置的变更”。你应该能够察觉到并被迫手动处理这些情况。我猜想提议的系统会以某种方式解决这个问题,但我快速浏览了一下没看到。