2025 10 22 HackerNews

2025-10-22 Hacker News Top Stories #

  1. 亚马逊人才流失削弱组织知识,导致 US‑EAST‑1 的 AWS 故障应对迟缓并引发大规模中断。
  2. Anthropic 推出 Claude Code on the web 网页预览,支持浏览器中并行编码、连接 GitHub、生成 PR 并在受限沙箱运行测试(仅对 Pro/Max 用户开放)。
  3. 国际象棋特级大师 Daniel Naroditsky 在家中猝死,社群在哀悼并呼吁停止关于其涉作弊风波的揣测,等待正式死因公布。
  4. 一篇教程展示如何从零实现键值数据库:采用追加写日志、分段压缩清理和内存哈希索引以在持久性与查询性能间权衡。
  5. 文章介绍用神经音频编解码器(如 VQ‑VAE 与残差量化)将音频压缩为离散令牌以供大模型处理,讨论时间维度与重建质量等挑战。
  6. 外国黑客利用未打补丁的 SharePoint 漏洞入侵堪萨斯城国家安全校园的系统,暴露 IT/OT 环境下补丁管理与国防供应链安全问题。
  7. 荷兰情报机构因华盛顿政治局势变化而在对美情报共享上更为谨慎,同时加强与欧洲盟国的合作与评估共享策略。
  8. 研究提出“LLM 脑腐”假说:长期暴露于低质量网络文本会降低模型推理与长文理解等能力,虽可通过再训练部分恢复但难以完全逆转。
  9. AWS 宕机暴露云服务高度集中带来的单点风险,引发关于多云冗余成本与关键第三方监管的争论。
  10. 研究估计自 2015 年建议早期引入花生以来,约 6 万名儿童避免了花生过敏,表明早期暴露在高危群体中可显著降低发病率。

Today is when the Amazon brain drain sent AWS down the spout #

https://www.theregister.com/2025/10/20/aws_outage_amazon_brain_drain_corey_quinn/

2025 年 10 月 20 日,AWS 遭遇重大服务中断,影响其美国东部 1 区(US-EAST-1)的多个核心服务,包括 DynamoDB,导致大量依赖 AWS 的应用程序和服务瘫痪,波及银行、游戏、社交媒体、政府系统及亚马逊电商平台。

事故始于凌晨 12:11 PDT,AWS 开始调查服务错误率和延迟上升问题。至凌晨 1:26,确认 DynamoDB 接口请求错误率显著升高。最终在 2:01 发现根本原因为 DNS 解析故障,该问题引发连锁反应,造成广泛服务不可用。

值得注意的是,AWS 在最初 75 分钟内未能快速定位问题,期间状态页面仍显示“一切正常”,引发外界对其应急响应能力的质疑。文章指出,这并非技术缺陷,而是资深工程师流失导致的“组织性知识断层”。

作者 Corey Quinn 指出,AWS 近年来经历大规模裁员,2022 至 2024 年间有超过 2.7 万名员工被裁,内部数据显示员工主动离职率高达 69% 至 81%,许多资深工程师因公司管理风格和“返岗强制令”而选择离开。

这些离职的工程师曾掌握系统深层故障模式和历史问题应对经验,而这些“隐性知识”无法通过招聘新员工快速复制。新团队缺乏应对复杂系统故障的实战经验,导致故障排查时间延长。

文章强调,此次事件暴露了 AWS 的“中央控制平面”成为系统性风险点,其可靠性已不再仅依赖技术架构,更依赖于人才储备。当资深专家离开,系统韧性开始下降。

尽管 AWS 可能将此次事件定性为“孤立事件”,但作者认为,这标志着 AWS 从“经验驱动”向“新人主导”的转型已进入风险显现期。若人才流失持续,类似大规模中断将不再是偶然,而是趋势。


HN 热度 963 points | 评论 587 comments | 作者:raw_anon_1111 | 1 day ago #

https://news.ycombinator.com/item?id=45649178

  • 亚马逊大规模裁员可能导致其在特定城市耗尽可用劳动力,引发人才枯竭问题。
  • 亚马逊内部研究已警告,其快速消耗美国劳动人口的速度可能在几年内导致某些地区劳动力供应枯竭。
  • 亚马逊的员工流动率极高,其招聘和替换策略类似于“轮换淘汰”,以控制薪酬和防止员工反抗。
  • 亚马逊的高强度工作文化导致员工普遍过劳,最终被迫离职,随后被新人替代。
  • 与其他公司相比,亚马逊的规模和增长速度使其面临独特的劳动力枯竭问题。
  • 亚马逊在技术岗位和仓储岗位都存在压榨员工的现象,导致员工难以长期留存。
  • 一些美国州正在放松童工法规,可能将 14 岁青少年纳入亚马逊仓库工作,引发社会争议。
  • 家庭教育在某些地区缺乏监管,导致学生成绩两极分化,部分学生表现优异,而另一些学生则严重落后。
  • 家庭教育学生整体表现优于公立学校学生,但这种比较受家庭背景和教育资源差异影响。
  • 公立学校经费充足,美国在生均教育支出上高于大多数 OECD 国家,因此“资金不足”并非教育质量差的主要原因。
  • 家庭教育缺乏统一评估标准,可能导致部分学生因家长教育能力不足或极端思想而受到不良影响。

Claude Code on the web #

https://www.anthropic.com/news/claude-code-on-the-web

Anthropic 推出 Claude Code on the web,目前处于研究预览阶段,允许用户通过浏览器直接委托编码任务。该功能基于 Anthropic 管理的云基础设施运行,支持并行执行多个编码任务,适用于修复 bug、处理常规问题或并行开发工作。

用户可连接 GitHub 仓库,描述需求,Claude 会自动完成实现。每个任务在独立的隔离环境中运行,支持实时进度追踪,并可动态调整任务方向。通过统一界面,用户可同时在多个仓库中执行任务,并自动生成 Pull Request 和清晰的变更摘要,提升开发效率。

该功能适用于回答项目结构问题、修复已知问题、执行后端变更等场景。Claude Code 还支持测试驱动开发,确保更改的正确性。此外,该功能现已上线 iOS 应用,开发者可在移动设备上体验,目前为早期预览版本,后续将根据用户反馈优化。

安全方面,所有任务在受限制的沙箱环境中运行,具备网络与文件系统隔离。Git 操作通过安全代理服务完成,确保仅访问授权仓库,保护代码与凭证安全。用户还可自定义网络配置,例如允许下载 npm 包以运行测试。

Claude Code on the web 仅对 Pro 和 Max 订阅用户开放,访问地址为 claude.com/code。云任务共享整体使用速率限制,详细技术细节可参考官方工程博客与文档。


HN 热度 564 points | 评论 376 comments | 作者:adocomplete | 1 day ago #

https://news.ycombinator.com/item?id=45647166

  • 使用者曾大量投入于 Claude Code,但现已几乎完全转向 Codex CLI,认为 Codex 在处理复杂任务和长期运行方面表现更优,且成本更低。
  • 有人质疑当前对新工具的推崇是重复历史,认为每次新工具发布时都会出现类似“上一个工具不行”的论调,反映出用户可能仍处于技术兴奋期,忽视潜在问题。
  • 有评论指出,这种不断更换工具的现象可能源于 AI 工具迭代迅速,当前工具可能很快被更新版本超越,因此用户应保持理性。
  • 有人认为,对新工具的过度赞美可能带有隐性广告意图,但也有反驳指出,该评论者身份可查,且其言论风格不符合典型广告特征。
  • 评论者强调,网络社区虽存在质疑,但不应轻易将他人视为“水军”或“机器人”,尤其在缺乏证据的情况下。
  • 有人指出,互联网并未死亡,尽管社交媒体生态存在信任问题,但用户身份验证仍存在漏洞,无法完全排除伪装可能。
  • 有观点认为,AI 工具的快速迭代是常态,与其持续批评旧工具,不如专注于利用当前可用的最佳工具。
  • 有人提出,AI 工具的持续进步是事实,但不应因过去工具的缺陷而全盘否定当前工具,应以开放心态看待技术发展。

Chess grandmaster Daniel Naroditsky has died #

https://old.reddit.com/r/chess/comments/1obnbmu/grandmaster_daniel_naroditsky_has_passed_away/

Daniel “Danya” Naroditsky,28 岁美籍特级大师、Twitch/YouTube 现象级教学主播,被亲友证实于近日突然去世,初步排除他杀。消息由好友 GM Oleksandr Bortnyk 在直播中含泪确认,并透露是他与 Charlotte Chess Center 创办人 Peter Giannatos 因多日联系不上 Danya,持钥匙进入其北卡家中,发现其已倒在客厅沙发,电视仍开着。Bortnyk 当场报警并陪伴至法医完成取证。

过去半年 Naroditsky 一直深陷前世界冠军克拉姆尼克(Vladimir Kramnik)发起的"公开作弊指控"风暴——克拉姆尼克连发长文、视频与推文,指其在线对局数据异常,甚至在其死讯传出后仍继续暗示"我早就警告过"。Danya 曾在最后一次公开直播(已删除 VOD)中情绪崩溃、语言混乱、中英文夹杂,被友人强行下播并送回家。许多观众事后回忆,他在近几个月的 speedrun 里明显消瘦、眼神涣散、下颌无意识抽动,多次表达"睡不着、没动力"。

Reddit 帖内 1800+ 条留言几乎一边倒地哀悼并怒斥克拉姆尼克"网络暴力杀人",要求国际棋联与各大平台将其除名、封号。多位顶尖棋手(Hikaru、Fabi、Gukesh 等)已在社交媒体发文悼念,称 Danya 是"最纯粹的国际象棋传播者"“免费教了世界几百小时”。

目前家属未公布确切死因,警方报告与尸检结果待定;版主与亲友均呼吁停止揣测,把焦点放在其留下的教学遗产与对心理健康的反思上。


HN 热度 411 points | 评论 134 comments | 作者:ntnbr | 1 day ago #

https://news.ycombinator.com/item?id=45646561

  • 对于丹尼尔・纳罗迪茨基的去世,许多人感到深深的悲痛,他在棋界的贡献和人品受到广泛赞誉。
  • 他在棋界被视为独特的人才,曾赢得多项青少年棋赛,并在斯坦福大学继续深造。
  • 许多评论提到他在网络直播中的谦逊和对其他玩家的善意,即使在对方可能作弊的情况下也给予他们机会。
  • 对于网络上的恶意指控和骚扰,有人指出这些对他的心理健康造成了重大影响,尤其是来自其他棋手的指责。
  • 一些评论提到,对他的过度猜测和讨论是缺乏尊重的,应该等官方消息出来再讨论。
  • 对于棋界的欺凌行为,许多人呼吁关注心理健康问题,并希望这样的现象能够被重视和改善。
  • 由于网络环境的恶劣,部分评论者认为这种氛围可能加重了心理压力,使他处于一种非常脆弱的状态。
  • 有人提到,尽管他在棋界享有盛名,但在个人生活中可能承受着巨大的压力和孤独感。
  • 许多人怀念他在棋局解说中的幽默和专业性,认为他的内容将继续在未来受到欢迎。

Build your own database #

https://www.nan.fyi/database

本文是一篇从零开始构建键值数据库的逐步指南,旨在帮助读者理解数据库的核心原理。

数据库的本质是持久化存储数据并高效查找。最基础的方式是使用文件存储键值对,例如将数据写入文本文件,通过遍历文件查找特定键。然而,这种简单方法在更新和删除数据时效率极低,因为修改或删除记录可能需要移动后续所有数据,导致性能严重下降。

为解决这一问题,文章引入了“追加只写”(append-only)机制:所有操作都以新增记录的方式进行,不修改原有数据。更新和删除操作变为添加新记录,更新时添加新值,删除时添加“墓碑”标记(如 null)表示该键已失效。查询时只需查找键的最新记录,从而保证数据一致性。

但该方法带来两个新问题:文件不断增长,且查找效率低。为解决文件膨胀问题,文章提出“分段与压缩”策略:当文件达到一定大小后,停止写入并创建新文件。旧文件通过压缩过程清除无效数据(如墓碑记录和重复键),合并后生成更小的新文件,从而控制存储空间。

为提升查找速度,文章引入“索引”机制。使用内存中的哈希表(如 JavaScript 对象)存储键到数据位置的映射,实现 O(1)时间复杂度的查找。虽然哈希表仅存在于内存中,但结合文件存储,可实现快速定位数据,兼顾性能与持久性。

文章最后指出,现代数据库的许多核心思想——如追加只写、分段、压缩、索引——都源于这种基础设计。通过理解这些原理,可以更深入掌握数据库的工作机制。


HN 热度 345 points | 评论 61 comments | 作者:nansdotio | 8 hours ago #

https://news.ycombinator.com/item?id=45657827

  • 该博客文章设计精美,示例清晰,阅读体验良好,有助于理解数据库底层原理。
  • 通过亲手构建数据库来学习,能深刻理解其设计思想,尽管可能无意中重复造轮子。
  • 使用 Lorem Ipsum 作为示例数据会降低可读性,建议使用更真实的模拟数据。
  • 文章中关于 LSM 树的描述存在误导,未充分说明分布式系统如何实现高并发性能。
  • 文章的交互式设计和动画效果非常出色,提升了学习体验。
  • 文章中的排序示例存在逻辑错误,实际写入磁盘的数据顺序与描述不符。
  • 在处理时间序列数据时,数据压缩和过期策略的权衡是关键挑战。
  • 作者的“第一性原理”讲解方式有助于深入理解问题本质,层层递进。
  • 面对复杂系统设计时,过度思考会让人感到疲惫,实际动手反而更轻松。
  • 有人认为该文章内容几乎完全源自《设计数据密集型应用系统》一书,应明确标注来源。
  • 有人提出对“数据库解决一个还是两个问题”的哲学性讨论,认为“持久存储”和“高效查询”本质是同一问题。
  • 有人调侃想实现一个“只写不读”的数据库,体现对数据库本质的幽默思考。
  • 有人指出事件驱动系统本质上类似于“写入即存储”,与“写入数据库”有相似性。

Neural audio codecs: how to get audio into LLMs #

https://kyutai.org/next/codec-explainer

尽管许多 LLMs 已经能够通过语音接口进行交互,但大多数仍然依赖于将语音转录为文本,然后生成文本答案并通过文本转语音技术将其读出。这种方式在某些场合下是可行的,但并不能实现真正的语音理解。因此,当前的语音 LLMs 在智能程度上明显落后于文本 LLMs。

文本和音频的处理在技术上是相似的,都是输入和输出的标记。但音频的复杂性体现在:

  • 音频数据的时间跨度大:例如,1 秒的音频包含成千上万的样本。
  • 难以保持一致性:在长时间尺度上生成连贯的音频比生成文本要困难得多。
  • 生成音频的计算成本高:逐样本生成的模型(如 WaveNet)需要极高的计算能力。

为了有效处理音频,文章提出了使用神经音频编解码器的思路。该方法的步骤如下:

  • ** 音频压缩 **:使用自编码器将音频压缩为较小的潜在表示,进而使其更易于处理。
  • ** 量化潜在表示 **:通过向量量化(VQ-VAE),将潜在表示映射到离散的表示中,以便与语言模型兼容。
  • ** 生成音频 **:在量化后,模型能够预测音频的连续性,然后将其解码回音频。

文章通过 Fashion MNIST 数据集展示了如何构建量化自编码器。该模型首先对图像进行编码并重构,然后通过 k-means 聚类对编码的结果进行量化,以创建离散的表示。这种方法在训练过程中,结合承诺损失,使编码器生成更容易量化的嵌入。

为了提高重建质量,文章提出了残差向量量化(Residual Vector Quantization)的方法,通过在第一层量化的基础上,再对残差进行量化,以提升模型的表现能力。

尽管当前的音频生成技术仍存在挑战,但通过神经音频编解码器的进展,未来能够实现更高效的语音理解和生成,最终达到真正的语音交互水平。

综上所述,文章深入探讨了如何通过神经音频编解码器有效解决音频处理中的难题,以及在此基础上如何利用先进的自编码器技术来提高音频生成的连贯性和质量。


HN 热度 322 points | 评论 97 comments | 作者:karimf | 11 hours ago #

https://news.ycombinator.com/item?id=45655161

  • 音频模型对音高和语调的理解能力有限,可能源于模型本身能力不足,而非安全对齐的刻意限制。
  • 语音模型在训练中依赖文本与音频的联合信息,导致音频特征被弱化,尤其在使用文本到语音合成数据时,音调信息被忽略。
  • 一些语音模型在处理非语言声音(如笑声、叹气)时表现不佳,因为现有语音识别系统通常会忽略这些非语言发声。
  • 某些模型(如 Qwen3、Gemini)已能较好识别语音特征和情绪,说明技术上具备实现能力。
  • 早期语音模型(如 GPT 语音模式)曾能模仿不同音调、语气甚至唱歌,但后期可能因强化学习被限制了此类能力。
  • 模型可能误判说话者身份或种族,但这种判断基于语音特征而非种族本身,存在误判风险,应避免将语音特征与种族直接关联。
  • 语音识别系统难以区分英式与美式英语发音差异(如“tomato”和“potato”),说明当前模型在语音细节处理上仍有不足。
  • 一些用户尝试用特定数据集(如《小马宝莉》粉丝转录文本)训练模型以增强情感表达能力,说明数据质量对模型表现有重要影响。

Foreign hackers breached a US nuclear weapons plant via SharePoint flaws #

https://www.csoonline.com/article/4074962/foreign-hackers-breached-a-us-nuclear-weapons-plant-via-sharepoint-flaws.html

外国黑客利用微软 SharePoint 存在的漏洞,成功入侵了美国国家核安全管理局(NNSA)位于密苏里州的堪萨斯城国家安全校园(KCNSC),该设施负责生产美国核武器所需的绝大部分非核组件,是美国核武库体系中最敏感的机构之一。

攻击者利用了两个新披露的 SharePoint 漏洞:CVE-2025-53770(欺骗漏洞)和 CVE-2025-49704(远程代码执行漏洞),这两个漏洞均影响本地部署的服务器。微软已于 7 月 19 日发布补丁,但相关系统未及时更新,导致攻击得手。NNSA 在 7 月 22 日确认受影响,称“极少数系统”被波及,且因广泛使用微软 M365 云服务,整体影响较小。

尽管美国国家安全局(NSA)在 8 月初已派员进驻现场开展应急响应,但目前 NNSA、Honeywell FM&T 及美国能源部均未就事件发表进一步说明。

此次事件凸显了 IT 系统漏洞可能被利用作为跳板,进而威胁到关键的工业控制系统(OT)安全,尤其在涉及国家安全设施时,暴露出联邦政府在 IT/OT 融合环境下的安全防护仍存在重大短板。


HN 热度 307 points | 评论 198 comments | 作者:zdw | 8 hours ago #

https://news.ycombinator.com/item?id=45657287

  • 使用 Microsoft 企业服务(如 Outlook、SharePoint、Teams)的公司往往代表技术文化不佳,是个人职业选择的红灯信号。
  • 提供 Mac 笔记本的公司是技术文化良好的绿灯信号,而提供 Windows 笔记本则被视为红灯信号。
  • 企业同时提供 Mac 和 Linux 设备是理想配置,能体现对开发人员工具自由的尊重。
  • 企业若同时提供 Mac 和 Windows 设备,可能表明其在工具选择上较为中立,属于中性或黄灯信号。
  • 企业使用 Mac 并配备 Office 套件,虽有微软工具痕迹,但整体仍可视为绿灯信号。
  • 企业使用 Google 工具在体验上优于 Microsoft,尤其在协作与沟通工具方面。
  • Microsoft Teams 被广泛认为是极差的沟通工具,远逊于 Slack 和 Zoom,甚至可能影响团队效率。
  • Slack 虽非完美,但相比 Teams 和 Outlook,是“较小的恶”,仍可接受。
  • 自托管的通信工具如 Zulip 在功能与体验上优于 Slack 和 Teams,是更理想的选择。
  • Windows 系统在开发环境中被视为“寄生虫”,拖慢开发效率,而 WSL 可作为有效替代方案。
  • WSL 在 Windows 11 上已支持图形界面(X 和 Wayland),可无缝运行 Linux 应用,提升开发体验。
  • 企业设备选择应基于实际需求,而非偏好,尤其在企业级设备领域,Windows 专业设备(如 ThinkPad、Framework)具有更强的耐用性和扩展性。
  • Mac 硬件虽优秀,但无法覆盖企业级移动设备(如 Panasonic、Getac)的特殊需求,其适用范围有限。
  • 个人偏好不应成为筛选公司的唯一标准,过度排斥 Microsoft 生态可能限制职业选择机会。
  • 企业使用 SharePoint 等微软产品,反映出其技术栈僵化,且存在安全风险,是技术落后的重要标志。
  • 企业技术文化与工具链高度相关,使用微软生态的公司往往存在官僚化、低效沟通等问题。
  • 企业若强制使用 Teams 等工具,可能严重影响团队协作,甚至导致员工考虑离职。
  • 企业应尊重开发人员的工具偏好,提供灵活的开发环境,而非强制统一工具链。

Dutch spy services have restricted intelligence-sharing with the United States #

https://intelnews.org/2025/10/20/01-3416/

根据荷兰两位高级情报官员的报道,荷兰的情报机构已开始限制与美国情报机构的信息共享,这一决定是由于华盛顿的政治局势变化所致。这一发展在《德 Volkskrant》报纸的联合采访中得到了确认,采访对象为荷兰两大情报机构的负责人:荷兰一般情报和安全局(AIVD)主任埃里克・阿克布姆和荷兰军事情报和安全局(MIVD)主任彼得・瑞辛克。

尽管两位官员强调荷兰与美国情报机构之间的关系仍然 “优秀”,但他们承认,荷兰在信息共享方面变得更加谨慎,特别是与中央情报局(CIA)和国家安全局(NSA)之间的合作。瑞辛克指出:“我们有时确实不再分享某些信息。” 阿克布姆补充道:“我们必须逐案考虑。” 他表示,荷兰无法明确说出将共享什么或不共享什么,但可以确认的是,荷兰在选择信息共享时更加挑剔。

此外,两位官员提到,荷兰的间谍们正在与欧洲同行加强情报合作,特别是与北欧、法国、德国、英国和波兰等国家的情报机构的合作。这表明荷兰在当前国际政治环境下,正在重新评估与不同国家之间的情报共享策略。


HN 热度 304 points | 评论 216 comments | 作者:Refreeze5224 | 1 day ago #

https://news.ycombinator.com/item?id=45646572

  • 荷兰政府及相关部门广泛使用 AWS 和微软的 Azure、Office 365 服务,导致大量数据和通信可能被美国情报机构获取。
  • 尽管存在对依赖美国云服务的担忧,但荷兰政府仍在推进向微软云服务的迁移,甚至在安全敏感部门如税务部门也采用 M365。
  • 德国等国家正积极减少对微软产品的依赖,转向开源替代方案,证明非微软系统也能支撑政府运作。
  • 一些政府机构在迁移过程中面临技术挑战,例如 Google Docs 无法满足财务部门对复杂电子表格和安全性的需求。
  • Excel 在金融领域具有不可替代的优势,尤其对高级用户而言,其功能远超其他办公软件,这使得转向替代方案困难。
  • 企业内部的系统迁移往往由非技术部门推动,如财务团队因 Excel 兼容性问题逐步转向 Windows 系统,进而影响整体技术架构。
  • 企业高层对微软产品的依赖源于习惯和培训成本,而非技术必要性,这阻碍了技术多元化。
  • 微软通过大量游说和商业利益影响政府决策,例如曾成功阻止德国慕尼黑的 LiMux 开源项目。
  • 即使在技术上可行,政府机构仍可能因政治和利益因素而选择微软产品,而非更安全或更独立的替代方案。
  • 完全脱离微软或美国技术栈在现实中难以实现,但保持技术多样性有助于降低风险和增强议价能力。
  • 采用开源软件如 LibreOffice 等可作为过渡方案,有助于实现部分系统去中心化和减少供应商锁定。
  • 在军事基地等美国势力存在的地区,如德国,真正实现技术独立面临现实障碍。
  • 云服务和办公软件的选择不仅是技术问题,更是政治、安全和利益博弈的结果。

LLMs can get “brain rot” #

https://llm-brain-rot.github.io/

本文提出并验证了“大语言模型脑腐(LLM Brain Rot)”假说:持续接触低质量网络文本会导致大语言模型出现长期认知能力衰退。研究通过在真实 Twitter/X 数据上进行受控实验,构建了两类垃圾数据与对照数据,分别基于“互动度”(M1)和“语义质量”(M2)两个维度,保持训练规模与操作一致。

实验结果表明,持续使用垃圾数据进行预训练,会导致模型在推理、长上下文理解、安全性和人格倾向(如自恋、反社会倾向)等方面出现显著下降。例如,在 M1 条件下,ARC 挑战任务的链式思维准确率从 74.9% 下降至 57.2%,RULER-CWE 任务从 84.4% 降至 52.3%。随着垃圾数据比例上升,认知能力呈剂量依赖性衰退。

错误分析揭示:模型主要表现为“思维跳过”——推理链被截断或省略,这是性能下降的主要原因。尽管通过指令微调和纯净数据再预训练可部分恢复能力,但无法完全恢复原始水平,说明存在持久的表征漂移,而非格式不匹配问题。

研究还发现,推文的流行度(非语义指标)比长度更能预测脑腐效应,提示“注意力经济”驱动的内容可能对模型认知健康构成更大威胁。

总体而言,该研究将数据质量视为影响模型能力的因果因素,强调持续预训练中的数据筛选应被视为“训练期安全”问题,呼吁对部署中的大模型定期进行“认知健康检查”。


HN 热度 265 points | 评论 143 comments | 作者:tamnd | 10 hours ago #

https://news.ycombinator.com/item?id=45656223

  • 使用破折号(em dash)是当前 AI 生成文本的显著特征,已被视为一种“水印”或识别标志。
  • 人们在阅读大量 AI 生成内容后,其语言风格和表达方式会不自觉地向 AI 文本靠拢,形成语言同质化。
  • AI 生成文本常使用“不只是 X,更是 Y”和三段式列举结构,这些模式源于西方修辞传统,但被 AI 机械复制,导致内容空洞乏味。
  • 一些人认为 AI 写作的“语气”和“风格”与 20 世纪初的文学风格(如福克纳)相似,因此显得不自然。
  • 有人指出,AI 生成内容缺乏真正理解,只是在拼接看似合理的短语,产出的是缺乏深度的陈词滥调。
  • 有人担忧,AI 语言风格正在重塑人类语言,甚至影响口语表达,形成恶性反馈循环。
  • 有人认为,AI 生成文本的“风格”是可被识别的,未来可能通过零宽空格、摩斯密码等隐蔽方式实现水印。
  • 有人表示,自己原本就习惯使用破折号,现在却因担心被误认为 AI 写作而被迫改变写作风格。
  • 有人指出,AI 语言风格的流行,反映了其在社交媒体和商业文案中的广泛使用,进一步加剧了语言的平庸化。
  • 有人认为,AI 生成文本的“正确性”不等于“高质量”,不能以“传达信息”为由忽视其表达的贫乏与机械性。
  • 有人质疑,当前对 AI 语言风格的批评,其实也反映了人类自身语言质量的下降,AI 只是放大了这一问题。

AWS outage shows internet users ‘at mercy’ of too few providers, experts say #

https://www.theguardian.com/technology/2025/oct/20/amazon-web-services-aws-outage-hits-dozens-websites-apps

亚马逊云服务(AWS)近日发生全球性技术故障,导致包括 Snapchat、Roblox、Signal、Duolingo、Coinbase、PlayStation Network、Peloton、Wordle 等在内的数千个应用和网站出现中断或访问困难。此次故障起源于美国东海岸的 AWS 数据中心,影响范围遍及全球,据宕机监测平台 Downdetector 统计,全球报告故障数超过 810 万,其中美国 190 万、英国 100 万、澳大利亚 41.8 万。

受影响的不仅包括消费类应用,还波及金融与公共服务领域。英国的 Lloyds 银行、 Halifax、 Bank of Scotland 以及 HMRC 税务网站均出现服务中断,Ring 用户也报告门铃设备无法使用。部分平台在数小时后逐步恢复,但部分服务持续出现异常,直至周一晚间,亚马逊才宣布所有云服务已恢复正常。

专家指出,此次事件暴露了全球互联网基础设施过度依赖少数科技巨头的风险。亚马逊、微软和谷歌控制着全球大部分云计算市场,这种集中化结构使整个数字生态面临“单点故障”威胁。多位学者和政策专家呼吁加快云服务的多元化发展,强调民主讨论、独立新闻和安全通信等关键领域不应依赖少数美国科技公司。

英国政府已介入,与亚马逊保持沟通,并面临来自议会财政委员会的压力,要求将亚马逊列为金融服务业的“关键第三方”,以纳入更严格的监管框架。此前,AWS 曾向议会表示其服务具备“多层保护”和“韧性支持”,但此次事件引发对监管缺失的质疑。

技术分析显示,故障源于 AWS 内部一个负责监控负载均衡器的子系统出现异常,而非网络攻击。伦敦大学学院安全工程教授 Steven Murdoch 指出,此次事件是“AWS 内部事故”,并非恶意攻击。事件也再次提醒全球:尽管大型科技公司具备强大的资源和技术能力,但其集中化架构带来的系统性风险不容忽视。


HN 热度 256 points | 评论 202 comments | 作者:evolve2k | 1 day ago #

https://news.ycombinator.com/item?id=45646649

  • 专家批评 AWS outage 暴露了互联网用户过度依赖少数云服务提供商的问题,但类似批评在 2021 年 Fastly outage 后也出现过,却未见实际改变。
  • 真正运营大规模云服务的从业者清楚,设计高可用系统成本极高,对大多数业务而言并不现实,而“关键服务”应自行应对此类风险。
  • 媒体在灾难发生后才会关注多区域、多云冗余的重要性,但平时几乎不提及,事件过后又迅速遗忘。
  • 所谓“专家”并非技术背景出身,而是来自人权组织、科技政策研究机构的学者或律师,缺乏实际运维经验。
  • 仅凭非技术背景人士对系统性风险的评论,难以提供真正有价值的建议,尤其在技术架构和成本权衡方面。
  • 有人认为,非技术专家对政策和经济影响发表意见是合理的,但不应被当作技术权威。
  • 云计算并非唯一选择,许多企业完全不依赖云服务,甚至自建基础设施,成本更低、可靠性更高。
  • 选择使用小规模云服务商并不需要编写代码,关键在于商业决策而非技术实现。
  • 新闻报道中使用“专家”一词应有实际专业背景支撑,当前引用的“专家”缺乏相关技术能力,误导公众。
  • 专家的建议若无法转化为具体技术或商业决策,其价值有限,仅停留在泛泛而谈。
  • 专家讨论的是技术的使用和社会影响,而非技术实现细节,因此不需要具备云工程师背景。
  • 一些专家对技术问题的判断可能基于过时或不准确的数据,其权威性存疑。

60k kids have avoided peanut allergies due to 2015 advice, study finds #

https://www.cbsnews.com/news/peanut-allergies-60000-kids-avoided-2015-advice/

一项最新研究发现,自 2015 年发布关于早期引入花生的指导建议以来,已有约 6 万名儿童避免了花生过敏。这一改变源于 2015 年英国伦敦国王学院的 Gideon Lack 教授主导的 LEAP 试验,该研究证明在婴儿期早期引入花生可使花生过敏风险降低超过 80%。

研究由费城儿童医院的过敏专家大卫·希尔博士领导,分析了数十家儿科诊所的电子健康记录,结果显示:在 2015 年针对高风险儿童发布建议后,0 至 3 岁儿童的花生过敏率下降超过 27%;2017 年建议扩展后,降幅进一步达到 40% 以上。

尽管如此,美国整体儿童食物过敏率仍呈上升趋势,目前约 8% 的儿童受食物过敏影响,其中超过 2% 为花生过敏。花生过敏是由于免疫系统错误识别花生蛋白为有害物质,引发包括皮疹、呼吸困难甚至危及生命的过敏性休克。

过去几十年,医生普遍建议将花生等易致敏食物推迟到 3 岁后才引入。但随着新证据的出现,2021 年更新的指南建议在婴儿 4 至 6 个月大时,无需筛查即可引入花生、牛奶、鸡蛋、大豆、鱼类、贝类、树坚果等主要食物过敏原。

目前仅有约 29% 的儿科医生和 65% 的过敏专科医生遵循 2017 年扩展后的建议,推广缓慢主要源于临床实践中的困惑和不确定性。专家指出,未来研究可进一步探索最佳引入时机、频率和剂量。

倡导组织 FARE 的首席执行官苏英·波布莱特表示,这项研究证实了早期引入过敏原的有效性,为全国范围内降低花生过敏发病率提供了重要契机。

营养师蒂芙尼·莱昂分享了自己作为母亲的实践经历:她根据最新科学证据,从婴儿期就为两个儿子引入花生酱、豆奶酸奶等食物,尽管起初家人难以接受,但她坚持基于证据的育儿方式。

专家建议,家长无需大量喂食,只需少量尝试,如一小勺花生酱或含过敏原的酸奶,即可安全地让婴儿免疫系统接触这些食物,从而建立耐受。


HN 热度 253 points | 评论 252 comments | 作者:zdw | 20 hours ago #

https://news.ycombinator.com/item?id=45652307

  • 有评论质疑研究中将花生过敏减少归因于 2015 年建议的科学依据,提出同期减少反式脂肪可能才是更重要的因素。
  • 一位家长分享孩子因未持续进行花生暴露而发展出花生过敏的经历,强调每日坚持摄入花生的重要性。
  • 另一位家长提到其孩子参与了早期引入过敏原的临床试验,后续孩子在遵循建议下未出现过敏,暗示早期引入可能有效。
  • 有观点认为不应过度焦虑错过所谓的“关键窗口期”,成年人食用花生也无问题,不应自责。
  • 有人提出免疫系统在早期接触多种病原体的环境下可能更不易对花生产生过敏反应。
  • 有家长质疑频繁喂食花生以预防过敏的做法是否合理,认为这听起来近乎荒谬。
  • 评论指出,早期引入花生可降低过敏风险,但不能完全消除,不能将过敏归因于单一行为。
  • 有人认为,即使不让孩子“吃”花生,仅在口腔内接触微量也能触发免疫系统适应。
  • 有评论表示,家长因担心育儿失误而长期处于焦虑状态,这是普遍现象。
  • 有家长表示,尽管孩子已出现过敏,但坚持每日摄入花生以维持耐受性,这是目前的应对方式。

Hacker News 精彩评论及翻译 #

Today is when the Amazon brain drain sent AWS down… #

https://news.ycombinator.com/item?id=45650861

Between the engineering staff and the warehouse workers, I wonder how long it will be until they have already fired everyone who ever would have been willing to work there.

Even with candidate pools of hundreds of thousands of H1-B engineers and tens of millions of illegal immigrant warehouse workers, there still comes a point where such a big company firing so many people so quickly exhausts all their options.

It reminds me of the Robot Chicken Sketch where Imperial Officers aboard the Death Star all pretend to be force choked to death by Darth Vader so they can avoid getting killed by lightsaber, then come back in under different names in different jobs. It’s worse though for Amazon: nobody wants to come back.

https://www.youtube.com/watch?v=fFihTRIxCkg

president_zippy

在工程师和仓库员工之间,我真想知道他们得花多长时间,才能把所有曾经愿意在那里工作的人都解雇掉。

即便有数十万H1-B工程师的应聘者池,以及数千万的非法移民仓库工人,对于这样一家大公司来说,如此迅速地解雇大量员工,最终也还是会耗尽所有可选的人才。

这让我想起了《机器鸡》的一个片段:死星上的帝国军官们为了不被光剑杀死,全都假装被达斯·维达原力掐死,然后再用不同的名字、不同的职位回来上班。不过对亚马逊来说,情况更糟——没人愿意回来。


https://news.ycombinator.com/item?id=45651834

I’ll go out on a limb and say we need Wikipedia and it’s okay that traffic falls.

Physical print encyclopedias got replaced by Wikipedia, but AI isn’t a replacement (can’t ever see how either). While AI is a method of easier access for the end user, the purpose of Wikipedia stands on its own.

I’ve always scoffed at the Wikimedia Foundation’s warchest and continuously increasing annual spending. I say now is the time to save money. Become self sustaining through investments so it can live for 1000 years.

To me, it is an existence for the common good and should be governed as such.

irjustin

我斗胆说一句,我们确实需要维基百科,所以流量下降也没关系。

纸质百科全书被维基百科取代了,但人工智能并非替代品(我看不出它如何能取代)。虽然AI对终端用户来说是一种更便捷的访问方式,但维基百科的宗旨是独立存在的。

我一直对维基媒体基金会那笔巨额资金和逐年增长的支出不屑一顾。但现在,我认为是时候省钱了。通过投资实现自给自足,让维基百科能够存续千年。

在我看来,它是一项为公共利益而存在的事物,理应如此被管理。


Today is when the Amazon brain drain sent AWS down… #

https://news.ycombinator.com/item?id=45651013

I like to think I’m halfway decent at my job, and I wouldn’t work there once. During undergrad, my landlord working for AMZN on the opposite end of the country offered me an interview, but it was during final exam week.

I asked if I could schedule the interview after my final exams, and his arrogance really showed when not only did he refuse, but then insisted my exams are not don’t even register on the same scale of importance as the opportunity to work for Amazon.

Somewhat related: a recruiter at Google cold-called me a couple months into my first job out of undergrad back in 2016 and was similarly condescending about “the chance” to work for Google compared to everything else. I already had a low opinion of them when they gave my then-girlfriend an introductory O’Reilly book on Java after she failed their interview.

I regret being born too late to work somewhere like Bell Labs, SGI, or Sun. I had a ton of graybeard wizard coworkers from these places, and they were all a pleasure to learn from and even better friends. For the first 2 years of my first job, every day of work was like walking into the Shire and talking magic spells with 20 Gandalfs.

That job was great until I got put on a team with a guy who was a former middle manager at some IBM-like company and went from being surrounded by people lightyears ahead of me to being surrounded by Dilbert characters. The messed-up part was that it wasn’t even punishment. I was rewarded after completing a project with my choice of which team I joined next, and I joined the wrong one. I assumed that joining a new team to utilize this newfangled “cloud computing” thing would be trailblazing, and I didn’t do any diligence on who I would work with.

To this day, I still regret not rejoining the first team I worked for, otherwise I would still be at that company and happy about it. Then again, the boredom and discontent while being on that sucky team is the reason I started investing, and now I can buy a house in cash and fund myself to do whatever I want for at least a decade. Hard to complain about the way things turned out.

president_zippy

自认工作能力还算不错,但我绝不会在那家公司工作。大学期间,我房东在亚马逊工作,地点远在千里之外,他给了我一个面试机会,但那正是期末考试周。

我问能否等考完试再面试,他那种傲慢的态度就暴露无遗了。他不仅拒绝了我的请求,还坚持声称我的期末考试根本无法与在亚马逊工作的机会相提并论。

有点关联的是:2016年,我本科毕业后刚开始工作几个月,谷歌的一位招聘人员突然打来电话,同样表现出一种居高临下的姿态,仿佛为谷歌工作是比其他一切都重要的“机遇”。当时我对谷歌的印象已经很差了,因为他们在我当时的女友面试失败后,只送了她一本入门的O’Reilly Java书。

我后悔自己生得太晚,没能像贝尔实验室、SGI或Sun那样的地方工作。我有很多来自这些地方的“资深专家”同事,和他们共事是一件乐事,他们更是我难能可贵的朋友。在我第一份工作的头两年,每天上班都仿佛走进夏尔,和二十个甘道夫一起探讨魔法。

那份工作很棒,直到我被调到一个团队,团队里有个家伙之前在类似IBM的公司做过中层经理。就这样,我身边一下子从一群远超我数辈的天才,变成了一群《呆伯特》漫画里的人物。最讽刺的是,这甚至算不上是一种惩罚。我完成一个项目后,被奖励了选择下一个团队的权利,而我偏偏选错了。我以为加入一个探索这种新奇“云计算”概念的团队会是开拓性的,结果我完全没有调查过未来将和谁共事。

直到今天,我仍然后悔没有回到我最初加入的那个团队。不然的话,我可能至今还待在那家公司,并且过得非常开心。话又说回来,正是在那个糟糕团队里感到的乏味和不满,促使我开始投资,而如今我已能全款买房,并且未来十年内都有足够的资金去做任何我想做的事。事已至此,实在没什么可抱怨的。


The scariest “user support” email I’ve received #

https://news.ycombinator.com/item?id=45650356

I can’t even exfiltrate my MacOS Notes on purpose. Maybe I’ll download it and give it a spin.

didgeoridoo

我甚至都无法有意导出我的 MacOS 笔记。也许我会下载下来试试看。


Postman which I thought worked locally on my compu… #

https://news.ycombinator.com/item?id=45650305

I remember when one of the “Core Goals” of Postman was “Complete control over your data - Keep simple JSON based data formats which can be exported and shared as per user needs”.

https://web.archive.org/web/20140604204111/http://www.getpostman.com/docs/

CaptainOfCoit

我记得 Postman 曾有一条“核心目标”是“完全掌控您的数据——保持简单的基于 JSON 的数据格式,以便根据用户需求进行导出和共享”。


Fallout from the AWS outage: Smart mattresses go r… #

https://news.ycombinator.com/item?id=45658464

Tech enthusiasts: My entire house is smart.

Tech workers: The only piece of technology in my house is a printer and I keep a gun next to it so I can shoot it if it makes a noise I don’t recognize.

(stolen from @PPathole on Twitter)

jsheard

科技爱好者:我整栋房子都是智能的。

科技从业者:我家唯一的技术设备就是一台打印机,我在它旁边放了一把枪,这样如果它发出任何我不认识的声响,我就可以把它一枪崩了。


Tesla is heading into multi-billion-dollar iceberg… #

https://news.ycombinator.com/item?id=45654747

FRA: “As for HW3 owners who bought FSD, which basically turned out to be an interest free loan to Tesla for years, the automaker needs to offer free FSD transfer and a $10,000 discount on a car upgrade.

While this might sound like a lot”

It would add up to a lot of money for Tesla, but for customers? Some of these people paid $15.000 years ago for something that hasn’t been delivered, and now, they would be able to get $10,000 ‘back’, only if they commit to spending way more again, in the hope to eventually get what they bought years ago, or, more likely, in the hope of eventually being able to subscribe to get the features they already paid for years ago.

Someone

对于购买了FSD的HW3车主来说,这笔钱基本上就相当于给了特斯拉一笔长达数年的免息贷款,因此汽车制造商应当提供免费的FSD转移服务,并在车辆升级时提供10,000美元的折扣。

虽然这听起来可能是一笔巨款”

这对特斯拉来说会是一大笔钱,但对客户呢?其中一些人在几年前就为尚未交付的服务支付了15,000美元,而现在,他们只有承诺再次花费更多钱,才有望“拿回”10,000美元,其目的要么是希望能最终得到自己在多年前购买的东西,或者更有可能的是,希望最终能够订阅到自己多年前就已付费使用的功能。


When a stadium adds AI to everything, it’s worse e… #

https://news.ycombinator.com/item?id=45648954

I was recently at an events center, that has replaced all of their vending machines with machines that require me to install an app(!) to purchase a product. Literally, didn’t take cash or credit - just via app.

Per the marketing on the side, this is meant to be for my benefit in order to earn “points” and get offered “deals.” I don’t think I have to tell you that I did NOT install the app, and just walked further to buy one from a vendor.

There is a massive arrogance problem within tech. Everyone thinks their product should be the center of everyone else’s universe. The best products are invisible/get out of the way.

Someone1234

我最近去了一个活动中心,他们把所有的自动售货机都换掉了,新机器要求我必须安装一个App (!) 才能买到东西。真的,它不接受现金或信用卡,只能通过App。

根据机器侧面的宣传,这么做是为了“方便我赚取积分”并获得“优惠”。我不说你们也知道,我根本没安装那个App,而是多走了一段路,从一个摊贩那里买了东西。

科技界存在一种极其傲慢的问题。每个人都觉得自己的产品理应成为别人世界的中心。而最好的产品,本应是让人感觉不到其存在的、是为用户让路的。


Fallout from the AWS outage: Smart mattresses go r… #

https://news.ycombinator.com/item?id=45658256

I feel like we need some sort of “Offline-First” or “Offline-Compatible” certification process for “smart” devices. It would require some threshold of usability and total safety without network connection, which would vary depending on the device category. Companies in compliance could put a badge on their products so wary consumers know who to trust.

goda90

我觉得我们需要为“智能”设备设立某种“离线优先”或“离线兼容”的认证流程。这要求设备在没有网络连接时,必须达到特定类别的可用性和绝对安全标准。通过认证的公司可以在其产品上贴上徽章,以便谨慎的消费者知道可以信赖哪些品牌。


Today is when the Amazon brain drain sent AWS down… #

https://news.ycombinator.com/item?id=45652376

It seems amazon itself is aware of this issue. The linked engadget article even mentions this:

“The rate at which Amazon has burned through the American working-age populace led to another piece of internal research, obtained this summer by Recode, which cautioned that the company might “deplete the available labor supply in the US” in certain metro regions within a few years.”

rester324

看起来亚马逊自己已经意识到这个问题了。Engadget的那篇链接文章甚至也提到了这一点:

“亚马逊消耗美国劳动年龄人口的速度,导致了另一项内部研究的产生,该研究由Recode在今年夏天获得,并警告称,公司在未来几年内可能会‘耗尽美国部分大都市地区的可用劳动力’。”


The Programmer Identity Crisis #

https://news.ycombinator.com/item?id=45659881

To me, the most salient point was this:

Code reviewing coworkers are rapidly losing their minds as they come to the crushing realization that they are now the first layer of quality control instead of one of the last. Asked to review; forced to pick apart. Calling out freshly added functions that are never called, hallucinated library additions, and obvious runtime or compilation errors. All while the author—who clearly only skimmed their “own” code—is taking no responsibility, going “whoopsie, Claude wrote that. Silly AI, ha-ha.”

LLMs have made Brandolini’s law (“The amount of energy needed to refute bullshit is an order of magnitude larger than to produce it”) perhaps understated. When an inexperienced or just inexpert developer can generate thousands of lines of code in minutes, the responsibility for keeping a system correct & sane gets offloaded to the reviewers who still know how to reason with human intelligence.

As a litmus test, look at a PR’s added/removed LoC delta. LLM-written ones are almost entirely additive, whereas good senior engineers often remove as much code as they add.

strix_varius

在我看来,最突出的一点是:

负责代码审查的同事们正在迅速陷入崩溃,因为他们痛苦地意识到,自己如今成了质量控制的第一道关卡,而不是最后一道。他们被要求进行审查,却被迫去挑刺。他们指出那些从未被调用的新增函数、凭空臆想的库添加,以及明显的运行时或编译错误。而与此同时,代码作者——显然只是草草翻阅了“自己”的代码——却毫无责任感,还说着“哎呀,那是Claude写的。这AI真傻,哈哈。”

大型语言模型或许让布林多利尼定律(“驳斥谬论所需的能量,比产出谬论所需的能量要高一个数量级”)显得有些保守了。当一个经验不足或不熟练的开发者能在几分钟内生成成千上万行代码时,保持系统正确和合理的责任,就被转移到了那些仍懂得运用人类智能进行推理的审查者身上。

作为一个试金石,看看一个拉取请求(PR)中增加和删除的代码行数差异。由大型语言模型编写的代码,几乎完全是增加的,而优秀的高级工程师们,常常删除的代码量和增加的一样多。


Space Elevator #

https://news.ycombinator.com/item?id=45643427

Very cool. One thing I wish was better shown: space is close, it’s just hard to go up. Our liveable breathable atmosphere is razor thin compared to the size of earth.

In most cases, 100km is less than the distance between sizeable metropolitan areas. It’s a day long bike ride. Air runs out less than a bus ride across town. A 15k jog/hike would put you in the stratosphere. Those jet aircraft that seem so high are closer than that. Closer than your friends house or the local stadium probably.

Look at a map or globe with that in mind and everything feels so thin!

jvanderbot

非常酷。有一件事我希望能更好地体现出来:太空其实很近,只是上去很难。与我们地球的大小相比,我们赖以生存的可呼吸的大气层薄如刀锋。

在大多数情况下,100公里的距离还比不上大城市之间的距离。这不过是一整天的自行车骑行路程。空气在你还没坐完一趟跨城的公交车时就耗尽了。跑或走15公里,你就能到达平流层。那些看起来飞得那么高的喷气式飞机,其实比那还要近。可能比你朋友家或本地体育场还要近。

带着这个视角去看地图或地球仪,你会感觉一切都如此纤薄!