2026 05 20 HackerNews

2026-05-20 Hacker News Top Stories #

  1. Karpathy 加入 Anthropic 预训练团队,拟将 AutoResearch 扩展为递归训练以提升 Claude 核心能力,社区对此褒贬不一。
  2. 马斯克对奥特曼与 OpenAI 的诉讼因超过诉讼时效被驳回、慈善信托指控未获支持,他称将上诉,此判决被视为 OpenAI 推进 IPO 的利好。
  3. 过去半年编码智能体因强化学习明显进步、开源模型突飞猛进并能本地高效运行,多款旗舰交替领跑但“鹈鹕骑车”等指标遭质疑,代码代理仍需监督。
  4. 苹果发布基于 Apple Intelligence 的无障碍更新,包括更智能的图像描述与问答、自然语言语音控制、保版式的阅读器摘要翻译、Vision Pro 眼动控制适配等并强调隐私。
  5. 虚拟操作系统博物馆收录 1700+ 预装系统,支持多虚拟化平台与离线体验,力图还原历史环境便于按需探索。
  6. Anthropic 收购 Stainless 并将其团队并入以强化多语言官方 SDK、MCP/API 基建与企业工具集成,提升开发者体验与企业落地。
  7. SuperSplat 展示以多角度微距拍摄训练的草莓高斯点绘,代码与数据开源,体现 splat 渲染精细细节与当前局限。
  8. 一名 CISA 承包商在 GitHub 误泄多组 AWS GovCloud 高权限密钥且数十小时未吊销,暴露承包商凭证管理与流程的严重短板。
  9. 在线点击解谜游戏 Click (2016) 通过与界面交互解锁 128 项成就并支持跨设备保存进度,轻量但富探索感。
  10. npm 账号 atool 被入侵致 317 个包在 22 分钟内发布 637 个恶意版本,利用 preinstall/Bun 脚本与 OIDC 等手法窃取凭证并持久化,凸显生态安装脚本风险。

1. 我已加入 Anthropic (I’ve joined Anthropic) #

https://twitter.com/karpathy/status/2056753169888334312

该网页内容为社交媒体平台 X(原 Twitter)上的一条个人动态。发布者是 Andrej Karpathy,他宣布自己已加入人工智能公司 Anthropic,表达了对未来几年大型语言模型(LLM)领域发展的期待和兴奋之情。他计划回归研发工作,并且依然热衷于教育事业,未来会继续从事相关工作。该动态发布时间为 2026 年 5 月 19 日晚上 11 点 05 分,获得了大量关注和互动,浏览量达到 1490 万,评论、点赞和转发数均非常高,显示出其在 AI 领域的影响力和粉丝基础。页面还提示用户开启 JavaScript 或使用支持的浏览器以获得更好体验,并提供了登录和注册入口。


HN 热度 1112 points | 评论 461 comments | 作者:dmarcos | 9 hours ago #

https://news.ycombinator.com/item?id=48194352

  • Karpathy 将加入 Anthropic 的预训练团队,负责提升 Claude 模型的核心能力。
  • 他计划将 AutoResearch 的理念扩展为递归训练改进的更大项目。
  • 有人认为 AutoResearch 主要是参数调优,缺乏创新,类似低效的超参数优化。
  • 也有人认为利用大模型进行自动化研究是个好思路,能带来有价值的发现。
  • Karpathy 在组织内部的表现更令人期待,可能会为 Anthropic 带来积极影响。
  • 有观点质疑他现在更多是在推广产品和品牌,而非纯技术贡献。
  • 也有人指出他过去在 OpenAI 和 Tesla 时也有类似的商业行为,仍保持免费分享知识。
  • 有人批评他在 Tesla 期间对“全自动驾驶”过于乐观,未能承担应有责任。
  • 也有人认为他离开 Tesla 是因为技术路线受限,转而寻找更尊重其决策的环境。
  • Karpathy 被认为是优秀的教育者,除了机器学习,还曾教授魔方速拧。
  • 有评论提到他过去的魔方教学身份 badmefisto 令人惊讶。
  • 讨论中也出现对个人品德和政治立场的争议,但认为这些与技术评价无关。
  • 有观点认为应尊重工作成果,同时允许对个人缺点进行批评。

2. 埃隆·马斯克败诉山姆·奥特曼及 OpenAI 的诉讼案 (Elon Musk has lost his lawsuit against Sam Altman and OpenAI) #

https://techcrunch.com/2026/05/18/elon-musk-has-lost-his-lawsuit-against-sam-altman-and-openai/

这篇文章报道了埃隆·马斯克针对 OpenAI 联合创始人山姆·奥特曼、格雷格·布罗克曼、OpenAI 及微软提起的诉讼案最终败诉。加州陪审团一致认为马斯克的诉讼因超过法定时效而无效,判决支持被告方的时效抗辩,认定马斯克所称的损害发生在 2021 年之前,超出了法律允许的起诉期限。

诉讼中,马斯克指控奥特曼等人通过创建盈利性子公司,涉嫌“窃取慈善机构”资源,但陪审团未被其说法说服。法官也表示证据支持陪审团的裁决,案件因此迅速结束。OpenAI 的律师称此案是马斯克试图破坏竞争对手的虚假诉讼,而微软方面则表示将继续支持与 OpenAI 的合作。

尽管败诉,马斯克在推特上表示将上诉,强调案件的实质是奥特曼和布罗克曼确实通过“窃取慈善机构”获利,只是时间点存在争议。他的律师也简短回应“上诉”一词。此次判决解除 OpenAI 面临的重大法律风险,有助于其即将进行的首次公开募股(IPO)顺利推进。


HN 热度 1061 points | 评论 561 comments | 作者:nycdatasci | 1 day ago #

https://news.ycombinator.com/item?id=48182754

  • 马斯克败诉的主要原因是他提起诉讼的时间过晚,超过了三年的诉讼时效,陪审团只需回答是非题,未涉及其他事实认定。
  • 马斯克未能建立慈善信托,且其资金在 2020 年前已全部使用,无法支持其违背慈善信托的指控。
  • 马斯克对 OpenAI 转为营利组织的态度并不坚定,曾表示非营利结构可能是错误,他的诉求缺乏说服力。
  • 马斯克延迟提起诉讼直到 ChatGPT 成功并开始竞争,且在董事会期间多次试图挖角 OpenAI 关键员工,存在不当行为。
  • 非营利组织转为营利组织在法律上有成熟程序,通常涉及资产出售和监管审批,OpenAI 的做法被认为试图钻法律漏洞。
  • 诉讼中关于非营利转营利的法律问题重要,但马斯克作为个人是否有资格提起此类诉讼存在争议,政府更适合处理此类问题。
  • 法院诉讼中“诉讼资格”(standing)很重要,防止任何人随意以社会重要问题为由起诉,法院不应成为所有社会争议的仲裁者。
  • 陪审团的职责是回答法官提出的具体问题,基于庭审证据作出事实认定,不能随意自行判断事实。

3. 过去六个月的大型语言模型五分钟速览 (The last six months in LLMs in five minutes) #

https://simonwillison.net/2026/May/19/5-minute-llms/

这篇文章是 Simon Willison 在 2026 年 5 月 19 日发布的博客,标题为《过去六个月的 LLM 发展五分钟速览》。文章总结了过去半年大型语言模型(LLM)领域的主要进展,尤其聚焦于 2025 年 11 月的关键转折点。

11 月是 LLM 特别是编码能力提升的关键时期,多个顶尖模型(Claude Sonnet 4.5、GPT-5.1、Gemini 3、GPT-5.1 Codex Max 和 Claude Opus 4.5)相继更替“最佳”称号。作者用“生成一只骑自行车的鹈鹕”的测试来对比模型表现,认为 Gemini 3 绘制的鹈鹕最出色,但整体上 Claude Opus 4.5 在接下来的几个月中表现最佳。

11 月的最大突破是编码智能体的显著提升。OpenAI 和 Anthropic 通过强化学习提升了模型写代码的质量,使得编码智能体从“偶尔有效”变为“基本可靠”,能够作为日常工具使用,减少了修正错误的时间。

11 月底,一个名为 Warelay 的项目首次提交代码,经过几次更名后,于 2 月以 OpenClaw 之名迅速走红。OpenClaw 是一种“个人 AI 助手”,被统称为“Claws”,在硅谷引发了 Mac Mini 抢购热潮,被形象地比喻为数字宠物和“水族箱”。

2 月,Gemini 3.1 Pro 发布,绘制了更精细的骑自行车鹈鹕,甚至带有鱼篮。随后,谷歌的 Jeff Dean 发布了一段动画视频,展示了多种动物骑车和滑板的场景,显示 AI 绘图能力的提升。

最近一个月,谷歌发布了 Gemma 4 系列开源模型,表现出色。中国 AI 实验室 GLM 发布了 1.5TB 的 GLM-5.1 开源模型,虽然硬件要求高,但效果优异。GLM-5.1 也绘制了一个很有水平的骑自行车鹈鹕,并尝试动画。另一款中国开源模型 Qwen3.6-35B-A3B 在作者笔记本上运行,绘制的鹈鹕甚至超过了 Claude Opus 4.7,显示了开源模型在性能上的进步。

总结来看,过去六个月的两大主题是:编码智能体质量大幅提升,成为实用工具;以及能够在普通笔记本上运行的开源模型性能超出预期,推动了 AI 模型的普及和应用。


HN 热度 727 points | 评论 556 comments | 作者:yakkomajuri | 22 hours ago #

https://news.ycombinator.com/item?id=48188183

  • “鹈鹕骑自行车”这类荒诞测试最初源自微软的 GPT 报告,更多是营销手段而非科学指标。
  • 生成模型能较好地满足复杂提示,但仍难以完全符合人类的常识假设和隐含前提。
  • 对于认知自动化,是否追求“多数人会做的”还是“满足条件的创造性表现”存在不同看法。
  • 编码代理在工具调用和大代码库查询方面表现提升明显,但生成生产级代码仍需大量引导和监督。
  • 生成代码质量受任务复杂度和代码库规模影响较大,且不同用户体验差异显著。
  • 许多开发者认为生成代码更多是辅助工具,需要人工微调和严格审查,尚未达到完全信任的程度。
  • 对于熟悉的代码库,自动生成代码的价值有限,反而可能增加额外负担;对不熟悉的系统则能显著提升效率。
  • 代码质量的衡量标准多样,存在“足够好”与“高质量”之间的认知差异。
  • 生成代码往往偏向于常见的 Web 应用模式,难以满足特定领域或非 Web 界面的需求。

4. 苹果发布全新无障碍功能 (Apple unveils new accessibility features) #

https://www.apple.com/newsroom/2026/05/apple-unveils-new-accessibility-features-and-updates-with-apple-intelligence/

苹果公司于 2026 年 5 月 19 日发布了一系列基于 Apple Intelligence 的无障碍功能更新,提升了 VoiceOver、放大镜、语音控制和无障碍阅读器的使用体验。这些新功能将于今年晚些时候推出。

VoiceOver 和放大镜通过 Apple Intelligence 能够更详细地描述屏幕和周围环境中的图像内容。VoiceOver 的图像探索功能可以系统性地识别照片、扫描账单和个人记录等视觉内容,用户还可以通过 iPhone 的动作按钮快速提问并获得详细回答。放大镜则提供高对比度界面,支持语音控制和快速问答,方便低视力用户使用。

语音控制功能变得更加智能,支持自然语言输入,用户无需记忆精确标签即可通过描述屏幕按钮和控件来操作设备,极大提升了物理障碍用户的操作便捷性。

无障碍阅读器针对多种障碍用户提供个性化阅读体验,支持复杂文档格式如多栏文本、图片和表格。新增的按需摘要功能帮助用户快速了解文章内容,同时内置翻译功能允许用户以母语阅读,同时保持自定义的格式和颜色。

此外,苹果还宣布了通过 Apple Vision Pro 实现眼动控制兼容电动轮椅的新功能,以及系统内生成字幕功能,提升无字幕视频的可访问性。苹果还推出了以无障碍为核心设计的 Hikawa Grip & Stand 适配器,现在线上商店提供三种新颜色选择。

苹果 CEO 蒂姆·库克强调,苹果在无障碍方面的设计独树一帜,结合隐私保护,利用 Apple Intelligence 带来强大新功能。苹果全球无障碍政策与倡议高级总监 Sarah Herrlinger 表示,这些更新为用户提供了更直观的输入、探索和个性化选项,始终保障用户隐私。


HN 热度 570 points | 评论 289 comments | 作者:interpol_p | 12 hours ago #

https://news.ycombinator.com/item?id=48192224

  • 苹果喜欢通过在看似普通的产品中偷偷测试新技术,比如通过辅助功能引入智能 AI,Touch Bar 实际上是苹果向自研芯片过渡的第一步,液态金属 SIM 卡取出工具是对制造工艺的测试,RealityKit 的 AR 功能多年未被理解直到 Vision Pro 发布。
  • 这些尝试很多都是商业化失败的案例,Touch Bar 最初不受欢迎,液态金属取出工具成本高且意义不大,RealityKit 和 Vision Pro 被认为是“解决无问题”的产品,3D Touch 存在发现和使用难题。
  • 苹果的每一步决策都是经过深思熟虑的,即使是看似失败的设计也是为了测试供应链和技术能力,比如液态金属工具是为了验证供应商能力,Touch Bar 是分阶段过渡苹果芯片的策略。
  • Touch Bar 的问题主要是替代了功能键引发专业用户不满,且苹果没有持续改进它,导致其潜力未被充分发挥。
  • Vision Pro 在市场定位上存在问题,缺乏明确的应用场景,尤其是游戏之外的用途较少。
  • 苹果首款自研基带芯片首次搭载在低端机型 iPhone 16e 上,体现了其逐步推广策略。
  • 液态金属是一种非晶态金属合金(也称金属玻璃),具有高强度和可注塑成型的特性,苹果通过 Sandisk Titanium 闪存等产品首次应用了该材料。
  • 液态金属与传统金属注射成型(MIM)工艺不同,具有独特的物理性质和制造工艺优势。

5. 我构建了一个几乎涵盖所有操作系统的虚拟博物馆 (I’ve built a virtual museum with nearly every operating system you can think of) #

https://virtualosmuseum.org/

该网页介绍了“虚拟操作系统博物馆”,这是一个通过虚拟机模拟运行 1700 多个预装操作系统的项目,支持 QEMU、VirtualBox 和 UTM 等多种虚拟化平台。用户无需自行配置或安装模拟器和操作系统,即可直接体验历史上各种操作系统和独立应用程序。该项目涵盖了从 1948 年首台存储程序计算机曼彻斯特宝宝机到现代的操作系统,内容丰富,涵盖了主机、工作站、家用电脑、个人电脑、移动和嵌入式系统以及各种研究和冷门系统。

博物馆内包括早期主机系统(如 CTSS、多种 Unix 版本)、工作站和 Unix 变种(如 SunOS、NeXTSTEP)、家用计算机系统(如 Apple II、ZX Spectrum)、个人电脑操作系统(如 DOS、Windows 早期版本、Mac OS 经典版)、移动和嵌入式系统(如 PalmOS、早期 Android)、以及一些罕见或研究性质的系统。项目目标是让任何人在现代电脑上都能轻松运行这些历史操作系统。

该项目提供完整版和精简版,完整版包含所有预下载内容,支持离线运行;精简版则首次运行时自动下载所需镜像。两种版本均支持自动和手动更新,方便用户获取最新的操作系统安装。

网页还展示了大量操作系统的截图,涵盖了不同年代和平台的界面和应用,展示了丰富的历史软件环境。

项目的存在是为了弥补现有软件保存项目的不足,解决了许多历史操作系统安装复杂、模拟器配置繁琐、兼容性差等问题,使得历史操作系统能够“触手可及”,用户只需点击即可运行,体验当时的使用环境。

该项目是作者 20 多年收藏和整理的成果,操作系统安装来源多样,有些是预装镜像,有些是从原始安装介质安装。部分系统需要特定版本的模拟器或经过补丁修改才能运行。许多安装还包含了当时的应用软件、开发工具和游戏,尽可能还原真实使用场景。

项目仍在持续完善中,作者通过 YouTube、博客和社交平台分享最新进展。项目由个人独立维护,支持方式包括 Patreon 和 Ko-fi,用户也可以通过 Discord 等渠道交流和建议新增内容。


HN 热度 533 points | 评论 122 comments | 作者:andreww591 | 8 hours ago #

https://news.ycombinator.com/item?id=48195009

  • 虚拟博物馆保存了操作系统的视觉界面,但无法还原当时的交互体验,如键盘延迟、鼠标加速度、CRT 显示效果和系统声音等。
  • 有人回忆起一个 Unix 系统中 uid 0 被称为“avatar”而非 root 的奇特现象,但未能确认其真实性。
  • 展示的操作系统版本多为“最后版本”,未必是最有趣或最具代表性的,举例说明 DomainOS 和 Solaris 早期版本的独特性。
  • 收藏和保护这些操作系统非常有价值,担心随着大学档案消失,许多系统会永久丢失。
  • Domain/OS 的模拟实现已经可行,但部分早期版本如 AEGIS 已基本丢失,仍有人尝试恢复旧软盘数据。
  • 有可能在遗产拍卖或退休人员清理时发现旧系统备份,某些公司可能有物理档案保存旧网络和文档。
  • 讨论了终端输入处理机制,指出 PTYS 默认行为与某些系统的输入编辑功能不同,但理论上可以实现类似功能。
  • 提到 Pick 操作系统及其在某些行业应用中的重要性和独特体验,部分用户有相关工作经历和怀念。

6. Anthropic 收购 Stainless (Anthropic acquires Stainless) #

https://www.anthropic.com/news/anthropic-acquires-stainless

Anthropic 宣布收购 Stainless,这是一家专注于 SDK 和 MCP 服务器工具的领先公司。Stainless 自 2022 年成立以来,一直为 Anthropic 提供官方 SDK 的生成支持,帮助开发者通过 TypeScript、Python、Go、Java 等多种语言快速、可靠地使用 API。此次收购旨在增强 Anthropic 的 Claude 平台,使其在连接数据和工具方面更具能力。

Anthropic 平台负责人 Katelyn Lesse 表示,智能代理的效用取决于其连接系统的能力,收购 Stainless 团队将推动 Claude 在开发者体验和代理连接性上的进步。Stainless 创始人兼 CEO Alex Rattray 指出,SDK 应得到与 API 同等的重视,双方团队的合并是基于对 Claude 生态系统发展的共同认可。

此外,Anthropic 开发了 MCP 以支持智能代理的连接功能,整合 Stainless 团队后,Claude 平台将继续在开发者体验和智能代理连接领域保持领先。网页还提及了 Anthropic 与 KPMG、PwC 等大型企业的合作,展示了 Claude 在企业级应用中的广泛部署和影响力。


HN 热度 522 points | 评论 365 comments | 作者:tomeraberbach | 1 day ago #

https://news.ycombinator.com/item?id=48182281

  • Anthropic 收购 Stainless 后,团队将加入 Anthropic 继续开发,主要做 API 集成和基础设施相关工作,虽然看似“无聊”,但对提升开发者体验很重要。
  • Stainless 的产品主要是根据 OpenAPI 规范自动生成高质量的 SDK、文档、服务器和发布流水线,帮助开发团队高效管理 API 相关代码和发布流程。
  • Stainless 的工作重点是提升开发者体验,生成的代码质量高,非基于 AI 自动生成,而是工程师手工设计,受到多家知名公司的认可和使用。
  • 虽然 Stainless 的官网首页信息不够直观,部分用户对其具体业务存在疑问,但其产品功能和价值被部分用户认可。
  • 有观点认为 Stainless 的产品虽“无聊”,但在细分市场中有价值,能带来财富;也有人质疑“无聊”业务不一定能带来财富。
  • 有人质疑是否真的需要 Stainless 这样的产品,认为未来的模型可能足够直接处理 OpenAPI 规范。
  • 有评论认为 Anthropic 仍需顶尖软件工程师,说明 AI 产品尚不能完全替代高级开发岗位。
  • 有观点认为此次收购更多是商业操作,双方都在资本和市场层面取得成功,而非单纯技术创新。

7. 草莓的高斯点绘 (Show HN: Gaussian Splat of a Strawberry) #

https://superspl.at/scene/84df8849

该网页介绍了一个名为 SuperSplat 的项目,最新更新包括软件归属、碰撞生成和 GPU 加速的直方图功能。页面展示了一个名为 Strawberry46457 的数据集,包含从 90 个角度拍摄的 88 张对焦堆叠图像,使用尼康 Z8 全画幅相机,光圈 f/7.1,曝光时间 1/160 秒,ISO 100,搭配 Laowa 180mm 微距镜头及 LED 灯和蓝幕拍摄。

训练工作基于 slang-splat 工具完成,相关代码可在 GitHub 上找到。该数据集采用 CC BY 许可证发布,虽然推荐署名,但并非强制。用户可以免费使用该作品。COLMAP 数据集也可在作者的 Patreon 页面免费下载。

网页还提供了相关软件的链接和使用建议,页面底部有评论区,但目前暂无评论。整体内容适合对计算机视觉、图像处理和数据集感兴趣的用户参考和使用。


HN 热度 459 points | 评论 182 comments | 作者:danybittel | 13 hours ago #

https://news.ycombinator.com/item?id=48191602

  • PlayCanvas 引擎从 2011 年用于游戏开发,到现在还能支持像草莓这样的 3D 展示,体现了开源项目的生命力和社区创造力。
  • SuperSplat 和 PlayCanvas 已经开源,方便大家学习和创新。
  • 3D splat 技术虽然视觉效果惊艳,但存在渲染错误和边界裁剪问题,使用带 LIDAR 的设备扫描可以提升效果。
  • 目前动画主要依赖多帧静态 3D splat 插值,数据量大且难以实现实时变形动画。
  • 动画变形如骨骼蒙皮仍需多边形网格支持,splat 技术在实时光照和动态编辑方面存在限制。
  • 未来若能实现时间采样和动态采样,splat 技术有潜力像扩散模型一样快速发展。
  • 通过动画四面体网格笼子驱动无网格几何体的研究为 splat 动画提供了新思路,但目前仍有限制。
  • 多边形网格是动画变形的基础,但 splat 技术代表了另一种光场采样的无网格表达方式。
  • 顶点蒙皮本质上是对点的加权变换,不一定非得依赖多边形网格,splat 与多边形的桥接值得探索。
  • Gaussian splatting 本质是大量半透明光斑叠加形成视觉效果,没有传统网格模型,表现的是光照场而非几何结构。
  • 光斑位置受多视角约束,确保表面视觉稳定,否则视角变化会导致模型崩溃。

8. CISA 管理员在 GitHub 上泄露了 AWS GovCloud 密钥 (CISA Admin Leaked AWS GovCloud Keys on GitHub) #

https://krebsonsecurity.com/2026/05/cisa-admin-leaked-aws-govcloud-keys-on-github/

这篇文章报道了美国网络安全和基础设施安全局(CISA)的一名承包商在 GitHub 上公开泄露了多个高度权限的 AWS GovCloud 账户凭证及大量内部系统敏感信息。安全研究人员 GitGuardian 的 Guillaume Valadon 发现该公开仓库名为“Private-CISA”,其中包含云密钥、令牌、明文密码、日志等敏感文件,暴露了 CISA 内部软件构建、测试和部署的详细信息。

泄露的文件中包括三个 AWS GovCloud 服务器的管理员凭证,以及多个内部系统的用户名和明文密码,涉及 CISA 的安全代码开发环境等关键资源。安全顾问 Philippe Caturegli 验证了这些凭证的有效性,指出这些信息可能被攻击者用来在 CISA 系统内横向移动,甚至通过篡改软件包实现持久后门。

该 GitHub 仓库由一家名为 Nightwing 的政府承包商员工维护,仓库创建于 2025 年 11 月,账户则早在 2018 年就已存在。仓库被用作同步工作文件的工具,且存在禁用 GitHub 默认的秘密检测功能、使用易猜密码等严重安全疏漏。尽管仓库被关闭,泄露的 AWS 密钥在通知后仍持续有效了 48 小时。

CISA 对此事件表示正在调查,目前尚无证据显示敏感数据被实际利用。该机构也承认将加强安全措施防止类似事件再次发生。文章还提到,CISA 目前预算和人员大幅削减,员工流失严重,可能影响其安全管理能力。整体来看,这起泄露事件暴露了政府承包商安全管理的重大漏洞,带来了极高的安全风险。


HN 热度 376 points | 评论 157 comments | 作者:LelouBil | 16 hours ago #

https://news.ycombinator.com/item?id=48190454

  • 泄露 AWS GovCloud 密钥和明文密码文件是极度不负责任和严重的疏忽,尤其是 CISA 作为网络安全机构更应重视。
  • 对于共享凭证的管理存在巨大缺口,很多组织缺乏合适的工具和流程,导致凭证被不安全地存储和传递。
  • 使用团队密码管理器是解决共享凭证问题的有效方法,但小企业或承包商可能因成本和认知不足而未采用。
  • AWS 根账户凭证不应频繁使用或存储在同一账户的秘密管理器中,根账户凭证管理存在“循环依赖”难题。
  • 删除根账户凭证并通过自动化 IAM 账户和恢复流程管理访问是一种更安全的做法,但恢复流程本身也存在潜在风险。
  • CISA 被认为在安全管理上存在严重缺陷,可能与内部削弱和资源不足有关,反映出机构内部的腐败和管理问题。
  • 公众对密码安全的认识普遍不足,简单密码和明文存储仍然普遍存在。
  • 有观点认为这类事件可能被用作掩盖更深层次的数据窃取或内部问题的借口。
  • 大型企业的 IT 团队并非总是安全的,历史上也有凭证通过不安全渠道泄露的案例。

9. 点击(2016) (Click (2016)) #

https://clickclickclick.click/

这个网页是一个在线点击游戏的界面,名为“clickclickclick.click”。页面显示当前成就解锁进度为 0%,总共有 128 个成就等待玩家去解锁。页面中有多个问号图标,可能代表未解锁的成就或提示信息。用户可以通过点击按钮尝试解锁所有成就。

页面底部提供了一个保存进度的链接,用户可以复制该链接在任何浏览器中继续当前游戏进度。页面还包含“保存”和“重置”按钮,方便用户管理游戏状态。此外,页面提供了返回上一页的导航选项。

总体来看,这个网页主要功能是一个点击类游戏,鼓励玩家通过不断点击来解锁各种成就,具有一定的挑战性和趣味性。


HN 热度 363 points | 评论 93 comments | 作者:andrewzeno | 1 day ago #

https://news.ycombinator.com/item?id=48187054

  • 用户对网站使用鼠标轨迹录像等分析工具感到隐私被侵犯,尽管这些功能通常会在条款中说明,但用户并不真正理解其工作原理。
  • 大多数人对数据被自动化系统收集并不在意,但一旦感觉有真人在监视个人行为,就会觉得非常不适。
  • 普通用户更关心的是如何保护自己不被亲友、同事等特定人群监视,而端到端加密和 VPN 对他们来说往往不实用,消失消息和隐身模式更有用。
  • 社会习惯中存在“公共场合的隐私”,即虽然在公共场所,但人们期望别人不会刻意监视自己。
  • 现代社会中恶意的监视行为被大规模机械化,且责任难以追究,导致隐私保护更加困难。
  • 有时公共场合的监听和交流是自然而然的社交行为,不一定都是恶意监视。
  • 技术使得单向监视变得极其容易,普通人之间也可能出现监视行为。
  • 过去的隐私习惯可能与城市化发展有关,生活环境不同导致隐私观念不同。
  • 用户往往不了解监控数据的潜在风险,包括未来可能的滥用和个性化定价等问题。
  • 大规模数据聚合和分析带来的伤害更为严重,但普通人难以理解其影响。
  • 区分匿名汇总数据和针对个人的行为跟踪对隐私感受有显著区别。
  • 很多人不是不关心隐私,而是不知道、不了解或无力改变现状。
  • 许多人即使知道隐私被侵犯,也因行业环境而感到无奈和疲惫,选择放弃抗争。
  • 用户对隐私的感知更多是情感层面而非理性分析,知道真相后往往选择忽视。
  • 条款和隐私政策虽然包含相关说明,但大多数用户不会认真阅读或理解。
  • 浏览器没有提醒用户网站是否监听键盘或鼠标事件,导致用户难以预判隐私风险。

10. 迷你沙丘虫再度来袭:314 个 npm 包被攻陷 (Mini Shai-Hulud Strikes Again: 314 npm Packages Compromised) #

https://safedep.io/mini-shai-hulud-strikes-again-314-npm-packages-compromised/

2026 年 5 月 19 日,npm 账号 atool(邮箱 i@hust.cc)遭到入侵,攻击者在 22 分钟内自动发布了 637 个恶意版本,涉及 317 个 npm 包。受影响的知名包包括 size-sensor(420 万月下载量)、echarts-for-react(380 万)、@antv/scale(220 万)、timeago.js(115 万)及大量 @antv 作用域包。恶意代码为一个 498KB 的混淆 Bun 脚本,使用了与三周前 SAP 事件中 Mini Shai-Hulud 工具包相同的扫描架构和凭证正则表达式,能够窃取包括 AWS 全链条凭证、Kubernetes 服务账户令牌、HashiCorp Vault、GitHub PAT、npm 令牌、SSH 密钥及本地密码管理器(1Password、Bitwarden 等)中的凭证。

数据通过两条渠道外泄:一是以 Git 对象形式提交到攻击者控制的公开 GitHub 仓库,二是通过 RSA+AES 加密的 HTTPS 请求伪装成 OpenTelemetry 追踪数据发送至指定服务器。攻击还利用 CI 环境中的 GitHub Actions OIDC 令牌交换获取 npm 发布令牌,使用 Sigstore 签名伪造身份发布恶意包,并在项目中注入持续存在的 GitHub 工作流文件,实现持久化。

此外,恶意代码劫持 AI 编程助手 Claude Code 和 Codex,通过注入会话启动钩子实现每次 AI 会话自动执行恶意代码,VS Code 中也通过 tasks.json 实现类似效果。系统层面,恶意软件以 systemd 服务和 macOS LaunchAgent 形式运行,建立 GitHub 死信通道后门,定时从 GitHub 提交消息中获取 RSA 签名的远程命令并执行。攻击还尝试通过 Docker 容器逃逸,感染本地其他 Node.js 项目。

攻击利用两条执行路径,每个恶意版本均添加 preinstall 钩子执行 bun run index.js,大部分版本还注入指向伪造 GitHub 提交的 optionalDependencies,利用 GitHub 的分叉对象共享机制隐藏恶意代码。使用语义版本范围的项目会自动升级到受感染版本。

此次攻击影响范围广泛,凭证窃取目标涵盖云服务密钥、数据库连接、支付和通讯令牌等多种敏感信息,数据外泄渠道隐蔽且多样,攻击手法复杂且具备高度持久性和传播能力。用户应警惕 2026 年 5 月 19 日发布的 atool 账号相关包,特别是带有 bun run index.js 预安装脚本的版本,并关注相关恶意 GitHub 提交和外泄仓库命名模式。


HN 热度 360 points | 评论 275 comments | 作者:theanonymousone | 19 hours ago #

https://news.ycombinator.com/item?id=48189368

  • NPM 默认允许生命周期脚本执行,导致任意代码执行风险,应默认禁用或限制执行范围。
  • 运行生命周期脚本应在沙箱环境中进行,避免使用用户权限执行任意代码。
  • 使用 pnpm 可以部分防止秘密泄露,但无法完全防止下游包中植入恶意代码。
  • NPM 生态系统普遍存在安全隐患,部分原因是过度依赖第三方包而非自己编写简单代码。
  • 其他语言包管理器如 Python、Ruby、PHP 等也存在安装时执行代码的情况,但有不同的安全措施。
  • 现代 Python 包倾向使用预编译的 wheel 文件,减少安装时执行任意代码的风险。
  • 包管理器应向 Linux 发行版包管理器靠拢,避免安装时执行命令,提供预构建的二进制包。
  • NPM 的高风险与其极端流行、依赖树庞大以及集中托管有关,不仅仅是生命周期脚本的原因。
  • 即使安装时不执行恶意代码,运行时执行恶意包代码仍然是安全隐患,信任来源是关键。
  • JavaScript 早期标准库匮乏,NPM 促进了代码复用和深依赖树的形成,增加了安全风险。

Hacker News 精彩评论及翻译 #

Gemini 3.5 Flash #

https://news.ycombinator.com/item?id=48198275

That pelican looks like it’s in Miami for a crypto conference.

hedgehog

那只鹈鹕看起来像是在迈阿密参加一个加密货币会议。


Google I/O #

https://news.ycombinator.com/item?id=48196708

can’t wait to hear all about the new Agentic workflows you can build with AI and build with agentic agent swarms and build more workflows to do more with Enterprise AI with Gemini Enterprise Agent Platform and elevate efficiency with the power of AI and unlock value with AI agents. also can’t wait to hear more about AI integrations across Google AI Workspace, like AI Gmail or AI docs (powered by Gemini Enterprise AI). also can’t wait to empower myself with more AI-powered data that will be unlocked with agents. AI.

r_lee

迫不及待想听听你们如何利用AI构建新的自主工作流,如何利用自主代理群体构建更多工作流,借助Gemini企业代理平台在企业AI中实现更多功能,以AI的力量提升效率,释放AI代理的价值。同样迫不及待想了解更多关于Google AI工作空间中的AI整合,比如AI Gmail或由Gemini企业AI驱动的AI文档。也非常期待借助这些代理获得更多由AI驱动的数据,从而增强自己的能力。


https://news.ycombinator.com/item?id=48197528

Nilay Patel has been talking about “Google Zero” - the moment when Google effectively stops sending any traffic to other sites - for a few years now: https://www.theverge.com/24167865/google-zero-search-crash-housefresh-ai-overviews-traffic-data-audience

simonw

Nilay Patel 多年来一直在讨论“谷歌零时刻”——也就是谷歌实际上停止向其他网站发送任何流量的时刻: https://www.theverge.com/24167865/google-zero-search-crash-housefresh-ai-overviews-traffic-data-audience


Google changes its search box #

https://news.ycombinator.com/item?id=48199338

What scares me about this new AI mode thingy is that every answer sounds like a systematic literature review, but only for the results. For example, if I look for users feedback about a specific product, it says “People think that…, but also that…; It’s important to notice that some people …” where with ‘people’ it means just a random comment on a random website just because it thought it was a good contribution to the results. Sounds like it’s giving a ground truth from “multiple” data, when instead it’s just aggregating almost random stuff. In the context of a systematic review, the feature that I would love the most is augmenting my initial query, so that I can just get more results that I could find interesting. I am 100% sure they thought about this, but ignored it for the most profitable option.

fscaramuzza

让我害怕这个新的AI模式的是,每个回答听起来都像是一篇系统性文献综述,但仅限于结果部分。例如,当我寻找关于某个特定产品的用户反馈时,它会说“人们认为……,但也有人觉得……;需要注意的是,有些人……”这里的“人们”其实只是指某个随机网站上的随机评论,仅仅因为它被认为对结果有贡献。听起来像是在给出基于“多重”数据的真实依据,实际上只是聚合了几乎随机的信息。在系统综述的背景下,我最希望的功能是能够扩展我的初始查询,这样我就能获得更多可能感兴趣的结果。我百分之百确定他们想过这个点,但为了追求最大利润选择忽略了它。


Anthropic acquires Stainless #

https://news.ycombinator.com/item?id=48187692

… and their team is joining Anthropic to build, who knows, some dumb integration to make Hubspot data available in Claude, or something equally as boring.

Fun fact, I named it “Stainless” after Stainless Steel pipes, likening ourselves to a high-end plumbing supply shop. If you look at the earliest versions of stainlessapi.com on archive.org, you’ll see our original motto was “Quality fittings for your REST API”.

All that is to say, the incredibly “boring” infrastructural work of making “boring” APIs like Hubspot’s more usefully accessible is absolutely the kind of thing I’m excited to do at Anthropic :)

(It also happens to be what got us all excited to work at stainless in the first place, but of course, we understand it’s not for everyone!)

rattray

……他们的团队正在加入Anthropic,去构建谁知道的,某种愚蠢的集成,让Hubspot的数据能在Claude中使用,或者类似同样无聊的东西。

有趣的是,我把它命名为“Stainless”,来自不锈钢管道,把自己比作一个高端的管道供应店。如果你查看archive.org上stainlessapi.com的最早版本,你会看到我们的原始座右铭是“为你的REST API提供优质配件”。

总之,让像Hubspot这样“无聊”的API变得更实用、更易访问,这种非常“无聊”的基础设施工作,正是我在Anthropic特别期待去做的事情 :)

(这也恰恰是当初让我们所有人都兴奋加入Stainless的原因,但当然,我们也明白这并不适合所有人!)


Anthropic acquires Stainless #

https://news.ycombinator.com/item?id=48186214

Anthropic is at a place where they need the world’s best software engineers, and they’re willing to comp at insane levels to get them. However: You simply cannot post a Linkedin job for “Really Good Software Engineer, comp $10M+” and make any sense of the inbound applications you’ll get. They’re not the first to figure this out, and they won’t be the last: Successfully building a company, and using that company’s products, is actually the best job interview you can ask for if you can pay for that caliber of candidate.

What you should be paying attention to: Stainless is shutting down, and their team is joining Anthropic to build, who knows, some dumb integration to make Hubspot data available in Claude, or something equally as boring. But, Stainless was successful. Be the next Stainless. The idea is already validated, these AI companies have already done this to a handful of companies and they’re going to keep doing it.

827a

Anthropic现在需要世界上最顶尖的软件工程师,而且他们愿意支付非常高的薪酬来吸引这些人才。然而:你根本不能在LinkedIn上发布“超级优秀的软件工程师,薪酬超过1000万美元”的职位,然后期望收到合理的申请。他们不是第一个意识到这一点的,也不会是最后一个:成功创建一家公司,并使用该公司的产品,实际上是你能提供给这种级别候选人的最佳面试形式。

你应该关注的是:Stainless正在关闭,他们的团队加入了Anthropic,去做一些,比如说,把Hubspot的数据整合到Claude里,或者一些同样无聊的东西。但Stainless是成功的。要成为下一个Stainless。这个想法已经被验证,这些AI公司已经对少数几家公司做过类似的事情,并且会继续这样做。


Apple unveils new accessibility features #

https://news.ycombinator.com/item?id=48192501

Fun fact: This video was made accessible to sighted people because no blind person would ever listen to voice at that speed. Honestly if you ever observe a blind person using computers you’d impressed how they can listen to audio at unimaginable speeds.

mohsen1

有趣的事实是:这个视频之所以对有视力的人开放,是因为没有盲人会以那种速度听语音。说实话,如果你观察盲人使用电脑,你会惊讶于他们能够以难以想象的速度听音频。


I’ve joined Anthropic #

https://news.ycombinator.com/item?id=48194460

AI news and ESPN feels interchangeable sometimes.

aizk

AI新闻和ESPN有时感觉都差不多。


Gemini 3.5 Flash #

https://news.ycombinator.com/item?id=48198232

The pelican is a lot : https://github.com/simonw/llm-gemini/issues/133#issuecomment-4491300245

Not a great bicycle though, it forgot the bar between the pedals and the back wheel and weirdly tangled the other bars.

Expensive too - that pelican cost 13 cents: https://www.llm-prices.com/#it=11&ot=14403&sel=gemini-3.5-flash

simonw

鹈鹕太厉害了:https://github.com/simonw/llm-gemini/issues/133#issuecomment-4491300245

不过这自行车不怎么样,它忘了踩踏板和后轮之间的横杆,而且奇怪地把其他横杆纠缠在一起了。

而且还很贵——那只鹈鹕花了13美分:https://www.llm-prices.com/#it=11&ot=14403&sel=gemini-3.5-flash


Apple unveils new accessibility features #

https://news.ycombinator.com/item?id=48192658

https://youtu.be/wKISPePFrIs?si=ahGfFp0U7-pTU9w6&t=43

my go to example of this is this talk by Saqib Shaikh (a blind software engineer at Microsoft) giving a talk about Visual Studio. Link is timestamped

asimovDev

我举的这个例子是微软盲人软件工程师Saqib Shaikh关于Visual Studio的演讲。链接中有时间戳。


The last six months in LLMs in five minutes #

https://news.ycombinator.com/item?id=48190085

Does this guy have a “publish to front page of HN” button on his blog editor?

wewewedxfgdf

难道这个家伙的博客编辑器里有一个“发布到HN首页”的按钮吗?


Google I/O #

https://news.ycombinator.com/item?id=48196220

I wonder if they’ll talk about AI?

martypitt

我想知道他们是否会谈论人工智能?


Elon Musk has lost his lawsuit against Sam Altman … #

https://news.ycombinator.com/item?id=48183523

My own thoughts:

If I had been on the jury, I would have found against Musk on every point.

His lawyers created a “3 phases of doubt” to try and sidestep the statute of limitations, but it was clearly bogus and he was on notice of OpenAI creating a for-profit in 2019.

Musk was perfectly happy to have OpenAI be a for-profit, a non-profit with an attached for-profit (the current structure), or even just absorbed into Tesla. His complaints fell flat for me given the number of emails where he said that a non-profit was likely a mistake.

This is technical, but Musk clearly never created a charitable trust, which was a precondition for his claims. His funds were donated for general use by OpenAI, not for any specific use that would allow him to claim breach of charitable trust. Also, all of his funds were spent by no later than 2020 which is before his alleged breach in 2023.

Musk unreasonably delayed bringing this case until the success of ChatGPT and starting a competing AI company, and he had unclean hands because he attempted to sabotage OpenAI repeatedly by poaching its key staff while on the board.

granzymes

我自己的看法:

如果我是陪审团成员,我会在每一点上都判决马斯克败诉。

他的律师制造了一个“怀疑的三阶段”来试图绕过时效限制,但这明显是假的,而且他早在2019年就知道OpenAI在创建一个盈利性机构。

马斯克完全乐意OpenAI成为一个盈利性机构,或者是一个带有盈利部门的非营利组织(目前的结构),甚至被特斯拉吸收。鉴于他多次在邮件中说非营利组织很可能是个错误,他的抱怨对我来说站不住脚。

这是技术性问题,但马斯克显然从未创建过慈善信托基金,而这是他主张权利的先决条件。他的资金是捐赠给OpenAI的通用用途,而不是用于任何特定用途,因此他无法主张慈善信托被违反。而且,他的资金最迟在2020年就已全部花光,远早于他指控的2023年违规时间。

马斯克无理地拖延提起诉讼,直到ChatGPT取得成功并开始创建竞争的AI公司,而他手段不正当,因为他在董事会期间多次试图通过挖走OpenAI关键员工来破坏OpenAI。


Gemini 3.5 Flash #

https://news.ycombinator.com/item?id=48197727

Per million input/output tokens:

Gemini 2.5 flash: $0.30/$2.50

Gemini 3.0 flash preview: $0.50/$3.00

Gemini 3.5 flash: $1.50/$9.00

Interesting pricing direction. I don’t think we have ever seen a 3x price increase for in the immediate next same-sized model (and lol @ 3 only ever getting a preview).

3.5 flash costs similar to Gemini 2.5 pro which was $1.25/$10

GodelNumbering

每百万输入/输出令牌:

Gemini 2.5 快闪版:$0.30/$2.50

Gemini 3.0 快闪预览版:$0.50/$3.00

Gemini 3.5 快闪版:$1.50/$9.00

有趣的定价方向。我觉得我们从未见过在紧接着的同等规模模型中价格上涨3倍的情况(笑,3.0版本竟然只出了一个预览版)。

3.5 快闪版的价格和 Gemini 2.5 专业版差不多,后者是 $1.25/$10。


The last six months in LLMs in five minutes #

https://news.ycombinator.com/item?id=48190464

The coding agents got really good

It’s since november 2025, the so called “inflection point”, that I’m still wondering for who coding agents become “really good”.

All I observe they got better at tool call and answering questions about big codebases, especially if the question has a vague pattern to search, and they’re superuseful for that! For generating production code even with a lot of steering and baby sitting?

Absolutely not, not quite there not even close in my experience.

But we should stop talking about 1s and 0s, especially with marketing hype trains, there exist a gradient of capabalities that agents have that really depends on the intricacies of the codebase you’re working on, I think everyone has yet to discover how to better apply these tools in their day to day work.

But that totally collides with the current narrative, that flattens out our work to be always the same and that can be automated easily in each case, it’s not!

That’s why the debate is so polizered imo, there isn’t a shared experience

hollowturtle

编码代理变得非常厉害了

自从2025年11月那个所谓的“转折点”以来,我一直在思考编码代理对谁来说变得“真的很厉害”。

我观察到的是它们在调用工具和回答关于大型代码库的问题上变得更好了,尤其是当问题有一个模糊的搜索模式时,它们非常有用!但是要它们生成可用于生产的代码,即使经过大量指导和监管?

绝对不,依我看来远远达不到那个水平。

不过我们应该停止非黑即白的讨论,尤其是在伴随着市场炒作的情况下,代理的能力是一个渐进的过程,真正取决于你操作的代码库的复杂细节,我觉得大家还没完全掌握如何在日常工作中更好地应用这些工具。

但这完全和当前的叙述相冲突,那种把我们的工作一概而论、认为每种情况都能轻松自动化的说法,事实并非如此!

我认为这也是为什么争论如此两极分化,因为没有一个共同的体验基础。