2026-04-03 Hacker News Top Stories #
- LinkedIn被曝通过JavaScript静默扫描用户浏览器扩展程序并加密传输扩展ID,引发对用户隐私深度信息采集和侵犯的争议。
- NASA阿耳忒弥斯二号任务成功发射,搭载宇航员的"诚信号"飞船开启为期约10天的载人绕月飞行,为深空探索及火星任务奠定基础。
- Google DeepMind发布基于Gemini 3技术的Gemma 4开源模型系列,支持多模态理解、140种语言及智能体工作流,适用于边缘计算与复杂任务自动化。
- 瑞典宣布学校回归基础教学,重新引入纸质书籍以减少对数字设备的依赖,应对数字化教育成效不佳和学生成绩持续下滑的问题。
- 2026年3月Steam on Linux市场占有率飙升至5.33%创历史新高,首次突破5%门槛,主要源于Steam Survey数据调整及中国区用户数据变化。
- DRAM价格飙升严重冲击业余爱好者单板计算机市场,导致Raspberry Pi等产品大幅提价,高内存配置SBC已超出大多数爱好者承受能力。
- AMD推出开源本地AI平台Lemonade,支持在GPU和NPU上高效运行大语言模型,提供多模态功能并兼容OpenAI API标准接口。
- Qwen团队发布仅通过API提供的Qwen3.6-Plus模型,在代理编码和多模态推理方面显著提升,但被质疑利用此前开源声誉进行商业推广。
- 纪念网站"我不是数字"通过交互式灯光视觉化呈现加沙地带超过72,000名遇难巴勒斯坦人信息,呼吁尊重个体生命而非统计数据。
- SpaceX秘密提交IPO申请计划于2026年6月上市,估值超1万亿美元拟募资最高750亿美元,或使马斯克成为全球首位万亿富豪。
1. LinkedIn 正在扫描您的浏览器扩展程序 (LinkedIn is searching your browser extensions) #
微软正在进行现代历史上最大的企业间谍活动之一。每当 LinkedIn 的十亿用户访问 linkedin.com 时,隐藏代码会扫描用户的计算机,搜集已安装软件的信息,并将结果传输到 LinkedIn 的服务器以及包括一家美以网络安全公司在内的第三方公司。这一过程在用户不知情的情况下进行,LinkedIn 的隐私政策中并没有提及这一行为。
由于 LinkedIn 知道每个用户的真实姓名、雇主和职位,它不是在搜索匿名访问者,而是在针对识别出的个人及其公司进行扫描。每天,全球数百万都在进行这种搜索。
主要发现包括:
-
个人数据的大规模泄露:LinkedIn 的扫描能够揭示个人的宗教信仰、政治观点、残疾情况以及求职活动。该平台扫描能够识别穆斯林的扩展、揭示政治倾向的扩展、为神经样性用户设计的扩展以及 509 个求职工具,这些都暴露了用户在当前雇主可见的平台上秘密寻求工作的情况。根据欧盟法律,这类数据属于受保护类别,LinkedIn 并没有获得用户的同意或披露,也没有合法依据。
-
企业间谍和商业机密盗窃:LinkedIn 扫描超过 200 种直接与其销售工具竞争的产品,包括 Apollo、Lusha 和 ZoomInfo。由于 LinkedIn 知道每个用户的雇主,它可以映射出哪些公司使用哪些竞争产品,从而在用户不知情的情况下提取数千个软件公司的客户名单。LinkedIn 利用这些信息向使用第三方工具的用户发出威胁,进行针对性的打击。
-
欺骗欧盟监管者:2023 年,欧盟将 LinkedIn 指定为《数字市场法》下的受监管门槛,并要求其向第三方工具开放平台。LinkedIn 的回应是发布两个限制性 API,并向欧盟委员会展示以为符合规定。然而,这两个 API 的调用频率极低,而 LinkedIn 内部的 API “Voyager” 则以每秒 163,000 次的速度运行。在微软提交的 249 页合规报告中,提到了 “API” 533 次,但 “Voyager” 这个词却没有出现。同时,LinkedIn 还扩大了对这些法规旨在保护的工具的监控,扫描列表从 2024 年的约 461 个产品增长到 2026 年 2 月的超过 6,000 个。
-
将你的数据发送给第三方:LinkedIn 从 HUMAN Security(一家美以网络安全公司)加载一个不可见的追踪元素,这个元素的宽度为零,隐藏在屏幕外,无需用户知便会在浏览器上设置 Cookie。此外,来自 LinkedIn 自己服务器的另一个指纹脚本在每次页面时悄悄执行,谷歌的第三个脚本也是如此。所有这些操作都是加密的,并未公开披露。
最后,该内容来自 Fairlinked e.V.,这是一个代表商业 LinkedIn 用户的协会,旨在记录和揭露这一重大的企业间谍和数据泄露丑闻,并向公众和监管机构通。协会呼吁公众支持和资金,以追究 LinkedIn 的责任。
HN 热度 1527 points | 评论 674 comments | 作者:digitalWestie | 11 hours ago #
https://news.ycombinator.com/item?id=47613981
- LinkedIn 在用户打开其网页时会通过 JavaScript 静默扫描已安装的浏览器扩展,收集并加密传输扩展信息,这种行为虽未突破浏览器沙箱,但仍构成隐私侵犯。
- 尽管该行为未直接访问用户计算机文件系统,但对浏览器扩展的探测仍属于对用户设备的深度信息采集,应被视为“扫描计算机”的范畴。
- 由于 Chrome 浏览器 V3 版本引入了扩展 ID 随机化机制,该功能显然非浏览器设计初衷,表明此行为具有规避防护机制的意图。
- LinkedIn 扫描的扩展列表中包含大量与自身业务无关的工具,甚至包括可能被用于监控或审查的扩展,暗示其行为具有潜在恶意或监视目的。
- 当前浏览器 API 限制导致开发者无法直接获取所有已安装扩展,因此只能通过逐一探测扩展 ID 的方式实现指纹识别,但这并不能为该行为提供正当性。
- 该技术手段虽常见于广告网络和反欺诈系统中,但其在未经用户明确同意的情况下实施,仍构成严重隐私问题。
- 开发者在面对此类需求时,不应简单接受“技术上可行”作为合理依据,而应坚守伦理底线,拒绝参与侵犯用户隐私的项目。
- 技术实现的“常见性”不能成为合理化侵犯隐私的借口,开发者应主动抵制非伦理的技术方案,而非被动执行。
- 企业常以反欺诈、反滥用等正当理由推动此类功能,但忽视了其对用户隐私的广泛影响,导致技术与伦理失衡。
- 在缺乏足够话语权和职业保障的情况下,开发者很难拒绝此类要求,导致伦理问题在技术实践中被系统性忽视。
- 当前技术行业对开发者存在高需求,但这种需求并未转化为对伦理决策的真正赋权,开发者仍处于被动执行地位。
- 随着 AI 技术发展,未来可能由 AI 模型替代人类开发者,而 AI 不会具备伦理判断能力,这将进一步加剧技术滥用风险。
2. 阿耳忒弥斯 2 号发射日更新 (Artemis II Launch Day Updates) #
https://www.nasa.gov/blogs/missions/2026/04/01/live-artemis-ii-launch-day-updates/
阿耳忒弥斯二号任务的宇宙飞船 “诚信号”(Orion)于东部时间 6 月 35 日下午 6:35 从佛罗里达州的肯尼迪航天中心 39B 发射台成功发射。这是 NASA 阿耳忒弥斯计划下的首次载人飞行,目的是测试将宇航员送往月球及更远深空的系统和硬件。
发射后,宇宙飞船的四个太阳能翼(SAWs)成功展开,确保宇宙飞船能够在飞行过程中持续获取电力。每个太阳能翼有 15,000 个太阳能电池,能够追踪太阳,最大化电力生成。紧着,发射控制中心在宇航员与发射系统分离后进行了首个重大里程碑 —— 核心级发动机的关闭。
在发射,发射团队完成了一系列准备工作,包括确保发射终止系统正常工作,这是一项安全系统,用于在火箭偏离预定航线时保护公众安全。发射前的 10 分钟倒计时阶段,发射总监进行了 “是否准备好发射” 的投票,所有成员一致同意继续进行。
此外,宇航员的安全舱门在发射前被封闭,这是确保宇航员在飞行期间安全的重要步骤。发射前的准备工作非常细致,工程师们进行了许多测试和检查,以确保所有系统的功能正常,包括舱门的密封性和安全机制。
整个任务预计将持续约 10 天,宇航员将绕月飞行,为未来更复杂的月球探索任务做准备。阿耳忒弥斯二号的成功发射标志着 NASA 在人类深空探索中迈出的重要一步,同时也为未来的火星任务奠定基础。
发射日的更新信息将通过 NASA 的官方渠道持续发布,包括 YouTube 频道和阿耳忒弥斯博客,以便公众可以随时了解任务进展和关键里程碑。
HN 热度 1069 points | 评论 927 comments | 作者:apitman | 1 day ago #
https://news.ycombinator.com/item?id=47603657
- Starship 进入低地球轨道(LEO)并不是一个重大挑战,因为现有的飞行明确瞄准的是略微亚轨道的轨迹。
- 相较于已完成的任务,Starship 的 LEO 目标确实不算什么挑战。
- 成功实现推进剂转移是一个重大挑战,目前已经展示了内部罐之间的转移,但尚未在航天器之间进行。
- Starship v3 的飞行将是一个重要的飞跃,因为它将首次使用 Raptor v3 引擎,并有许多其他改进。
- 有网友认为,SpaceX 故意不将任务扩大到 LEO,是为了确保每次测试的成功。
- 否认外交压力对美国航天项目的影响,认为这种影响在最近几年并不存在。
- 有人认为,SpaceX 在推进器的再点火上已经取得了成功,这对于进入 LEO 至关重要。
- 对于推进剂转移测试,剩余的燃料足以进行实验,Tankers 并不需要快速重复使用。
- 某些网友对 NASA 的进展表示失望,认为 SpaceX 在设置航天器的先进性方面领先。
- 质疑在没有有效的热保护罩的情况下,SpaceX 如何实现推进剂转移。
- 认为 SpaceX 的目标不断变化,Starship 的进展显得滞后,但其目标较小却能获得批准。
- 有网友认为,在开展新任务时,应当最大化学习,而不是设定小目标。
- 不同于 SpaceX,其他竞争者的进展也比较慢。
- 关于推进剂转移的历史,有人指出,早在几十年前,苏联就已经完成了在轨道上的推进剂转移。
- 对于航天发射的成本和效率问题,认为 NASA 一直以来在于发射的费用高且时间长。
- 一些评论者对 SpaceX 的计划持怀疑态度,但也承认这次计划与阿波罗任务的雄心相当。
3. Google 发布 Gemma 4 开源模型 (Google releases Gemma 4 open models) #
https://deepmind.google/models/gemma/gemma-4/
该网页是 Google DeepMind 官方网站的模型展示页面,重点介绍了其最新发布的 Gemma 4 系列开源大模型。Gemma 4 基于 Gemini 3 的研究与技术,旨在实现“每参数最高智能”,具备卓越的性能与效率。
模型系列包含多个版本,涵盖不同规模与应用场景:
- E2B 与 E4B 版本:专为移动设备和物联网(IoT)设计,支持音频与视觉处理,可在边缘设备上离线运行,实现近乎零延迟的实时响应。
- 26B 与 31B 版本:面向个人电脑与高性能计算场景,提供前沿的推理能力,适用于开发智能代理、代码辅助和复杂任务自动化。
Gemma 4 具备多项先进能力:
- 支持智能体工作流,可自主规划、调用工具、操作应用完成任务。
- 强大的多模态理解能力,支持文本、音频与视觉信息融合处理。
- 支持 140 种语言,具备跨文化语境理解能力。
- 可通过微调优化特定任务表现,兼容主流训练框架。
- 架构高效,可在本地硬件上部署,适合开发者与研究者本地化使用。
性能方面,Gemma 4 在多项权威基准测试中表现领先,包括:
- 多语言问答(MMMLU)准确率超 85%
- 科学知识(GPQA Diamond)达到 84.3%
- 数学推理(AIME 2026)达 89.2%
- 工具使用能力(τ2-bench)在零售场景中达 86.4%
所有模型均通过严格的安全与可靠性验证,符合企业与主权机构的安全标准,支持在 Vertex AI、Kubernetes、Ollama、Docker 等平台部署。
用户可通过 Hugging Face、Ollama、Kaggle、LM Studio 等平台下载模型,也可在 Google AI Studio 和 Google AI Edge Gallery 中试用。官网鼓励开发者加入“Gemmaverse”,共同构建负责任、有益于人类的 AI 生态。
HN 热度 1046 points | 评论 327 comments | 作者:jeffmcjunkin | 8 hours ago #
https://news.ycombinator.com/item?id=47616361
- Gemma 4 模型在推理、多模态和工具调用方面表现出色,尤其是 2B 和 4B 的小模型,性能令人惊喜。
- 使用 Unsloth 提供的 GGUF 格式模型可在本地高效运行,配合 llama.cpp 实现低延迟的 OCR、全文搜索、嵌入和摘要处理。
- 本地部署方案可实现完全离线的文档处理流程,避免云服务带来的数据隐私和红印问题,适合处理历史档案等敏感数据。
- 对于 PDF 内容提取,GLM-OCR 是一个轻量级且高效的本地 OCR 模型,尤其适合在低内存设备上运行,支持表格结构化提取。
- 通过结合 Qwen-VL 和 Qwen-Embedding 模型,可构建完整的文档处理流水线,实现多语言翻译、向量化存储和 RAG 检索。
- 使用 n8n + Ollama + Gemma 3:4B 可实现端到端的本地自动化工作流,虽然性能受限于硬件,但完全不依赖云端服务。
- 在 llama.cpp 中禁用“思考”模式需使用
--reasoning off参数,而非旧的--reasoning-budget 0或enable_thinking: false。 - Gemma 4 在编写 Nix 配置等任务上表现优于 Qwen3.5-35B,性能接近但资源消耗显著更低。
- Unsloth 的模型支持仍在更新中,部分页面截图与实际模型不符,需注意版本兼容性问题。
- 用户期待 Unsloth 推出更高效的 Flash 版本,以进一步提升推理速度和内存效率。
- 相较于原始模型,量化后的 GGUF 版本在保持 99% 性能的同时,内存和 CPU 占用减少至三分之一,适合本地部署。
4. 瑞典回归基础:课堂上用书籍取代屏幕 (Sweden goes back to basics, swapping screens for books in the classroom) #
https://undark.org/2026/04/01/sweden-schools-books/
瑞典近年来推行教育改革,宣布学校将回归基础教学,重新引入纸质书籍,并减少对数字设备的依赖。2023 年,瑞典政府启动大规模教材采购计划,投入 8300 万美元用于购买各学科教材和教师用书,另拨款 5400 万美元用于购置文学与非文学类图书,目标是让每位学生每门课程都拥有实体教材。
这一转变源于对过去十余年数字化教育成效的反思。自 2000 年至 2012 年,瑞典学生在阅读、数学和科学等标准化测试中的成绩持续下滑,尽管 2012 至 2018 年有所回升,但到 2022 年再次下降。教育界开始质疑数字教学是否真正有效,尤其关注屏幕使用带来的注意力分散、深度阅读能力下降、书写技能退化等问题。
研究者指出,纸质教材在教授说明性文本(如科学、数学)方面更具优势,而数字阅读对年轻学习者可能增加认知负担,影响理解力与记忆保持。此外,疫情期间在线教学暴露出技术并非万能,专家强调“技术是工具,不是教师”。
尽管如此,瑞典并未完全取消数字技术。教育部门强调,数字工具应在适当年龄引入,以促进而非阻碍学习。数字素养仍被视为重要目标,尤其在高年级阶段。
这一改革引发国际关注,尤其在美国,许多学区也广泛采用平板电脑和数字设备。美国 2024 年在教育科技上的投入达 300 亿美元,是教材支出的十倍。然而,越来越多教育专家和心理学家质疑过度依赖技术的合理性,认为应优先夯实读写算等基本能力。
有观点认为,让儿童在 K-12 阶段频繁使用电脑和平板,可能是教育史上代价最昂贵的错误之一。瑞典的举措被视为对“技术万能论”的一次重要纠偏,强调在教育中回归本质,重视纸质阅读与手写训练的价值。
HN 热度 722 points | 评论 376 comments | 作者:novaRom | 13 hours ago #
https://news.ycombinator.com/item?id=47612601
- 使用技术进行教育(尤其是中小学阶段)是一种错误,长期后果将非常明显,类似荷兰饥荒对后代的影响。
- 技术应被用于教授基础计算机技能,如打字、使用办公软件、基本编程等,但不应替代传统教学方式。
- 手写对认知发展至关重要,不应因存在打字而被取消,阅读长篇书籍有助于培养注意力和信息处理能力。
- 在数学、语文、历史等学科中使用电子设备是错误的,应限制技术使用,仅在特定课程中如计算机实验室每周安排一小时学习基础技能。
- 学习建网站价值不大,容易让学生沉迷于格式而非内容,浪费时间,应优先关注核心知识。
- 使用 Python 进行数值和统计方法教学应以手算为主,以培养直觉,类似不允许小学生使用计算器学习乘除法。
- 通过视频或动画辅助教学(如 Desmos、3Blue1Brown)有助于建立直观理解,但不应取代基础训练。
- 逐步引入抽象概念是合理的,如先掌握逻辑和伪代码,再引入编程工具,避免过早陷入语法细节。
- 使用物理卡片进行间隔重复记忆(SRS)是可行且有效的替代数字工具的方法,尤其适合课堂实施。
5. Steam 在 Linux 上的使用率在 3 月大幅飙升,突破 5% 大关 (Steam on Linux Use Skyrocketed Above 5% in March) #
https://www.phoronix.com/news/Steam-On-Linux-Tops-5p
Steam on Linux 在 2026 年 3 月迎来显著增长,市场占有率飙升至 5.33%,创下历史新高,首次突破 5% 门槛。这一数字是 2025 年底 3.5% 的近两倍,也远超同期 Steam on macOS 的 2.35% 市场占有率,实现“翻倍”超越。
此次增长主要归因于 Steam Survey 数据的调整,尤其是 Steam 中国区用户数据的大幅下降——简体中文使用率月环比下降 31.85%,而英文使用率则上升至 39.09%。这一变化导致 Linux 用户占比被重新评估并显著提升。
在硬件方面,约四分之一的 Linux 玩家正在使用 Steam OS。AMD 在 Linux 平台上的优势依然明显,其 CPU 在 Steam Linux 用户中的使用率接近 70%,得益于 Steam Deck 采用定制 AMD APU 以及 AMD 硬件在 Linux 生态中对开源驱动的良好支持。
总体来看,Windows 在 Steam 平台的市场份额下降至 92.33%,而 Linux 和 macOS 均实现增长,反映出 Linux 游戏生态持续回暖。完整数据可查阅 SteamPowered.com。
HN 热度 714 points | 评论 325 comments | 作者:hkmaxpro | 21 hours ago #
https://news.ycombinator.com/item?id=47609564
- Steam 硬件调查的月度数据变化不可靠,应谨慎对待,因为数据修正频繁且原因不明,可能反映调查方法存在根本性缺陷。
- 中国春节假期导致 2 月在线玩家激增,进而影响 3 月数据对比,但该解释无法完全解释数据异常。
- 中国春节对 3 月数据的影响仅体现在月度变化上,而非绝对数值,因此不能作为解释 3 月数据飙升的充分理由。
- CloudFlare Radar 数据显示 Linux 用户占比 3-4%,芬兰和德国等地区比例更高,但该数据可能因用户伪装而低估。
- Linux 用户更注重隐私,常通过伪装用户代理来规避追踪,但这反而可能增加被识别为异常行为的风险。
- 伪装用户代理不仅无法提升隐私,反而可能因指纹不一致导致被标记为机器人,从而触发更多验证码或访问限制。
- 某些政府或流媒体网站因不兼容 Linux 系统而拒绝服务,用户为访问这些网站不得不伪装用户代理。
- 一些用户在使用 SBC 复古游戏机运行 Linux 并玩 Steam 游戏,这类非主流设备可能推动了 Linux 在 Steam 中的占比上升。
- 伪装用户代理可能导致更频繁的 CloudFlare 验证码,甚至陷入无限循环,最终放弃访问目标网站。
- 伪装用户代理会破坏浏览器指纹的一致性,使系统更容易被识别为自动化工具,从而面临更严格的审查或限制。
- 现在大多数网站不再因操作系统而拒绝服务,只有少数涉及原生代码分发或 DRM 的网站仍存在平台限制。
6. DRAM 价格飙升正重创业余爱好者单板计算机市场 (DRAM pricing is killing the hobbyist SBC market) #
https://www.jeffgeerling.com/blog/2026/dram-pricing-is-killing-the-hobbyist-sbc-market/
DRAM 价格飙升正严重冲击业余爱好者使用的单板计算机(SBC)市场。2026 年 4 月 1 日,Raspberry Pi 宣布对其搭载 LPDDR4 内存的全系列产品再次提价,其中包括新款“合理配置”3GB 内存的 Pi 4,售价为 83.75 美元,而 16GB 内存的 Pi 5 价格已涨至 299.99 美元。
目前,LPDDR 内存芯片已占 SBC 主板成本的绝大部分。这一趋势导致多数 SBC 厂商难以推出新机型,仅 Radxa 等少数厂商仍保持一定发布节奏。4GB 以上内存的 SBC 已超出大多数业余爱好者的承受能力。
不仅 SBC,连曾性价比极高的迷你 PC 也普遍涨价至 250 美元以上,8GB 内存型号尤为明显。二手设备价格同样上涨,尤其是内存超过 4GB 的机型。
作者 Jeff Geerling 表示,他原本设计项目时追求成本低于 100 美元,以便轻松试错。如今价格高企,迫使他更多转向老旧 SBC 和微控制器平台,这可能是未来许多爱好者的选择。
尽管 Raspberry Pi 凭借其成熟的微控制器生态和工业市场仍能维持,但小型厂商可能难以长期支撑。作者引用 Eben Upton 的观点,认为内存价格终将回落,但不确定市场能否在价格恢复前存活下来。
文章最后推荐了相关阅读,包括关于“蓝莓 Pi”的趣闻、Pi 500 性能对比以及 Radxa X4 等新平台。
HN 热度 601 points | 评论 521 comments | 作者:ingve | 1 day ago #
https://news.ycombinator.com/item?id=47606840
- DRAM 价格上涨导致低成本智能手机市场受到严重冲击,许多小品牌难以维持运营,面临倒闭或被大公司并购的命运。
- 低档和中档智能手机销量大幅下滑,预计未来几年全球手机总销量可能从 11 亿降至 5 亿至 6 亿,主要影响集中在价格敏感市场。
- 对于低利润的中低端手机厂商而言,DRAM 成本占比高,缺乏长期采购协议,难以承受成本上涨压力,生存空间被严重压缩。
- 小众细分市场如超小型手机、工业级耐用手机等可能因供应链问题而消失,导致消费者选择减少。
- 手机更换周期延长是必然趋势,老旧设备因内存不足、应用兼容性差等问题导致使用体验下降,频繁出现卡顿、数据丢失等问题。
- 高端手机厂商如苹果虽有足够利润缓冲,但中低端市场受冲击更大,消费者购买力下降,导致整体市场萎缩。
- 在发展中国家,100-200 美元的中国品牌手机是主流选择,DRAM 涨价将严重影响这些地区的数字接入和通信普及。
- 手机厂商的“换代营销”模式可能因此失效,消费者不再频繁更换功能相近的新机型,市场将趋于理性。
- 一些用户长期使用低价手机,但设备寿命受限于软件更新和内存容量,无法满足现代应用需求,不得不提前更换。
- 尽管部分用户仍可忍受旧设备,但现代网页和应用对内存要求越来越高,导致旧机频繁崩溃、数据丢失,使用体验极差。
- 中国存在大量非主流的独立安卓手机品牌,它们在特定细分市场有独特价值,但面临被市场淘汰的风险。
7. Lemonade by AMD:一款基于 GPU 和 NPU 的快速开源本地大模型服务器 (Lemonade by AMD: a fast and open source local LLM server using GPU and NPU) #
Lemonade 是一款开源、快速、私密的本地人工智能平台,专为在个人电脑上运行大模型而设计。它支持在 GPU 和 NPU 上高效运行,无需依赖云端,确保数据安全与隐私。
平台核心功能包括:支持聊天、图像生成、语音合成、语音识别与视觉理解,所有功能通过统一的 OpenAI API 标准接口提供,兼容数百款主流应用,如 Open WebUI、n8n、GitHub Copilot、Dify 等。
Lemonade 采用轻量级 C++ 后端,仅 2MB 大小,安装仅需一分钟,支持 Windows、Linux 和 macOS(Beta),并能自动适配用户的硬件配置,包括 GPU 与 NPU。它兼容多种推理引擎,如 llama.cpp、Ryzen AI SW、FastFlowLM 等,实现跨平台高性能运行。
用户可通过内置图形界面快速下载、切换和管理模型,支持同时运行多个模型。最新版本 v10.0.1(2026 年 3 月 25 日发布)引入多项优化:支持从 Hugging Face 直接搜索和添加 GGUF 模型,新增 qwen3.5-4b 在 NPU 上的运行支持,提升 llama.cpp 性能,并优化 Linux 系统下 FastFlowLM 的安装流程。
Lemonade 由 AMD 支持,基于 Apache 2.0 许可,致力于推动本地 AI 的开放与普及,适合开发者、研究人员及普通用户构建私有、高效的 AI 工作流。
HN 热度 421 points | 评论 94 comments | 作者:AbuAssar | 13 hours ago #
https://news.ycombinator.com/item?id=47612724
- Lemonade 是一个专为 AMD 硬件优化的开源本地 LLM 服务器,支持 GPU、NPU 和 CPU 运行,提供开箱即用的体验,兼容 OpenAI 和 Ollama 接口,可用于 VSCode Copilot 和 Open Web UI 等工具。
- 在 Strix Halo 设备上使用 Lemonade 可以实现文本生成、语音识别、语音合成、图像生成与编辑等多种 AI 功能,且支持 ROCm 和 Vulkan 多后端运行。
- 与 llama.cpp 使用 Vulkan 相比,Lemonade 在相同硬件上性能相当,尤其在 AMD 平台上有更好的优化和易用性。
- Qwen3.5-122B 模型在 Strix Halo 上使用 Lemonade 运行时,性能与使用 Vulkan 的 llama.cpp 相近,具体取决于上下文设置和硬件配置。
- Qwen3-Coder-Next 模型在 128GB Framework Desktop 上表现优异,编码能力优于 Qwen3.5-35B-A3B,且推理速度更快,是当前的推荐模型。
- 8bit MLX Unsloth 量化版本的 Qwen3-Coder-Next 在 MBB M5 Max 上表现极佳,支持双模型并行运行,但低精度量化在长上下文(>17 万 token)下可能出现记忆丢失。
- 在 AMD 7900 XTX 上,Vulkan 后端相比 ROCm 在性能上有 20% 以上的提升,尤其在 Linux kernel 7.0.0rc5 下表现更优。
- ROCm 在 AMD 桌面卡上的使用体验仍存在挑战,包括驱动兼容性和依赖管理问题,而 Lemonade 有效简化了这一过程。
- Ryzen AI NPU 主要用于电池供电场景下的能效优化,实际推理性能远低于独立 GPU,不适合作为主力推理设备。
- 有用户认为 AMD 在本地 AI 推理方面具备成本、自由度和安全性优势,是家庭用户的最佳选择。
- 也有用户指出 NVIDIA 卡在功耗效率和性能上仍优于 AMD,ROCm 支持不完善,尤其在 Debian 等系统上社区支持反而更优。
- Lemonade 的命名源于“LLM”发音类似“lemon”,谐音“lemonade”,具有趣味性和品牌联想。
- 有用户调侃命名应为“LLMonade”或“LuLuleMonade”,体现对命名的幽默解读。
- 有人质疑该软件是否支持从 CD 运行模型,带有玩笑性质。
8. Qwen3.6-Plus:迈向真实世界智能体 (Qwen3.6-Plus: Towards real world agents) #
https://qwen.ai/blog?id=qwen3.6
Qwen 团队在 2 月份发布了 Qwen3.5 系列后,正式推出了 Qwen3.6-Plus。这一版本通过 API 立即提供,代表了相较于其前任的巨大能力升级。最显著的改进是模型在 “代理编码” 能力上的显著增强,能够处理从前端网页开发到复杂的代码库级问题解决的多种任务,树立了新的行业标准。同时,Qwen3.6-Plus 在世界感知上也表现出更高的准确性和更强的多模态推理能力。
在开发过程中,团队积极回应了社区对于 Qwen3.5-Plus 的反馈,这一版本为开发者生态系统提供了一个高度稳定可靠的基础,带来了真正变革性的 “编程体验”。Qwen3.6-Plus 具备以下特性:
- 默认拥有 100 万的上下文窗口。
- 显著改善的代理编码能力。
- 更强的多模态感知和推理能力。
** 性能评估 **
Qwen3.6-Plus 在多个评估任务中与最前沿的模型进行了全面对比,涵盖不同任务和模态。在编码代理领域,Qwen3.6-Plus 表现出强大的实际工程性能,不仅在主流代码修复基准测试中与行业领袖相当,还在复杂的终端操作和自动化任务执行方面表现出色。对于通用代理和工具使用,该模型在多个具有挑战性的长远规划任务中取得了顶尖结果,并在各种工具调用基准测试中领先。
** 多模态能力 **
Qwen3.6-Plus 在多模态能力上取得了稳定的进展,主要体现在三个核心维度:高级推理、增强适用性和执行复杂任务的能力。它在复杂文档理解、物理世界视觉分析、视频推理和视觉编码等方面表现优异,并能够整合跨模态信息进行复杂分析和决策。
**API 使用 **
Qwen3.6-Plus 通过 Alibaba Cloud Model Studio 提供,用户可以轻松集成 API 与流行的第三方编码助手,以优化开发工作流程。新版本的 API 引入了一项新特性 “preserve_thinking”,该功能能够保留所有先前轮次中的思考内容,推荐用于代理任务,特别是在处理多步复杂任务时可以增强决策的一致性。
总结来说,Qwen3.6-Plus 标志着 Qwen 系列在高度自主超代理的演进中迈出了重要一步,能够自信地应对从复杂代码管理到跨领域的长期规划等现实世界挑战。
HN 热度 406 points | 评论 142 comments | 作者:pretext | 10 hours ago #
https://news.ycombinator.com/item?id=47615002
- Qwen 新发布的模型为托管专用模型,非开源权重模型,此举被视为利用此前开源小模型获取的声誉进行市场推广的策略。
- 与更早版本如 Opus 4.5 相比,刻意淡化当前最新版本的性能,存在误导用户之嫌,损害了品牌信誉。
- 虽然存在一个对性能要求不高但成本更低的市场,但该细分市场竞争激烈,用户忠诚度低,难以形成稳定优势。
- 开源大模型(如 300B 级别)虽名义上开放,但实际使用门槛高,多数用户仍会转向云服务,从而推动其托管服务的使用。
- 模型虽为 MoE 架构,理论上可在普通硬件上运行,但速度极慢,实用性受限,进一步强化了对云服务的依赖。
- 有用户认为,中国 AI 公司若转向闭源并收费,将失去其“开放”这一核心优势,尤其在地缘政治背景下,难以获得国际信任。
- 中国并非唯一在推进开源 AI 的国家,其他中国实验室仍保持开源承诺,但 Qwen 的策略可能影响整体生态信任。
- 中国 AI 生态整体健康,尽管存在大量二流玩家,但若头部企业放缓开源节奏,将为本地开发者提供更多关注与机会。
- 有用户强调,即使模型性能稍逊,只要开源且能构建生态,仍值得支持,关键在于开放性而非技术领先。
- 地缘政治因素影响技术选择,部分用户宁愿支持美国科技巨头,也不愿将数据和研发支持交给中国公司,担心被利用。
- 中国在 AI 领域的发展被视为对西方的潜在竞争,尤其在数据主权和国家安全层面,选择中国服务存在风险。
- 有观点指出,美国对加拿大等国的经济与政治干预,使部分国家更倾向于支持非美国主导的 AI 技术,包括中国方案。
- 中国并未对其他国家发动战争威胁,相较之下,美国的威胁行为更令人担忧,因此在安全角度上,中国选项更可取。
- 认为将中国 AI 视为“地缘政治对手”是现实,但不应忽视中国科研人员在开源 AI 领域的积极贡献。
- 个人选择应基于自身价值观和利益,不能强制他人支持特定技术路线,支持中国 AI 是合理选择。
- 有用户批评将中国 AI 视为“威胁”是过度反应,认为这种立场过于简单化,忽视了技术合作的可能。
- Qwen 团队近期人员流动可能与公司战略转向闭源有关,暗示内部存在分歧或压力。
9. 我不是数字——纪念逾 72,000 名在加沙遇难的巴勒斯坦人 (I Am Not A Number. In memory of the more than 72,000 Palestinians killed) #
https://bkhmsi.github.io/i-am-not-a-number/
这是一个纪念加沙地带遇难巴勒斯坦人的网页,标题为“我不是数字”。页面以视觉化方式呈现超过 72,000 名在以色列对加沙的军事行动中丧生的巴勒斯坦人,每盏灯代表一个生命。
用户可以通过筛选年龄范围查看不同群体的遇难者,当前显示为 60,199 条记录,数据仍在加载中。页面提供“重置”功能,可清除筛选条件。
通过悬停在灯光上,用户可以查看遇难者的基本信息,如姓名、年龄和性别,以唤起对个体生命的记忆与尊重。
网页采用阿拉伯语和英文双语界面,强调对逝者的纪念与对人道主义的呼吁。整体设计简洁而富有情感冲击力,旨在提醒人们关注加沙冲突中的人道灾难,反对将生命简化为统计数据。
HN 热度 394 points | 评论 113 comments | 作者:bjourne | 15 hours ago #
https://news.ycombinator.com/item?id=47612053
- 该网页展示的数字令人震撼,每一次鼠标移动都揭示了生命的逝去,象征着无数个体的悲剧,令人感到极度悲伤。
- 有人指出,尽管该帖被举报,但其在 Hacker News 上的排名依然靠前,说明其影响力已达成传播目的。
- 有人质疑为何该帖未被举报,认为揭露现实的帖子不应被轻易压制。
- 有评论认为,72,000 的死亡数字是严重低估,真实数字可能更高。
- 有人反驳称,所有被杀儿童都是“恐怖分子”,此言论极为冷酷无情。
- 有人指出,以色列禁止外国记者进入加沙,且在冲突中杀害的记者数量超过人类历史上所有战争的总和。
- 有人认为,现代军队普遍限制记者进入战区,乌克兰也存在类似限制,因此以色列的做法并非异常。
- 有人反驳称,伊拉克战争时有数千名记者进入战区,而以色列目前在加沙完全禁止记者进入,情况完全不同。
- 有人指出,以色列曾两次袭击加沙医院的记者所在建筑,且第二次袭击目标是救援人员,视频证据确凿。
- 有人认为,乌克兰限制记者进入危险区域是合理做法,而以色列的类似行为却受到批评,这种双重标准令人质疑。
- 有人指出,以色列在加沙的新闻管制与战争行为存在严重问题,其行为与国际舆论形成强烈反差。
- 有人认为,以色列在加沙的军事行动是出于自卫,而哈马斯将武器藏在民用设施中,制造了舆论困境。
- 有人指出,哈马斯故意将武器藏在医院和学校,无论以色列是否打击,都会引发国际舆论对以色列的谴责。
- 有人认为,以色列应优先保护平民,但哈马斯却将平民置于危险之中,这是其发动袭击的后果。
- 有人反驳称,乌克兰目前仍处于被占领状态,20% 的领土被俄罗斯占领,平民持续遭受轰炸,因此不能说乌克兰已变得“强大”。
- 有人指出,西方国家在历史上长期存在殖民、战争、种族歧视、土地掠夺等行为,当前对以色列的支持是其延续。
- 有人讽刺称,将以色列称为“文明的西方国家”实属荒谬,其行为与西方国家的道德标准相悖。
- 有人指出,以色列的政策实际上反对两国方案,意味着其不承认巴勒斯坦人的权利,与“保护本国人民”的说法矛盾。
10. SpaceX 秘密提交 IPO 申请,拟 2026 年上市,或成史上最大 IPO 之一 (SpaceX files to go public) #
https://www.nytimes.com/2026/04/01/technology/spacex-ipo-elon-musk.html
SpaceX 已秘密提交首次公开募股(IPO)申请,计划于 2026 年 6 月上市,可能成为历史上规模最大的 IPO 之一。公司估值超过 1 万亿美元,拟募资 500 亿至 750 亿美元。此次 IPO 将可能创造一代人的财富奇迹,对华尔街、员工及创始人埃隆·马斯克本人意义重大。马斯克目前已是全球最富有的人之一,此次上市或使其成为全球首位净资产达万亿级别的富豪。
SpaceX 由马斯克于 2002 年创立,目标是实现人类移民火星,推动地球以外的生命延续。公司已发展为全球领先的航天企业,其星舰(Starship)火箭项目在德克萨斯州开展测试。此次 IPO 不仅标志着 SpaceX 的重要里程碑,也可能引发人工智能领域企业如 OpenAI 和 Anthropic 跟进上市的热潮。
尽管马斯克本人未回应置评请求,SpaceX 发言人也未置评,但彭博社此前已报道了该消息。此次上市将考验资本市场对高科技、高风险航天项目的接受程度,同时也将重塑全球科技与太空产业的融资格局。
HN 热度 383 points | 评论 554 comments | 作者:nutjob2 | 1 day ago #
https://news.ycombinator.com/item?id=47604155
- SpaceX 大幅降低了将物资送入轨道的成本,其星舰系统有望进一步将成本降低 100 倍,通过频繁发射、回收和重复使用火箭,已将曾经被认为不可能的任务变为常态。
- SpaceX 目前发射的航天器数量远超全球其他地区总和,且在互联网基础设施方面处于世界领先地位,未来有望取代传统互联网服务提供商和移动运营商。
- 尽管 SpaceX 研发投入巨大,且有 xAI 项目作为资金消耗点,但其仍实现了约 160 亿美元的营收,并预计今年利润将更高,展现出极强的创新能力和快速推进的业务模式。
- 所谓的 160 亿美元利润数据仅为总收入,未扣除研发等成本,实际盈利情况需谨慎看待,且相关财务数据未经审计。
- 所谓 80 亿美元 EBITDA 数据存在严重误导,该指标未包含卫星制造、发射、地面基础设施更新、员工股票激励、广告支出、税收及债务偿还等关键成本。
- SpaceX 使用的“调整后 EBITDA”属于非标准会计处理方式,允许公司自行定义财务规则,存在高度操纵空间,类似历史上的安然公司和 Theranos 的财务透明度问题。
- 当前 SpaceX 估值中约 90% 依赖于“黄金时代”预期,即未来巨大增长潜力的想象,而非当前实际盈利能力。
- 公司财务报表在提交上市申请(S-1)前通常不会公开,因此目前的财务数据缺乏独立审计,可信度存疑。
- 学习财务知识有助于理解企业运作逻辑,尽管相关文献常以“提升公司盈利”为导向,但个人学习可帮助理解 AI 时代下的经济本质。
- 理解企业财务应从基础微观经济学、宏观经济学、财务会计、公司金融与估值等多维度入手,其中阿斯瓦斯·达莫达兰(Aswath Damodaran)的课程是权威参考。
- 财务模型的核心在于理解交易与人的行为,关注资金流入流出、风险与回报的转移机制,以及不同经济与法律控制层级之间的动态平衡。
- 有人认为财务分析不应过度复杂化,应以清晰、简洁的方式传达核心逻辑,过度使用术语反而会掩盖实质内容。
- 个人学习财务知识的真正价值在于提升对现实世界的理解力,而非单纯追求企业盈利或投资回报。
Hacker News 精彩评论及翻译 #
Google releases Gemma 4 open models #
https://news.ycombinator.com/item?id=47616439
Thinking / reasoning + multimodal + tool calling.
We made some quants at https://huggingface.co/collections/unsloth/gemma-4 for folks to run them - they work really well!
Guide for those interested: https://unsloth.ai/docs/models/gemma-4
Also note to use temperature = 1.0, top_p = 0.95, top_k = 64 and the EOS is “<turn|>”. “<|channel>thought\n” is also used for the thinking trace!
danielhanchen
思考/推理、多模态和工具调用。
我们在 https://huggingface.co/collections/unsloth/gemma-4 制作了一些量化版本供大家运行 - 效果非常好!
感兴趣的朋友可以参考这个指南:https://unsloth.ai/docs/models/gemma-4
另外请注意使用 temperature = 1.0,top_p = 0.95,top_k = 64,且 EOS 是 “<turn|>"。"<|channel>thought\n” 也被用于记录思考轨迹!
LinkedIn is searching your browser extensions #
https://news.ycombinator.com/item?id=47614309
The headline seems pretty misleading. Here’s what seems to actually be going on:
Every time you open LinkedIn in a Chrome-based browser, LinkedIn’s JavaScript executes a silent scan of your installed browser extensions. The scan probes for thousands of specific extensions by ID, collects the results, encrypts them, and transmits them to LinkedIn’s servers.
This does seem invasive. It also seems like what I’d expect to find in modern browser fingerprinting code. I’m not deeply familiar with what APIs are available for detecting extensions, but the fact that it scans for specific extensions sounds more like a product of an API limitation (i.e. no available getAllExtensions() or somesuch) vs. something inherently sinister (e.g. “they’re checking to see if you’re a Muslim”).
I’m certainly not endorsing it, do think it’s pretty problematic, and I’m glad it’s getting some visibility. But I do take some issue with the alarmist framing of what’s going on.
I’ve come to mostly expect this behavior from most websites that run advertising code and this is why I run ad blockers.
haswell
标题似乎相当具有误导性。这似乎是实际发生的情况:
每次你在基于 Chrome 的浏览器中打开 LinkedIn,LinkedIn 的 JavaScript 就会对你已安装的浏览器扩展进行静默扫描。该扫描会通过 ID 检测数千个特定扩展,收集结果,对其进行加密,并将数据传输到 LinkedIn 的服务器。
这确实挺侵犯隐私的。它看起来也像是我在现代浏览器指纹识别代码中会找到的东西。我对用于检测扩展的可用 API 不太熟悉,但它扫描特定扩展这一事实听起来更像是一种 API 限制(即没有可用的 getAllExtensions() 之类的东西)的产物,而不是某种本质上恶意的意图(例如,“他们在检查你是不是穆斯林”)。
我当然不会支持它,但确实认为这很有问题,很高兴它能引起一些关注。但我对这种情况被描述得危言耸听确实有些异议。
我对大多数运行广告代码的网站表现出这种行为已经习以为常了,这也是我使用广告拦截器的原因。
LinkedIn is searching your browser extensions #
https://news.ycombinator.com/item?id=47614778
this is why I run ad blockers.
It’s pretty wild that we live in a world where the actual FBI has recommended we use ad blockers to protect ourselves, and if everyone actually listened, much of the Internet (and economy) as we know it would disappear. The FBI is like “you should protect yourself from the way that the third largest company in the world does business”, and the average person’s response is “nah, that would take at least a couple of minutes of my time, I’ll just go ahead and continue to suffer with invasive ads and make sure $GOOG keeps going up”.
lastofthemojito
这就就是我使用广告拦截器(插件)的原因。
令人难以置信的是,我们生活在一个真正的FBI都建议大家使用广告拦截器来保护自己的世界里。如果所有人都照做,那么我们熟知的互联网(以及经济)将不复存在。FBI仿佛在说“你应该采取措施,免受世界第三大公司的商业模式侵害”,而普通人的反应却是:“不,那至少得花我几分钟时间,我还是继续忍受这些侵入式广告吧,顺便让$GOOG的股价继续上涨吧。”
LinkedIn is searching your browser extensions #
https://news.ycombinator.com/item?id=47614585
How is probing your browser for installed extensions not “scanning your computer”?
Calling the title misleading because they didn’t breach the browser sandbox is wrong when this is clearly a scenario most people didn’t think was possible. Chrome added extensionId randomization with the change to V3, so it’s clearly not an intended scenario.
vs. something inherently sinister (e.g. “they’re checking to see if you’re a Muslim”)
They chose to put that particular extension in their target list, how is it not sinister? If the list had only extensions to affect LinkedIn page directly (a good chunk seem to be LinkedIn productivity tools) they would have some plausible deniability, but that’s not the case. You’re just “nothing ever happens"ing this.
andersonpico
检查你浏览器中已安装的扩展程序,这怎么能不算“扫描你的电脑”呢? 说标题具有误导性是因为他们没有突破浏览器沙箱,这种说法是错误的,因为显然这是一个大多数人未曾想到的场景。Chrome 在转为 V3 版本时增加了扩展程序 ID 随机化,所以这显然不是他们预设的场景。
对比某种本质上的恶意(例如“他们在检查你是不是穆斯林”)
他们选择把那个特定的扩展程序列在目标列表中,这怎么能不是恶意的呢?如果目标列表里只有那些能直接影响 LinkedIn 页面的扩展(看起来一大半似乎是 LinkedIn 生产力工具),他们倒还有点合理的推诿借口,但事实并非如此。你这纯粹是在用“从未发生过事”的心态来开脱。
DRAM pricing is killing the hobbyist SBC market #
https://news.ycombinator.com/item?id=47607173
DRAM pricing is killing the everything market.
We just had a vendor uplift our quote 50% per unit for some machines because of a mix of memory + supply chain issues.
jonathantf2
DRAM价格正在搞垮整个市场。
我们刚遇到一家供应商,因为内存和供应链问题的双重因素,把部分机器的报价上调了50%。
Artemis II will use laser beams to live-stream 4K … #
https://news.ycombinator.com/item?id=47615903
Hopefully, the footage is better than the missed pan up at lift-off, and showing spectators at the time of booster separation.
I understand funding cuts and all, but this is a once-in-a-generation moment and it’s filmed with no apparent effort whatsoever.
xattt
希望视频画面比发射升空时漏掉的向上摇镜要好,并且能拍到一级助推器分离时的观众。 我理解预算削减这类情况,但这是一生难得的瞬间,而且拍摄明显完全没有用心。
Google releases Gemma 4 open models #
https://news.ycombinator.com/item?id=47617370
I ran these in LM Studio and got unrecognizable pelicans out of the 2B and 4B models and an outstanding pelican out of the 26b-a4b model - I think the best I’ve seen from a model that runs on my laptop.
https://simonwillison.net/2026/Apr/2/gemma-4/
The gemma-4-31b model is completely broken for me - it just spits out “—\n” no matter what prompt I feed it. I got a pelican out of it via the AI Studio API hosted model instead.
simonw
我在 LM Studio 中运行了这些模型,2B 和 4B 模型生成的海鹦完全无法辨认,而 26b-a4b 模型生成了一张非常棒的海鹦——我认为这是我能在笔记本上运行的最好的模型。
gemma-4-31b 模型对我来说完全坏了——无论我输入什么提示词,它都只吐出“—\n”。我改用了 AI Studio API 托管的模型,结果得到了一只海鹦。
I quit. The clankers won #
https://news.ycombinator.com/item?id=47600071
Improving developer skills is not valuable to your company. They don’t tell a customer how many person-hours of engineering talent improvement their contract is responsible for. They just want a solved problem. Some companies comprehend how short-sighted this is and invest in professional development in one way or another. They want better engineers so that their operations run better. It’s an investment and arguably a smart one.
Adoption of AI at a FOMO corporate pace doesn’t seem to include this consideration. They largely want your skills to atrophy as you instead beep boop the AI machine to do the job (arguably) faster. I think they’re wrong and silly and any time they try to justify it, the words don’t reconcile into a rational series of statements. But they’re the boss and they can do the thing if they want to. At work I either do what they want in exchange for money or I say no thank you and walk away.
Which led me to the conclusion I’m currently at: I think I’m mostly just mourning the fact that I got to do my hobby as a career for the past 15 years, but that’s ending. I can still code at home.
Waterluvian
提升开发者的技能对您的公司来说毫无价值。他们不会告诉客户,他们的合同义务包含了多少个人工时的工程技术能力提升。他们只想要一个问题被解决。有些公司意识到了这种短视的做法,并会以某种形式投资于职业发展。他们想要更好的工程师,从而让运作更加顺畅。这是一种投资,而且可以说是明智的投资。
在企业层面的FOMO(害怕错过)节奏下,AI的采纳似乎并不包含这种考量。他们大多希望你的技能退化,让你转而去“哔哔啵啵”AI机器来完成工作(据推测)更快。我认为他们既错误又愚蠢,每当他们试图为此辩护时,那些话语都显得语无伦次,无法构成一套自洽的逻辑。但他们是老板,如果想这么做,他们就有权这么做。在工作中,我要么按他们想要的做换取薪水,要么说声“不,谢谢”然后走人。
这让我得出了目前的结论:我想我主要是对过去15年里能把爱好当作工作来做的这件事感到遗憾,因为那即将结束了。我仍然可以在家写代码。
Claude Code Unpacked : A visual guide #
https://news.ycombinator.com/item?id=47599312
A 500k line codebase for an agent CLI proves one thing: making a probabilistic LLM behave deterministically is a massive state-management nightmare. Right now, they’re great for prompting simple sites/platforms but they break at large enterprise repos.
If you don’t have a rigid, external state machine governing the workflow, you have to brute-force reliability. That codebase bloat is likely 90% defensive programming; frustration regexes, context sanitizers, tool-retry loops, and state rollbacks just to stop the agent from drifting or silently breaking things.
The visual map is great, but from an architectural perspective, we’re still herding cats with massive code volume instead of actually governing the agents at the system level.
amangsingh
一个 50 万行代码的 Agent CLI 证明了这一点:让概率性的大模型表现出确定性的行为,是一场巨大的状态管理噩梦。目前,它们在操作简单网站/平台时表现出色,但在面对大型企业代码库时会失效。
如果没有刚性的、外部的状态机来控制工作流,你就必须强行确保可靠性。那个庞大的代码库中可能有 90% 是防御性编程;令人抓狂的正则匹配、上下文清洗、工具重试循环和状态回滚,仅仅是为了防止 Agent 走偏或静默地破坏事物。
可视化地图很棒,但从架构角度来看,我们仍然像在驱赶野猫一样靠庞大的代码量行事,而不是真正在系统层面去管控 Agent。
SpaceX files to go public #
https://news.ycombinator.com/item?id=47605754
I really wish more people were aware of this. It’s a major scandal and definitely not being talked enough about.
Nevermind SpaceX, which at least have some importance for US defense industry, but xAI ? We will be investing in Elon’s private venture, at the price that he himself set and which is at least 2 orders of magnitude too high…
TheAlchemist
我真的希望更多人意识到这一点。这是一个重大丑闻,绝对没有被讨论得足够充分。
暂且不谈 SpaceX,它至少对美国防务工业还有一席之地,但 xAI 呢?我们要投资埃隆的私人企业,按照他自己设定的价格,这价格至少高出两个数量级……
LinkedIn is searching your browser extensions #
https://news.ycombinator.com/item?id=47614288
this is a massive violation of trust
The scan doesn’t just look for LinkedIn-related tools. It identifies whether you use an Islamic content filter (PordaAI — “Blur Haram objects, real-time AI for Islamic values”), whether you’ve installed an anti-Zionist political tagger (Anti-Zionist Tag), or a tool designed for neurodivergent users (simplify).
andersonpico
这是严重的信任破坏
此次扫描并不仅仅寻找与领英相关的工具。它会识别你是否使用了伊斯兰内容过滤工具(PordaAI——即“模糊禁忌物体,针对伊斯兰价值观的实时 AI”),是否安装了反犹太复国主义政治标签器,亦或是为神经多样性用户设计的工具。
LinkedIn is searching your browser extensions #
https://news.ycombinator.com/item?id=47614875
How is probing your browser for installed extensions not “scanning your computer”?
I think most people would interpret “scanning your computer” as breaking out of the confines the browser and gathering information from the computer itself. If this was happening, the magnitude of the scandal would be hard to overstate.
But this is not happening. What actually is happening is still a problem. But the hyperbole undermines what they’re trying to communicate and this is why I objected to the title.
They chose to put that particular extension in their target list, how is it not sinister?
Alongside thousands of other extensions. If they were scanning for a dozen things and this was one of them, I’d tend to agree with you. But this sounds more like they enumerated known extension IDs for a large number of extensions because getting all installed extensions isn’t possible.
If we step back for a moment and ask the question: “I’ve been tasked with building a unique fingerprint capability to combat (bots/scrapers/known bad actors, etc), how would I leverage installed extensions as part of that fingerprint?”
What the article describes sounds like what many devs would land on given the browser APIs available.
To reiterate, at no point am I saying this is good or acceptable. I think there’s a massive privacy problem in the tech industry that needs to be addressed.
But the authors have chosen to frame this in language that is hyperbolic and alarmist, and in doing so I thing they’re making people focus on the wrong things and actually obscuring the severity of the problem, which is certainly not limited to LinkedIn.
haswell
探测浏览器已安装扩展怎么能不算是“扫描你的电脑”呢?
我认为大多数人会将“扫描你的电脑”理解为跳出浏览器的限制,直接从电脑本身收集信息。如果是这种情况,那这场丑闻的严重程度简直难以言表。
但这并没有发生。实际情况依然是存在问题,但夸张的修辞削弱了他们想表达的信息,这也是我反对这个标题的原因。
他们特意把那个特定的扩展列入目标列表,这怎么能不显得有些居心叵测呢?
成千上万个扩展都在其中。如果他们是在扫描几十样东西,而这个只是其中之一,我或许会同意你的看法。但这听起来更像是他们列举了大量已知扩展的ID,因为无法获取所有已安装的扩展。
如果我们退一步,问一个问题:“如果我的任务是构建一种独特的指纹功能来对抗(机器人/爬虫/已知恶意行为者等),我会如何利用已安装的扩展作为该指纹的一部分?”
文章中描述的情况听起来像是许多开发者在现有的浏览器API下会采用的方法。
我重申一点,我从未说这做得好或可以接受。我认为科技行业存在一个巨大的隐私问题,需要解决。
但作者选择了用夸张且危言耸听的语言来定性这件事,结果我觉得这让人们关注了错误的方向,实际上反而掩盖了问题的严重性,而这个问题肯定不仅仅局限于领英。
Why the US Navy won’t blast the Iranians and ‘open… #
https://news.ycombinator.com/item?id=47596437
A big mistake here was simply underestimating the scale of Iran. Iran has 90,000,000 people. More than 2x Ukraine. More than 2x Germany. More than 2x Iraq. More than any country in Europe. About 2/3 of Russia. Expecting to win a war on the cheap was a fantasy. Especially since Iran has been fighting Israel for years.
On the naval front, Ukraine sunk the Moskva with a few truck-mounted missiles. That finally made it undeniable that sending naval vessels anywhere near a hostile shore is a thing of the past. Countermeasures can take out some attacking missiles, but not all of them.
This is a real problem for the U.S. Navy, because they’ve invested heavily in craft intended to operate near hostile shores. Littoral combat ships and amphibious assault ships are intended to operate offshore of trouble spots. This worked a lot better when the trouble spots couldn’t do much to them.
The size of Iran means that knocking out drone and missile production for long won’t work. Russia has been trying to do that to Ukraine for years now. Ukraine produced 4 million drones last year, and production continues to increase. Ukraine even exports drones now. Saudi Arabia, Kuwait, and the UAE have been making deals with Ukraine for air defense systems. Iran exports drones to Russia.
Mass-produced drones today are a simple airframe, a lawnmower engine, and the smarts of a cell phone. Ukraine has people making them in basements. Presumably, so does Iran.
The US can’t just pull out, either. The enemy gets a vote on when it’s over. Israel, Iran, and Yemen now all have to agree. Probably the best deal the US can get at this point is a cease fire with Iran collecting tolls on the Strait of Hormuz.
Worst outcome is the US attacks Cuba, Cuba allies with Iran, it turns out that Cuba has been stocking up on Iranian drones, and Cuba becomes a forward base for drone and missile attacks on the southern US.
Animats
这里犯下的一个重大错误在于低估了伊朗的规模。伊朗拥有9000万人口,超过乌克兰的两倍,超过德国的两倍,超过伊拉克的两倍,也超过欧洲任何国家,大约是俄罗斯的2/3。指望以低成本打赢战争简直是异想天开。毕竟伊朗多年来一直与以色列交战。
在海上战场,乌克兰仅用几枚车载导弹就击沉了“莫斯科号”。这最终无可辩驳地证明,派遣舰船靠近敌对海岸已成过去式。反制措施可以摧毁部分来袭导弹,但不可能全部摧毁。
这对美军来说是真正的问题,因为他们为在敌对海岸附近行动的舰艇投入了大量资金。濒海战斗舰和两栖攻击舰本意是在麻烦地区的近海运作。以前麻烦地点无法对它们造成什么威胁时,这种情况效果要好得多。
伊朗的体量意味着摧毁无人机和导弹的生产能力很长一段时间内都不会奏效。俄罗斯多年来一直在试图对乌克兰这样做。去年乌克兰生产了400万架无人机,产量仍在增加。乌克兰现在甚至还在出口无人机。沙特阿拉伯、科威特和阿联酋一直在与乌克兰就防空系统达成交易。伊朗向俄罗斯出口无人机。
现代大规模生产的无人机就是一个简单的机身、一台割草机引擎和手机的智能程度。乌克兰有人在地下室里制造它们。想必伊朗也是如此。
美国也不能直接撤出。敌人说了算,什么时候结束还得看对方的意思。以色列、伊朗和也门现在都必须同意。美国目前能争取到的最好协议可能就是在停火的同时,伊朗对霍尔木兹海峡征收过路费。
最坏的结果是美国攻击古巴,随后古巴与伊朗结盟,结果发现古巴一直在囤积伊朗无人机,并将其变成针对美国南部的无人机和导弹攻击的前沿基地。
Cursor 3 #
https://news.ycombinator.com/item?id=47618253
Man, I wish they’d keep the old philosophy of letting the developer drive and the agent assist.
I feel like this design direction is leaning more towards a chat interface as a first class citizen and the code itself as a secondary concern.
I really don’t like that.
Even when I’m using AI agents to write code, I still find myself spending most of my time reading and reasoning about code. Showing me little snippets of my repo in a chat window and changes made by the agent in a PR type visual does not help with this. If anything, it makes it more confusing to keep the context of the code in my head.
It’s why I use Cursor over Claude Code, I still want to code not just vibe my way through tickets.
seamossfet
哎,真希望他们能保持旧有的理念,让开发者主导,让 AI 辅助。
我感觉这种设计方向更倾向于将聊天界面视为首要功能,而把代码本身视为次要事项。
我真的不喜欢这样。
即便我在使用 AI 代理来写代码时,我发现自己依然花费大部分时间在阅读和推敲代码上。在聊天窗口里给我看代码仓库的零星片段,或者在类似 PR 的视图中展示代理做的更改,这对我毫无帮助。反过来,这反而让我在脑海中保持对代码上下文的认知变得更加混乱。
这就是为什么我选择 Cursor 而不是 Claude Code,我仍然想要写代码,而不是靠着感觉把工单混过去。
Qwen3.6-Plus: Towards real world agents #
https://news.ycombinator.com/item?id=47615397
This is their hosted-only model, not an open weight model like they’ve become known for. They got a lot of good publicity for their open weight model releases, which was the goal. The hard part is pivoting from an open weight provider to being considered as a competitor to Claude and ChatGPT. Initial reactions are mostly anger from everyone who didn’t realize that the play along was to give away the smaller models as advertising, not because they were feeling generous.
Comparing to Opus 4.5 instead of the current 4.6 and other last-gen models is clearly an attempt to deceive, which isn’t winning them any points either.
I think there is a moderately large market for models like this that aren’t quite SOTA level but can be served up much cheaper. I don’t know how successful they’ll be in the race to the bottom in this market niche, though. Most users of cheap API tokens are not loyal to any brand and will change providers overnight each time someone releases a slightly better model.
Aurornis
这是他们的托管模型,并非他们广为人知的开放权重模型。他们在开放权重模型发布上获得了大量好的公关宣传,这就是当初的目标。难就难在从开放权重提供商转型,成为被视为能与 Claude 和 ChatGPT 抗衡的竞争对手。目前的初步反应主要是愤怒,因为许多人没有意识到这只是一个配合演出的套路,免费提供小模型是为了做广告,而不是出于慷慨。
与 Opus 4.5 而非目前最新的 4.6 和其他上一代模型进行比较,显然是一种试图欺骗的行为,这也没能给他们赢来任何好感。
我认为,像这种处于顶尖水平稍逊但服务价格便宜得多的模型,存在一个相当大的市场。不过,我不确定他们在这一细分市场的价格战中能有多成功。大多数使用便宜 API 代币的用户并不忠于任何品牌,每次有人发布稍微好一点的模型时,他们都会在一天之内更换提供商。
Artemis II Launch Day Updates #
https://news.ycombinator.com/item?id=47608198
It is very disconcerting to see so many completely disregarding incredible technological innovation because other problems exist, especially on HN.
If we were not allowed to progress technology until everybody is 100% free of suffering, we’d never be able to create technological that may potentially lead to the alleviation of suffering. It all feels very crabs in a bucket - “I don’t feel happy so nobody else should, and nothing should happen unless it is things that directly, immediately do things I want and solve problems I care about.”
GaryBluto
看到如此多的人因为其他问题的存在而完全无视令人惊叹的科技创新,尤其是在 HN 上,这让人感到非常不安。如果不允许我们在所有人都彻底摆脱苦难之前推进技术,我们就永远无法创造出那些可能带来苦难缓解的技术。这感觉非常像“螃蟹效应”——“我不想快乐,所以别人也不配快乐;如果不直接、立刻满足我的要求并解决我在意的问题,那就不该发生任何事。”
Artemis II Launch Day Updates #
https://news.ycombinator.com/item?id=47606861
Regardless of whether this particular mission is perfectly planned, this is precisely the kind of thing that will help humanity outgrow the dark age of war, inequality and climate mismanagement.
It is a noble endeavor - science, engineering and peaceful exploration hold the keys to our survival and prosperity.
It is also important psychologically to our survival - a reminder there is a bigger pie, that we can solve hard problems, that progress can be made, that competence and education counts, as does courage, and that we can work together for a common cause.
This is the best of America, and for a while we can be proud of the human race.
jgord
无论这次具体的任务计划是否完美,这正是能够帮助人类摆脱战争、不平等以及气候管理不善的黑暗时代的契机。
这是一个崇高的志业——科学、工程与和平探索掌握了我们生存与繁荣的钥匙。
这对我们生存也具有心理上的重要性——它提醒我们还有更大的蛋糕(发展空间),提醒我们可以解决困难的问题,提醒进步是可能的,提醒能力和教育很重要,勇气也同样重要,以及我们可以为共同的目标共同努力。
这是美国的最佳写照,在很长一段时间里,我们可以为全人类感到自豪。
Artemis II Launch Day Updates #
https://news.ycombinator.com/item?id=47604551
It is a bit chilling to watch these astronaut profiles having just read yesterday about the heat shield issues observed on the prior mission, and that this will be the first time we can test the heat shield in the actual pressures and temperatures that it will have to endure.
Godspeed crew of Artemis II.
adamsb6
昨天刚读了关于上次任务中观察到的隔热盾问题,看着这些宇航员资料让人不寒而栗,因为这是我们第一次能在真实的压力和温度下测试隔热盾。祝阿耳忒弥斯2号乘组好运。
Tailscale’s new macOS home #
https://news.ycombinator.com/item?id=47618574
I haven’t had enough menu bar icons to run into this but is it really the case that the notch just hides whatever icons happen to be behind it? Like, the OS doesn’t handle this incredibly obvious edge case? Why not just put an overflow dropdown next to the notch (something Windows XP managed to figure out 25 years ago)? I know software quality has been going down in recent versions of macOS but this is absurd.
paxys
我因为菜单栏图标不够多还没遇到过这种情况,但这难道是真的吗?系统难道真的只是简单地就把刘海后面的图标给隐藏了?也就是说,连这种显而易见的边界情况系统都处理不了?为什么不在刘海旁边直接加个溢出下拉菜单(哪怕是 25 年前的 Windows XP 都已经解决的这个问题)?我知道最近的 macOS 版本软件质量确实在下滑,但这也太离谱了吧。
Steam on Linux Use Skyrocketed Above 5% in March #
https://news.ycombinator.com/item?id=47609818
I’ve probably said this a bunch of times already, but based on my past experience, any analysis built on month-to-month changes in the Steam Hardware Survey should be taken with a very large grain of salt, if not considered outright useless for any serious conclusions.
The clue is already in the article itself. The author notes that “part of the jump at least appears to be explained by Valve correcting again the Steam China numbers.” If you actually think about what that implies, it raises more questions than answers. A 31.85% monthly drop is obviously not organic, so yes, it makes sense to call it a “correction.” But then why was the previous month’s data so far off in the first place? Is there something fundamentally flawed in the survey methodology, like sampling bias, non-uniform distribution, regional skew, or something else?
And if this kind of correction happens this month, what’s stopping it from happening in previous months? The reality is: it does happen all the time. You can usually spot at least one clearly unrealistic data point in almost every release.
At that point, it’s hard to argue there’s any real value in trying to analyze these results in a rigorous way.
thrdbndndn
我可能已经说过很多次了,但根据我过去的经验,任何基于 Steam 硬件调查月度变化的分析都应当大打折扣,如果是为了得出严肃结论,甚至可以直接认为其毫无用处。
线索就在文章本身。作者指出,“至少部分上涨幅度可能是由 Valve 再次修正了 Steam 中国的数据所解释的。”如果你真正去思考这暗示了什么,提出的问题反而比给出的答案还要多。
31.85% 的月度下跌显然不是自然发生的,所以是的,称之为“修正”是有道理的。但这又怎么解释上个月的数据一开始就差这么多呢?调查方法是否存在根本性缺陷,比如抽样偏差、分布不均、区域偏差或者其他什么?
而且如果这种修正发生在本月,那是什么阻止了它在之前的月份发生?现实情况是:这种事一直都在发生。你通常几乎可以在每一次发布中至少发现一个明显不切实际的数据点。
到了这一步,就很难再认为用严谨的方式分析这些结果有什么真正的价值了。
Artemis II Launch Day Updates #
https://news.ycombinator.com/item?id=47607619
“We have a beautiful moon rise, we’re heading right at it” got me a little choked up. Here’s to the ever unfolding adventure of mankind.
kiernanmcgowan
“我们正径直驶向那美丽的月升”,这句话让我有些动容。为人类永无止境的冒险之旅致敬。
Artemis II Launch Day Updates #
https://news.ycombinator.com/item?id=47605635
I will be watching the launch from Europe, so it will be not earlier than half past midnight for us. My kids (9 and 10) are sleeping on the couch in front of the projection screen, so that they do not even have to get up when I wake them up at midnight, which I promised.
Just wanted to add my grain of positivity here. Godspeed Artemis 2!
mathieu4v
我将在欧洲观看发射,所以对于我们来说,时间不会早于午夜过半。我的孩子们(9岁和10岁)正睡在投影屏幕前的沙发上,这样就算我在午夜叫醒他们,也不用站起来,这是我答应他们的。 只是想在这里添一份正能量。祝阿尔忒弥斯2号一路平安!
Artemis II Launch Day Updates #
https://news.ycombinator.com/item?id=47607684
April 6: flyby
April 10: splashdown
After that, the exciting work will be in Starship making LEO and testing propellant transfer (a humanity first) [1] and Blue Origin testing its rocket and lunar lander [2], both scheduled for 2026, to enable Artemis II (EDIT: III), currently scheduled—optimistically, in my opinion—for next year.
[1] https://en.wikipedia.org/wiki/List_of_Starship_launches#Future_launches
[2] https://en.wikipedia.org/wiki/Blue_Moon_Pathfinder_Mission_1
JumpCrisscross
4月6日:飞越 4月10日:溅落
在此之后,令人兴奋的工作将是让星舰进入近地轨道并进行燃料转移(人类的当务之急)[1],以及蓝色起源测试其火箭和登月着陆器 [2],这两者都定于2026年进行,从而为阿尔忒弥斯二号(编辑:应为三号)做准备,目前其计划——在我看来有些乐观——是为明年。
[1] https://en.wikipedia.org/wiki/List_of_Starship_launches#Future_launches [2] https://en.wikipedia.org/wiki/Blue_Moon_Pathfinder_Mission_1
Google releases Gemma 4 open models #
https://news.ycombinator.com/item?id=47617137
Hi all! I work on the Gemma team, one of many as this one was a bigger effort given it was a mainline release. Happy to answer whatever questions I can
canyon289
大家好!我是 Gemma 团队众多成员中的一员。因为这次是主干版本发布,所以这次投入的精力更大。我很乐意回答任何我能回答的问题。
EmDash – A spiritual successor to WordPress that s… #
https://news.ycombinator.com/item?id=47604154
Convince me this isn’t vibeslop.
If Cloudflare really have radically changed their software development philosophy lately, this would actually be an interesting project, being based on Astro and coming with some APIs for programmatic management.
Them being so happy about the „cost of software development“ and not going very deep into ecosystem, community or project management doesn’t convince me that this is going to be a worthwhile project, even if, unlike their previous vibe coding demos, this one actually works.
solarkraft
说服我这不是个虚有其表的玩意儿。 如果 Cloudflare 最近真的彻底转变了他们的软件开发理念,那这确实会是个有趣的项目,毕竟它基于 Astro,还附带了一些用于编程式管理的 API。 他们对“软件开发成本”表现得如此津津乐道,却没深入探讨生态系统、社区或项目管理,这无法说服我认为这是一个有价值的项目,即使不像他们之前的“氛围感”演示那样是一堆花架子,这个至少能跑起来。
Why the US Navy won’t blast the Iranians and ‘open… #
https://news.ycombinator.com/item?id=47597708
It is so rich hearing that America can attack anybody, but godforbid an attack on the “homeland” is an unforgivable act that will invoke nukes immediately.
integricho
听着美国可以说打谁就打谁,真是讽刺,但要是有人敢攻击他们的“本土”,那就是不可饶恕的行径,会立即动用核武。
EmDash – A spiritual successor to WordPress that s… #
https://news.ycombinator.com/item?id=47603398
I don’t think it’s the code that makes WordPress valuable. I’ve been learning WordPress recently and haven’t been too impressed with the internals. WordPress is valuable because of the ecosystem and support. I have no doubt that WordPress will still be a thing in ten years. What’s the support plan for EmDash? I see commits are mostly from a single developer.
E: Oh, I think it’s an April fools joke, I’m embarrassed.
E2: Apparently not a joke.
8organicbits
我认为 WordPress 的价值并不在于代码本身。最近我正在学习 WordPress,但对它的内部核心实现并没有太惊艳的感觉。WordPress之所以有价值,是因为其生态系统和支持。我毫不怀疑,10年后 WordPress 依然会是一个重要的存在。EmDash 有什么支持计划吗?我看提交记录主要来自一个开发者。 E:哦,我想这可能是愚人节玩笑,我很尴尬。 E2:看来确实不是玩笑。
U.S. exempts oil industry from protecting Gulf ani… #
https://news.ycombinator.com/item?id=47595980
Wasn’t diversifying US energy sources also a national security issue? And wind energy was set aside because, wait for it, they killed animals. Birds to be specific.
alanwreath
多元化美国能源来源不也是一个国家安全问题吗?而且风能被搁置了,因为,等等,它们杀害了动物。具体来说是鸟类。