2025-10-23 Hacker News Top Stories #
- Idealist.org 将部分 staging 从每月 3000 美元的 Heroku 迁移到每月 55 美元的 Hetzner 服务器,使用 Disco 实现类似 git push 的部署并共享本地 Postgres,从而大幅降低成本但需自行承担运维责任。
- OpenAI 推出 macOS 预览版 ChatGPT Atlas,在浏览器侧栏提供智能摘要、跨页比较与任务代理等功能,现仅向 Plus/Pro/企业用户开放并支持隐私与记忆控制。
- MinIO 宣布自 2025-10-15 起停止发布官方 Docker 镜像与公开文档,要求用户自行构建,造成社区强烈不满与对安全更新及时性的担忧。
- 文章主张应将隐私偏好和追踪禁令移至浏览器层面(如使 DNT/GPC 有法律效力),以减少网站弹窗、降低合规成本并提升用户体验。
- Project Gutenberg CEO Greg Newby 去世,他长期推动公共领域书籍数字化与传播并对数字出版产生深远影响。
- Meta 将裁撤约 600 个 AI 岗位,重组资源以推进新设“超级智能实验室”并调整其 AI 战略。
- 作者分享多年使用的实用 shell 脚本集合,涵盖剪贴板、文件管理、文本处理和多媒体操作等,旨在提升命令行效率与可移植性。
- 欧洲广播联盟与 BBC 的研究发现主流 AI 助手在新闻呈现中有 45% 出现误述或来源问题,呼吁加强监管与提升公众媒体素养。
- 格陵兰国家电信 Tusass 与 Eutelsat(OneWeb)签署协议,改用低轨卫星为无海底电缆覆盖的偏远城镇提供更稳定、低延迟的网络并保持本地控制。
- 谷歌量子团队报告 Willow 105 量子芯片通过“量子回声”实验在特定分子模拟任务上展示可验证的量子优势,较当前经典算法显著加速。
Replacing a $3000/mo Heroku bill with a $55/mo server #
https://disco.cloud/blog/how-idealistorg-replaced-a-3000mo-heroku-bill-with-a-55-server/
Idealist.org 是全球最大的非营利组织招聘平台,曾面临高昂的 Heroku 成本问题,尤其是其 staging 环境每月高达 500 美元,两个核心环境合计每月支出近 1000 美元。
为降低成本,团队尝试将一个 staging 环境迁移至成本仅为 55 美元/月的 Hetzner 服务器,并借助 Disco 工具实现与 Heroku 类似的“git push 部署”流程。
该方案成功的关键在于:所有 staging 环境共享一个本地 Postgres 实例,避免了 Heroku 中昂贵的托管数据库服务费用。同时,Disco 提供了自动 SSL、零停机部署、日志查看和统一管理界面,极大降低了自建部署系统的复杂性。
迁移后,团队迅速扩展出 6 个独立的 staging 环境,包括主分支、功能冻结分支、临时 PR 环境和长期功能分支,全部运行在单台服务器上,总成本远低于原 Heroku 的 3000 美元/月。
尽管需自行处理 DNS、CDN、服务器监控、安全更新和故障恢复等运维工作,且服务器位于欧洲,对美国用户访问略有影响,但对非生产性质的 staging 环境而言,这些代价完全可接受。
最核心的收获是:staging 环境从“稀缺昂贵资源”转变为“免费可弃用的基础设施”,开发者可自由创建、销毁环境,不再因成本而犹豫。
六个月后,该方案已转为永久架构,团队意识到真正的成本不仅是金钱,更是因高成本带来的开发效率抑制。
HN 热度 781 points | 评论 532 comments | 作者:jryio | 1 day ago #
https://news.ycombinator.com/item?id=45661253
- 使用 earlyoom 可以在内存不足时更早地触发 OOM 杀死进程,避免系统完全崩溃,但相比 newer 的解决方案效率较低。
- systemd-oomd 和 oomd 利用内核的 PSI(Pressure Stall Information)机制,能更准确、及时地检测内存压力,响应速度优于 earlyoom。
- 尽管 systemd-oomd 功能更先进,但 Ubuntu 服务器版默认并未启用,这可能导致系统在内存耗尽时直接卡死。
- systemd-oomd 和 oomd 仍会周期性轮询系统状态,但其数据来源更精确,因此整体表现更优。
- 早期的 earlyoom 会频繁主动检查内存状态,消耗 CPU,而现代方案通过内核机制减少资源浪费。
- 对于 GPU 内存泄漏问题,目前尚无类似 oomd 或 zram 的成熟解决方案,尤其在 Electron 应用中常见。
- 可通过调整
oom_score_adj
为关键服务设置负值,避免其被优先杀死,提升系统稳定性。 - 禁用内存过度分配(
vm.overcommit_memory = 0
)可防止因内存超卖导致的 OOM,适用于生产环境。 - 通过合理设置
min_free_kbytes
、admin_reserve_kbytes
等参数,可有效防止内存耗尽,尤其适用于大规模服务器集群。 - 在不需要持久化数据的内存型节点上,可设置
vm.panic_on_oom = 2
和kernel.panic = 60
,实现快速重启自愈。 - 这些内核参数可用于主动触发系统重启,实现无损切换 NFS 集群等运维操作。
- 使用 cgroups 限制各应用内存使用,是防止单个服务耗尽内存的有效手段,但配置复杂。
- 在裸金属服务器上手动管理内存和 OOM 策略,仍适用于未采用 Kubernetes 的场景,尤其对专用节点(如数据库、存储节点)有意义。
- 一些公司虽使用 Kubernetes,但仍有部分节点(如 PCI 主机、SFTP 服务器)因特殊需求不接入集群,仍需手动调优。
ChatGPT Atlas #
该网页是 OpenAI 推出的 ChatGPT Atlas 桌面应用的介绍页面,主要面向 macOS 用户。ChatGPT Atlas 可以在浏览器中打开侧边栏,帮助用户在浏览网页时即时获取答案、智能建议和任务协助。
核心功能包括:
- 智能摘要:快速总结网页内容,帮助理解复杂信息。
- 比较与分析:支持跨页面比较产品、数据或信息。
- 任务自动化:在代理模式下,ChatGPT 可以代表用户执行完整任务,如旅行规划、购物比价,全程受用户控制。
- 一键协作:在邮件、日历、文档中选中文本,即可立即获得 ChatGPT 的帮助。
- 隐私控制:用户可自主选择允许 ChatGPT 访问的网站,清除浏览记录,使用无痕模式,并随时管理浏览器记忆。
该应用目前仅支持 macOS,适用于 Plus、Pro 和企业版用户,处于预览阶段。支持自定义浏览偏好和界面主题,提升使用体验。
页面还展示了应用的多种使用场景,如学生学习、商业分析、内容创作、日常任务处理等,强调其“随身携带的 AI 协作伙伴”定位。
HN 热度 749 points | 评论 717 comments | 作者:easton | 1 day ago #
https://news.ycombinator.com/item?id=45658479
- ChatGPT 的记忆功能可能导致回答变得冗长且不相关,尤其在语音模式下问题更为严重。
- 关闭记忆功能后,ChatGPT 的回答变得更简洁直接,用户体验显著提升。
- 使用“机器人”人格设定或自定义指令可有效减少冗余表达,提高回答效率。
- 记忆功能容易让模型基于错误或无关的上下文生成内容,影响回答的客观性和准确性。
- 有用户发现记忆功能会引发模型“自我强化”的问题,即使明确要求简洁,仍会重复啰嗦。
- 部分用户认为记忆功能更适合用作聊天伙伴,而非工具型辅助,对专业任务帮助有限。
- 与 Claude 等模型相比,ChatGPT 的记忆机制缺乏明确的“主动调用”机制,容易造成干扰。
- 有用户指出,记忆功能在某些场景下会引入偏见,影响模型输出的中立性。
- “即时模式”(Instant mode)比“思考模式”更易出现冗长和不相关的内容,建议默认使用思考模式。
- 用户建议通过设置“自定义指令”来全局控制输出风格,比每次重复提示更有效。
MinIO stops distributing free Docker images #
https://github.com/minio/minio/issues/21647#issuecomment-3418675115
MinIO 项目宣布从版本 2025-10-15 起转为“仅源码分发”模式,不再自动构建并推送官方 Docker 镜像至 Docker Hub 和 Quay.io。这一变更导致用户无法通过常规方式获取最新的安全更新镜像,引发社区强烈不满。
社区成员指出,该变更在重大安全发布(CVE)期间突然执行,缺乏提前通知,严重影响了生产环境的安全更新。许多用户依赖 MinIO 的 Docker 镜像,其全球下载量超 10 亿次,此举被视为对社区的严重背离。
项目维护者回应称,该决策在安全漏洞发布前已做出,仅因时机不佳而引发争议。他们强调,用户可自行构建镜像,但未提供自动化 CI/CD 支持,增加了使用门槛。
部分用户批评此举存在“锁死”风险,尤其对已付费使用的企业用户而言,开源版本功能被逐步削减(如移除 OIDC 支持),且缺乏透明沟通,已动摇对项目可信度的信心。
多位开发者表示将考虑迁移至其他对象存储方案,担忧大量现有系统因无法更新而长期暴露于安全风险中。此次事件被类比为 ownCloud 到 Nextcloud 的迁移失败案例,反映出开源项目治理与社区信任的重要性。
HN 热度 647 points | 评论 378 comments | 作者:LexSiga | 18 hours ago #
https://news.ycombinator.com/item?id=45665452
- MinIO 停止分发免费 Docker 镜像,并且已撤下开源代码库的文档,这比停止镜像分发更严重,可能意味着其开源贡献即将终止。
- MinIO 的文档站点已下线,转向 AIStor 文档,开源社区的维护似乎已不再持续,后续版本的使用将变得困难。
- 作者曾使用 MinIO 搭建集群,发现安装和故障排查的指导信息多依赖已删除的 GitHub 评论,现在难以获取有效帮助。
- 作者所在公司计划将 MinIO 集群扩展至约 100PB,但其支持费用接近同等 S3 存储成本,性价比不高,未来可能依赖社区支持。
- 有用户指出,MinIO 支持价格“略低于同等 S3 存储成本”是荒谬的,认为企业级对象存储如 NetApp 或 Dell 的实际成本远低于 S3。
- Cloudflare R2 因免费出站流量和竞争性定价,成为性价比极高的替代方案。
- 大型企业通常能获得 50%-60% 的 AWS 折扣,甚至通过承诺支出或预留实例实现 70% 的计算资源折扣。
- 有用户指出,即使在商业规模,也很难获得“2/3 折扣”这种夸张优惠,实际折扣通常在单个百分点范围内。
- 企业级客户通过长期承诺可获得显著折扣,但小规模客户(如每月 1 万美元)通常难以获得显著优惠。
- 100 倍于当前支出的规模才可能获得真正有吸引力的折扣,因此对中小客户而言,云服务价格仍不具优势。
- 云服务折扣主要集中在计算资源,存储、网络和高级服务的折扣有限,整体节省比例远低于预期。
- 有用户调侃,每月花费 1 万美元已远超“业余爱好”范畴,暗示该支出规模已属企业级。
- 一些用户认为,MinIO 撤下文档的行为等同于放弃开源维护,使新版本的使用变得不可持续。
- 从多个来源获取二进制文件或自行编译 Go 代码,比依赖不可靠的 Docker 镜像更可靠,但文档缺失使这一做法也难以实施。
Internet’s biggest annoyance: Cookie laws should target browsers, not websites #
网页讨论了当前互联网上普遍存在的 Cookie 弹窗问题,指出尽管 GDPR 和 CCPA 等隐私法规初衷良好,旨在赋予用户数据控制权,但实际执行中却导致了用户体验严重下降。用户每天面对无数重复的 Cookie 同意请求,产生“同意疲劳”,而小网站因缺乏资源难以合规,被迫安装性能低下的第三方工具,形成恶性循环。
文章提出一个根本性解决方案:将用户隐私偏好设置从网站转移到浏览器层面。用户只需在浏览器中一次性设定隐私选项,如“仅允许必要数据”“允许性能分析”或“个性化体验”,浏览器便自动代表用户管理所有网站的 Cookie 请求。这种模式能实现真正的用户控制,减少重复操作,提升网页加载速度,并大幅减轻网站开发者的合规负担。
相比监管数百万网站的低效做法,监管少数主流浏览器更为可行。文章强调,这一变革并非技术幻想,而是对“Do Not Track”失败教训的反思——只有将用户选择转化为浏览器强制执行的规则,才能真正落实隐私保护。最终,浏览器端统一管理将取代当前混乱、低效的碎片化系统,让互联网变得更简洁、高效、以用户为中心。
HN 热度 527 points | 评论 512 comments | 作者:SweetSoftPillow | 12 hours ago #
https://news.ycombinator.com/item?id=45667866
- 法律本身存在问题,允许网站通过“恶意合规”规避责任,导致用户被迫接受复杂的同意流程,而真正的解决方案应是强制网站尊重用户的“拒绝所有”选择。
- 法院已裁定某些网站的“接受所有”按钮设计属于非法暗黑模式,应直接将“拒绝所有”选项置于显眼位置,以符合法律本意。
- 现有法律允许网站无视“拒绝追踪”(DNT)头信息,导致该机制形同虚设,需将 DNT 或 GPC(全球隐私控制)转化为具有法律约束力的机制,否则无法真正阻止追踪。
- GPC(全球隐私控制)已在加州成为法律,但欧盟进展缓慢,且部分监管机构(如爱尔兰 DPA)未能有效执行,导致合规性差。
- 由于 DNT 默认开启曾被浏览器(如 Edge)采用,反而被广告商用作“用户未明确同意”的借口,削弱了其法律效力。
- 真正有效的隐私保护应从技术层面限制网站的追踪与指纹识别能力,例如通过浏览器内置的屏蔽机制(类似 uBlock Origin)阻止恶意脚本加载。
- 用户可能并不知晓或未主动设置 DNT/GPC,因此应允许用户在浏览器层面统一设置隐私偏好,避免每次访问都重复弹窗。
- 当前的 Cookie 弹窗设计存在严重不公平,若“拒绝所有”选项不如“接受所有”显眼,则已违反欧盟法律,但此类违规行为仍普遍存在。
- 网站不应在用户已通过 DNT/GPC 明确拒绝追踪的情况下,仍持续弹窗请求同意,这属于对用户意愿的无视。
- 一些声称支持 GPC 的扩展程序捆绑了其他功能,甚至采用免费增值模式,存在隐私风险,用户应警惕此类“伪隐私”工具。
- GDPR 等法规文本冗长,但其背后的思考远超文字本身,法律制定需要深思熟虑,不能轻率修改。
- 快速迭代的“敏捷法律”不可取,可能导致法律缺乏稳定性与严肃性,容易被政治操纵或临时滥用。
- 未来应推动浏览器原生支持隐私控制机制,使用户无需依赖第三方扩展即可实现统一、可靠的隐私设置。
Greg Newby, CEO of Project Gutenberg Literary Archive Foundation, has died #
https://www.pgdp.net/wiki/In_Memoriam/gbnewby
Dr. Gregory B. Newby(gbnewby)因癌症去世,享年多年致力于 Project Gutenberg Literary Archive Foundation 的领导工作,担任该基金会 CEO 超过 20 年。他与 Distributed Proofreaders 长期紧密合作,并是其基金会董事会的投票成员。
Newby 出生于加拿大,后在美国长大,最终返回加拿大,在育空地区政府工作,同时继续领导 Project Gutenberg 项目。他于 1987 年收到一封电子邮件,内含《爱丽丝梦游仙境》的电子版,由此激发了他对电子书潜力的热情,认为这是“一件了不起的事”。
他始终坚信 Project Gutenberg 的使命——让文学作品广泛传播,惠及大众,这一信念支撑着他持续投入工作。2023 年,他与微软和麻省理工学院合作,推出了“Project Gutenberg 开放有声书系列”,由 AI 朗读,该项目被《时代》杂志评为“2023 年度最佳发明”之一。
在他的愿景推动下,通过 Distributed Proofreaders 等项目生产的电子书数量突破 75,000 种。他的远见与不懈努力,使 Project Gutenberg 成为全球数字出版的重要基石。他的离世,让 Distributed Proofreaders 社区深感痛惜,其贡献将被长久铭记。
HN 热度 507 points | 评论 70 comments | 作者:ron_k | 15 hours ago #
https://news.ycombinator.com/item?id=45666510
- Greg Newby 是 Project Gutenberg 和 Standard Ebooks 项目的重要推动者,他的离世令人震惊和悲伤,他以无私、耐心和对文学与自由网络的热爱影响了很多人。
- Standard Ebooks 的电子书缺乏唯一标识符(如 ISBN 或 OCLC 号),这给识别和管理带来了不便,尽管其内容质量高且免费。
- 有人指出,对 Standard Ebooks 的批评应更温和,因为该项目提供的是高质量且免费的资源,不应以苛刻态度对待。
- Project Gutenberg 和 IMSLP 等网站是互联网上极具价值的文化遗产保存平台,值得读者捐赠支持以维持其运营。
- 尽管每年有新作品进入公共领域,但版权并非阻碍文化作品广泛传播的唯一瓶颈,大量公共领域的文献仍因未被转录、索引或分类而难以使用。
- 一些公共领域的作品虽然内容平庸(如《一月生日派对》),但作为历史生活的见证仍具有独特价值,不应被完全忽视。
- 现实中,大多数作品(如视频、博客、软件)的受众极少,这说明“重要性”与“存在性”并不成正比,资源分配应优先考虑真正有影响力的作品。
- 即使是看似“无足轻重”的作品,其存在也反映了特定时代的生活方式,具有社会和历史意义,不应轻易否定其价值。
- 一些高价值的文献(如《算法》第二版)因版权问题无法获取,说明版权状态仍是阻碍知识传播的关键障碍。
- 未来的人类可能更关注实用或历史性的内容,而非当前流行的流行文化作品,因此当前的“热门”未必能经受时间考验。
- 与经典文学相比,如《哈利·波特》这类当代作品可能在百年后不再被广泛阅读,其持久影响力尚不确定。
- 从文学价值和长期阅读影响力来看,经典作品(如《傲慢与偏见》《弗兰肯斯坦》)的持久生命力远超许多当代流行作品。
Meta is axing 600 roles across its AI division #
https://www.theverge.com/news/804253/meta-ai-research-layoffs-fair-superintelligence
Meta 计划裁撤其人工智能部门约 600 个岗位,主要涉及旗下的基础人工智能研究部门 FAIR(Fundamental AI Research),以及 AI 产品与基础设施团队。此次裁员是公司 AI 战略调整的一部分,旨在优化组织结构,提升决策效率。
尽管 FAIR 团队规模缩减,Meta 仍在积极招聘,重点推进其新成立的“超级智能实验室”TBD Lab。该实验室由 Meta AI 负责人 Alexandr Wang 领导,目标是将 FAIR 的研究成果整合并规模化应用于大模型开发。
此前,Meta 曾因投资 143 亿美元收购 Scale AI 并高调招聘而启动 AI 扩张计划,但仅数月后便暂停招聘并启动重组。FAIR 负责人 Joelle Pineau 已于今年早些时候离职,而 Wang 在内部备忘录中表示,团队精简将使每位成员承担更大责任,提升影响力。
受影响员工可申请公司内部其他岗位。Meta 发言人 Ana Brekalo 已确认 Axios 报道内容属实。
HN 热度 436 points | 评论 371 comments | 作者:Lionga | 7 hours ago #
https://news.ycombinator.com/item?id=45671778
- Meta 裁撤 AI 部门 600 个岗位,理由是减少团队规模可提升决策效率,让每个人承担更多责任,引发外界对 AI 实际成效的质疑。
- 大型科技公司面临“成熟企业病”,原有成功模式难以适应快速变化的 AI 领域,内部官僚主义和风险规避文化阻碍创新。
- 领导层应将传统业务转为维护模式,同时在公司内部建立完全隔离的新组织,以摆脱旧体系束缚,推动真正创新。
- 企业若不主动自我颠覆,外部竞争者将取代其现有核心业务,这是“自我淘汰”的必然逻辑。
- Google 曾发明 Transformer 架构却长期未充分利用,反映出“创新者困境”——害怕颠覆自身核心业务而错失机遇。
- 大型公司内部存在严重的官僚主义,决策流程冗长,低效会议泛滥,技术债务严重,年轻员工难以推动变革。
- 年轻员工提出合理建议常被忽视,管理层以“经验”为由压制创新,导致人才流失和系统持续恶化。
- 企业应像 Netflix 转型流媒体那样,通过内部孵化新业务模式来替代旧有盈利模式,实现可持续发展。
- “先行动后解释”或“行动偏向”是应对官僚僵化的有效策略,关键在于建立可快速修复问题的团队机制。
- 企业创新失败往往源于对现有成功路径的过度依赖,而非技术本身不足,需打破路径依赖。
Scripts I wrote that I use all the time #
https://evanhahn.com/scripts-i-wrote-that-i-use-all-the-time/
本文作者 Evan Hahn 分享了自己在维护 dotfiles 十多年中编写并频繁使用的各类 shell 脚本,涵盖日常操作、文件管理、互联网工具、文本处理、REPL 启动器、时间管理、音视频处理等多个方面。
在日常操作中,copy 和 pasta 用于便捷地复制与粘贴剪贴板内容,cpwd 可将当前路径复制到剪贴板,pastas 能持续监控剪贴板变化并输出历史记录。
文件管理方面,mkcd 用于创建并进入新目录,tempe 快速进入临时目录用于临时工作,trash 可安全删除文件至回收站,mksh 用于快速创建可执行脚本,serveit 启动本地静态文件服务器,适用于网页开发场景。
互联网相关工具包括:getsong 下载音乐(如 YouTube 视频转音频),getpod 用于下载播客类内容,getsubs 提取视频字幕,wifi on/off/toggle 控制无线网络,url 解析 URL 各部分信息,便于提取目标链接。
文本处理类脚本包括:line 10 用于提取文件的第 10 行,scratch 打开临时编辑文件,straightquote 将智能引号转为普通引号,markdownquote 为选中文本添加 Markdown 引用符号,jsonformat 格式化 JSON 输出,uppered/lowered 转换大小写,nato 用于读出字母数字串,u+ 用于查询 Unicode 字符,snippets 用于快速调用常用代码片段。
REPL 启动器如 iclj(Clojure)、ijs(Deno/Node)、iphp(PHP)、ipy(Python)、isql(SQLite)提供快速进入交互式环境的能力。
时间管理工具包括:hoy 输出 ISO 格式当前日期,timer 设置倒计时并发出声音提醒,rn 显示当前日期与日历。
音视频与图片处理方面,ocr 从图片提取文字(仅 macOS 支持),boop 根据命令执行结果播放不同音效,sfx 播放指定音效文件,tunes 播放音乐,pix 显示图片,radio 播放网络电台,speak 朗读输入内容。
这些脚本体现了作者对效率、安全和用户体验的重视,是高度实用的命令行增强工具集合。
HN 热度 419 points | 评论 143 comments | 作者:speckx | 9 hours ago #
https://news.ycombinator.com/item?id=45670052
- 使用
trash
命令比手动逐个移动文件到废纸篓更高效,且避免了每次删除时的提示音和仅能恢复最后一个文件的问题。 jq
比 Node.js 更轻量且预装于 macOS,是格式化 JSON 的更优选择。uuidgen
命令已内置在 macOS 和大多数 Linux 发行版中,无需额外依赖 Node.js 或自定义脚本生成 UUID。- Python 的
json.tool
模块可直接实现 JSON 的格式化输出,无需依赖外部工具。 ripr
是一个替代rm
和trash
的工具,支持延迟删除或安全擦除。- 有人建议重新实现
rm
或使用 ZFS 来实现更安全的文件删除机制。 - 在 macOS 上推荐使用
trash
工具,它能正确处理废纸篓操作且兼容性良好。 - PowerShell 中可通过
New-Guid
生成 UUID,ConvertFrom-Json
和ConvertTo-Json
可实现 JSON 格式化。 - 随着经验增长,开发者会从高度定制化 shell 环境转向使用原生 UNIX 工具,追求简洁与可移植性。
- 简化环境并非出于懒惰,而是为了在多系统、容器等临时环境中保持一致性和高效性。
- 使用
atuin
等工具管理 shell 历史可提升效率,但可能与fzf
冲突,需注意兼容性。 - 通过
chezmoi
等工具管理 dotfiles 可在不同环境中保持一致配置,提升开发体验。 - 在他人系统或生产环境上部署个人配置文件存在风险,应谨慎处理,避免破坏系统稳定性。
- 使用
sshrc
等工具可实现 SSH 会话中临时同步配置,不影响系统全局设置。 - 在现代系统中,使用共享的 root 账户或默认密码是严重安全问题,应坚决避免。
AI assistants misrepresent news content 45% of the time #
https://www.bbc.co.uk/mediacentre/2025/new-ebu-research-ai-assistants-news-content
一项由欧洲广播联盟(EBU)协调、BBC 主导的国际性大规模研究显示,人工智能助手在传递新闻内容时存在严重问题,错误率高达 45%,且这一现象跨越语言、地区和平台,具有系统性。
研究覆盖 18 个国家的 22 家公共媒体机构,涉及 14 种语言,评估了 ChatGPT、Copilot、Gemini 和 Perplexity 四款主流 AI 助手超过 3000 条新闻回应。关键发现包括:31% 的回答存在严重信息来源问题,20% 包含重大事实错误,如虚构细节或过时信息。其中 Gemini 表现最差,76% 的回应存在显著问题,主要源于其糟糕的溯源能力。
研究指出,AI 助手正逐渐取代搜索引擎成为公众获取新闻的主要渠道。据《2025 年 Reuters 数字新闻报告》,7% 的在线新闻用户通过 AI 获取新闻,而这一比例在 25 岁以下群体中上升至 15%。然而,公众对 AI 的准确性普遍抱有过度信任,近三分之一英国成年人认为 AI 能准确总结新闻,年轻人中这一比例接近一半。
这种信任与实际表现之间的落差带来严重后果:当 AI 出现错误时,用户往往将责任归咎于新闻机构,而非 AI 本身,这可能损害公众对新闻媒体的信任,进而影响民主参与。
为此,研究团队发布了《AI 助手新闻真实性工具包》,旨在提升 AI 回应质量并加强用户媒体素养。EBU 及成员媒体呼吁欧盟和各国监管机构严格执行现有信息真实性、数字服务与媒体多元化的法规,并建议建立持续的独立监测机制,以应对 AI 技术快速迭代带来的挑战。
该研究基于 BBC 今年早些时候发布的初步报告,此次国际扩展验证了问题的普遍性,表明 AI 在新闻传播中的可靠性仍需根本性改进。
HN 热度 390 points | 评论 274 comments | 作者:sohkamyung | 11 hours ago #
https://news.ycombinator.com/item?id=45668990
- AI 助手在新闻内容呈现上存在 45% 的误述率,主要问题包括引用来源不当,如引用维基百科而非原始新闻源。
- 有评论指出,人类记者对研究报告的误述率高达 85%,相比之下 AI 的 45% 误述率并不算特别糟糕。
- 一些人回忆大学课程中发现,新闻报道对科研论文的摘要存在 100% 的误述情况,主要表现为曲解研究结论或做出原文未支持的主张。
- 有观点认为,媒体素养教育应成为公民课程的必修内容,以提升公众对信息来源的批判性判断能力。
- 人类编辑和媒体在处理新闻内容时也存在严重误述问题,甚至可能比 AI 更差。
- 机器人协议(robots.txt)限制了 AI 对部分网站的访问,但研究期间媒体组织临时开放了访问权限以供测试。
- AI 模型可能通过两种方式获取信息:一是作为训练数据的定期爬取,二是实时搜索查询,而 robots.txt 可能无法有效区分这两种请求。
- AI 容易被虚假或已删除的维基百科条目误导,例如曾存在一篇由 AI 生成并被删除的“欧盟 2040 扩员目标”文章,但 AI 仍可能引用该不存在的条目。
- AI 缺乏批判性思维能力,无法判断信息来源的可靠性,导致其在选择信息源时表现不佳,这使得“引用真实存在的来源”成为目前的最低标准。
- AI 在处理复杂人类写作时容易出现理解偏差,如混淆说话人身份或丢失上下文,这类问题在顶级模型中依然存在。
- 有创作者发现,AI 不仅会自己生成错误信息,还会将其他 AI 生成的错误内容作为可信来源,形成“错误传播循环”。
Greenland’s national telco, Tusass, signs new agreement with Eutelsat #
https://www.dagens.com/technology/greenland-ditches-starlink-for-french-satellite-service
格陵兰岛决定放弃使用美国的星链(Starlink)卫星互联网服务,转而选择法国的欧卫公司(Eutelsat)提供的 OneWeb 卫星网络,以加强本地互联网连接。
这一新协议由格陵兰国家电信公司 Tusass 与 Eutelsat 达成,旨在为东部和北部缺乏海底电缆或无线电连接的偏远地区提供更快、更稳定的网络服务。这些地区包括塔西拉克(Tasiilaq)、伊托克托尔米特(Ittoqqortoormiit)和卡纳克(Qaanaaq)等城镇。
OneWeb 卫星运行在比传统卫星更低的轨道上,信号延迟更低,传输更可靠。Tusass 负责人托克·宾泽尔表示,新服务将显著改善偏远居民的生活质量,弥补长期存在的数字鸿沟。
尽管曾与星链进行过谈判,但 Tusass 最终选择继续与 Eutelsat 合作,主要基于对现有系统的熟悉度、长期合作关系以及对国家通信基础设施自主控制的重视。
格陵兰部分政界人士担忧外国企业介入可能威胁国家安全,因此目前 Tusass 仍是格陵兰唯一的电信运营商。未来虽不排除与其他伙伴合作,但确保通信系统掌握在本地手中是首要原则。
首批受益地区为塔西拉克,预计将在 2025 年底前接入新网络,后续将逐步扩展至其他社区。
HN 热度 383 points | 评论 235 comments | 作者:saubeidl | 17 hours ago #
https://news.ycombinator.com/item?id=45665796
- 绿岛的通信系统必须由本地控制,以确保国家主权和安全,这是拒绝星链(Starlink)的主要原因。
- 星链提供的直接面向消费者的服务不符合绿岛政府对通信基础设施控制权的要求,其模式与现有由国家运营商主导的集中式系统不兼容。
- 绿岛政府和运营商更信任与本地已有合作的欧洲通信卫星公司(Eutelsat),因为其系统熟悉且长期合作,而非引入外部新供应商。
- 尽管星链可能提供更好的技术和服务,但国家主权优先于技术先进性,不能将关键通信基础设施依赖于外国企业,尤其是与美国关系密切的企业。
- 美国曾公开表达对购买格陵兰岛的兴趣,并暗示不排除军事手段,这种言论加剧了对美国意图的不信任,影响了绿岛对星链的信任。
- 即使通信系统由外国控制,只要能维持基本连接,就仍可能被视为“主权”——但这种观点被反驳,认为真正的主权意味着对通信路径的完全掌控。
- 依赖外国企业提供的通信服务,意味着在关键时刻可能被切断或操控,这与国家主权原则相悖。
- 一些评论认为,对美国的不信任并非基于实际行为,而是基于其言论,但这种言论来自掌握全球最强军事力量的领导人,不可轻视。
- 有人认为,将“完美”作为拒绝“更好”解决方案的借口是不合理的,但绿岛选择更安全而非更优的方案,是出于战略考量。
- 绿岛目前的通信系统由国家运营商 Tusass 全面掌控,涵盖光纤、移动网络、微波和海事无线电,具备完整的本地控制能力。
- 有观点指出,即便星链不直接控制本地通信,但若其成为主要通信方式,仍可能被外部力量干预,从而削弱真正的主权。
Willow quantum chip demonstrates verifiable quantum advantage on hardware #
https://blog.google/technology/research/quantum-echoes-willow-verifiable-quantum-advantage/
谷歌量子人工智能团队宣布了一项重大突破:其自主研发的 Willow 量子芯片首次在硬件上成功运行了可验证的量子优势算法——“量子回声”(Quantum Echoes)算法。这是历史上首次实现量子计算机在真实任务中超越经典超级计算机的表现。
该算法在计算分子结构方面展现出 13,000 倍于当前最快经典算法的速度优势。它通过模拟物理实验,精确测量系统中扰动的传播过程,能够揭示分子、磁体甚至黑洞等复杂系统的内部结构。
“量子回声”机制类似于声学中的回声,但基于量子干涉原理。研究人员在 Willow 芯片的 105 个量子比特上,先正向运行量子操作,扰动一个量子比特,再精确反向运行,捕捉由此产生的“量子回声”。由于量子波的建设性干涉,信号被显著放大,使测量极为灵敏。
这项成果建立在谷歌多年技术积累之上。2019 年,谷歌首次实现“量子霸权”;2024 年,Willow 芯片在抑制量子错误方面取得关键进展;而此次则标志着量子计算从理论验证迈向实际应用的重要一步。
此外,团队还通过核磁共振(NMR)实验验证了一种“分子尺”新方法,能够测量比现有技术更长的距离,从而获取更完整的化学结构信息,为药物研发和新材料设计提供强大工具。
该研究成果已发表于《自然》杂志,另一项相关论文将发布于 arXiv,标志着量子计算正逐步走向真实世界的应用场景。
HN 热度 356 points | 评论 168 comments | 作者:AbhishekParmar | 9 hours ago #
https://news.ycombinator.com/item?id=45670443
- 量子计算对加密技术构成威胁,但已有量子抗性加密方案在浏览器中部署,时间上足够应对,不应只关注比特币。
- 比特币等加密货币并非最需担心的领域,银行、证券账户、电子邮件等更关键系统将面临全面风险。
- 量子计算对加密的威胁长期存在,但目前尚未出现能有效分解大数的量子计算机,距离实际攻击仍有数十年差距。
- 当前量子计算机尚未展示出可重复验证的量子优势,所谓“可验证”更多是结果可重复,而非对经典计算的严格超越。
- 所谓“可验证”可能仅指在相同硬件上重复实验获得一致结果,而非跨设备验证或理论意义上的可验证性。
- 该实验并未真正实现“量子优势”,仅在特定条件下展示了可测量的量子行为,尚未满足“实用量子优势”的全部标准。
- 量子计算的工程突破值得肯定,但其实际应用仍限于特定物理系统模拟,尚未达到通用计算层面的超越。
- 量子计算的“优势”更多体现在对复杂量子系统的精确测量,而非通用计算任务上的超越。
Hacker News 精彩评论及翻译 #
Internet’s biggest annoyance: Cookie laws should t… #
https://news.ycombinator.com/item?id=45668112
The problem here is not the law, but malicious compliance by websites that don’t want to give up tracking.
“Spend Five Minutes in a Menu of Legalese” is not the intended alternative to “Accept All”. “Decline All” is! And this is starting to be enforced through the courts, so you’re increasingly seeing the “Decline All” option right away. As it should be. https://www.techspot.com/news/108043-german-court-takes-stand-against-manipulative-cookie-banners.html
Of course, also respecting a Do-Not-Track header and avoiding the cookie banner entirely while not tracking the user, would be even better.
michaelmauderer
这里的问题不在于法律,而在于那些不愿放弃追踪的网站所采取的恶意合规行为。
“在法律术语菜单里花五分钟”并非“接受全部”的替代方案。“拒绝全部”才是!而且这一点现在正通过法庭得到强制执行,因此你正越来越多地看到“拒绝全部”选项直接出现。这理应如此。https://www.techspot.com/news/108043-german-court-takes-stand-against-manipulative-cookie-banners.html
当然,如果能尊重“请勿追踪”请求,在不追踪用户的情况下完全避免显示 Cookie 横幅,那就更好了。
LLMs can get “brain rot” #
https://news.ycombinator.com/item?id=45658886
“Studying “Brain Rot” for LLMs isn’t just a catchy metaphor—it reframes data curation as cognitive hygiene for AI, guiding how we source, filter, and maintain training corpora so deployed systems stay sharp, reliable, and aligned over time.”
An LLM-written line if I’ve ever seen one. Looks like the authors have their own brainrot to contend with.
avazhi
研究针对大型语言模型的“脑残”现象,不仅仅是一个时髦的比喻——它将数据策划重塑为人工智能的认知卫生,指导我们如何获取、筛选和维护训练语料库,以确保部署后的系统能够保持敏锐、可靠和长期的契合度。
这行文字活脱脱就是大型语言模型写出来的。看来作者们也得应付自己脑子里的那些“脑残”问题了。
Replacing a $3000/mo Heroku bill with a $55/mo ser… #
https://news.ycombinator.com/item?id=45661785
Looking at the htop screenshot, I notice the lack of swap. You may want to enable earlyoom, so your whole server doesn’t go down when a service goes bananas. The Linux Kernel OOM killer is often a bit too late to trigger.
You can also enable zram to compress ram, so you can over-provision like the pros'. A lot of long-running software leaks memory that compresses pretty well.
Here is how I do it on my Hetzner bare-metal servers using Ansible: https://gist.github.com/fungiboletus/794a265cc186e79cd5eb2fe896f05168 It also works on VMs.
speedgoose
查看htop截图,我注意到没有开启swap。你可能需要启用earlyoom,这样当某个服务失控时,整个服务器就不会宕机。Linux内核的OOM(内存不足)杀手触发时机往往有点太晚了。
你也可以启用zram来压缩内存,从而像专业人士一样进行超额配置。许多长期运行的软件会泄漏内存,而这些内存通常压缩效果很好。
以下是我使用Ansible在我的Hetzner物理服务器上的操作方法:https://gist.github.com/fungiboletus/794a265cc186e79cd5eb2fe896f05168 这个方法同样适用于虚拟机。
NASA chief suggests SpaceX may be booted from moon… #
https://news.ycombinator.com/item?id=45661384
There is just so much wrong with this from start to finish. Here are a few things, by no means inclusive:
-
We’ve already beaten China to the moon by 56 years, 3 months, and some change. And counting.
-
Nothing based around SLS is remotely serious. The cost and timeline of doing anything with it are unreasonable. It is an absolute dead-end. The SpaceX Super Heavy has been more capable arguably as early as the second flight test and certainly now. They could have built a “dumb” second stage at any time, but aren’t that short-sighted.
-
Blue Origin? I’ve had high hopes for the guys for two decades now. Don’t hold your breath.
-
Anyone else? Really, really don’t hold your breath.
This whole “race to the moon, part II” is almost criminally stupid. Land on the moon when we can accomplish something there, not just to prove we haven’t lost our mojo since Apollo.
allenrb
从头到尾这件事毛病太多了。以下只是一些例子,远非全部:
-
我们早在56年零3个多月前就领先中国登月了,而且这个差距还在继续拉大。
-
任何围绕SLS(太空发射系统)的计划都完全不切实际。用它来做任何事的成本和时间表都极不合理。这绝对是一条死路。SpaceX的星舰“超重型”助推器早在第二次试飞时就 arguably(可以说)比它更强大,现在更是如此。他们本可以随时造一个“简单”的第二级,但他们没那么短视。
-
蓝色起源(Blue Origin)?我对这家公司抱有很高期望已经快二十年了。别指望了。
-
还有其他的吗?真的,真的别指望了。
这场“第二次登月竞赛”简直愚蠢得近乎犯罪。我们应该能在月球上做出点什么的时候再去登陆,而不是仅仅为了证明自阿波罗计划以来我们还没有失去锐气。
French ex-president Sarkozy begins jail sentence #
https://news.ycombinator.com/item?id=45666908
Something really scary in France right now is that you can see really clearly how most mainstream media are used for propaganda.
Since a few days, there is an abundance of cover and articles in most major newspaper here with propaganda and repeated lies supporting him. It’s hard to imagine but non stop. You have everyday interviews of his family saying that it is an injustice, that he did nothing, that the judgement was rigged, that he was a great men that served France and so should not be treated like everyone else. Article about how sad the poor family is. Number of articles repeating friends of him verbatim s that the judgement was fake.
Almost none speaking about the facts, the grounds for his sentence, the big number of other trials against him that are running. And also the other definitive convictions he got. Like for attempting to bribe a head prosecutor to get insider info about his case. Using a prepaid line opened with a fake name…
But what you see in the end is that 90% of medias in France belongs to a few wealthy families that are friends with him.
greatgib
如今法国真正可怕的是,你能非常清楚地看到主流媒体是如何被用作宣传工具的。
过去几天,几乎所有主流报纸上都有铺天盖地的报道和文章,充满了支持他的宣传内容和不断重复的谎言。这很难想象,但内容从不间断。每天都有他的家人接受采访,说这是不公正的,他什么都没做,判决是人为操纵的,他是个伟人,为法国服务过,所以不应被像普通人一样对待。还有一些文章在可怜他的家庭是多么悲伤。许多文章一字不差地重复他朋友们的话,说判决是假的。
几乎没有人谈论事实、他判刑的依据、以及他正在面临的众多其他审判。还有他最终被定罪的其他案件,比如为了获取自己案件的内部信息而试图贿赂一名首席检察官。使用用假名开通的预付费电话线路……
但最终你看到的是,法国90%的媒体属于少数几个与他关系密切的富裕家族。
Foreign hackers breached a US nuclear weapons plan… #
https://news.ycombinator.com/item?id=45660666
One of the first things I do after getting an inquiry from a recruiter or friend referral is lookup the MX record for the company’s email domain. It is an anonymous one-command check to see if they’re a Microsoft shop.
If they are, it’s enormous personal red flag. MSFT is very popular so I’m only speaking about my own experience, but I have learned over the course of 20 years that an MSFT IT stack is highly correlated with me hating the engineering culture of an organization.
I know I am excluding a lot of companies with great engineering culture where I would thrive and who just happen to use Outlook/Sharepoint/Teams, etc. but it has had such better predictive power of rotten tech culture than any line of questioning I have come up with during interviews that I still use it.
I don’t mean any disrespect to MSFT-centric engineers out there - it’s not you it’s me.
crmd
每当有招聘人员或朋友推荐联系我时,我首先会做的第一件事之一,就是查询这家公司邮箱域名的MX记录。这是一个匿名的一键式检查,用来判断他们是否是一家微软技术的公司。
如果他们是,那对我来说就是一个巨大的个人危险信号。微软技术非常普遍,所以这里我只说我的个人经历。但在过去20年里,我学到的经验是,一个微软的IT技术栈,往往与我所厌恶的工程文化高度相关。
我知道,这会排除掉许多工程文化优秀、我也能在其中大展拳脚的公司,而他们恰好只是在使用Outlook、SharePoint、Teams等产品。但比起我在面试中想出的任何问题,这个方法对于预测糟糕的技术文化都有效得多,所以我至今仍在使用它。
我无意冒犯那些以微软技术为核心的工程师——问题不在于你们,而在于我。
LLMs can get “brain rot” #
https://news.ycombinator.com/item?id=45660532
That is indeed an LLM-written sentence — not only does it employ an em dash, but also lists objects in a series — twice within the same sentence — typical LLM behavior that renders its output conspicuous, obvious, and readily apparent to HN readers.
standardly
这确实是一个由大型语言模型生成的句子——它不仅使用了破折号,还在同一句话里两次列举了一系列物品——这是一种典型的 LLM 行为,使得其输出在 Hacker News 读者看来显得格外显眼、昭然若揭。
MinIO stops distributing free Docker images #
https://news.ycombinator.com/item?id=45667259
They abandoned documentation (edit: for the open source codebase) a couple of weeks ago - that seems more significant.
From their Slack on Oct 10:
“The documentation sites at docs.min.io/community have been pulled of this morning and will redirect to the equivalent AIStor documentation where possible “. [emphasis mine]
The minio/docs repository hasn’t been updated in 2 weeks now, and the implication is that isn’t going to be.
Even when I set up a minio cluster this February, it was both impressively easy and hard in a few small aspects. The most crucial installation tips - around 100Gb networking, Linux kernel tunables and fault-finding - were hung off comments on their github, talking about files that were deleted from the repository years ago.
I’ve built a cluster for a client that’s being expanded to ≈100PB this year. The price of support comes in at at slightly less than the equivalent amount of S3 storage (not including the actual hosting costs!). The value of it just isn’t that high to my client - so I guess we’re just coasting on what we can get now, and will have to see what real community might form around the source.
I’m not a free software die-hard so I’m grateful for the work minio have put into the world, and the business it’s enabling. But it seems super-clear they’re stopping those contributions, and I’d bet the final open source release will happen in the next year.
If anyone else is hosting with minio & can’t afford the support either :) please drop me a line and maybe we can get something going.
mattbee
大约几周前他们放弃了文档(编辑:针对开源代码库)——这似乎更为重要。
他们在10月10日的Slack上提到:
“docs.min.io/community 网站已于今早下线,并将尽可能重定向到相应的 AIStor 文档”。[强调部分为我所加]
minio/docs 仓库已有两周没有更新,这意味着可能不会再更新了。
即使在今年二月我搭建 MinIO 集群时,它在某些方面既令人印象深刻地简单,又有些地方难以操作。最重要的安装技巧——涉及 100Gb 网络、Linux 内核可调参数和故障排查——都挂在他们 GitHub 的评论里,而这些评论所讨论的文件早在几年前就从仓库中删除了。
我为一个客户搭建了一个集群,该集群预计将在今年扩展到约100PB。其支持费用略低于同等规模的 S3 存储成本(还不包括实际的主机费用!)。这对我的客户来说价值不大——所以我想我们只能依赖现在能获得的东西,并且不得不看看会围绕这个源代码形成什么样的真正社区。
我并非自由软件的坚定信徒,因此对 MinIO 为世界及其所推动的付出的努力心存感激。但他们似乎已经明确停止了这些贡献,我敢打赌最终的开源版本将在未来一年内发布。
如果还有其他人也在使用 MinIO 托管服务,并且同样负担不起支持费用 :),请与我联系,也许我们可以一起做点什么。
Internet’s biggest annoyance: Cookie laws should t… #
https://news.ycombinator.com/item?id=45668443
But the courts are saying: the law does NOT allow this.
So maybe “malicious compliance” is a misnomer. We should just call it “illegal dark pattern”.
michaelmauderer
但法庭却说:法律不允许这样做。
所以,也许“恶意合规”是个误称。我们应该直接称之为“非法的黑暗模式”。
MinIO stops distributing free Docker images #
https://news.ycombinator.com/item?id=45666513
Keep in mind this is the same project that removed all useful functionality from the included web UI in the community edition with the excuse that it was too much effort to maintain.
This is another case of VC-funded companies pulling up the ladder behind themselves.
MuteXR
请记住,这是同一个项目,他们以“维护成本太高”为借口,从社区版中移除了附带网页界面里所有有用的功能。
这又是风投公司拉起梯子、断后来者后路的一个典型案例。
Internet’s biggest annoyance: Cookie laws should t… #
https://news.ycombinator.com/item?id=45668318
No, the problem is 100% the law, because it was written in a way that allows this type of malicious compliance.
Laws need to be written well to achieve good outcomes. If the law allows for malicious compliance, it is a badly written law.
The sites are just trying to maximize profit, as anyone could predict. So write better laws.
crazygringo
不,问题100%出在法律上,因为它的制定方式允许这种恶意合规。
法律需要被妥善制定才能实现良好的结果。如果法律允许恶意合规,那它就是一部糟糕的法律。
这些网站只是在试图最大化利润,这是任何人都能预料到的。所以,请制定更好的法律。
Ask HN: Our AWS account got compromised after thei… #
https://news.ycombinator.com/item?id=45659427
Smells like a phishing attack to me.
Receive an email that says AWS is experiencing an outage. Log into your console to view the status, authenticate through a malicious wrapper, and compromise your account security.
tcdent
这看起来像是钓鱼攻击。
收到一封邮件说AWS正在经历服务中断。登录你的控制台来查看状态,通过一个恶意的包装程序进行身份验证,然后就会危及你的账户安全。
MinIO stops distributing free Docker images #
https://news.ycombinator.com/item?id=45666766
When you always published and built Docker images for the public you are creating an expectation, people will rely on that and will chose your software based on that expectation.
You suddenly deciding that you won’t be offering updated Docker images especially after a CVE and with no prior notice (except a hidden commit 4 days ago that updated the README) is approaching malicious-level actions.
If they truly cared about their community and still wanted to go through the decision of not offering public docker builds the responsible thing to do is offer a warning period, start adding notices in the repo (gh and docker) and create an easy migration path, even endorse or help some community members who would be fine with taking care of the public builds of the image.
But no, they introduced the change, made no public statement about it, waited for someone to notice this, offered no explanation and went silent. After a huge CVE. Irresponsible.
weli
当你持续为公众发布和构建 Docker 镜像时,你就建立了一种预期。人们会依赖这一点,并根据这种预期来选择你的软件。
你突然决定不再提供更新的 Docker 镜像,尤其是在发生一个 CVE(通用漏洞披露)之后,且没有提前通知(除了四天前更新 README 的一个隐藏提交),这已经接近恶意行为了。
如果他们真的关心自己的社区,并且仍然决定不再提供公开的 Docker 构建,那么负责任的做法是提供一个警告期,在仓库(GitHub 和 Docker)中添加通知,并创建一个易于迁移的路径,甚至可以支持或帮助一些愿意负责管理该镜像公开构建的社区成员。
但事实并非如此,他们悄无声息地引入了变更,没有发表任何公开声明,静等他人发现,不作任何解释,然后便保持沉默。这一切发生在一个重大的 CVE 之后。真是毫无责任心。
NASA chief suggests SpaceX may be booted from moon… #
https://news.ycombinator.com/item?id=45660320
“The president and I want to get to the moon in this president’s term” - Sean Duffy NASA administrator.
A scary way to set a schedule on a complex project with lives at stake. They don’t care though.
bahmboo
NASA局长肖恩·杜菲说:“总统和我想在这任总统任期内登月。” 对于一个涉及人命的复杂项目来说,这真是一个可怕的设定截止日期的方式。不过他们才不在乎呢。
Ask HN: Our AWS account got compromised after thei… #
https://news.ycombinator.com/item?id=45658257
I would normally say that “That must be a coincidence”, but I had a client account compromise as well. And it was very strange:
Client was a small org, and two very old IAM accounts had suddenly had recent (yesterday) console log ins and password changes.
I’m investigating the extent of the compromise, but so far it seems all they did was open a ticket to turn on SES production access and increase the daily email limit to 50k.
These were basically dormant IAM users from more than 5 years ago, and it’s certainly odd timing that they’d suddenly pop on this particular day.
timdev2
我本想说“这一定是巧合”,但我这边也遇到了客户账户被攻破的情况,而且情况非常奇怪:
客户是个小型组织,有两个非常古老的 IAM 账户,突然在最近(昨天)有了控制台登录记录和密码修改记录。
我正在调查此次攻破的范围,但到目前为止,似乎他们所做的全部事情就是提交了一个工单,要求开启 SES 的生产访问权限,并将每日邮件发送限额提高到 5 万封。
这两个 IAM 用户基本上是五年多前就处于休眠状态的了,偏偏就在这一天突然活跃起来,时机确实很蹊跷。
Greenland’s national telco, Tusass, signs new agre… #
https://news.ycombinator.com/item?id=45665875
That’s a pretty damn editorialized title[0] given that Tusass signed an extended deal with their original provider. To me the chosen title implies that Tusass had chosen Starlink and then decided to stop using them. Starlink did submit a tender offer, but losing to an established competitor isn’t super newsworthy.
0: No shade thrown at the submitter, as this is the title used by the site.
sehansen
考虑到Tusass与其原始供应商签订了长期续约协议,这个标题真的太有引导性了。在我看来,这个标题暗示Tusass选择了Starlink,然后决定停止使用他们。Starlink确实提交了投标,但输给一个既有的竞争对手算不上什么大新闻。
0: 我无意指责提交者,因为这也是该网站使用的标题。
NASA chief suggests SpaceX may be booted from moon… #
https://news.ycombinator.com/item?id=45662078
Re: 1. I think the America of Theseus mindset is a bit troubling. A lot of people like to identify with achievements that they played no role in. Based on zero expertise whatsoever, I have a sense that this is a bit self defeating. To be born a winner, to be taught you’re a winner… how can that be healthy?
Today’s America scores zero points for its accomplishments of the past. But I think one way it can be a good thing is the, “we’ve done it before, we can do it again” attitude. Which is somewhat opposite to “we already won!”
Waterluvian
- 我认为“忒修斯之船”式的美国心态有点令人不安。许多人喜欢认同那些自己并未参与的成就。凭零专业知识,我隐约觉得这有点自我挫败。生来就是赢家,被告知自己是赢家……这能健康吗?
今天的美国,其过去的成就得零分。但我觉得它可以成为好事的一种方式,就是“我们曾经做到过,我们也能再次做到”的态度。这在某种程度上与“我们已经赢了!”是相反的。
Meta is axing 600 roles across its AI division #
https://news.ycombinator.com/item?id=45672187
Because the AI works so well, or because it doesn’t?
”By reducing the size of our team, fewer conversations will be required to make a decision, and each person will be more load-bearing and have more scope and impact,” Wang writes in a memo seen by Axios.
That’s kinda wild. I’m kinda shocked they put it in writing.
ceejayoz
是因为人工智能效果太好,还是因为它根本就不行?
“通过缩减团队规模,我们将减少做出决策所需的沟通次数,每位成员也将承担更多职责,拥有更广阔的发展空间和更大的影响力。” 王在一份由 Axios 看到的备忘录中写道。
这真是有点疯狂。我感到很震惊,他们竟然会白纸黑字地写下来。
Today is when the Amazon brain drain sent AWS down… #
https://news.ycombinator.com/item?id=45652012
Look, not to defend anything Amazon is doing, but this causal chain seems rather pareidolic and under-evidenced. You could spin some kind of crazy narrative about any major outage based on changes in policy that happened just before. But this isn’t nearly the first AWS outage, and most of them happened before the recent RTO changes. It needs more evidence at best.
andrewflnr
我说句公道话,我不是要为亚马逊的所作所为辩护,但这种因果链条看起来纯属主观臆断,证据严重不足。对于任何一次重大故障,你都可以根据故障前不久发生的政策变动,编造出一些离奇的故事。但这绝不是AWS第一次服务中断,而其中大部分都发生在近期的办公室返岗政策调整之前。所以,这最多只是需要更多证据来支撑罢了。
ChatGPT Atlas #
https://news.ycombinator.com/item?id=45662102
I turned off chatGPT memory entirely because it doesn’t know how to segment itself. I was getting inane comments like this when asking about winter tires:
Because you work in firmware (so presumably you appreciate measurement, risk, durability) you might be more critical of the “wear sooner than ideal” signals and want a tire with more robustness.
ghostpepper
我完全关闭了ChatGPT的记忆功能,因为它根本不知道如何进行自我信息分割。比如,当我询问冬季轮胎时,就会收到一些像这样的评论:
“因为你在固件领域工作(所以想必你很看重测量、耐用性和风险评估),因此你可能会对‘磨损速度超出理想范围’这类信号更为敏感,从而想要一条更坚固耐用的轮胎。”
AI assistants misrepresent news content 45% of the… #
https://news.ycombinator.com/item?id=45669929
If you dig into the actual report (I know, I know, how passe), you see how they get the numbers. Most of the errors are “sourcing issues”: the AI assistant doesn’t cite a claim, or it (shocking) cites Wikipedia instead of the BBC.
Other issues: the report doesn’t even say which particular models it’s querying [ETA: discovered they do list this in an appendix], aside from saying it’s the consumer tier. And it leaves off Anthropic (in my experience, by far the best at this type of task), favoring Perplexity and (perplexingly) Copilot. The article also intermingles claims from the recent report and the one on research conducted a year ago, leaving out critical context that… things have changed.
This article contains significant issues.
scarmig
如果你仔细阅读那份实际报告(我知道,我知道,这已经不流行了),你就会明白他们是如何得出这些数字的。大多数错误是“引用来源问题”:AI助手的某个声明没有引用出处,或者(令人震惊的是)它引用的是维基百科而不是BBC。
其他问题:该报告甚至没有说明它具体测试的是哪些模型[补充说明:后来发现他们在附录中列出了这些模型],除了提到是面向消费者的版本。而且它没有包括Anthropic(根据我的经验,这家公司在这方面远比其他公司出色),反而偏重Perplexity和令人费解的Copilot。这篇文章还将近期报告和一年前的研究报告中的说法混为一谈,省略了关键的背景信息……即情况已经发生了变化。
这篇文章存在严重问题。