2025 10 16 HackerNews

2025-10-16 Hacker News Top Stories #

  1. 自由软件基金会启动 Librephone 项目,旨在通过逆向工程替换手机中的专有固件以实现真正自由的移动生态,但面临资金与时间挑战。
  2. 苹果发布基于第三代 3nm 的 M5 芯片,大幅提升 AI 与图形性能并开放给开发者,但对统一内存容量的限制引发争议。
  3. 作者揭露一次伪造的远程“求职面试”中嵌入高度伪装的后门,可从外部加载并执行 payload,警示在隔离环境中审查未知代码并核实来源。
  4. 研究显示媒体报道严重偏向谋杀与恐怖袭击等戏剧性事件,而低报心脏病、癌症等实际主要死因,扭曲公众风险认知。
  5. 文章指出将传统软件的修复思维套用于 AI 会误判问题根源,AI 的缺陷更多来自大规模训练数据和涌现行为,难以通过单次修复解决。
  6. 跨国调查揭露监控公司 First Wap 与其 Altamides 定位工具被广泛滥用与泄露,影响数百万条追踪记录并波及政要、记者与普通民众。
  7. 爱尔兰将自 2026 年起常态化艺术家基本收入计划,每周约发放 375 美元给入选艺术家,虽带来积极影响但在资格与评估上存在争议。
  8. Anthropic 发布 Claude Haiku 4.5,小型模型在编码性能、速度与成本上显著优化且对齐性较高,适合低延迟的应用场景。
  9. GrapheneOS 与一家主要 Android 厂商合作,计划摆脱仅支持 Pixel 的限制,扩展到搭载高通旗舰芯片的机型以提高可用设备范围。
  10. 报告指出电商流量中存在大量高度仿真的机器人行为,平均约 73% 为虚假流量,严重误导广告投放与转化评估。

FSF announces Librephone project #

https://www.fsf.org/news/librephone-project

自由软件基金会(FSF)于 2025 年 10 月 14 日宣布启动“Librephone”项目,旨在推动移动电话的软件自由。随着全球多数用户将智能手机作为主要计算设备,FSF 决定将四十多年来在桌面和服务器系统上推动软件自由的经验,延伸至移动领域。

Librephone 的目标是实现手机系统的完全自由——用户应拥有研究、修改、分享和分发所用软件的权利。该项目将重点解决当前 Android 发行版在软件自由方面存在的最后障碍,特别是设备固件中的专有二进制代码(binary blobs)问题。

项目由资深自由软件开发者罗布·萨沃伊(Rob Savoye)领导,他拥有多年嵌入式系统和自由软件开发经验。FSF 已获得其董事会成员约翰·吉尔摩(John Gilmore)的捐赠支持,后者长期使用 LineageOS 搭配 MicroG 和 F-Droid,但发现其仍依赖部分专有模块,因此推动该项目以彻底替换这些非自由组件。

当前首要任务是评估现有开源项目(如 Replicant 和 LineageOS)的兼容性与自由度,筛选出自由问题最少、最易修复的现代手机型号,作为首个目标设备。随后将通过逆向工程,逐步替换所有非自由软件。

FSF 强调,这一工作复杂、耗时且成本不菲,但已有大量前期成果可依托。项目将与现有自由软件开发者社区协作,欢迎技术贡献与资金支持。

更多信息可访问项目官网: https://librephone.fsf.org,或通过 IRC 频道 #librephone 连接 libera.chat 参与讨论。更多宣传内容见 https://fsf.org/campaigns/librephone


HN 热度 1379 points | 评论 563 comments | 作者:g-b-r | 1 day ago #

https://news.ycombinator.com/item?id=45586339

  • FSF 发起 Librephone 项目旨在逆向工程现代 SoC 中广泛使用的非自由固件,目标是构建一个从底层开始完全自由的手机系统。
  • 当前开源移动生态分裂严重,缺乏统一协作,导致各自难以对抗大型科技公司。
  • LineageOS 因 Android 新版本强制要求 eBPF 而面临困境,而 postmarketOS 的上游内核驱动可能提供解决方案。
  • GrapheneOS 受限于仅支持 Pixel 设备,而 LineageOS 可帮助扩展支持范围,两者应合作互补。
  • 有人认为自由软件运动过度关注 1% 的非自由部分,而忽视了 99% 已实现的自由,这种极端立场可能使其难以被主流接受。
  • 与政府透明度类比,某些硬件功能如安全和通信可能需要闭源,但闭源也可能被滥用隐藏间谍软件。
  • 若自由软件运动能承认某些闭源部分的合理性,或可提升其可信度并避免被边缘化。
  • 自由软件的核心是“全有或全无”,1% 的闭源即意味着系统不自由,这是其本质要求。
  • 开源是务实的,接受 99% 开放即可,而自由软件运动则坚持 100% 自由,具有更强的意识形态色彩。
  • 历史上 FSF 多次预见问题并被证明正确,如 GitHub 被微软收购、Android 未来可能限制 F-Droid 等。
  • 尽管 FSF 常被批评为“极端”,但其预测往往准确,这种“正确”本身可能使其观点更具价值。
  • 有人质疑 FSF“正确”的说法,认为其对 99.9% 的软件持否定态度,导致“误报”频发,但应反思“误报”的定义是否合理。
  • 当前没有完全无闭源固件的 ARM 或 x86 桌面设备,即使高端服务器也难以做到完全自由。
  • Librephone 项目的目标是为 LineageOS 等系统提供完全自由的驱动程序,使用户无需依赖厂商提供的闭源固件。

Apple M5 chip #

https://www.apple.com/newsroom/2025/10/apple-unleashes-m5-the-next-big-leap-in-ai-performance-for-apple-silicon/

Apple 今日宣布推出 M5 芯片,标志着苹果自研芯片在 AI 性能上的重大飞跃。M5 采用第三代 3 纳米制程工艺,专为 AI 任务优化,是专为 14 英寸 MacBook Pro、iPad Pro 和 Apple Vision Pro 设计的下一代系统级芯片。

M5 芯片的核心亮点包括:

  • 10 核下一代 GPU 架构,每核心均配备神经加速器,AI 峰值计算性能相比 M4 提升超过 4 倍,相比 M1 提升超过 6 倍。
  • GPU 图形性能最高提升 45%,得益于第三代光线追踪引擎和增强的着色器核心,支持更流畅的游戏体验和更快速的复杂图形渲染。
  • 搭载全球最快的性能核心,CPU 最高可达 10 核(4 性能核 +6 效率核),多线程性能相比 M4 提升最高 15%。
  • 16 核神经引擎进一步升级,配合高达 153GB/s 的统一内存带宽(较 M4 提升近 30%),显著提升 AI 与多媒体处理效率。

M5 芯片将全面赋能设备的 AI 能力,使 14 英寸 MacBook Pro 和 iPad Pro 在本地运行扩散模型、大语言模型等 AI 工作负载时实现显著加速。开发者可通过 Core ML、Metal Performance Shaders 和 Metal 4 等框架,利用新硬件特性快速提升应用性能,支持直接编程神经加速器的 Tensor API。

在 Apple Vision Pro 中,M5 芯片可实现微 OLED 显示屏像素渲染提升 10%,刷新率最高达 120Hz,带来更清晰、更流畅的视觉体验,有效减少运动模糊。

M5 芯片的推出,标志着苹果在 AI 性能、图形处理和能效方面的全面领先,为用户和开发者带来更强大、更智能的设备体验。相关设备现已开启预购。


HN 热度 918 points | 评论 1013 comments | 作者:mihau | 11 hours ago #

https://news.ycombinator.com/item?id=45591799

  • M5 芯片在 CPU 核心数和内存带宽上相比 M4 有提升,但统一内存容量未增加,仍为 32GB,与 M4 保持一致。
  • 有用户指出 M5 芯片统一内存为 24GB 的说法可能是错误的,苹果官网明确支持 14 英寸 MacBook Pro 配置 32GB 内存。
  • 有人推测苹果可能通过限制标准版芯片的内存容量来制造产品差异,推动用户升级至更高配置的 Pro/Max 型号。
  • 有观点认为苹果在 M4 系列中已通过限制内存配置来实现“计划性淘汰”,例如 M4 Pro 最高仅支持 48GB 内存,而 M4 Max 则需顶级配置才能达到 64GB。
  • 有人指出在 Mac mini 上 M4 Pro 仍支持 64GB 内存,说明技术上并非不可行,因此限制可能出于商业策略而非技术限制。
  • 有评论认为苹果可能通过减少 SKU(库存单位)来简化产品线,而非纯粹的技术原因。
  • 苹果在软件更新方面对开发者要求较高,频繁更改 API 和架构,迫使开发者持续适应新变化。
  • 尽管苹果硬件支持周期长,但软件层面的兼容性问题让开发者面临持续的适配压力。
  • Windows 系统在兼容性方面也存在诸多问题,例如 TPM 强制要求、本地账户限制以及多代 API 的频繁更迭。
  • 一些老旧的 Windows API(如 Win32、MFC、.NET)至今仍被支持,但新框架(如 MAUI、Silverlight)的迭代频繁,增加了开发负担。
  • 与 Windows 相比,Mac 平台运行 90 年代游戏等旧软件更加困难,通常需要依赖模拟器或虚拟机。

I almost got hacked by a ‘job interview’ #

https://blog.daviddodda.com/how-i-almost-got-hacked-by-a-job-interview

作者 David Dodda 分享了一次几乎被黑客攻击的经历,起因是一次看似正规的区块链公司“Symfa”的远程编程面试。对方通过 LinkedIn 联系他,自称 Chief Blockchain Officer 的 Mykola Yanchii,邀请他参与一个名为“BestCity”的房地产平台开发项目,并发送了一个看似标准的 React/Node.js 代码测试项目。

作者在时间紧迫的情况下,未使用沙盒环境,直接开始审查代码。在准备运行项目前,他临时向 AI 助手询问代码是否存在可疑行为,结果发现服务器端控制器文件中隐藏了一段高度伪装的恶意代码。该代码通过字节数组解码后,会向外部 URL 请求一段远程 payload,执行后可窃取用户电脑中的所有敏感信息,包括加密钱包、密码和文件。

这段恶意代码被巧妙地嵌入在正常功能代码中,且攻击者使用了动态失效的 URL(24 小时后失效),并采用多层混淆技术,极大增加了检测难度。整个骗局从 LinkedIn 个人资料、公司页面到面试流程都高度逼真,利用了开发者的信任心理和时间压力。

作者强调,这次事件暴露了开发者在日常工作中面临的巨大风险:频繁运行未知代码、缺乏安全防护、轻信“正规”渠道。他提醒所有开发者,必须养成以下习惯:使用 Docker 或虚拟机隔离运行未知代码;在执行前用 AI 工具扫描可疑行为;核实信息真实性;对催促快速执行的请求保持警惕。

文章最后指出,这种攻击方式极具针对性,一旦成功,可能造成生产环境泄露、巨额加密资产损失和大规模用户数据泄露。一个简单的 AI 提示,就可能避免灾难性后果。


HN 热度 695 points | 评论 364 comments | 作者:DavidDodda | 11 hours ago #

https://news.ycombinator.com/item?id=45591707

  • 这篇文章的写作风格让人感觉像是由 AI 生成的,尽管内容很有价值,但缺乏作者个人的原创感。
  • 多个评论指出 AI 生成文章常使用短句和“不仅 X,也 Y”这类模式,容易被识别出来。
  • 有人认为 AI 生成的内容虽然语法正确,但缺乏灵魂和个性,显得平淡无味,无法替代人类的个人风格。
  • 使用 AI 工具润色邮件或文章会显得冗长且内容空洞,反而降低沟通效率。
  • 有管理者发现员工使用 AI 后,原本独特的语言风格被削弱,担心这会影响个人表达的真实性。
  • 作为非母语者,有人认为直接表达反而更受客户欢迎,而过度修饰的表达方式可能适得其反。
  • 有人主张仅用 AI 进行语法和拼写检查,手动决定修改,避免失去个人写作风格。
  • 有人通过反复使用 AI 生成内容并不断调整,结合多模型对比,最终让 AI 输出更贴近自己的真实语气。
  • AI 生成内容的“声音”取决于输入的样本量,若提供足够多的个人写作风格样本,AI 可以模仿出类似个人风格的输出。
  • 有人认为 AI 在帮助克服写作障碍和理清思路方面有帮助,但最终仍需人工编辑以保留个人风格。

What Americans die from vs. what the news reports on #

https://ourworldindata.org/does-the-news-reflect-what-we-die-from

本文探讨了美国媒体报道的死亡原因与实际死亡原因之间的显著差异。研究基于 2023 年美国疾病控制与预防中心(CDC)的数据,分析了 15 种主要死亡原因,并对比了《纽约时报》、《华盛顿邮报》和福克斯新闻网站对这些原因的报道频率。

结果显示,心脏病和癌症合计占美国死亡人数的 56%,但仅获得媒体总报道量的 7%。相比之下,尽管谋杀和恐怖袭击等事件死亡人数较少,却占据了超过一半的媒体报道。例如,2023 年美国仅有 16 起恐怖袭击致死事件,但其媒体报道量是实际死亡人数的 18,000 倍以上,谋杀案的报道量也达到其死亡人数的 43 倍。

研究指出,媒体倾向于报道具有戏剧性、情感冲击力和“新闻性”的事件,如谋杀、恐怖袭击和灾难,因为这些事件具有独特故事性,容易吸引读者关注。而像心脏病、糖尿病等慢性疾病虽是主要死因,但因每天发生、缺乏新意,难以成为头条新闻。

尽管不同媒体在政治立场上存在差异,但它们在报道选题上的相似性远高于差异,说明这种偏见并非源于党派立场,而是源于媒体对“新闻价值”的普遍定义。文章提醒公众,媒体报道并不反映真实风险,容易误导人们对社会威胁的认知。

作者强调,媒体反映的是公众兴趣,而公众往往更关注戏剧性事件。但这种偏差可能导致社会资源分配失衡,公众对真正重大健康问题的关注不足。文章呼吁媒体和公众共同反思,提升对长期、普遍性健康风险的关注。


HN 热度 664 points | 评论 446 comments | 作者:alphabetatango | 1 day ago #

https://news.ycombinator.com/item?id=45583336

  • 心脏病和癌症虽是主要死因,但媒体对此类慢性病的报道远低于其实际影响,而谋杀、校园枪击等事件因具有突发性和冲击力更受媒体青睐。
  • 媒体对健康问题如肥胖、癌症的报道虽多,但多集中于商业化的健康产品、饮食潮流和短期研究进展,缺乏对根本原因和长期趋势的深入分析。
  • 健康问题如肥胖和慢性病的成因复杂,涉及食品环境、城市规划、工作制度和医疗可及性,但这些结构性问题在媒体中未得到足够关注。
  • 媒体对死亡原因的报道偏差会影响公众对社会健康趋势的理解,导致对真正可预防的健康问题重视不足。
  • 尽管心脏病和癌症是普遍的自然死亡原因,但其报道缺乏新鲜感,媒体更倾向于追逐突发事件以吸引注意力。
  • 社会对暴力犯罪的报道远多于可预防的慢性病,但后者才是导致更多死亡的根源,因此应增加对慢性病的系统性报道。
  • 健康问题的报道不应仅停留在“美国人肥胖”这类重复信息,而应关注科学进展、政策干预和长期趋势分析。
  • 政府和媒体缺乏透明度,导致公众难以获取真实、可比的死亡数据,影响对公共健康问题的判断。
  • 媒体对健康问题的报道往往受商业利益驱动,如推广减肥药、健身课程和“神奇疗法”,而非推动真正的健康改善。
  • 媒体对癌症等疾病的报道常夸大进展,制造“攻克癌症”等虚假希望,忽视长期研究和系统性解决方案。

Beliefs that are true for regular software but false when applied to AI #

https://boydkane.com/essays/boss

本文探讨了公众对人工智能(AI)安全问题的误解,指出人们常以传统软件的思维模式来理解 AI 系统,从而产生严重误判。作者强调,尽管公众已认识到软件漏洞可能造成现实危害,但这一认知在 AI 领域并不适用。

传统软件的漏洞源于代码中的错误,如遗漏分号等,可通过仔细审查代码定位并修复。但现代 AI 系统的问题主要来自训练数据本身,而非代码逻辑。AI 训练依赖海量数据(如 FineWeb 数据集达 11.25 万亿词),远超人类可读范围,因此无法追溯具体哪部分数据导致了异常行为。

AI 的“错误”无法像软件那样通过逻辑推理找到根源。即使开发者也无法完全理解 AI 为何做出某些判断。所谓“修复”AI 问题,往往只是通过重新训练或调整数据来抑制特定行为,但无法保证问题不再出现。更危险的是,同样的输入在不同时间可能产生不同输出,且 AI 公司常微调响应方式以增强自然感,进一步加剧不可预测性。

此外,AI 系统不具备传统软件的确定性:一次修复后,旧问题可能在新情境下重现;即使输入完全一致,输出也可能因细微变化而大相径庭。最后,人们无法像开发传统软件那样,通过明确需求来确保 AI 行为符合预期,因为 AI 的“行为”是训练数据的复杂涌现结果,难以精确控制。

作者指出,这种根本性的认知差异导致专家与公众之间存在巨大理解鸿沟:专家清楚 AI 的不可解释性与不可控性,而公众却仍期待“找到 bug、修好就行”的传统解决方案,这正是 AI 安全风险被低估的核心原因。


HN 热度 499 points | 评论 386 comments | 作者:beyarkay | 1 day ago #

https://news.ycombinator.com/item?id=45583180

  • 苹果在 AI 应用上进展缓慢,其推出的 AI 功能如表情生成、通知摘要和校对工具较为基础,且曾因表现失控而回滚。
  • 苹果对 AI 的谨慎态度是合理的,因为当前 AI 工具在实际使用中可靠性不足,容易出现随机错误,反而降低生产力。
  • 苹果的用户体验和质量控制标准近年来明显下滑,已不如过去严格,可能与公司更注重供应链和商业优化有关。
  • 尽管苹果在 AI 方面进展缓慢,但其整体产品体验仍优于其他厂商,反映出其过去在细节打磨上的深厚积累。
  • 苹果的 AI 功能存在明显缺陷,如通知摘要无法在非专注模式下清除,导致通知堆积,影响使用体验。
  • 一些 AI 功能如优先通知和照片清理效果不错,尤其在去除画面中无关人物方面表现良好,但对复杂任务支持有限。
  • AI 功能的开发存在“先有解决方案再找问题”的倾向,许多功能并未解决真实用户痛点,例如长消息摘要并无实际必要。
  • 有用户反映 AI 在处理邮件时可能误将钓鱼邮件标记为高优先级,反映出 AI 在理解语义和安全过滤方面仍有不足。
  • 某些 AI 应用如 Ring App 的通知摘要会将多个单独的行人通知合并为“一群人”,导致误报和恐慌,说明 AI 在聚合信息时可能适得其反。
  • 虽然部分用户认为 ChatGPT 5 表现稳定,但也有开发者在使用 Copilot 时遇到 AI 反复修改代码、甚至删除注释的问题,说明 AI 在开发场景中仍不可靠。

Surveillance data challenges what we thought we knew about location tracking #

https://www.lighthousereports.com/investigation/surveillance-secrets/

这是一篇由 Lighthouse 联合多家国际媒体发布的深度调查报道,题为《Surveillance Secrets》(监控秘密),聚焦全球监控产业中一家名为 First Wap 的公司及其名为 Altamides 的手机定位追踪软件。

调查始于一份藏匿于深网的庞大监控数据档案,包含超过 150 万条追踪记录、逾 1.4 万个独特手机号码,覆盖 160 多个国家。这些数据揭示了 Altamides 技术被广泛用于追踪全球各类人群,包括政界要员、企业高管、记者、活动人士和普通民众。

报道揭露 First Wap 公司不仅向政府客户销售技术,还向私营企业出售,例如一家受制裁的矿业公司计划用其监控环保抗议者。公司高管在秘密行业展会上公开宣称可实现“全球任意人员定位”,并曾讨论如何规避国际制裁。

调查团队通过分析数据集群,成功识别出多位高知名度目标,包括卡塔尔前总理、叙利亚前总统巴沙尔·阿萨德的妻子、Netflix 制片人亚当·西拉斯基、黑水公司创始人埃里克·普林斯、印尼《Tempo》杂志高级编辑阿里·努尔·亚辛等。在意大利,记者詹路易吉·努齐在揭露梵蒂冈腐败后不久即被追踪;在美国,23andMe 创始人安妮·沃伊西基在硅谷频繁移动时被上千次定位;在南非,卢旺达反对派领袖帕特里克·卡雷盖亚的盟友在遇刺前已被监控。

多个国家的媒体伙伴也发现本地异常监控活动:奥地利红牛公司高管被追踪,挪威电信高管遭锁定,以色列律师与非洲、海湾地区商人成为目标,塞尔维亚能源行业人士被波及。

First Wap 公司回应称不参与任何非法行为,强调其技术仅用于打击有组织犯罪、恐怖主义和腐败,并声称安装后不再掌握产品使用情况。但调查结果彻底打破了该行业“仅用于合法执法”的叙事,揭示出技术滥用的广泛性与系统性。

该调查由超过 70 名记者、14 家媒体机构共同完成,是迄今为止对现代监控产业最全面的揭露之一。


HN 热度 456 points | 评论 135 comments | 作者:tk | 1 day ago #

https://news.ycombinator.com/item?id=45584498

  • 记者应深入探讨为何允许技术监控和信息共享的机制存在,而不仅仅是揭露滥用案例和灰色法律状态。
  • 领导者在掌握权力后往往更倾向于利用监控技术带来的控制力,而非担忧潜在的滥用问题。
  • 理想的全面监控政府虽能降低犯罪率,但现实中因机构腐败、数据错误和领导更替导致系统失控。
  • 中央化监控系统一旦失控,去中心化和隐私保护作为“备胎”具有必要性。
  • 柏拉图《理想国》的权威性源于对正义的追求,但正义与自由存在根本冲突。
  • 政府的核心功能是协调资源以增强社会竞争力,而非单纯追求正义或福利。
  • 政府的本质是垄断暴力,以减少社会整体暴力,维护秩序。
  • 政治权力应被视为临时代理,代表民众决策,而非“领导”民众,权力应随时可被撤销。
  • 社会共识的瓦解反映的是民众不再认可所谓“领导者”的合法性,转而自主决策。
  • 多数人实际上需要领导,完全依赖技术官僚管理的模式已导致当前社会问题。
  • 民主投票并非理性决策机制,多数人常在具体情境中放弃珍视的权利。
  • 无限制言论自由可能导致被宣传和营销操控,所谓“同意”可能并不真实。

Ireland is making basic income for artists program permanent #

https://www.artnews.com/art-news/news/ireland-basic-income-artists-program-permanent-1234756981/

爱尔兰将把此前试点的艺术家基本收入计划正式化,从 2026 年起长期实施。该计划为入选艺术家提供每周约 375 美元(每月约 1500 美元)的固定补贴,首批名额为 2000 个,申请将于 2026 年 9 月开放,具体资格标准尚未公布。政府表示,若资金允许,未来可能扩大规模。

该试点项目始于 2022 年,原定 2025 年 2 月结束,后延长六个月。其初衷是应对新冠疫情对艺术行业的冲击,当时大量演出和活动被取消,艺术家收入严重受损。申请涵盖视觉艺术、戏剧、文学、音乐、舞蹈、歌剧、电影、马戏和建筑等领域,申请人需提供两项证明其为专业文化工作者的材料,如艺术作品收入证明、专业协会会员资格或媒体评论等。首轮申请中,超过 9000 人提交,8200 人符合资格,最终 2000 人被随机选中获得资助,另有 1000 人作为对照组用于研究。

根据英国咨询公司 Alma Economics 发布的外部评估报告,试点项目至今耗资 7200 万欧元,但已为爱尔兰经济带来近 8000 万欧元的总收益。报告指出,受助艺术家的创作收入平均每月增加超过 500 欧元,非艺术类工作收入减少约 280 欧元,对其他社会福利的依赖也下降,每人每月平均减少 100 欧元支出。

文化、通信与体育部长帕特里克·奥唐诺万表示,该投资对艺术行业和整体经济产生了立竿见影的积极影响。报告还预测,若实施长期、扩大的基本收入计划,艺术家产出将增加 22%,艺术品平均价格可能下降 9% 至 25%。

2024 年 10 月,政府公布的一项公众调查显示,97% 的受访者支持该计划。但在选择标准上存在分歧:47% 认为应按经济需求筛选,37.5% 支持按艺术成就选拔,仅 14% 支持随机抽选。

爱尔兰的艺术家基本收入计划属于“全民基本收入”(UBI)范畴,即无论个人状况如何,所有公民均可定期获得无条件现金补助。近年来,随着人工智能引发的就业担忧加剧,UBI 理念逐渐获得关注。该计划被视为 UBI 可行性的有力例证。

UBI 实验室网络(UBI Lab Network)强调:“试点已证明基本收入有效,人们现在就需要 UBI 来应对日益严峻的社会、经济和生态危机。” 该组织呼吁在全国范围内推行类似政策。UBI Lab Leeds 组织者雷因哈德·赫斯也表示:“我们不需要更多试点,人们现在就需要基本收入。”


HN 热度 429 points | 评论 430 comments | 作者:rbanffy | 13 hours ago #

https://news.ycombinator.com/item?id=45590900

  • 爱尔兰的艺术家基本收入计划并非真正的全民基本收入,因其仅覆盖已有艺术身份的人群,排除了想成为艺术家但无法负担的人,存在明显局限性。
  • 该计划的经济收益评估数据存疑,尤其是将心理幸福感估值为近 8000 万欧元的做法缺乏实际资金支持,难以支撑项目长期可持续性。
  • 有评论讽刺指出,该计划将心理福祉和文化参与的“社会价值”进行货币化估算,本质上是用数字包装非量化价值,难以作为政策依据。
  • 有人调侃称,爱尔兰自 6 世纪起便已有类似“基本收入”的实践,即修道士通过提供免费酒水和庇护换取社区支持,这种模式比现代数字报告更持久有效。
  • 评论认为现代性过度依赖数据和报告,反而忽视了像“牧灵关怀”这类非量化、以人为本的社会支持模式,后者才是长期存在的关键。
  • 有人反讽指出,天主教会并非不重视财务,其财务报告、税务豁免和募捐活动都极为严密,所谓“不靠数字”是误解。
  • 有用户幽默表达对“在乡村小镇发神秘建议、每周听一次村民烦恼、其余时间在酒吧提供文化氛围”这一理想职位的向往。
  • 评论提到,现实中天主教神父工作极为繁重,需在多个教堂间奔波举行弥撒,有时需在一天内完成多场仪式,且需承担日常牧灵、葬礼、告解等职责。
  • 一些地区因教区萎缩和神父短缺,导致神父需跨区域服务多个教堂,甚至在不同教堂间连续举行弥撒,工作强度远超一般认知。
  • 有用户指出,部分城市教堂在一周内举行多次弥撒,包括平日和周日,且需准备不同内容的讲道,工作量巨大,远非“轻松坐班”可比。

Claude Haiku 4.5 #

https://www.anthropic.com/news/claude-haiku-4-5

Anthropic 发布了最新小型模型 Claude Haiku 4.5,该模型现已对所有用户开放。相比五个月前的前沿模型 Claude Sonnet 4,Haiku 4.5 在编码性能上达到相近水平,但成本降低至三分之一,速度提升超过两倍。

Haiku 4.5 在使用计算机、多智能体协作和实时响应等任务中表现优异,尤其适用于需要低延迟的应用场景,如聊天助手、客户服务、配对编程和 AI 辅助开发。其高效性使 Claude for Chrome 和 Claude Code 的体验更加流畅。

尽管 Claude Sonnet 4.5 仍是当前的前沿模型,也是全球最佳编码模型,但 Haiku 4.5 提供了接近前沿性能且成本更低的替代方案。它支持与 Sonnet 4.5 协同工作,例如由 Sonnet 4.5 进行复杂任务分解,再由多个 Haiku 4.5 实例并行执行子任务。

该模型在多个基准测试中表现突出,如 SWE-bench Verified 达到 73.3%,在 agentic coding 评估中达到 Sonnet 4.5 的 90% 性能,媲美更大模型。在终端操作、数学推理、多语言理解等任务中也展现出强大能力。

安全方面,Haiku 4.5 表现优异,其对齐程度优于前代模型,且在自动化对齐评估中低于 Sonnet 4.5 和 Opus 4.1,成为目前最安全的模型之一。其 CBRN 风险较低,因此被归类为 AI 安全等级 2(ASL-2),比 Sonnet 4.5 和 Opus 4.1 的 ASL-3 更宽松。

开发者可通过 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 使用 Haiku 4.5,价格为每百万输入/输出 token 1 美元/5 美元,是性价比极高的选择。

更多技术细节、评估结果和系统卡信息可在官方文档中查阅。


HN 热度 399 points | 评论 174 comments | 作者:adocomplete | 8 hours ago #

https://news.ycombinator.com/item?id=45595403

  • Claude Haiku 4.5 在生成 SVG 代码方面表现出色,尤其在处理“鹈鹕骑自行车”这类复杂请求时,生成质量高且速度快,时间到首字仅 0.69 秒。
  • 与 GPT-5、Grok 4 Fast 等模型相比,Haiku 4.5 在推理速度和输出精准度上具有明显优势,平均生成速度可达 220 token/sec,接近 Gemini 2.5 Flash Lite 水平。
  • 尽管 Haiku 4.5 的价格相比前代有所上涨,但其在代码生成中的高效性与精准性可能使其在实际使用中更具性价比。
  • 有观点认为 Anthropic 模型在真实场景中的表现优于公开基准测试,说明其在实际应用中可能更具优势。
  • 一些用户对模型是否“作弊”于特定测试(如“鹈鹕骑自行车”)表示怀疑,但也有观点认为这些测试并非刻意设计,模型表现稳定,未发现针对性优化。
  • 模型在图像生成方面仍存在局限,例如对弓箭手手臂等细节处理不佳,但对复杂场景(如“香菇骑船”)的生成能力令人印象深刻。
  • 有用户建议测试更复杂的场景,如“骑马射箭的弓箭手射向湖上帆船”,以进一步评估模型能力。
  • 尽管 Haiku 4.5 性能优秀,但品牌认知和用户对“小模型”的偏见可能影响其市场采纳,尤其在与 Sonnet 等模型对比时。
  • GPT-5 在价格与性能之间取得良好平衡,但 Haiku 4.5 若能保持稳定表现,可能成为多数编码任务的理想选择。
  • 有用户指出,长期任务(超过 7 分钟)中,Sonnet 4.5 性能可能出现下降,这可能是 Haiku 4.5 需要关注的潜在问题。

GrapheneOS is ready to break free from Pixels #

https://www.androidauthority.com/graphene-os-major-android-oem-partnership-3606853/

GrapheneOS,一个以隐私和安全为核心的 Android 定制系统,正计划打破其仅支持 Google Pixel 手机的局限。该项目已确认与一家主要的 Android 手机制造商达成合作,将把 GrapheneOS 引入搭载高通骁龙旗舰芯片的智能手机。

此次合作始于 2025 年 6 月,目标是为该厂商未来的旗舰机型提供官方支持。尽管未公布具体品牌,但消息指出这些设备将在价格上与 Pixel 系列相当,并在全球范围内销售。这一进展标志着 GrapheneOS 首次走出 Pixel 生态,迈向更广泛的市场。

目前,GrapheneOS 仍将继续支持现有 Pixel 设备,包括即将发布的 Pixel 10。但对于 Pixel 11 是否继续支持,项目团队仍在评估中。此前,GrapheneOS 因 Google 安全补丁更新周期过长而提出批评,此次合作有望通过更早获取安全更新,进一步保障系统安全性。

有猜测认为合作伙伴可能是 Nothing,因其支持解锁引导程序,但其目前尚不被视为“主流 Android OEM”。此次合作被视为 GrapheneOS 迈向独立和规模化的重要一步,可能在 2026 至 2027 年间实现设备落地。


HN 热度 390 points | 评论 230 comments | 作者:MaximilianEmel | 1 day ago #

https://news.ycombinator.com/item?id=45585869

  • GrapheneOS 的核心目标是安全与隐私,不应被期望在用户体验和功能上超越 Android,其专注点应保持在安全加固上。
  • 有人认为 GrapheneOS 应该更积极地改进 Android 的核心体验,如通知系统、多任务处理等,但不应由其团队直接承担所有改进工作。
  • 有观点指出,当前移动操作系统缺乏创新,大多数系统只是对 iOS 或三星等厂商的微调,缺乏真正有突破性的设计。
  • 许多用户认为 AOSP 原生应用虽然简陋,但已足够使用,无需过度美化,且用户可通过安装第三方应用自行定制体验。
  • 一些开发者指出,GrapheneOS 已在实际中推动了多项实用性改进,如 eSIM 支持、网络定位、Android Auto 和 Google 消息兼容性等,这些是响应用户需求的结果。
  • 有人建议,GrapheneOS 可以作为“移动版 Debian”作为基础,由其他团队在其之上开发更具吸引力的用户体验和功能,再反哺上游。
  • 有评论强调,GrapheneOS 的资源有限,若过度追求功能丰富,反而会削弱其在安全与隐私方面的核心使命。
  • 部分用户认为,AOSP 应用如音乐播放器等确实多年未更新,体验不佳,但 GrapheneOS 并未包含此类应用,因此问题不成立。
  • 也有观点认为,用户完全有能力自行修改或替换 GrapheneOS 的应用,不应将美观问题归咎于项目本身。
  • 有人指出,GrapheneOS 项目本身已承担了大量维护 AOSP 安全更新的工作,已属不易,不应再被要求承担 UI/UX 优化的重担。

Bots are getting good at mimicking engagement #

https://joindatacops.com/resources/how-73-of-your-e-commerce-visitors-could-be-fake

文章揭示了当前电商网站面临的严重虚假流量问题,指出 73% 的访问者可能是机器人而非真实用户。作者通过实际案例发现,某客户网站月访问量达 5 万,但仅产生 47 笔销售,转化率低于 0.1%。尽管广告投入高达每月 4000 美元,且分析工具显示数据“向好”,但实际营收几乎停滞。

为查明真相,作者开发了一套简单追踪脚本,分析用户行为细节,如鼠标移动轨迹、滚动速度、点击间隔等。结果显示,该客户网站 68% 的流量为非人类流量,且这些机器人高度仿真,能模拟点击、滚动、加购等行为。

作者随后对超过 200 个中小型电商网站进行调查,发现平均 73% 的流量为虚假流量,形成系统性问题。他将这些机器人分为三类:

  • “互动机器人”:行为高度一致,如每页停留 11-13 秒,滚动速度恒定,缺乏人类的随机性。
  • “购物车弃单机器人”:反复添加同一商品,等待 4 分钟后放弃,可能用于操纵平台算法或制造正常弃单假象。
  • “幻影社交流量机器人”:从 Instagram 或 TikTok 等渠道“引流”,但仅停留 1.8 秒即离开,却仍被计入有效访客,误导广告效果评估。

此外,文章指出并非所有自动化流量都是恶意的。例如,大型零售商会使用“良性机器人”进行数据抓取,监控库存、价格、排名和广告展示,这类行为属于合法商业竞争。但据估算,全球近 50% 的网络流量来自机器人,其中大量为欺诈性流量。

文章最后揭示了数字广告经济的深层问题:某客户每月花费 1.2 万美元在 Google 广告上,过滤虚假流量后流量下降 71%,但销售额反而增长 34%。这说明真实转化率早已改善,却被虚假流量掩盖。然而,当作者向广告平台提出此问题时,对方以“AI 检测先进”等话术回避,一位内部人士私下承认:平台清楚问题存在,但若彻底过滤,收入将骤降 40%,影响投资者信心。

文章警示:当前数字营销的绩效评估体系已被虚假流量严重扭曲,企业需重新审视流量真实性,否则将持续浪费巨额广告预算。


HN 热度 340 points | 评论 264 comments | 作者:simul007 | 13 hours ago #

https://news.ycombinator.com/item?id=45590681

  • 广告和流量数据中的机器人流量占比极高,许多平台明知存在虚假流量却选择不处理,以维持收入。
  • 企业为了保持客户满意度和合同收入,宁愿隐藏机器人流量数据,即使这构成对客户的误导。
  • 透明化数据展示,如通过堆叠图表区分真实与机器人流量,是更负责任的做法,能引导客户关注真实用户行为。
  • 将广告计费与实际转化结果挂钩,可能比单纯依赖点击或观看次数更公平,但目前系统激励机制存在严重偏差。
  • 一些公司曾尝试过滤虚假流量,但因销售团队压力被迫放弃,反映出商业利益与数据真实之间的冲突。
  • 用户使用广告屏蔽工具时,平台不应因此拒绝计入观看次数,尊重用户隐私选择是合理且必要的。
  • 当前数字广告生态中,真实数据的价值被金钱利益压制,导致“真相”让位于“数据表现”。
  • 一些平台对广告屏蔽用户采取技术对抗,本质上是希望减少不产生广告收益的流量,而非真正关心内容观看。
  • 用“切蛋糕,你选块”的公平分配模型可能有助于解决广告计费中的信任问题,但实际执行困难。
  • 机器人流量已高度仿真,能模仿人类行为,使传统分析工具难以识别,形成系统性欺骗。
  • 企业若逐步引入流量过滤机制,可能引发客户对数据下降的质疑,应采用渐进式透明化策略。

Hacker News 精彩评论及翻译 #

Apple M5 chip #

https://news.ycombinator.com/item?id=45592057

The modern Apple feels like their hardware teams way outperforming the software teams.

toddmorey

感觉现在的苹果,硬件团队的水平远超软件团队。


Ireland is making basic income for artists program… #

https://news.ycombinator.com/item?id=45591439

They tried to call this “universal” until people pointed out it is the opposite of universal. This program is a wild distortion of what UBI is meant to be.

Everyone who would like to be an artist, but can’t afford to be one, is disqualified. Meanwhile, the acquaintance of mine who sold his house in London at a large profit and retired to a cottage in Westmeath to live off his gains and noodle around on the guitar a bit is a recipient of funds from this program.

Tellingly there’s very little information about how to become an artist with this program.

Edit/addendum: Worth noting they’ve produced some very dubious numbers to claim this program is a net gain economically. https://www.rte.ie/culture/2025/0923/1534768-basic-income-for-the-arts-pilot-generated-over-100m-in-benefits/

""" A key component of the total benefits came from psychological wellbeing, which contributed almost €80 million. In addition, the report estimates that audience engagement with the arts generated €16.9 million in social value, based on public willingness-to-pay for cultural experiences. """

And, as much as I like psychological wellbeing (who doesn’t!) - saying that it’s worth €80 million when you didn’t actually get €80 million doesn’t help things when it comes time to pay for the program. I’m unsurprised that giving people money improved their psychological well being.

I’d be more excited to see basic income for Deliveroo riders and people working in chippers.

CalRobert

他们曾试图将此项目称为“普适性”的,直到有人指出它恰恰相反。这个项目严重扭曲了全民基本收入(UBI)的初衷。

所有那些渴望成为艺术家但又负担不起的人,都被排除在外。与此同时,我的一位熟人,他在伦敦卖掉房子赚了一大笔钱,然后搬到西米思郡的一间小别墅里,靠这笔钱过日子,没事就随便弹弹吉他,却成了这个项目的资助对象。

值得注意的是,关于如何通过这个项目“成为”一名艺术家,信息少得可怜。

补充/编辑:值得注意的是,他们为了声称该项目在经济上实现了净收益,炮制了一些极其可疑的数据。报告称:“总收益的关键组成部分来自于心理健康,这部分贡献了将近8000万欧元。此外,报告估计,观众参与艺术活动产生了1690万欧元的社会价值,这一数据基于公众为文化体验而支付意愿的估算。”

而且,虽然我也认同心理健康的重要性(谁会不认同呢!)——当你实际上并没有得到8000万欧元,却声称它值这么多,那么在需要为这个项目买单的时候,这种说法就站不住脚了。给人们发钱能改善他们的心理健康,我一点也不惊讶。

我其实更期待看到能为外卖骑手和炸鱼薯条店员工提供的基本收入。


Apple M5 chip #

https://news.ycombinator.com/item?id=45592334

The M5 MacBook Pro still gets the Broadcom WiFi chip but the M5 iPad Pros get the N1 and C1X (Sweet).

All in all, apple is doing some incredible things with hardware.

Software teams at apple really need to get their act together. The M1 itself is so powerful that nobody really needs to upgrade that for most things most people do on their computers. Tahoe however makes my M1 Air feel sluggish doing the exact same tasks ive been last couple of years. I really hope this is not intentional from Apple to make me upgrade. That would be a big let down.

mumber_typhoon

M5 MacBook Pro 仍然使用了博通 WiFi 芯片,而 M5 iPad Pro 则配备了 N1 和 C1X 芯片(太棒了)。

总而言之,苹果在硬件方面确实在做一些了不起的事情。

苹果的软件团队真的需要好好努力了。M1 芯片本身的性能已经非常强大,对于大多数人来说,在电脑上做的绝大多数事情都根本不需要升级。然而,Tahose(macOS Sequoia 的代号)却让我的 M1 Air 在运行过去几年里同样的任务时感觉变得迟缓。我真的希望苹果不是故意为之,想借此逼我升级。那将是一种巨大的失望。


FSF announces Librephone project #

https://news.ycombinator.com/item?id=45588911

Why can’t they just partner with postmarketOS here?

Why do we have to have /e/OS instead of a better supported LineageOS, because /e/ is a 1:1 copy anyways?

Why do we have to have a Librephone project now instead of partnering with say, Fairphone and the Pine64 people?

Open source loses this war because proprietary devices are streamlined. The only thing that comes close to this is GrapheneOS, LineageOS, and postmarketOS.

LineageOS has huge problems since the mandatory eBPF requirements of late Android versions, which postmarketOS and its upstreamed kernel drivers could fix. GrapheneOS has huge problems because of Pixel devices, which LineageOS could help with.

We need a unification of this ecosystem because each on their own is hardly surviving on their own against the megacorporations.

cookiengineer

他们为什么不直接与 postmarketOS 合作呢? 我们为什么非要使用 /e/OS,而不是一个拥有更好支持的 LineageOS 呢?毕竟 /e/OS 本质上就是它的1:1复制品。 我们为什么非要现在搞一个 Librephone 项目,而不是比如说和 Fairphone 以及 Pine64 的人合作呢? 开源在这场战争中输了,因为专有设备经过了精简优化。 唯一能与之抗衡的只有 GrapheneOS、LineageOS 和 postmarketOS。 由于新版 Android 强制要求 eBPF,LineageOS 遇到了巨大难题,而这本可以由 postmarketOS 及其上游化的内核驱动来解决。 由于 Pixel 设备的问题,GrapheneOS 也面临巨大挑战,而这本可以由 LineageOS 来帮助解决。 我们需要整个生态系统的统一,因为面对这些巨头公司时,任何一方都难以独自生存。


Beliefs that are true for regular software but fal… #

https://news.ycombinator.com/item?id=45585648

For a real world example of the challenges of harnessing LLMs, look at Apple. Over a year ago they had a big product launch focused on “Apple Intelligence” that was supposed to make heavy use of LLMs for agentic workflows. But all we’ve really gotten since then are a couple of minor tools for making emojis, summarizing notifications, and proof reading. And they even had to roll back the notification summaries for a while for being wildly “out of control”. [1] And in this year’s iPhone launch the AI marketing was toned down significantly.

I think Apple execs genuinely underestimated how difficult it would be to get LLMs to perform up to Apple’s typical standards of polish and control.

[1] https://www.bbc.com/news/articles/cge93de21n0o

freetime2

要了解将大型语言模型(LLMs)付诸实践所面临的挑战,苹果公司就是一个很好的现实案例。一年多前,他们举办了一场盛大的产品发布会,重点推出了“Apple Intelligence”,计划在代理工作流中大量应用LLMs。但自那以来,我们真正得到的不过是几款小工具:制作表情符号、摘要通知和校对文稿。而且,这些通知摘要功能甚至还一度因“失控”严重而被撤回。[1] 在今年的iPhone发布会中,其人工智能营销的声势也显著减弱了。

我认为,苹果的高管们确实严重低估了要让LLMs达到苹果一贯的精良品质和控制标准,其难度有多高。


The cost of turning down wind turbines in Britain #

https://news.ycombinator.com/item?id=45590673

People oppose everything.

  • Lattice overhead powerlines? Eyesore (should use the new T style ones), house values, wind noise, hums, WiFi interference, cancer, access roads, hazard to planes, birds

  • T-frame pylons: boring ( https://www.theguardian.com/commentisfree/2015/apr/13/electricity-pylons-britain-duller-place-national-grid-t-pylon-design ), eyesore (we prefer the lattice ones), most of the above too

  • Underground: damaging to the environment, end stations are eyesores/light polluters, more construction traffic, should be HVDC not AC, house values

  • Solar farms: waste of good land (golf courses are fine) noise somehow, construction, eyesore (but a 400 acre field of stinky bright yellow rapeseed is OK), house values

  • Onshore Wind farms: all the birds all the time, access, eyesore, noise, dangerous, should be offshore, house value, waste of land, I heard on Facebook the CO2 takes 500 years to pay back

  • Offshore wind farms: eyesores, radar hazard, all the birds, house values somehow, navigation hazard, seabed disruption

  • Build an access road: destroying the countryside, dust if not surfaced, drainage, house values

  • Don’t build an access road: destroying roads, HGVs on local roads, house values

  • Nuclear: literally all the reasons plus scary

Some of them are fair on their own, but it really adds up to a tendentious bunch of wankers at every turn who think the house they bought for 100k in 1991 and is now worth 900k is the corner of the universe.

As a foreign influence

I’m sure these people would never take foreign cash: https://www.bbc.co.uk/news/articles/c93k584nvgeo https://www.bbc.co.uk/news/articles/clyk1j92195o

grues-dinner

人们反对一切。

  • 架空电网线路?有碍观瞻(应该用新的T型杆),影响房产价值,风噪,嗡嗡声,WiFi干扰,致癌,通道,对飞机的威胁,伤害鸟类。
  • T型电线杆:无聊(链接),有碍观瞻(我们更喜欢铁塔式的),上述大部分问题也存在。
  • 地下电缆:破坏环境,终端电站有碍观瞻/造成光污染,增加施工交通,应该是高压直流电而非交流电,影响房产价值。
  • 太阳能发电场:浪费好地(高尔夫球场就没问题),莫名地有噪音,施工,有碍观瞻(但400英亩臭烘烘的亮黄色油菜田就没事),影响房产价值。
  • 陆上风电场:会杀死所有鸟类,通道问题,有碍观瞻,噪音,危险,应该建在海上,影响房产价值,浪费土地,我在Facebook上听说其碳排放需要500年才能回本。
  • 海上风电场:有碍观瞻,对雷达的干扰,伤害鸟类,莫名其妙地影响房产价值,对航行的威胁,破坏海床。
  • 修建一条通道:破坏乡村风光,如果没铺路面会有扬尘,排水问题,影响房产价值。
  • 不修通道:破坏现有道路,重型货车开上本地道路,影响房产价值。
  • 核能:以上所有理由,外加“很可怕”。

其中一些理由单看或许有几分道理,但综合起来,就是一群走到哪都充满偏见、自以为是的混蛋,他们觉得自己1991年花10万英镑买的、如今价值90万英镑的房子就是宇宙的中心。

来自外国的影响

我敢肯定这些人绝不会收外国钱的:https://www.bbc.co.uk/news/articles/c93k584nvgeo https://www.bbc.co.uk/news/articles/clyk1j92195o


Why Is SQLite Coded In C #

https://news.ycombinator.com/item?id=45586284

“None of the safe programming languages existed for the first 10 years of SQLite’s existence. SQLite could be recoded in Go or Rust, but doing so would probably introduce far more bugs than would be fixed, and it may also result in slower code.”

Modern languages might do more than C to prevent programmers from writing buggy code, but if you already have bug-free code due to massive time, attention, and testing, and the rate of change is low (or zero), it doesn’t really matter what the language is. SQLIte could be assembly language for all it would matter.

jasonthorsness

在 SQLite 存在的头十年里,没有任何安全的编程语言。SQLite 可以用 Go 或 Rust 重写,但这样做可能会引入比修复的更多的错误,并且也可能导致代码运行更慢。

现代语言在防止程序员编写有缺陷的代码方面可能比 C 语言做得更多,但如果你已经通过投入大量的时间、精力和测试获得了无错误的代码,且变更率很低(或为零),那么使用何种语言就真的无关紧要了。在这种情况下,SQLite 即使用汇编语言编写也无所谓。


Apple Vision Pro upgraded with M5 chip #

https://news.ycombinator.com/item?id=45592162

I was super interested in the Vision Pro when it was first released. Then I found out they went with an app model and the device could only display a single MacOS window. There went my dream of surrounding myself with a bunch of vim windows and terminals.

If they’d focused on maximizing the device’s usefulness instead of its revenue stream, maybe things would have worked out better.

DennisP

Vision Pro刚发布时,我特别感兴趣。后来我发现,它采用的是应用模式,而且设备只能显示一个macOS窗口。我梦想着被一堆vim窗口和终端包围的场景,就这样破灭了。如果他们当时能专注于最大化设备的实用性,而不是它的盈利模式,或许结果会好得多。


Bots are getting good at mimicking engagement #

https://news.ycombinator.com/item?id=45590682

Hi HN. I run a marketing agency and fell down this rabbit hole after a client’s analytics made no sense (50k visitors, 47 sales). I ended up building a simple script to track user behavior and analyzed 200+ small e-commerce sites. The average was 73% bot traffic that standard analytics counts as real.

The bots are getting creepily good at mimicking engagement. I wrote up my findings, including some of the bizarre patterns I saw and the off-the-record conversations I had with ad tech insiders. It seems like a massive, open secret that nobody wants to talk about because the whole system is propped up by it.

I’m curious if other developers, founders, or marketers here have seen similar discrepancies in their own data.

simul007

我经营着一家营销机构,因为一位客户的(5万次访问,47笔成交)数据实在说不通,我偶然陷入了一个兔子洞。我最终写了一个简单的脚本来追踪用户行为,并分析了200多家小型电商网站。平均来看,有73%的流量是机器人流量,而标准分析工具却将它们计为真实流量。这些机器人在模仿用户互动方面已经变得诡异般地强大。我将我的发现整理成文,其中包含我观察到的一些诡异模式,以及我与广告技术圈内人士的非公开谈话。这似乎是一个巨大的、公开的秘密——一个没人愿意谈论的秘密,因为整个系统都依赖于它而得以维持。我很想知道这里的其他开发者、创始人或营销人员是否在自己的数据中看到过类似的出入。


FSF announces Librephone project #

https://news.ycombinator.com/item?id=45586695

Ultimately, I don’t think the most important challenge is in binary firmware blobs, but the software which people depend upon to run their lives. What does it matter if you can run a completely free software stack on your phone, if your bank software (or your required government ID, as is looking depressingly likely) requires you to run a Big Tech approved phone OS? Perhaps the FSF can’t do much about that, but that is where I feel they could truly make the biggest difference for freedom for the average user.

bigstrat2003

说到底,我认为最重要的挑战并非二进制固件块,而是人们赖以生存的软件。如果你的手机可以运行一个完全自由的软件栈,但你的银行软件(或者你所必需的政府身份证件,而这看起来令人沮丧地可能发生)却要求你运行一个由大型科技公司批准的手机操作系统,那又有什么意义呢?也许自由软件基金会(FSF)对此无能为力,但我认为,那才是他们能够为普通用户的自由带来真正最大改变的地方。


M5 MacBook Pro #

https://news.ycombinator.com/item?id=45593989

To any Linux users, I recently bought a fully loaded M4 MacBook pro to replace my aging Lenovo and strongly regret it. I thought I would use it for playing with LLMs, but local dev on a Mac is not fun and I still don’t have it fully set up. I’ll probably replace it with a framework at some point in the near future.

Edit: okay, that garnered more attention than I expected, I guess I owe a qualification.

  1. Everything is just slightly different. I had to split all my dot files into common/Linux/Mac specific sections. Don’t expect to be able to clone and build any random C++ project unless someone in the project is specifically targeting Mac.

  2. Not everything is supported natively on arm64. I had an idea and wanted to spin up a project using DynamoRIO, but wasn’t supported. Others have mentioned the docker quirks.

  3. The window manager. I’m not a fan of all the animations and needing to gester between screens (and yes, I’ve been down the hotkeys rabbit hole). To install a 3rd party window manager you need to disable some security setting because appearantly they work by injecting into the display manager and calling private APIs.

So my person takeaway was that I took the openness of the Linux ecosystem for granted (I’ve always had a local checkout of the kernel so I can grep an error message if needed). Losing that for me felt like wearing a straightjacket. Ironically I have a MBP at work, but spend my day ssh’d into a Linux box. It’s a great machine for running a web browser and terminal emulator.

0xfaded

致所有 Linux 用户:我最近买了一台顶配的 M4 MacBook Pro 来替换我那台老旧的联想电脑,对此感到非常后悔。我原计划用它来玩转大模型,但在 Mac 上进行本地开发并不好玩,而且我至今还没能把它完全配置好。我可能会在不久的将来把它换成一台 Framework 笔记本电脑。

编辑:好吧,这个帖子获得的关注比我预期的要多,我想我需要补充说明一下。

  1. 所有东西都只是略有不同。我必须把我的所有 dot 文件拆分成通用版、Linux 版和 macOS 版。不要期望能随便 clone 一个 C++ 项目就能编译运行,除非项目本身特别针对 macOS 进行过适配。

  2. 并非所有东西都支持 arm64 原生架构。我有一个想法,想用 DynamoRIO 启动一个项目,但发现它不支持。其他人也提到了 Docker 的一些古怪之处。

  3. 窗口管理器。我不喜欢所有的动画效果,也不需要在多个屏幕之间进行手势操作(是的,我已经钻进快捷键的深坑里了)。要安装第三方窗口管理器,你需要禁用一些安全设置,因为它们显然是通过注入到显示管理器并调用私有 API 来工作的。

所以我个人的体会是,我把 Linux 生态系统的开放性当成了理所当然(我一直本地存有内核源代码副本,以便在需要时用 grep 搜索错误信息)。失去这种自由对我来说就像是穿了一件紧身衣。讽刺的是,我在工作中有一台 MacBook Pro,但整天都通过 SSH 连接到一台 Linux 服务器。这是一台运行网页浏览器和终端模拟器的绝佳机器。


I am a programmer, not a rubber-stamp that approve… #

https://news.ycombinator.com/item?id=45588709

I find LLM generated code ends up pushing review/maintenance burden onto others. It “looks” right at first glance, and passes superficial tests, so it’s easy to get merged. But then as you build on top of it, you realize the foundations are hastily put together, so a lot of it needs to be rewritten. Fine for throwaway or exploratory work, but heaven help you if you’re working in a project where people use LLMs to “fix” bugs generated by previous LLM generated code.

So yes it does increase “velocity” for the person A who can get away with using it. But then the decrease in velocity for person B trying to build on top of that code is never properly tracked. It’s like a game of hot potato, if you want to game the metrics you better be the one working on greenfield code (although I suppose maintenance work has never been looked at favorably in performance review; but now the cycle of code rot is accelerated)

krackers

我发现,大语言模型(LLM)生成的代码,最终将审查和维护的负担都转嫁给了他人。这些代码初看之下“看起来”没问题,也能通过一些肤浅的测试,因此很容易被合并。但当后续开发在此基础上进行时,你会发现其基础是仓促搭建的,导致很大一部分都需要重写。这种代码对于一次性或探索性的工作或许还行,但如果你在一个项目中,看到人们用LLM去“修复”之前LLM生成的代码所产生的bug,那可真是自求多福了。

所以,对于能够靠它蒙混过关的开发者A来说,这确实能提高他的“开发速度”。但对于那些试图在此基础上继续开发的开发者B来说,其开发速度的下降却从未被追踪。这就像“传土豆”游戏,如果你想钻绩效指标的空子,最好就是去做那些全新的开发工作(虽然我猜,维护工作在绩效评估中向来就不受青睐,但现在代码腐烂的循环被大大加速了)。


I almost got hacked by a ‘job interview’ #

https://news.ycombinator.com/item?id=45595164

“transforming real estate with blockchain” is the only red flag needed

blactuary

“用区块链颠覆房地产”本身就是一个危险信号。


Leaving serverless led to performance improvement … #

https://news.ycombinator.com/item?id=45591246

The takeaway here isn’t that serverless doesn’t work, it’s that the authors didn’t understand what they were building on. Putting a latency-critical API on a stateless edge runtime was a rookie mistake, and the pain they describe was entirely predictable.

kburman

这里的重点并非无服务器技术行不通,而是作者们没有理解他们所构建的基础。将延迟敏感的API部署在无状态边缘运行时上,是个新手错误,而他们所描述的困扰也完全是可预见的。


Why the push for Agentic when models can barely fo… #

https://news.ycombinator.com/item?id=45577441

if you’re working on novel code, LLMs are absolutely horrible

This is spot on. Current state-of-the-art models are, in my experience, very good at writing boilerplate code or very simple architecture especially in projects or frameworks where there are extremely well-known opinionated patterns (MVC especially).

What they are genuinely impressive at is parsing through large amounts of information to find something (eg: in a codebase, or in stack traces, or in logs). But this hype machine of ‘agents creating entire codebases’ is surely just smoke and mirrors - at least for now.

joshvince

如果你正在处理新颖的代码,大语言模型绝对是糟糕的。

这说到点子上了。根据我的经验,当前最先进的模型非常擅长编写样板代码或非常简单的架构,尤其是在那些有非常知名且固化模式(尤其是MVC)的项目或框架中。

它们真正令人印象深刻的是处理大量信息以找到某些东西(例如:在代码库、堆栈跟踪或日志中)。但这种“代理创建整个代码库”的炒作机器肯定只是障眼法——至少目前是这样。