2025 11 16 HackerNews

2025-11-16 Hacker News Top Stories #

  1. AI 世界时钟:每分钟由九种不同 AI 模型生成模拟时钟前端代码,展示各模型风格差异与类似人类认知缺陷的绘钟错误。
  2. 对 Archive.today 的可疑施压调查:AdGuard 披露法国组织 WAAD 以疑似伪造证据要求屏蔽 Archive.today,暴露对数字基础设施的不当外部干预风险。
  3. 欧盟聊天监控伪装回归:提案以儿童保护为名强制扫描私人消息(含端到端加密),被批隐私侵害与高误报风险。
  4. 贫穷与身无分文的区别:作者强调贫困是长期结构性困境,而非短期资金短缺可解,需制度性支持。
  5. 无互联网环境下的安全通信应用:Bitchat 利用蓝牙多跳与端到端加密在断网环境建立去中心化本地通信网络,已用于冲突与封锁地区。
  6. 搜索爱泼斯坦档案:建立可检索的爱泼斯坦相关文件数据库,汇集邮件、法律文件与证据以助追责与调查。
  7. Go 的甜蜜 16 岁:总结 Go 在并发测试、容器感知调度、加密审计、内存与 GC 优化及 AI 集成等方面的改进。
  8. TCP:互联网的基石:深入讲解 TCP 在不可靠 IP 上如何实现可靠传输及流量与拥塞控制,并附 C 语言示例。
  9. 所有赞美献给午餐阿姨:缅怀并致敬在预算与政策限制下仍以关怀和本地食材为学生提供营养餐的食堂工作者。
  10. AMD GPU 在 AI 计算中展现强大潜力:HipKittens 通过底层编程原语与寄存器/缓存调度优化释放 CDNA GPU 性能,提升 AI 推理与训练效率。

AI 世界时钟 (AI World Clocks) #

https://clocks.brianmoore.com/

这是一个由人工智能生成的全球时钟展示网站,每分钟会随机显示一个由九种不同 AI 模型生成的模拟时钟。每个时钟均由对应模型在 2000 个词元的限制下生成,内容为符合指定时间的响应式网页代码,包含数字或刻度、动态秒针动画,并采用白色背景。所有生成的时钟均仅返回纯前端代码(无额外说明或格式标记),确保页面简洁。该网站由 Brian Moore 创建,灵感来自 Matthew Rayfield,用户可关注其 Instagram 获取更新。当前展示时间为 09:08:45 上午,系统正在持续生成新的时钟。九个参与的 AI 模型包括 GPT-3.5、GPT-4o、GPT-5、Haiku 3.5、Gemini 2.5、DeepSeek V3.1、Grok 4、Qwen 2.5 和 Kimi K2,体现不同模型在设计风格与代码实现上的差异。


HN 热度 1290 points | 评论 363 comments | 作者:waxpancake | 1 day ago #

https://news.ycombinator.com/item?id=45930151

  • 该 AI 时钟生成项目由作者制作,每分钟由九个不同的 AI 模型生成一个新时钟,其中 Kimi 时钟最准确但缺乏变化,Qwen 时钟则最荒诞有趣。
  • 时钟绘制常用于评估痴呆症,AI 在绘制时钟时出现的错误与认知受损人类的失败模式相似,暗示 AI 可能展现出类似人类认知缺陷的特征。
  • 梦境中时钟、文字或电子设备常出现异常,是清醒梦者判断自己是否在梦中的重要线索。
  • 梦境中的异常现象可能源于大脑计算资源有限,无法完整模拟复杂系统,类似于游戏中的视觉优化技术。
  • 有人通过训练“现实检查”习惯(如查看时钟或文字)来实现清醒梦,关键在于在清醒时养成怀疑现实的习惯。
  • 一些人天生或通过练习几乎每晚都能清醒梦,但长期进行可能影响睡眠质量,导致疲劳。
  • 有观点认为,随着经验积累,所有梦境最终都会变得清醒且平静,因为梦者不再对梦境内容产生反应。
  • 梦中打电话或输入文字时,数字或文字常无法正确显示,这是常见的梦境异常现象。
  • 有人认为梦境中的异常可能不是随机的,而是现实世界本身也处于某种“故障状态”或模拟之中。
  • AI 生成错误并非因为训练数据中包含痴呆患者画的时钟,而是因为 AI 在认知功能上与人类相似,因此会以类似方式失败。

对 Archive.today 的可疑施压调查 (Our investigation into the suspicious pressure on Archive.today) #

https://adguard-dns.io/en/blog/archive-today-adguard-dns-block-demand.html

AdGuard DNS 近期遭遇来自法国组织“网络滥用防御协会”(Web Abuse Association Defense, WAAD)的投诉,要求其屏蔽 Archive.today 及其镜像域名。WAAD 声称 Archive.today 管理员自 2023 年起拒绝删除非法内容,尤其是涉及儿童性虐待材料(CSAM)的内容。

AdGuard DNS 并非内容托管方,因此对这类请求感到异常。随后,WAAD 发送了带有法律威胁性质的邮件,甚至提供了所谓“公证员在线记录”(constat d’huissier sur Internet)作为证据。这些记录实际由在线服务 Qualijuris 生成,多数创建于 2025 年 8 月,与 WAAD 声称的 2023 年时间线不符。

进一步调查发现,这些所谓“公证记录”并非由 WAAD 本人发起,而是由一名与该组织联系人同名的个人在 2023 年订购。该人曾使用一个伪装域名(仅指向真实律师网站)发送邮件,该域名已于事后失效。该邮件同样引用了法国《数字经济发展信任法》(LCEN)第 6-I-7 条,与 WAAD 的诉求如出一辙。

Archive.today 方面回应称,其从未收到过关于这些 URL 的正式通知,且在收到 AdGuard DNS 询问后,已立即删除了相关非法内容。他们还指出,自己正遭受一系列来自法国组织的“连续投诉”,疑似有系统性施压行为。

目前,WAAD 注册于 2025 年 2–3 月,网站信息极少,Twitter 账号仅在 2025 年 8 月创建,粉丝数为 4。其域名注册信息隐藏,使用 ProtonMail 邮箱,网站由 Cloudflare 保护,难以追踪真实身份。

AdGuard DNS 认为,此类由非司法机构主导的“投诉”施压,严重违背了网络治理应由法院裁决的原则。目前仍无法确认 WAAD 背后的真正操控者,但怀疑存在身份冒用或组织伪装行为。事件也反映出对数字基础设施服务的不当施压风险正在上升。


HN 热度 1279 points | 评论 354 comments | 作者:immibis | 15 hours ago #

https://news.ycombinator.com/item?id=45936460

  • AdGuard 主动揭露对 Archive.today 施加的压力,值得肯定,其邮件往来细节揭示了“N”GO 的短暂历史。
  • 针对 AdGuard 的举报,Archive.today 应要求对方通过认证邮件(最好国际邮件)正式提交证据,以符合法律程序。
  • 举报方不应自行下载涉嫌儿童性虐待内容(CSAM),这种行为存在严重法律和伦理风险。
  • 举报方所用网站模板为免费模板,注册时间与信息存在可疑之处,如虚构的紧急联系电话。
  • 该组织注册信息显示其位于法国里昂的邮政信箱,可能为注册公司常用地址,且创始人信息未公开。
  • 该组织的注册时间与发布信息时间过于紧凑,整体流程显得不真实,疑似为掩盖真实目的而伪造。
  • 举报行为可能并非出于真正打击 CSAM 的目的,而是另有隐情,例如利用举报机制进行其他操作。
  • 若 Archive.today 未收到过任何先前通知,却迅速删除内容,其处理方式值得怀疑。
  • 举报方未直接通知网站管理员,而是直接要求 DNS 服务商屏蔽,不符合常规处理流程。
  • 遇到 CSAM 应优先向各国指定机构报告,如美国 CyberTipline、英国 IWF,由其负责后续处理与追踪。
  • 个人直接通知网站管理员可能导致内容被删除但未上报,不利于打击犯罪和保护受害者。
  • 在法国,政治精英并非必然免于法律制裁,前总统已被判刑并实际服刑,尽管后续有缓刑安排。

欧盟聊天监控的伪装回归 (The disguised return of EU Chat Control) #

https://reclaimthenet.org/the-disguised-return-of-the-eus-private-message-scanning-plot

欧洲联盟(EU)的 “聊天控制 2.0” 计划正在悄然复苏,重新提出了对私人数字通信的监控方案。这一修订提案引发了来自数字自由捍卫者的强烈警告,尤其是前欧洲议会议员帕特里克・布赖尔(Dr. Patrick Breyer)。他指出,该提案在 “风险缓解” 和 “儿童保护” 的表述下,实际上隐藏了广泛的新监控权力。

布赖尔称,欧盟委员会悄然重新引入了对私人消息的强制扫描,这一提案在公众反对声中曾被否决。他表示,这一新文本要求服务提供商采取 “所有适当的风险缓解措施”,这实际上是一个漏洞,可以迫使公司监控所有用户的私人消息,包括那些使用端对端加密的消息。

他警告称,新的提案将允许对文本和元数据进行分析,可能会部署算法和人工智能来监控对话,并标记 “可疑” 内容。这种自动化的审查无法理解上下文,可能会将普通的交流也一并纳入监控。布赖尔举例说,想象一下你的手机在扫描你与伴侣、女儿或心理医生的每一段对话,只因为出现了 “爱” 或 “见面” 等词汇,这并不是保护儿童,而是数字猎巫。

布赖尔还指出,现有的自愿系统已经显现出缺陷,例如德国警方报告称,约一半的被标记案件被证明是无关的。此外,新提案还要求用户在创建聊天或电子邮件帐户时进行年龄验证,这可能需要官方身份证或生物识别检查,从而有效地取消了在线匿名通信的可能性。

他对此表示强烈谴责,认为这将影响揭发者、记者、政治活动家和寻求帮助的人的匿名保护。此外,提案还限制了 16 岁以下未成年人使用带聊天功能的社交媒体平台,这种措施被批评为过于保护性的做法,将年轻人孤立,而非赋予他们能力。

布赖尔呼吁那些曾经抵制大规模监控的欧盟成员国,如德国、荷兰、波兰等,阻止这一提案的通过。他建议在任何协议达成之前,必须进行一系列具体修改,例如保证 “风险缓解” 不会被用来强制扫描,禁止基于人工智能的文本监控,以及保护匿名访问沟通工具的权利。

他总结道,这一提案是在 “出售安全” 的名义下,实际上却是在交付一个全面的监控机器,承诺儿童保护却惩罚了儿童并使隐私犯罪化。他认为,这不是妥协,而是对公民的欺诈,任何民主政府都不应成为这种行为的同谋。


HN 热度 806 points | 评论 328 comments | 作者:egorfine | 1 day ago #

https://news.ycombinator.com/item?id=45929511

  • 50% 的误报率在打击罕见犯罪如儿童性剥削的背景下看似良好,但实际意味着大量无辜者被错误牵连,造成严重社会伤害。
  • 当前自愿举报机制下误报率高达 48.3%,且未披露扫描消息总量,真实风险可能被低估,若强制推行将导致误报数量激增。
  • 负责审查儿童性虐待内容的工作人员面临巨大心理创伤,甚至出现辞职现象,说明此类工作对人性与心理健康具有毁灭性影响。
  • 尽管技术手段可提高检测效率,但无法解决系统性误报问题,且对无辜者的伤害可能远超对罪犯的打击效果。
  • 以保护儿童为名的监控措施可能造成大规模“误伤”,包括家庭破裂、名誉受损、财产被没收等,其代价远超合理范围。
  • 误报率 50% 意味着每拯救一个罪犯,就可能错误地摧毁另一个无辜者的正常生活,这种代价难以承受。
  • 以情感化理由(如儿童受害)为由推动大规模监控,实则是利用公众同情心掩盖系统性侵犯隐私的实质。
  • 真正的解决方案不应依赖技术监控,而应从根源上加强社会支持、心理干预和执法效率,而非牺牲全民隐私。

贫穷与身无分文的区别 (Being poor vs. being broke) #

https://blog.ctms.me/posts/2025-11-14-being-poor-or-being-broke/

本文作者 Dom Corriveau 深入探讨了“贫穷”与“暂时拮据”之间的本质区别,指出社会普遍误解了贫穷的真实状态。他强调,大多数人所谓的“建议”如“省钱”“自己动手”“找第二份工作”等,都是基于“暂时没钱”的经验,而这些对真正贫穷的人毫无意义。

贫穷不是短期的经济困难,而是一种持续、无解的生存状态。即使有技能,也无法通过“自己修车”节省开支,因为连 300 美元的零件钱都拿不出来。没有多余的钱储蓄或借贷,任何支出都可能带来毁灭性后果。所谓“努力就能改变命运”的说法,忽视了贫穷者每天面对的系统性困境。

作者以自己修车、做饭、应对食物银行排队等真实经历说明,贫穷者早已在生活上做到极致的节俭与自给自足,但这些努力无法带来根本改变。真正的贫穷是“永远没有喘息之机”,连希望都成为一种折磨。

最后,作者呼吁社会停止用“你不够努力”“你不够聪明”来归因贫穷,应真正理解贫穷是一种结构性的、长期的生存危机,而非个人失败。


HN 热度 547 points | 评论 640 comments | 作者:speckx | 1 day ago #

https://news.ycombinator.com/item?id=45928912

  • 贫困不仅仅是缺少金钱,更是一种持续的心理压力,使人对所有物品产生过度依赖,害怕丢弃任何可能有用的物件,甚至因小额债务而陷入无法挽回的恶性循环。
  • 贫困者常因无力支付小额罚款或债务而被迫失去重要物品,如工作用的交通工具或家族传承的无价之物,这些损失对心理和生活造成毁灭性打击。
  • 贫困经历会深刻影响人的财务观念,即使日后经济状况改善,仍会保持极度保守的消费和储蓄习惯,影响长期财富积累。
  • 债务追讨机制存在严重不公,例如拍卖债务人车辆所得远低于其实际价值,且追讨费用远超债务本身,导致债务人雪上加霜。
  • 债务追讨过程中,债权人和执行机构往往只关注流程完成,而非公平或合理,导致债务人失去基本生活保障,而追讨方却从中获利。
  • 一些人认为贫困是个人选择的结果,认为只要努力就能摆脱困境,这种观点忽视了结构性困境和心理创伤对人的影响。
  • 有人指出,贫困者并非完全无能为力,但社会系统设计本身对弱势群体极为不友好,使得自救变得异常困难。
  • 电影《好运》(Good Fortune)通过故事揭示了贫困者在系统性压迫下的挣扎,暗示社会需要更人性化的解决方案。

Bitchat for Gaza – 无互联网环境下的安全通信消息应用 (Bitchat for Gaza – messaging without internet) #

https://updates.techforpalestine.org/bitchat-for-gaza-messaging-without-internet/

Bitchat 是一款专为在无互联网或断电情况下仍能安全通信而设计的 messaging 应用,特别针对加沙地带的通信困境。由于以色列控制着加沙的电力、电信和互联网路由,频繁的网络中断和基础设施破坏导致当地居民无法与外界联系。同时,主流通信工具如 WhatsApp 存在数据泄露风险,可能被用于监控和定位,威胁用户安全。

Bitchat 通过蓝牙直连技术实现设备间的点对点通信,消息可在设备间接力传递,形成去中心化的本地通信网络,即使在完全断网时也能持续使用。所有消息均端到端加密,无中央服务器存储数据,用户无需注册、不需提供手机号或邮箱,也不依赖 SIM 卡。

应用支持“Geohash”位置频道,用户可创建或加入基于地理位置的聊天组,便于邻里间联络、协调救援、分享紧急信息。该功能在互联网恢复时也能通过全球中继网络发送消息至世界任何地方。

该应用已通过 Tech for Palestine(T4P)的安全评估,被认定为在通信中断环境下安全可靠的工具。T4P 社区成员也是其主要开发者之一。Bitchat 在尼泊尔、印度尼西亚、科特迪瓦、马达加斯加等发生社会动荡的国家也受到欢迎,成为民众应对网络封锁的替代方案。

使用建议:首次使用应更改默认用户名,通过面对面确认联系人身份以防止冒充。可将常用联系人设为“收藏”,并通过“/c”命令定期清除消息,避免设备被没收后信息泄露。建议搭配 Gaza Online 提供的可再生能源 eSIM 使用,以在断网时仍能恢复部分互联网接入。

Bitchat 是一个真正“抗以色列网络控制”的通信工具,致力于保障被封锁地区人民的基本沟通权利。


HN 热度 486 points | 评论 265 comments | 作者:ciconia | 1 day ago #

https://news.ycombinator.com/item?id=45929358

  • 以色列在战争初期摧毁了加沙的 Watan 塔,该建筑是多家互联网服务提供商和国际媒体机构的枢纽,此举严重破坏了加沙的互联网基础设施。
  • 加沙的网络中断并非偶然,而是系统性攻击的一部分,被国际组织视为侵犯人权的行为。
  • 尽管以色列声称此举是为了打击抵抗力量,但其行为在战争中常被用作掩盖真相的工具,导致大量无辜平民伤亡。
  • 与乌克兰相比,加沙的战争环境更为极端,儿童死亡比例极高,且平民伤亡远超乌克兰。
  • 有观点指出,加沙的儿童死亡数据需谨慎解读,原始数据来自特定群体(同事家庭),不能完全代表整个加沙。
  • 尽管战争环境恶劣,但仍有程序员在乌克兰坚持工作,说明在非战区或非极端环境下,正常工作仍有可能。
  • 乌克兰的战争虽带来干扰,但整体生活仍相对正常,而加沙的生存条件远超一般战争区域,极端危险且资源匮乏。
  • 有程序员分享在阿富汗的编程经历,指出在缺乏电力和基本生存资源的情况下,学习和工作极为困难,而加沙的条件可能更恶劣。
  • 一些人质疑将加沙与乌克兰对比是否合理,认为两者冲突性质、伤亡结构和人道危机程度差异巨大。
  • 有数据显示,加沙约 70% 的死亡为妇女和儿童,远高于乌克兰的类似比例,凸显加沙战争对平民的毁灭性影响。
  • 以色列的军事行动被批评为短期但极端暴力,其行为可能在历史上留下恶劣记录。

展示 HN:可搜索的艾普斯坦文件整理平台 (Show HN: Epstein Files Organized and Searchable) #

https://searchepsteinfiles.com/

网页标题为 “搜索爱泼斯坦档案”,主要功能是提供一个平台,用户可以搜索与爱泼斯坦相关的各种文件和信息。网站的描述指出这是一个旨在为所有受害者追求正义的搜索工具。

网页内容分为多个部分,主要包括以下几点:

  1. ** 搜索功能 **:用户可以搜索不同类型的文件,相关内容包括图片、人物、组织和国家等。

  2. ** 文件类型分类 **:

    • ** 电子邮件 **:2234 份文件
    • ** 文章 **:291 篇文件
    • ** 法律文件 **:82 份文件
    • ** 聊天记录 **:50 条记录
    • ** 数据文件 **:37 份
    • ** 书籍 **:25 本
    • ** 报告 **:22 份
    • ** 信件 **:11 封
    • ** 研究材料 **:10 份
    • ** 意见文章 **:9 篇
    • ** 提案 **:7 份
    • ** 访谈 **:6 个
    • ** 新闻 **:5 篇
    • ** 文字记录 **:5 份
  3. ** 内容标签 **:文件根据敏感性和影响力进行分类,包括 “最明确的内容”、“敏感内容”、“引人注目的内容” 和 “影响文件”。

  4. ** 版权信息 **:网站版权所有,日期为 2025 年,提供了联系信息。


HN 热度 300 points | 评论 52 comments | 作者:searchepstein | 1 day ago #

https://news.ycombinator.com/item?id=45931331

  • 这种逐步释放信息的“慢 drip”策略旨在逐步软化公众反应,使人们对事件的接受度逐渐提高,从而削弱可能引发的实质性社会反应。
  • 该策略类似于“单向停车道”,让支持者在不断暴露信息后更难撤回立场,从而巩固其支持。
  • 有人认为,缓慢释放信息可以对抗新闻周期的遗忘效应,使事件持续占据公众视野,避免被快速淹没。
  • 该策略在斯诺登事件中被证实有效,相比其他类似事件,能更持久地引发公众讨论。
  • 有人质疑,不应因信息释放方式不理想就拒绝查看或分析这些资料,这反而会削弱揭露真相的努力。
  • 有人指出,信息释放方式本身可能就是一种操控手段,需警惕其对公众认知的潜在影响。
  • 有人讽刺地质疑,难道一个为摩萨德工作的人不会留下任何未加密的邮件吗?暗示信息的真实性可能被质疑。
  • 有人提出,与其被动接受信息释放节奏,不如主动隐藏证据,以防止人们意识到自身在特定条件下也可能成为“怪物”。
  • 有人指出,这种信息释放模式常被用于让公众逐渐习惯,最终使事件变成“旧闻”,从而逃避问责。
  • 有人认为,政府可能以“正在调查民主党人”为由,继续拖延或阻止信息的完整公开。
  • 有人指出,Zeteo News 已发布可搜索的档案,通过谷歌工具实现对原始 PDF 文件的检索。
  • 有人建议搜索“erection”(勃起)一词,以发现其中一些令人震惊的内容。
  • 有人发现文档中包含一些令人不安的材料,例如关于 2016 年特朗普与“Katie Johnson”性侵指控的法院文件。
  • 有人批评文档中存在明显的粗心或懒惰的遮盖处理,例如用“______”代替姓名,但上下文仍可推测身份。
  • 有人指出,2016 年关于特朗普性侵的指控文件与本案无关,且该案件已被认定为虚假,原告从未公开露面。
  • 有人指出,该指控由《杰里·斯普林格秀》前制作人诺姆·卢博夫以化名“阿尔·泰勒”发起,他本人已承认虚构故事,但声称内容真实。
  • 有人感叹,尽管证据显示该指控是伪造的,但依然不断被重复传播,反映出人们更愿意相信政治对手是邪恶的。
  • 有人认为,这种虚假指控的持续传播,与当年对克林顿的阴谋论如出一辙,反映出公众对政治对手的偏见。
  • 有人指出,该文件早在 2016 年大选前就已公开,当时并未引发足够关注,如今也难以突破政治极化格局。
  • 有人认为,尽管信息量巨大,但主流媒体对此反应冷淡,公众讨论仍局限于极少数人,且多被政治立场主导。
  • 有人认为,随着 MAGA 群体内部的分化,核心支持者反而变得更极端、更坚定,导致舆论环境更加极化。
  • 有人指出,尽管证据充分,但主流社会对这些信息的反应极为冷淡,令人震惊,背后可能有强大的政治与媒体压制。
  • 有人认为,当前政府利用行政权力对媒体施压,阻止其报道可能不利的内容,形成“寒蝉效应”。
  • 有人认为,特朗普与马特·盖茨之间的裂痕可能成为其政治弱点,使其他政治人物更容易脱离其阵营。

Go 的甜蜜 16 岁 (Go’s Sweet 16) #

https://go.dev/blog/16years

Go 语言发布 16 周年,回顾了自 2009 年开源以来的持续发展与创新。2025 年,Go 1.24 和 Go 1.25 版本相继发布,延续了稳定的发布节奏,聚焦于提升开发效率、系统可靠性与安全性。

在核心语言与标准库方面,Go 1.25 正式推出 testing/synctest 包,显著简化了并发与异步代码的测试。该工具通过虚拟化时间机制,使原本缓慢且易出错的测试变得快速、稳定,仅需少量代码即可实现。同时,testing.B.Loop API 优化了基准测试,解决了传统 N API 的隐蔽问题。此外,新引入的 Context 清理与日志记录功能,进一步提升了测试代码的可维护性。

Go 与容器化技术深度结合,Go 1.25 引入容器感知调度,自动调整并行度,避免 CPU 限流,优化尾延迟,增强生产环境的开箱即用能力。新推出的飞行记录器(Flight Recorder)基于执行追踪,可在运行时捕获关键事件快照,为故障排查提供深入的动态行为分析。

在安全方面,Go 标准库的加密包经过独立安全审计,仅发现一个低危问题,表现优异。通过与 Geomys 合作,加密包已获得 CAVP 认证,为未来 FIPS 140-3 合规铺平道路,满足金融、政府等受监管领域的需求。同时,os.Root API 的引入,提供了防路径遍历的文件系统访问机制,有效防御特定类型的安全漏洞。

底层性能优化方面,Go 1.24 重构了 map 实现,采用前沿哈希表设计,显著提升性能、降低尾延迟,并在某些场景下节省内存。Go 1.25 引入实验性垃圾回收器“Green Tea”,可减少 10% 至 40% 的 GC 开销,未来在支持 AVX-512 指令集的硬件上还将进一步优化,预计在 Go 1.26 中默认启用。

在开发工具生态方面,gopls 语言服务器在过去一年内发布了四个版本,持续增强 VS Code 等编辑器的 Go 开发体验。新增多项代码分析、重构功能,以及对 Model Context Protocol(MCP)的实验性支持,使 AI 助手可调用 gopls 能力,推动智能编程辅助的发展。

整体来看,Go 在语言设计、安全性、性能与生态建设上持续进步,正积极应对生成式 AI 带来的挑战,致力于构建更高效、安全、可扩展的生产级软件平台。


HN 热度 286 points | 评论 216 comments | 作者:0xedb | 1 day ago #

https://news.ycombinator.com/item?id=45932962

  • Go 在单体仓库(monorepo)中使用非常方便,只需创建文件夹并添加 main.go 文件,通过 go install 即可快速编译所有项目,尤其适合快速构建 CLI 工具。
  • 相比其他语言,Go 的集成开发体验更优,其内置的构建、包管理、测试、格式化、性能分析等工具统一在一个二进制中,使用起来不臃肿且高效。
  • 虽然其他语言理论上也能实现类似便捷性,但实际中多数语言缺乏这种一体化的工具链设计,导致入门和开发体验远不如 Go。
  • C/C++ 虽然技术上可以做到类似功能,但依赖复杂的构建系统(如 make、CMake、autotools),在跨平台、依赖管理等方面体验极差,常陷入“构建地狱”。
  • 一些现代语言如 Deno、Bun 和 Rust 都借鉴了 Go 的设计理念,强调统一工具链和开箱即用的开发体验。
  • Python 社区也推出了 uv 等工具,试图向 Go 的工具链模式靠拢,说明 Go 的一体化开发理念已被广泛认可。
  • Go 的工具链虽好,但语言本身存在一些设计缺陷,如缺乏真正的枚举类型、切片操作隐含“魔法”、删除数组元素语法不直观。
  • Go 的 map 查找键是否存在语法清晰(value, exists := myMap[key]),但默认 JSON 库对空切片处理不当,序列化为 null,体验不佳。
  • Go 的错误处理机制(if err != nil)和代码规范(如禁止过多 if/else)虽保证了代码质量,但导致函数过度拆分,代码冗长,类似“企业级 Java”风格。
  • Go 的 lambda 语法冗长,panic 机制在库中滥用,影响代码健壮性,且包下载依赖内部代理时配置繁琐。
  • Go 的接口设计简洁,但使用时难以区分接口与结构体,缺乏类型信息,带来一定迷惑性。
  • Go 的 iter 包提供了迭代器支持,但语言本身未原生提供,仍需手动引入,使用不够自然。
  • Go 的语法简洁,上手快,适合快速开发,但牺牲了部分语言表达力,如缺乏泛型、结果类型、错误传播等特性。

TCP:互联网的基石 (TCP, the workhorse of the internet) #

https://cefboud.com/posts/tcp-deep-dive-internals/

本文探讨了 TCP 协议作为互联网核心传输协议的重要性与工作机制。作者以轻松幽默的笔调指出,尽管互联网底层网络环境不可靠,常出现丢包、乱序、拥塞等问题,但 TCP 通过可靠传输机制,确保了应用层数据的完整、有序与不重复,使得 HTTP、SMTP、SSH 等应用能够稳定运行。

文章首先解释了 TCP 存在的必要性:IP 层只能将数据包送达目标主机,而无法确保数据正确交付给具体的应用进程。TCP 通过端口机制实现进程间的通信,并在传输层提供可靠性保障,使开发者无需自行处理重传、校验和乱序等问题。

接着,文章深入讲解了 TCP 的两大核心机制——流量控制与拥塞控制。流量控制通过“窗口大小”字段,让接收方告知发送方当前可接收的数据量,防止接收缓冲区溢出;拥塞控制则通过“慢启动”“拥塞避免”等算法,避免网络过载,防止出现类似 1986 年“拥塞崩溃”的历史事件。

随后,作者通过 C 语言编写了一个简单的 TCP 回显服务器代码,展示了如何使用 socket API 实现网络通信,并通过 telnet 客户端进行测试。代码演示了 TCP 连接的建立、数据收发与连接关闭流程,同时揭示了 TCP 是全双工的,通信双方可自由发送数据,不局限于请求-响应模式。

最后,文章进一步扩展,实现了一个简易的 HTTP/1.1 服务器,能够响应客户端请求并返回标准 HTTP 响应头与内容,展示了 TCP 如何支撑更高层协议的运行。

全文通过理论结合实践的方式,生动展现了 TCP 如何在复杂网络环境中默默支撑起现代互联网的稳定运行,是一篇兼具技术深度与可读性的网络协议科普佳作。


HN 热度 275 points | 评论 137 comments | 作者:signa11 | 18 hours ago #

https://news.ycombinator.com/item?id=45935503

  • TCP 是在不可靠的数据报层上构建可靠数据流的最优解,其设计思想源于对可靠传输问题的深刻理解。
  • 传统 TCP 存在窗口大小受限、丢包处理效率低以及单流传输限制等缺陷,这些促使了 SCTP 和 QUIC 等新协议的发展。
  • 拥塞控制算法属于实现层面的逻辑,而非传输层协议本身,其目标是高效利用带宽并保证公平性。
  • 现代网络环境下,需要更先进的拥塞控制算法来应对大缓冲区、长往返时延和动态带宽变化等挑战。
  • 部分 Web 开发者因缺乏对连接管理的深入理解,倾向于创建大量连接而非合理使用多路复用,造成资源浪费。
  • 在早期技术条件下,通过 JavaScript 实现多任务下载队列并支持优先级和取消功能,能显著提升用户体验。
  • 即使在没有现代框架支持的时代,应用层的多路复用也能实现高效、智能的资源预加载与管理。
  • 将多路复用功能下放到传输层(如 HTTP/2、QUIC)比在应用层手动实现更合理、更高效。
  • QUIC 虽然目前主要以用户空间实现,但其实现复杂度并不高,完全可以在内核中实现。
  • 内核级 QUIC 实现对延迟和吞吐量并无实质提升,现有网络栈设计已足够,关键在于协议实现质量。
  • 浏览器作为复杂的操作系统,倾向于采用 QUIC,但这也导致其无法被内核有效监控和管理。
  • CDN 的主要价值在于边缘节点部署、隐藏后端、处理 TLS、过滤恶意流量等,而非单纯依赖缓存优化。
  • 当前浏览器出于隐私保护考虑,不再共享其他站点的缓存资源,使得 CDN 的缓存优势大幅减弱。
  • 大多数网站并不真正需要 CDN,其功能可由开发者自行实现,只是使用 CDN 更加便捷。
  • 早期浏览器通常限制每个主机最多 2-4 个并发连接,这促使开发者优化连接使用策略。
  • HTTP/2 支持在一个连接上多路复用多个流,提供比早期方案更精细的控制能力。
  • TCP 的可靠传输机制源自法国 Cylades 网络的启发,是 IP 网络中端到端可靠性的核心原则。
  • 尽管现代互联网存在延迟和抖动问题,但这是包交换技术胜利的代价,而电路交换可能带来更高的成本。

所有赞美献给午餐阿姨 (All praise to the lunch ladies) #

https://bittersoutherner.com/issue-no-12/all-praise-to-the-lunch-ladies

文章讲述了作者对祖母贝拉·库尔佩珀的回忆,她曾是美国南部一所小学的午餐阿姨,一生致力于为孩子们提供饱腹而有温度的餐食。尽管出身贫寒、仅有小学三年级学历,且从未学会开车,她却在 43 岁时开始在蓝岭小学担任午餐服务工作,一干就是近三十年。

祖母的厨房充满生活智慧:她用政府配给的加工奶酪(“政府奶酪”)制作美味的通心粉,用家中剩余的培根油调味豆类,坚持从头做起,哪怕面对预算限制和标准化流程的束缚。她不仅为学生提供食物,更以“情境伦理”为原则,悄悄给没有午餐费的孩子额外食物,甚至从后门递出餐食。她曾坚定回应批评:“我从不赚钱,也不亏钱,为什么不能让孩子们吃饱?”

作者回忆童年时,祖母的厨房是温暖的中心——那里有自制的汤、刚出炉的蛋糕、腌菜和手工饼干。她用爱与资源的智慧,将有限条件转化为滋养人心的日常。尽管作者从未从她那里学到具体食谱,但祖母的品格与对社区的关怀深深影响了她。

文章也转向当代学校午餐工作者,如田纳西州特伦顿的丽莎·斯通伯纳、杰克逊的珍奈·博克斯和阿拉巴马州的斯蒂芬妮·迪拉德。她们在资源有限、政策繁琐的环境中,依然坚持为学生提供健康、本地化、有温度的餐食,用行动延续着“午餐阿姨”的精神——一种不被看见却至关重要的社区守护。

全文致敬那些默默无闻却至关重要的人:她们用双手喂养孩子,用善意对抗贫困,用坚持诠释“爱”与“责任”的真正含义。


HN 热度 257 points | 评论 172 comments | 作者:gmays | 1 day ago #

https://news.ycombinator.com/item?id=45931403

  • 美国学校午餐工作人员在资源有限的情况下仍努力为学生提供营养均衡的餐食,其工作值得尊敬。
  • 一些学校在推行“Let’s Move”计划时引入低盐、全麦食品,但学生普遍不接受,导致大量食物浪费。
  • 低盐饮食在儿童中并不合理,因为儿童本身很少有高血压问题,过度限制盐分可能影响食欲和营养摄入。
  • 盐对食物风味至关重要,能激活味蕾,缺乏盐分会使食物显得平淡无味,影响进食体验。
  • 有观点认为,现代健康饮食中“低盐”是一种被过度推崇的潮流,类似过去“低脂”“高碳水”等被证实并不完全科学的饮食观念。
  • 一些家庭选择长期不加盐烹饪,发现食物依然美味,且对健康有益,但外出就餐时常因食物过咸而难以适应。
  • 盐在历史上具有重要地位,曾作为货币支付手段,甚至影响地名和词汇演变,如“salary”一词即源于“salt”。
  • 尽管有文献记载罗马士兵曾以盐作为薪酬,但缺乏考古证据支持,该说法仍存争议,更可能为货币支付。
  • 有争议观点认为,盐在古代对肉类保存至关重要,因此作为士兵的配给品具有实际意义,但货币支付更为高效和普遍。

AMD GPU 在 AI 计算中展现强大潜力,HipKittens 助力释放硬件性能 (AMD GPUs Go Brrr) #

https://hazyresearch.stanford.edu/blog/2025-11-09-amd-brr

AMD GPU 在 AI 计算中展现出强大的潜力,但其性能尚未被充分释放,主要受限于软件生态的不成熟。本文介绍了 HipKittens 项目,这是一个专为 AMD CDNA 架构 GPU 设计的编程原语集合,旨在帮助开发者充分发挥硬件性能。

AMD MI355X GPU 拥有 256 个计算单元(CUs),每个 CU 包含 4 个 SIMD,每个 SIMD 支持 64 线程的“wave”(对比 NVIDIA 的 32 线程 warp)。其内存层次结构包括私有 L2 缓存和共享的最后层级缓存(LLC),并采用芯片组(chiplet)设计,将 256 个 CUs 划分为 8 个 XCD,每个 XCD 有 32 个 CUs。尽管在 SRAM 容量、异步矩阵乘法指令、寄存器重分配和专用张量内存加速等方面不如 NVIDIA B200,但 AMD 在寄存器文件大小和处理器数量上具有优势,且支持更细粒度的矩阵核心指令。

在编程层面,HipKittens 通过“tiles”作为基本数据结构,支持在寄存器或共享内存中操作。开发者可使用类似 PyTorch 的函数如 exp、mma、add、row_max 等,结合模板元编程直接调用 CDNA 汇编指令,实现高效低开销的内核开发。

关键挑战包括:

  • 寄存器调度:HIPCC 编译器无法有效使用 AGPR(累加器通用寄存器)作为 MFMA 指令输入,导致性能下降。HipKittens 引入显式寄存器调度机制,允许开发者手动指定寄存器,绕过编译器限制。
  • 寄存器布局:与 NVIDIA 规则化的布局不同,AMD 的寄存器布局随数据类型和矩阵形状变化极大,无法使用统一的 swizzle 模式,需针对不同布局定制策略。
  • 指令执行阶段:AMD 的内存指令(如 ds_read_b128)在多个非连续阶段执行,与 NVIDIA 的顺序阶段不同,增加了编程复杂度。

此外,由于 AMD 采用 NUMA 式缓存架构,跨处理器调度任务时需考虑缓存一致性与数据局部性,避免性能下降。

总体而言,HipKittens 通过优化寄存器使用、适配 AMD 独特的内存与执行模型,提供了一套面向高性能 AI 计算的底层编程工具,使开发者能够更高效地利用 AMD GPU 的硬件能力。


HN 热度 248 points | 评论 87 comments | 作者:vinhnx | 23 hours ago #

https://news.ycombinator.com/item?id=45934416

  • 硬件公司应专注于硬件制造,以保持商业动机的纯粹性,即使接受 20% 的性能损失也在所不惜。
  • 硬件公司销售高阶芯片的动机并非纯粹,而是为了最大化利润,软件问题本质上是商业策略的一部分。
  • 现代芯片复杂度极高,除制造商外无人能编写出高效驱动程序,因此依赖厂商提供完整文档是必要的。
  • 即使没有官方文档,独立开发者仍可能通过逆向工程开发出高性能驱动,如 Alyssa Rosenzweig 对苹果 M1 GPU 的成功案例。
  • 开源社区在无报酬情况下也能开发出高质量软件,FOSS 历史已证明这一点,因此“无报酬则无好软件”的假设过时。
  • 企业不愿公开硬件文档,是因为这涉及商业机密与竞争劣势,且文档编写本身成本高昂,内部沟通更高效。
  • 逆向工程耗时极长,无法满足商业市场对快速迭代和产品上市时间的要求,不适合用于主流商业产品。
  • 硬件与软件团队之间存在“鸡生蛋蛋生鸡”的困境:硬件需要软件才能运行,但软件又需要硬件文档才能开发。
  • 企业若不公开文档,本质上是出于商业选择,而非技术不可行,这种封闭策略违背了开放协作的初衷。
  • 从数据中心规模来看,硬件与软件的封闭性导致整体资源效率下降,但企业仍不愿为此承担额外成本。
  • 尽管苹果 M 系列芯片在消费市场销量巨大,但其封闭性限制了在数据中心等领域的广泛应用。
  • 对于开发者而言,获取硬件文档的渴望是真实存在的,但市场体量决定了其仍属小众需求。

Hacker News 精彩评论及翻译 #

Our investigation into the suspicious pressure on … #

https://news.ycombinator.com/item?id=45936833

I don’t know anything about Adguard, but good on the team for doing the extra digging instead of just going along with the claim. Even better that they’re sharing what they’ve found with everyone else.

atomicfiredoll

我对Adguard一无所知,但团队没有轻信这一说法,而是进行了深入调查,这值得称赞。更棒的是,他们还将自己的发现分享给了大家。


AI World Clocks #

https://news.ycombinator.com/item?id=45931463

hi, I made this. thank you for posting.

I love clocks and I love finding the edges of what any given technology is capable of.

I’ve watched this for many hours and Kimi frequently gets the most accurate clock but also the least variation and is most boring. Qwen is often times the most insane and makes me laugh. Which one is “better?”

lanewinfield

你好,这是我做的。谢谢分享。

我喜欢钟表,也喜欢探索任何一项技术的能力极限。

我已经看了好几个小时了,Kimi 经常能给出最准确的时钟,但变化也最小,也因此最无聊。Qwen 则经常最疯狂,逗我笑。哪一个才是“更好”的呢?


Being poor vs. being broke #

https://news.ycombinator.com/item?id=45931955

its not uncommon to have the few worthwhile items you own being seized by bailifs to recoup debts, treasured heirlooms that cannot be replaced and have little monetary value so they do no impact to your debt. The hoarding of canned goods to avoid being unable to eat.

As a teenager I worked at a bailiffs in the office typing up the paperwork. One case that stuck was me was where the debtor owed somewhere around £400. The bailiff took a motorbike (or scooter) that could easily have covered the debt. It was sold at auction for £50. £35 bailiff fees for taking it there and £15 auctioneer fees, £0 off the debt. It was so unfair it should have been criminal.

dwedge

法警为追讨债务而扣押你仅有的几件贵重物品,这种情况并不少见。那些无法替代的珍贵传家宝,本身几乎没有经济价值,对偿还债务毫无作用。人们也会囤积罐头食品,以防挨饿。

我十几岁时在法警办公室工作,负责打字整理文件。有一个案子让我印象深刻,欠款人大约欠了400英镑。法警扣押了一辆摩托车(或踏板车),它的价值足以轻松还清这笔债务。但它最后在拍卖会上只卖到了50英镑。法警扣押和运送费35英镑,拍卖行手续费15英镑,债务一分未还。这太不公平了,简直是一种犯罪。


Unofficial Microsoft Teams client for Linux #

https://news.ycombinator.com/item?id=45935673

The official client is absolutely terrible. But, I’ve found a much better solution: I tell all my customers Microsoft Teams doesn’t work for us and they’ll have to pick something else.

Kudos for at least trying to address this, MS should hang their head in shame, this is not the hardest problem to solve these days. If we could do it in 1995 they should be able to do it 30 years later.

jacquesm

官方客户端简直烂透了。但是,我找到了一个更好的办法:我告诉我的所有客户,微软Teams对我们来说不适用,他们必须选择其他的工具。微软至少还试图解决这个问题,值得点赞,但他们真该感到羞愧,这在当今根本不是什么难以解决的问题。如果我们在1995年就能做到,那么30年后的他们理应也能做到。


AI World Clocks #

https://news.ycombinator.com/item?id=45934504

Clock drawing is widely used as a test for assessing dementia. Sometimes the LLMs fail in ways that are fairly predictable if you’re familiar with CSS and typical shortcomings of LLMs, but sometimes they fail in ways that are less obvious from a technical perspective but are exactly the same failure modes as cognitively-impaired humans.

I think you might have stumbled upon something surprisingly profound.

https://www.psychdb.com/cognitive-testing/clock-drawing-test

jdietrich

画钟测试被广泛用作评估痴呆症的一种方法。有时,大型语言模型的失败方式相当可预测,如果你熟悉CSS和LLM的典型局限性;但有时,它们从技术角度看失败的并不那么明显,其失败模式却与认知受损的人类完全相同。我认为你可能偶然发现了一些出人意料地深刻的东西。 https://www.psychdb.com/cognitive-testing/clock-drawing-test


Being poor vs. being broke #

https://news.ycombinator.com/item?id=45929284

I like this guy’s backstory[0].

I grew up in Africa. The poverty I saw, as a child, was foundational in my own personal development.

There are some places in the US, that have that kind of poverty, but I have not seen them, with my own eyes.

I have family that dedicated most of their life to fighting poverty (with very limited success). They believe that poverty is probably the single biggest problem in the world, today. Almost every major issue we face, can be traced back to poverty.

Income inequality is one thing, but hardcore poverty, as described by the author, is a different beast, and creates a level of desperation that is incredibly dangerous.

[0] https://blog.ctms.me/about/

ChrisMarshallNY

我喜欢这个人的背景故事[0]。

我在非洲长大。我童年时看到的贫困,对我个人的成长起到了奠基性的作用。

美国有些地方也有那样的贫困,但我没有亲眼见过。

我家人将大部分生命致力于与贫困作斗争(但成效甚微)。他们认为,贫困可能是当今世界最大的问题。我们面临的几乎所有重大问题,都可以追溯到贫困。

收入不平等是一回事,但作者所描述的那种极端贫困则是另一回事,它创造了一种极其危险的绝望感。


Our investigation into the suspicious pressure on … #

https://news.ycombinator.com/item?id=45937951

member of DNS4EU ops team here - This was not the case, we had reachability issues with the authoritative servers of archive.is and had to reach out to the team to allow our source IPs.

https://www.reddit.com/r/BuyFromEU/comments/1ohekv5/updatedns4eu_is_not_blocking_archive_today/

andronikos

我是 DNS4EU 运维团队的成员。情况并非如此,我们的服务器无法连接到 archive.is 的权威服务器,因此我们不得不联系对方团队,以将我们的源 IP 地址加入白名单。


AGI fantasy is a blocker to actual engineering #

https://news.ycombinator.com/item?id=45927408

I will go meta into what you posted here: That people are classifying themselves as “AI skeptics”. Many people are treating this in terms of tribal conflict and identity politics. On HN, we can do better! IMO the move is drop the politics, and discuss things on their technical merits. If we do talk about it as a debate, we can do it when with open minds, and intellectual honesty.

I think much of this may be a reaction to the hype promoted by tech CEOs and media outlets. People are seeing through their lies and exaggerations, and taking positions like “AI/LLMs have no values or uses”, then using every argument they hear as a reason why it is bad in a broad sense. For example: Energy and water concerns. That’s my best guess about the concern you’re braced against.

the__alchemist

我想从更高层面谈谈你提到的现象,即人们正在将自己归类为“人工智能怀疑论者”。很多人将此视为部落冲突和身份政治。在HN(Hacker News)上,我们可以做得更好!恕我直言,我们应该抛开政治立场,从技术本身的价值来讨论问题。如果我们确实要将其作为一场辩论来讨论,那么就应该本着开放的心态和理智诚实的原则来进行。

我认为,这在很大程度上可能是对科技公司CEO和媒体所宣传的炒作的一种反应。人们已经识破了他们的谎言和夸大宣传,并采取了“人工智能/大语言模型没有价值或用处”的立场,然后,他们将听到的每一个论点都当作其整体上是有害的证据。例如:能源和水资源方面的担忧。这便是我对你所准备应对的担忧的最好猜测。


HipKittens: Fast and furious AMD kernels #

https://news.ycombinator.com/item?id=45934212

Full disclosure, we have a contract with AMD to get Llama 405B training on MI350X on MLPerf.

Things are turning around for AMD. If you have an AMD card, go to pytorch.org, click Linux+ROCm and install PyTorch. 3 years ago, this was hopeless. Today, most mainline things work. I ran nanochat on MI300X and it just worked. I think that’s true about MI350X now too. The MI350X machine is stable.

They are clearly behind NVIDIA, nobody doubts that. And a lot of investment into software will be required to catch up, ecosystem, compiler, and driver. But 2 years ago they seemed hopeless, now they don’t. Things take time. HipKittens is a great codebase to study to see where AMD’s LLVM backend is still lacking; compare it to the CUDA Kittens.

For training, it’s NVIDIA and Google in first. AMD in second. And nobody in third. Intel and Tenstorrent are not remotely close. Huawei examples segfaulted. Groq gave up selling chips. Cerebras isn’t available anywhere. Trainium had a 5 day wait time to get one instance and I lost interest.

georgehotz

坦白说,我们与AMD签有合同,旨在MLPerf基准测试中使用MI350X进行Llama 405B模型的训练。

AMD的情况正在好转。如果你有AMD的显卡,可以访问pytorch.org,点击Linux+ROCm并安装PyTorch。三年前,这还毫无希望,现在大多数主流功能都能正常工作。我在MI300X上运行nanochat,它直接就跑起来了,我相信MI350X现在也是一样。MI350X机器很稳定。

他们显然落后于NVIDIA,这一点毋庸置疑。要追上来,AMD需要在软件生态系统、编译器和驱动程序上进行大量投资。但两年前他们看起来毫无希望,现在则不然。事情需要时间。HipKittens是一个很好的学习代码库,可以用来研究AMD的LLVM后端还缺少什么;可以将其与CUDA Kittens进行比较。

在训练领域,第一梯队是NVIDIA和Google,AMD在第二梯队,没有第三梯队。英特尔和Tenstorrent还差得远。华为的示例程序会段错误,Groq已经放弃销售芯片,Cerebras的产品哪里都买不到。Trainium需要等待5天才能获得一个实例,我就失去兴趣了。


Disrupting the first reported AI-orchestrated cybe… #

https://news.ycombinator.com/item?id=45924744

At this point they had to convince Claude—which is extensively trained to avoid harmful behaviors—to engage in the attack. They did so by jailbreaking it, effectively tricking it to bypass its guardrails. They broke down their attacks into small, seemingly innocent tasks that Claude would execute without being provided the full context of their malicious purpose. They also told Claude that it was an employee of a legitimate cybersecurity firm, and was being used in defensive testing.

Guardrails in AI are like a $2 luggage padlock on a bicycle in the middle of nowhere. Even a moron, given enough time, and a little dedication, will defeat it. And this is not some kind of inferiority of one AI manufacturer over another. It’s inherent to LLMs. They are stupid, but they do contain information. You use language to extract information from them, so there will always be a lexicographical way to extract said information (or make them do things).

This raises an important question: if AI models can be misused for cyberattacks at this scale, why continue to develop and release them? The answer is

Money.

0xbadcafebee

在这一点上,他们必须说服Claude——这个被广泛训练以避免有害行为的模型——参与攻击。他们通过“越狱”做到了这一点,有效地诱骗它绕过了其安全护栏。他们将攻击分解成一些看似无辜的小任务,Claude在未被告知其恶意目的的全部情况下就会执行这些任务。他们还告诉Claude,它是一家合法网络安全公司的员工,并且正在被用于防御性测试。

AI的安全护栏就像是放在荒郊野岭的一辆自行车上,挂着一个2美元的行李箱锁。只要有足够的时间和一点点毅力,即使是白痴也能破解它。这并非是某家AI制造商比其他制造商更优越的问题,这是大语言模型(LLMs)固有的问题。它们很愚蠢,但它们确实包含信息。你使用语言从它们身上提取信息,因此总会存在一种词汇层面上的方法来获取这些信息(或让它们执行某些操作)。

这引发了一个重要的问题:如果AI模型可以被滥用来发动如此规模的攻击,为什么我们还要继续开发和发布它们?答案是钱。


AGI fantasy is a blocker to actual engineering #

https://news.ycombinator.com/item?id=45927212

The language around AGI is proof, in my mind, that religious impulses don’t die with the withering of religion. A desire for a totalizing solution to all woes still endures.

lordleft

在我看来,关于AGI的言辞证明,宗教冲动并不会随着宗教的衰落而消亡。对解决一切苦难的包罗万象之方案的渴望仍然存在。


AI World Clocks #

https://news.ycombinator.com/item?id=45931435

Watching this over the past few minutes, it looks like Kimi K2 generates the best clock face most consistently. I’d never heard of that model before today!

Qwen 2.5’s clocks, on the other hand, look like they never make it out of the womb.

otterley

过去几分钟看下来,Kimi K2生成的钟面看起来最稳定最好。我今天之前都没听说过这个型号!Qwen 2.5的钟面呢,看起来像是永远没从子宫里出来。


I think nobody wants AI in Firefox, Mozilla #

https://news.ycombinator.com/item?id=45927629

I am a regular Firefox user; it is literally the tool I use most often during my working hours. I like it more than Chrome.

Firefox is steadily losing market share, and any attempts to do something about it are met with negativity. The 2-4% of users who use it care about their privacy. But they are not being deprived of it; the AI tab is optional, and no one is removing the regular tab. (Of course, it would be better if they allowed the integration of local models or aggregators, such as Openrouter, Huggingface…)

Meanwhile, developers continue to ignore Firefox, testing only Chromium browsers. Large companies are also choosing the Chromium engine for their browsers.

Perhaps if they implement this functionality conveniently, more average users will use Firefox.

railka

我是一个忠实的Firefox用户;它简直是我工作期间使用最频繁的工具。我比Chrome更喜欢它。

Firefox的市场份额正在稳步下降,而任何试图挽回局面的努力都遭到了负面评价。使用它的用户(占2-4%)非常关心自己的隐私。但他们的隐私并没有被剥夺;AI标签页是可选的,也没有人会移除常规标签页。(当然,如果能允许集成本地模型或聚合器,比如Openrouter、Huggingface……那就更好了。)

与此同时,开发者们继续忽视Firefox,只测试基于Chromium的浏览器。大公司也在为其浏览器选择Chromium引擎。

也许,如果他们能方便地实现这一功能,就会有更多普通用户使用Firefox。


I think nobody wants AI in Firefox, Mozilla #

https://news.ycombinator.com/item?id=45927448

I think “nobody i know” and nobody are different things. Mozilla wants more firefox users. there are “AI browsers” and ai integrated browsing is becoming more and more the norm. Mozilla is doing the right thing here, the features are there but unobtrusive. But down the road, I fully expect Mozilla to do whatever they have to do to remain in the game. Their small market share is hurting the entire internet, they can’t afford to become a browser for retro-techo-luddites or something.

notepad0x90

我认为“我认识的没人”和“没人”是两码事。Mozilla想要更多的Firefox用户。现在有“AI浏览器”,而集成AI的浏览方式正变得越来越普遍。Mozilla在这里做了正确的事情,这些功能已经具备,而且不显眼。但从长远来看,我完全预计Mozilla会做任何他们必须做的事情来保持在竞争中。他们的小市场份额正在损害整个互联网,他们不能沦为某种反科技的顽固派使用的浏览器。


Our investigation into the suspicious pressure on … #

https://news.ycombinator.com/item?id=45936869

Its interesting that being unable to find a legal route to dig up dirt on archive.is, they’re going the route of CSAM allegations.

I first heard of this technique on a discussion on Lowendtalk from a hoster discussing how pressure campaigns were orchestrated.

The host used to host VMs for a customer that was not well liked but otherwise within the bounds of free speech in the US (I guess something on the order of KF/SaSu/SF), so a given user would upload CSAM on the forum, then report the same CSAM to the hoster. They used to use the same IP address for their entire operation. When the host and the customer compared notes, they’d find about these details.

Honestly at the time I thought the story was bunk, in the age of residential proxies and VPNs and whatnot, surely whoever did this wouldn’t just upload said CSAM from their own IP, but one possible explanation would be that the forum probably just blocked datacenter IPs wholesale and the person orchestrating the campaign wasn’t willing to risk the legal fallout of uploading CSAM out of some regular citizen’s infected device.

In this case, I assume law enforcement just sets up a website with said CSAM, gets archive.is to crawl it, and then pressurize DNS providers about it.

supriyo-biswas

有趣的是,当无法通过合法途径挖出 archive.is 的黑料时,他们竟选择了 CSAM 指控这条路。

我第一次听说这种手法,是在 Lowendtalk 上的一场讨论中,一位主机托管商分享了他们是如何策划施压活动的。

该主机商曾为一个不受欢迎、但内容在美国言论自由范围内的客户(我猜大概是 KF/SaSu/SF 这类网站)托管虚拟机。于是,某个用户就会在论坛上传 CSAM,然后再向主机商举报这些内容。他们过去总是用同一个 IP 地址进行整个操作。当主机商和客户对信息时,就会发现这些细节。

老实说,我当时觉得这个故事是胡说八道。在这个住宅代理和 VPN 等技术盛行的时代,做这种事的人肯定不会用自己的 IP 地址上传那些 CSAM。但一个可能的解释是,该论坛可能直接封禁了所有数据中心 IP,而策划这场活动的人不愿冒风险,通过某个普通公民被感染的设备来上传 CSAM 而承担法律后果。

在这种情况下,我推测执法机构只是建立了一个包含这些 CSAM 的网站,让 archive.is 来抓取,然后就此向 DNS 提供商施压。


Oracle hit hard in Wall Street’s tech sell-off ove… #

https://news.ycombinator.com/item?id=45929120

Unfair. Oracle excels at some things, like extortion, blackmailing and litigation.

foofoo12

不公平。甲骨文公司擅长某些事情,比如敲诈、勒索和诉讼。


Lawmakers want to ban VPNs #

https://news.ycombinator.com/item?id=45926826

I’m reminded of efforts in the 1990s to ban strong encryption in email and websites because governments tried to tell us it was used by drug dealers and pedos to do their nefarious activities.

Yes, governments really did want to force us to use HTTPS with only broken/weak crypto.

Same propaganda, different buzzwords.

cornonthecobra

这让我想起了90年代那些试图禁止电子邮件和网站使用强加密的企图,因为政府当时试图告诉我们,强加密被毒贩和恋童癖者用来进行他们的邪恶活动。

没错,政府当时确实曾想强迫我们使用仅有被破解或弱加密的HTTPS。

同样的宣传,只是换了流行词而已。


TCP, the workhorse of the internet #

https://news.ycombinator.com/item?id=45936004

If you start with the problem of how to create a reliable stream of data on top of an unreliable datagram layer, then the solution that comes out will look virtually identical to TCP. It just is the right solution for the job.

The three drawbacks of the original TCP algorithm were the window size (the maximum value is just too small for today’s speeds), poor handling of missing packets (addressed by extensions such as selective-ACK), and the fact that it only manages one stream at a time, and some applications want multiple streams that don’t block each other. You could use multiple TCP connections, but that adds its own overhead, so SCTP and QUIC were designed to address those issues.

The congestion control algorithm is not part of the on-the-wire protocol, it’s just some code on each side of the connection that decides when to (re)send packets to make the best use of the available bandwidth. Anything that implements a reliable stream on top of datagrams needs to implement such an algorithm. The original ones (Reno, Vegas, etc) were very simple but already did a good job, although back then network equipment didn’t have large buffers. A lot of research is going into making better algorithms that handle large buffers, large roundtrip times, varying bandwidth needs and also being fair when multiple connections share the same bandwidth.

gsliepen

如果你从“如何在不可靠的数据报层之上创建一个可靠的数据流”这个问题出发,那么得出的解决方案将几乎与TCP完全一样。这就是解决这个问题的正确方法。

最初TCP算法有三个缺点:窗口大小(其最大值对于当今的网络速度来说太小了)、对丢失数据包的处理不佳(这一问题通过选择性确认等扩展方式得以解决),以及它一次只能管理一个数据流,而某些应用程序需要多个互不阻塞的数据流。你可以使用多个TCP连接,但这会增加自身的开销,因此SCTP和QUIC被设计出来以解决这些问题。

拥塞控制算法并非线协议的一部分,它只是连接两端的一些代码,用于决定何时(重新)发送数据包,以充分利用可用带宽。任何在数据报之上实现可靠数据流的技术都需要实现这样一种算法。最初的那些算法(如Reno、Vegas等)非常简单,但已经做得很好了,尽管当时的网络设备没有大的缓冲区。目前有大量研究致力于开发更好的算法,以处理大缓冲区、大往返时间、多变的带宽需求,以及在多个连接共享同一带宽时保证公平性。


The disguised return of EU Chat Control #

https://news.ycombinator.com/item?id=45930546

The right to privacy is enshrined in the European Convention on Human Rights, article 8 [0].

It escapes me how politicians can repeatedly attempt to violate this.

[0] https://fra.europa.eu/en/law-reference/european-convention-human-rights-article-8-0

pcrh

隐私权载于《欧洲人权公约》第8条[0]。

我实在不明白政治家们为何能反复试图违反这一点。


Why I’m Learning Sumerian #

https://news.ycombinator.com/item?id=45924596

…Sumerian, written in cuneiform, was humanity’s first writing system. A language that hasn’t been spoken in four thousand years. The same question circles again: Why am I doing this? Why am I trying to learn Sumerian, a language that hasn’t been spoken for five thousand years?… Watch out reader, by the end it maybe indeed turn out that Sumerian hasn’t been spoken for 10, 20, or 30 thousand years. The LLM just doesn’t know what sounds better.

alex_young

…苏美尔语,用楔形文字书写,是人类最早的书写系统,一种已有四千年未被使用的语言。 同样的问题再次萦绕:我为什么要这么做? 我为什么要努力学习苏美尔语,一种已有五千年未被使用的语言?… 请注意,读者,到最后可能会发现,苏美尔语其实已经有一万年、两万年甚至三万年没有被使用了。这个大语言模型根本不知道哪个说法更好听。


Go’s Sweet 16 #

https://news.ycombinator.com/item?id=45933368

I know they say that your programming language isn’t the bottleneck, but I remember sitting there being frustrated as a young dev that I couldn’t parse faster in the languages I was using when I learned about Go.

It took a few more years before I actually got around to learning it and I have to say I’ve never picked up a language so quickly. (Which makes sense, it’s got the smallest language spec of any of them)

I’m sure there are plenty of reasons this is wrong, but it feels like Go gets me 80% of the way to Rust with 20% of the effort.

Xeoncross

我知道他们总说编程语言本身不是瓶颈,但作为一个初出茅庐的开发者,当我了解到 Go 时,我清楚地记得自己曾因在使用其他编程语言时解析速度不够快而感到沮丧。

过了几年我才真正开始学习 Go,不得不说,我从没这么快掌握过一门编程语言。(这很合理,在所有语言中,Go 的语言规范是最小的。)

我肯定有很多理由可以反驳这一点,但感觉上,Go 能让我用 20% 的努力就达到 Rust 80% 的效果。


A new Google model is nearly perfect on automated … #

https://news.ycombinator.com/item?id=45932816

I really hope they have because I’ve also been experimenting with LLMs to automate searching through old archival handwritten documents. I’m interested in the Conquistadors and their extensive accounts of their expeditions, but holy cow reading 16th century handwritten Spanish and translating it at the same time is a nightmare, requiring a ton of expertise and inside field knowledge. It doesn’t help that they were often written in the field by semi-literate people who misused lots of words. Even the simplest accounts require quite a lot of detective work to decipher with subtle signals like that pound sign for the sugar loaf.

Whatever it is, users have reported some truly wild things: it codes fully functioning Windows and Apple OS clones, 3D design software, Nintendo emulators, and productivity suites from single prompts.

This I’m a lot more skeptical of. The linked twitter post just looks like something it would replicate via HTML/CSS/JS. Whats the kernel look like?

throwup238

我真心希望它能做到,因为我也一直在尝试利用大语言模型(LLM)来自动搜索旧的手写档案文件。我对征服者(Conquistadors)和他们详尽的探险记录很感兴趣,但我的天,同时阅读16世纪的手写西班牙语并进行翻译简直是场噩梦,这需要海量的专业知识和领域内知识。更糟糕的是,这些文件通常是由半文盲的人在野外仓促写就,还误用了很多词汇。即使是最简单的记录,也需要进行大量的考证工作才能解读,比如那个表示糖块的磅号,就需要仔细辨别。

不管怎样,用户报告了一些匪夷所思的事情:仅凭一个提示,它就能编写出功能完备的Windows和苹果操作系统克隆版、三维设计软件、任天堂模拟器以及办公套件。

对此我则要怀疑得多。链接中的推特帖子看起来就像是它用HTML/CSS/JS复刻出来的东西。它的内核长什么样呢?


AGI fantasy is a blocker to actual engineering #

https://news.ycombinator.com/item?id=45926946

It is ultimately a hardware problem. To simplify it greatly, an LLM neuron is a single input single output function. A human brain neuron takes in thousands of inputs and produces thousands of outputs, to the point that some inputs start being processed before they even get inside the cell by structures on the outside of it. An LLM neuron is an approximation of this. We cannot manufacture a human level neuron to be small and fast and energy efficient enough with our manufacturing capabilities today. A human brain has something like 80 or 90 billion of them and there are other types of cells that outnumber neurons by I think two orders of magnitude. The entire architecture is massively parallel and has a complex feedback network instead of the LLM’s rigid mostly forward processing. When I say massively parallel I don’t mean a billion tensor units. I mean a quintillion input superpositions.

And the final kicker: the human brain runs on like two dozen Watts. An LLM takes a year of running on a few MW to train and several KW to run.

Given this I am not certain we will get to AGI by simulating it in a GPU or TPU. We would need a new hardware paradigm.

IgorPartola

归根结底,这是一个硬件问题。为了简化,大型语言模型的神经元是一个单输入单输出的函数。人脑神经元接收数千个输入并产生数千个输出,其程度之深,以至于一些输入甚至在进入细胞之前,就被细胞外的结构开始处理了。大型语言模型的神经元是对此的一种近似。以我们目前的技术能力,我们还无法制造出足够小、足够快、足够节能的人脑级别神经元。人脑大约有800亿到900亿个神经元,还有其他类型的细胞数量是神经元的100倍(我想是两个数量级)。整个架构是大规模并行处理的,并且拥有复杂的反馈网络,而不是大型语言模型那种僵化的、主要是前向的处理方式。当我说“大规模并行”时,我不是指十亿个张量单元,而是指千万亿级的输入叠加状态。

最后一点:人脑的运行功耗大约只有几十瓦。训练一个大型语言模型需要以几兆瓦的功率运行一整年,而运行则需要几千瓦的功率。

鉴于此,我不确定我们通过在GPU或TPU上模拟就能实现通用人工智能。我们需要一种新的硬件范式。