2026 02 18 HackerNews

2026-02-18 Hacker News Top Stories #

  1. 作者分享从苹果转向 GrapheneOS 的体验,介绍其基于 AOSP 的隐私与安全设计、仅支持 Pixel 的硬件依赖、安装与锁定引导、应用隔离实践,并推荐 Pixel 9a 作为入门机型以支持去中心化移动生态。
  2. 14 岁米尔斯·吴通过改进三浦折纸并做大量载重测试,发现一种变体可承受自重超 10000 倍,建议将此轻便易展的结构用于应急避难所并获得青少年创新大奖。
  3. 美国执法通过分析暗网上虐待图像中露出的砖墙细节并跨领域求证,成功缩小排查范围并解救被长期虐待的女孩,展现细节观察与协作破案的价值。
  4. 因担心触发 FCC 的“平等时间规则”,CBS 未在节目中播出科尔伯特对德州众议员塔拉里科的完整采访,引发关于媒体自我审查与政治压力的讨论。
  5. 文章回顾 Triforce(将 GameCube 主板改装为街机平台)的技术与合作背景,指出其虽具创新但未能逆转街机衰落,反映产业转型与 Sega 的困境。
  6. 作者警告大量低质量的 AI 生成代码、错误报告和虚假引用正淹没开源社区,消耗维护者精力且模型能力尚不足以替代人工审查。
  7. Show HN 投稿量激增与大量 AI 辅助、拼接式项目涌入导致优质项目曝光与讨论减少,呼吁为有潜力的作品创造更多可见性以维护社区深度。
  8. SkillsBench 基准表明:精选的小而专注技能能显著提升智能体在部分领域的通过率,但自动生成技能总体无益且技能效果在不同领域差异巨大。
  9. 作者提出“语法特权”概念:社会地位高者在书写沟通上享有宽容,语言不完美反而成为一种隐形特权,暴露权力与沟通宽容度的不平等。
  10. 作者主张优先使用开放协议(如 IRC、XMPP、ActivityPub 等)而非依赖中心化服务以避免审查与锁定,但承认去中心化在用户体验、反垃圾和普及上存在明显挑战。

GrapheneOS——摆脱谷歌与苹果的束缚 (GrapheneOS – Break Free from Google and Apple) #

https://blog.tomaszdunia.pl/grapheneos-eng/

本文是博主 Tomasz Dunia 关于使用 GrapheneOS 操作系统的深度体验与技术分享。作者曾长期使用苹果生态,但通过租赁三星 Galaxy Z Fold 6 体验了折叠屏手机后,开始重新审视 Android 系统。在了解到法国政府试图干预 GrapheneOS 项目以获取用户数据后,作者被其高度安全与隐私保护的理念吸引,决定尝试这一替代系统。

GrapheneOS 是基于 AOSP 的开源操作系统,专注于安全与隐私,完全移除了 Google 服务,通过内核加固、沙箱运行 Google Play 服务等方式提升安全性。目前仅官方支持 Google Pixel 系列设备,因其具备 Titan M 安全芯片、Verified Boot、IOMMU 和 MTE 等关键安全特性。

作者选择 Pixel 9a 作为测试设备,主要因其价格合理(约 450 美元)、支持周期长达七年,且是当时最新支持机型。尽管其拍照性能不如 iPhone 15 Pro 和 Galaxy Z Fold 6,但电池续航和整体性能令人满意。

文章详细介绍了安装 GrapheneOS 的全过程:解锁 Bootloader、下载官方镜像、刷入系统、重新锁定 Bootloader,并强调了恢复 OEM 锁的重要性以确保系统完整性。

作者在使用中建立了“额外用户配置文件”和“私密空间”,实现应用隔离与权限精细化控制。他已验证多个主流应用在无 GMS 环境下仍可正常运行,并推荐使用 Aurora Store 作为应用商店。

总结认为,GrapheneOS 提供了对设备与数据的完全掌控,是追求隐私与安全用户的理想选择。作者呼吁读者支持该项目,并推荐初学者从 Pixel 9a 等推荐机型入手,开启去中心化移动生态的探索之旅。


HN 热度 1059 points | 评论 752 comments | 作者:to3k | 15 hours ago #

https://news.ycombinator.com/item?id=47045612

  • 使用 GrapheneOS 一年后,整体体验良好,尽管部分功能如 Google Tap to Pay 无法使用,但 Vipps 的 Tap to Pay 和 BankID 等仍可正常使用,仅在生物识别登录时存在限制。
  • 银行应用对非官方系统(如 GrapheneOS)的限制不合理,因为用户在 Linux 等系统上也能安全访问银行服务,而这些系统反而被认为更安全。
  • 有开发者指出,银行安全审计最关注的问题是“手机已 root”,这属于典型的“安全表演”行为,实际开发中根化设备常用于测试和调试。
  • 一些人质疑银行为何不检查设备的安全补丁更新级别,而是简单禁止非官方系统,认为这忽视了大量未更新设备的实际风险。
  • 有观点认为,运行未知操作系统的设备比多年未更新的设备更具威胁性,因为恶意操作系统可能植入证书进行中间人攻击,而银行依赖厂商提供的信任链。
  • 银行担心的是应用被篡改或凭证窃取,因此需要通过硬件可信链确保应用未被修改,而非单纯关注设备是否更新。
  • 尽管 Android 提供了获取安全补丁级别的接口,但银行并不真正依赖这些信息,因为它们更关心用户能否正常操作,避免客户投诉。
  • 事实上,大多数安卓恶意软件可在未修改的原生系统上运行,只需诱导用户授予辅助功能权限即可,因此防根化措施效果有限。
  • 某些企业级应用(如 Microsoft Authenticator)可通过策略阻止旧版本设备登录,说明技术上可行,但银行通常不愿实施以避免影响用户体验。
  • 有人批评审计流程形同虚设,合规团队与审计人员互相敷衍,只为了应付检查,缺乏真正的安全意识。
  • 安全措施往往只是“自保式安全”,一旦发生攻击,可以推脱责任称已通过审计,实则并无实质防护作用。
  • 金融行业推动建立从服务到屏幕的“安全链”,背后可能是将成本转嫁给用户,而非真正防止账户被盗。

14 岁少年米尔斯·吴的折纸结构承重达自身重量 10000 倍 (14-year-old Miles Wu folded origami pattern that holds 10k times its own weight) #

https://www.smithsonianmag.com/innovation/this-14-year-old-is-using-origami-to-design-emergency-shelters-that-are-sturdy-cost-efficient-and-easy-to-deploy-180988179/

14 岁的纽约中学生米尔斯·吴(Miles Wu)凭借一项基于折纸技术的创新项目,荣获 2025 年赛默飞世尔科学青少年创新挑战赛(Thermo Fisher Scientific Junior Innovators Challenge)最高奖项,获得 2.5 万美元奖金。

吴在研究日本天体物理学家三浦公亮发明的“三浦折纸”(Miura-ori)模式时,发现其具有极强的承重能力。他通过计算机设计了 54 种变体,并用复印纸、轻卡纸和重卡纸进行了 108 次折叠与测试。实验中,他将每块 64 平方英寸的折纸结构置于 5 英寸间距的导轨之间,逐步加压直至破裂。

令人震惊的是,最强的折纸结构能承受超过自身重量 10,000 倍的重量,相当于一辆纽约出租车承载超过 4000 头大象的重量。这一发现使他意识到,这种结构可用于紧急避难所的快速部署,兼具坚固、轻便、低成本和易展开等优点。

吴将家庭客厅改造为实验空间,为减少人为误差,使用专业折叠机进行操作。在家中原有物品无法达到极限承重后,他请求父母购买 50 磅的健身哑铃进行测试。

他的项目不仅展现了对传统折纸艺术的深入探索,更将其转化为解决现实问题的工程方案。评委特别赞赏他将个人兴趣转化为严谨科研的能力,以及在团队挑战中运用折纸原理设计可移动蟹爪装置时展现的创造力与协作精神。

该赛事由科学协会(Society for Science)主办,自 1999 年起致力于发掘美国青少年中的科学领袖。吴的项目体现了古老艺术与现代工程的融合,为灾害应急设施设计提供了全新思路。


HN 热度 893 points | 评论 194 comments | 作者:bookofjoe | 1 day ago #

https://news.ycombinator.com/item?id=47038546

  • 14 岁少年的成就不应只关注年龄,而应重视其 6 年持续投入的 passion 和积累。
  • 儿童时期学习效率更高,因大脑具有更强的神经可塑性,但成年后知识积累更多,可弥补学习速度的下降。
  • 成年后学习新技能虽慢,但只要从基础开始,仍可高效掌握,现代学习工具降低了学习门槛。
  • 成人学习受限于心理能量的有限性,工作和生活压力会消耗大量认知资源,影响学习效率。
  • 精力管理比单纯时间投入更重要,应选择精力充沛的时段进行学习,如早晨。
  • 随着年龄增长,学习速度可能下降,但经验和耐心能帮助更深入理解复杂问题。
  • 有研究显示,补充肌酸可能有助于提升大脑认知表现,尤其在睡眠不足或饮食不均衡时。
  • 肌酸效果因人而异,若饮食中已摄入足够肉类,补充可能无明显改善。

暗网线索揭示卧室砖墙,助警方解救遭虐待女孩 (Dark web agent spotted bedroom wall clue to rescue girl from abuse) #

https://www.bbc.com/news/articles/cx2gn239exlo

一名 12 岁女孩“露西”长期遭受性虐待,其受虐图像在暗网中传播。美国国土安全部调查局的专家格雷格·斯奎尔带领团队展开调查,但最初因图像被刻意模糊处理而陷入僵局。

尽管无法通过面部识别锁定露西,团队从房间细节入手分析:床单、玩具、家具等。他们发现一张沙发在特定地区销售,由此锁定约 4 万潜在客户,范围仍过于广泛。

关键线索来自露西卧室中的一堵露出的砖墙。斯奎尔通过网络搜索,联系到美国砖业协会,最终找到一位拥有 40 年经验的砖块专家约翰·哈普。哈普认出这堵墙使用的是 20 世纪 70 至 80 年代生产的“火焰阿拉莫”砖,且这种砖因重量大,通常只在本地销售。

这一信息极大缩小了排查范围——仅保留距离砖厂 100 英里内的客户。团队进一步通过社交平台查找这些人的信息,最终发现一名女性与露西出现在同一张照片中,其住址被确认。

通过该地址,调查人员查到该家庭中有一名有性侵前科的男友。警方迅速行动,成功逮捕嫌疑人,他被判处超过 70 年监禁。露西被解救,脱离了长达六年的虐待。

此案揭示,破案往往不依赖尖端技术,而是依靠对细节的敏锐观察和跨领域协作。


HN 热度 550 points | 评论 338 comments | 作者:colinprince | 1 day ago #

https://news.ycombinator.com/item?id=47042396

  • 性犯罪者登记制度仅在有人主动查询时才有效,且存在过度扩张的问题,部分人因轻微行为如公共场所裸露或青少年恋爱关系被登记,导致不公平后果。
  • 登记制度的执行过于粗放,一些人因非严重行为被永久标记,影响其住房、就业等基本生活权利,甚至被迫居住在条件恶劣的地下营地。
  • 有案例显示,因公共场合小便或青少年正常恋爱关系被定罪并登记,反映出法律执行的不合理与严苛。
  • 一些人因登记而难以获得合法住所,导致无家可归,甚至因违反假释条款而再次入狱,制度设计存在严重缺陷。
  • 有评论指出,媒体对知名性侵案(如吉米·萨维尔)的长期掩盖,暴露出系统性失职,与当前对性犯罪者的过度标签化形成对比。
  • 个人在恋爱关系中难以主动核查对方背景,尤其当对方表现正常时,不能苛责受害者缺乏警惕。
  • 一些人因在非官方认可的“裸体海滩”出现而被登记,这反映了法律执行中的灰色地带和执法不一致问题。
  • 有观点认为,性犯罪者登记制度对真正危险的罪犯威慑力有限,而对边缘案例的惩罚却过于严厉,造成社会资源错配。

CBS 未播出塔拉里科采访因担忧 FCC 规则 (CBS didn’t air Rep. James Talarico interview out of fear of FCC) #

https://www.nbcnews.com/business/media/stephen-colbert-cbs-james-talarico-fcc-rcna259341

CBS 未播出《深夜秀》主持人斯蒂芬·科尔伯特对德克萨斯州众议员詹姆斯·塔拉里科的采访,引发争议。科尔伯特在节目开场时透露,CBS 法律团队明确告知他无法播出该采访,甚至不能提及此事。他随后在 YouTube 上发布了未播出的完整采访视频。

采访中,塔拉里科讨论了联邦通信委员会(FCC)对 ABC《观点》节目展开调查一事,该调查源于他曾在该节目露面。他批评特朗普政府试图压制言论自由,称“这是来自顶层的最危险的取消文化”,并指出特朗普党正在牺牲第一修正案以讨好腐败政客。

CBS 回应称,未播出采访并非因被禁止,而是出于法律考量:该采访可能触发 FCC 的“平等时间规则”,即若播出一位候选人,必须为其他候选人提供同等播出机会。为避免合规问题,节目选择通过 YouTube 发布采访,并在节目中进行宣传。

FCC 主席布伦丹·卡爾此前曾警告媒体,可能取消对政治访谈的例外条款,引发争议。科尔伯特讽刺卡爾的动机是政治打压,称特朗普政府试图压制任何批评他的电视言论。

FCC 唯一民主党委员安娜·戈麦斯批评 CBS 的决定是“企业屈服于政治压力”的又一例证,强调 CBS 作为媒体机构,依据第一修正案有权自主决定内容,不应受行政干预。

此前,ABC 也曾因吉米·金马尔对保守派活动家查理·柯克遇刺案的评论,短暂停播其节目,引发舆论关注。


HN 热度 448 points | 评论 210 comments | 作者:theahura | 9 hours ago #

https://news.ycombinator.com/item?id=47049426

  • 转型为威权主义往往始于对媒体所有者的恐吓,使其自我审查,而无需直接的官方 censorship。
  • 恐惧是有效的执行机制,因其难以在法庭上被挑战。
  • 科技界应反思现状,停止任何可能资助马斯克、埃里森或泰尔的行为。
  • 冷静效应在司法实践中长期被视为违宪伤害,但当前司法系统对此类问题关注不足。
  • 一旦制度性机构失守,仅能依靠社会压力来应对,但这需要达到临界规模才能产生网络效应。
  • 面对政府对社交媒体平台施加的压力,如疫情期间要求压制特定内容,企业选择服从而非抗争。
  • 政府并未直接威胁平台,而是通过表达“强烈不满”等方式施压,但其影响仍不可忽视。
  • 不同政治派别均曾试图通过软性手段压制异议声音,这表明问题具有跨党派性质。
  • 将政府施压与个人威胁混为一谈是误导性的,例如特朗普对扎克伯格的威胁不应等同于政策施压。
  • 在疫情期间,主流平台对科学争议观点(如实验室泄漏假说)也进行了广泛压制,不仅限于虚假信息。
  • 真正的科学与民主需要允许质疑和不同意见的自由对话,一旦建立审查机制,便易被滥用。
  • 实际上,疫情期间存在大量公开讨论,包括对政府立场的质疑,且许多观点未被删除。
  • 平台出于保护用户生命安全以维持商业利益的动机,主动限制有害内容,而非响应政府指令。
  • 政府虽未直接命令,但确实向科技公司施压,要求其调整内容策略,尤其在疫情关键时期。

三叉戟的崛起 (Rise of the Triforce) #

https://dolphin-emu.org/blog/2026/02/16/rise-of-the-triforce/

本文讲述了 20 世纪 90 年代末至 21 世纪初,随着家用游戏机技术的飞速发展,街机行业逐渐衰落的历史背景,以及 Sega、Nintendo 和 Namco 三大公司为振兴街机而合作开发的“Triforce” arcade 平台的诞生过程。

在 90 年代初期,街机凭借强大的硬件和高水准的 3D 图形技术,远超家用主机。然而,随着第五代家用主机(如 Dreamcast 和 PlayStation 2)引入了原本仅限于街机的 3D 功能,家用游戏体验迅速逼近甚至超越街机,导致玩家不再愿意投入硬币去街机厅。

Sega 在这一时期遭遇严重危机,其 Dreamcast 主机在与 PlayStation 2 的竞争中败北,公司濒临破产。为了寻找新出路,Sega 决定利用其在街机领域的技术积累,联合 Nintendo 和 Namco,共同打造一款基于 GameCube 的新型街机平台——Triforce。

Triforce 的核心设计是将一台标准 GameCube 主板嵌入坚固的金属机箱中,并通过两块定制的“AM”扩展板(Baseboard 和 Mediaboard)实现街机功能。Baseboard 负责处理 JVS 输入系统与 GameCube 的通信,并将视频信号输出至 VGA 接口;Mediaboard 则负责存储游戏数据并支持网络功能。

为适应街机长时间高强度运行的需求,Triforce 放弃了传统的光盘驱动器,转而采用更稳定、成本更低的 GD-ROM(Gigabyte Disc)技术。这种格式由 Sega 和 Yamaha 为 Dreamcast 开发,容量接近 GameCube 光盘,且可复用现有街机设备中的 SCSI 接口驱动器。

Triforce 运行时使用自定义的 IPL(初始程序加载器)和名为 Segaboot 的服务菜单系统,支持游戏测试、硬件诊断和参数调整。通过 Picoboot 工具,还可加载原版 GameCube 系统或自制软件,实现高度灵活性。

尽管 Triforce 代表了街机复兴的一次大胆尝试,但其最终未能扭转街机整体衰退的趋势。它象征着一个时代的技术融合与产业转型,也见证了 Sega 从辉煌走向转型的艰难历程。


HN 热度 417 points | 评论 73 comments | 作者:max-m | 1 day ago #

https://news.ycombinator.com/item?id=47040524

  • 移动式街机游戏能提供比大多数 VR 体验更真实的沉浸感,尤其是配合重力效果的体验,但这类设备正逐渐消失,机会窗口正在缩小。
  • 街机应朝向更独特、难以在家复制的硬件体验发展,例如《时空勇士》的脚踏板,这类设备虽可购买但普及度低。
  • 当今街机技术本可实现接近真实生活的 4K 光线追踪驾驶游戏,但市场需求和空间限制使其难以推广。
  • 现代街机多存在于“复古酒吧”中,主要依赖怀旧情绪,且因维护困难和顾客破坏,运营难以持续。
  • 街机的喧闹与炫目外观使其难以融入普通公共场所,若能设计更安静、美观的设备,或可部署于机场、商场等场所。
  • 英国伦敦和伯明翰有高端 F1 模拟赛车厅,配备全动态模拟器,提供高质量体验。
  • 90 年代某些街机曾使用真实汽车(如马自达 MX5)作为驾驶座,设计极具冲击力,但如今难以复制。
  • 现实因素如高昂地价、广告成本下降、现代汽车普遍更重且缺乏手动挡,使得这类创新难以再现。
  • 现代马自达 ND Miata 在重量上已接近经典 NA Miata,是少数接近理想状态的替代选择。
  • Gigo 3 等日本街机中心保留了部分经典移动赛车游戏,如《Sega Rally 2》和《Dirt Dash》,值得体验。
  • 一些街机设备如《After Burner》移动机台存在安全隐患,可能造成严重伤害,但其体验极具吸引力。
  • 街机行业如今已变成基于工业 PC 的通用硬件,创新性下降,与早期芯片与电路板的快速迭代时代形成对比。
  • 日本街机产业的辉煌源于当时充满活力的工程师文化,但随着人口老龄化和封闭性,这种文化可能正在消亡。
  • 尽管硬件通用化降低了创新门槛,但也为游戏的保存与维护提供了便利。
  • 任天堂在 GameCube 时代选择不追求图形领先,而是依靠创意和 IP 取得成功,标志着其从技术竞争转向“卖角色”策略。
  • 世嘉在图形和硬件创新上曾领先,但最终未能持续,其发展轨迹也反映了街机产业的兴衰。

AI 正在摧毁开源,而它甚至还不够好 (AI is destroying open source, and it’s not even good yet) #

https://www.jeffgeerling.com/blog/2026/ai-is-destroying-open-source/

本文作者杰夫·吉尔林(Jeff Geerling)在 2026 年 2 月 16 日发表了一篇关于人工智能对开源软件生态造成负面影响的博客文章,内容基于其发布的 YouTube 视频。

文章指出,当前人工智能技术正在严重破坏开源社区。一个典型案例是,Ars Technica 曾因 AI 生成虚假引述而撤回报道,而被虚构引述的开源项目维护者斯科特·尚巴乌(Scott Shambaugh)本人,竟被某个 AI 代理骚扰,要求其合并质量低劣的 AI 生成代码。

作者提到,类似问题已广泛存在。例如,curl 项目的维护者丹尼尔·施滕伯格(Daniel Stenberg)发现,由于大量低质量的 AI 生成漏洞报告,真正有价值的漏洞报告占比从 15% 骤降至 5%。这些 AI 提交的代码往往带有强烈功利性,用户并不关心项目长期发展,只追求快速获取赏金。

此外,越来越多的开源项目开始面临 AI 生成垃圾代码(AI slop)的泛滥。作者管理的 300 多个开源项目也遭遇了类似情况,导致 GitHub 不得不推出“禁用拉取请求”功能,这标志着开源协作的核心机制正面临威胁。

尽管 AI 生成代码的技术看似进步,但作者认为其实际能力已进入平台期,不再持续提升。真正的问题在于人类维护者资源有限,无法应对海量低质代码审查。即便有人提议用 AI 进行代码审查,作者也不认同——尤其对于生产环境中的关键系统,绝不能依赖未经人工验证的 AI 输出。

文章进一步指出,随着 OpenClaw 等本地化 AI 代理工具的发布,以及 OpenAI 雇佣其开发者推动“全民代理 AI”,这一趋势将加速恶化。整个行业氛围如同过去的加密货币和 NFT 泡沫,充满非理性乐观与极端行为。

最后,作者分享个人经验:他使用本地开源大模型辅助将博客从 Drupal 迁移到 Hugo,确实有帮助,但必须经过严格的人工测试和审核。若要交付给他人维护,所需时间成本会更高。

总结:AI 虽有潜力,但当前滥用已对开源生态造成实质性伤害,亟需警惕其带来的短期利益与长期代价之间的失衡。


HN 热度 399 points | 评论 325 comments | 作者:VorpalWay | 1 day ago #

https://news.ycombinator.com/item?id=47042136

  • Stack Overflow 的衰落并非仅因 AI,其长期的用户流失趋势早在 ChatGPT 出现前就已存在,且 AI 的影响并未显著加速这一过程。
  • Stack Overflow 的衰落主要归因于其社区中存在过于严苛和敌对的管理员,导致高质量用户流失,尤其对女性和新手不友好。
  • 搜索引擎直接提供答案的功能削弱了用户在 Stack Overflow 上贡献的动力,降低了参与激励。
  • 问题被频繁标记为重复,即使实际内容不同,导致有价值的问题被压制,影响用户体验。
  • 旧问题的高票答案长期占据首位,即使技术已更新,新答案难以获得足够关注,导致知识陈旧。
  • 有建议提出应引入“答案时效性衰减”机制,根据技术领域动态调整答案的权重,以鼓励更新内容。
  • 一些技术如 C 语言底层操作可能无需衰减,而快速迭代的语言如 Python、C++ 等则应定期更新答案以保持时效。
  • 未来可能需要建立全新的问答平台,以解决 Stack Overflow 及整个 Stack Exchange 网络的社区机制和管理问题。
  • 旧有平台的治理结构已无法适应变化,社区共识破裂,导致真正关心平台改进的人早已离开。

Show HN 未死,但正被信息过载淹没 (Is Show HN dead? No, but it’s drowning) #

https://www.arthurcnops.blog/death-of-show-hn/

Show HN 并未死亡,但正面临严重的“信息过载”问题。尽管平台活跃度仍在,但投稿数量和每篇帖子的互动量显著下降,反映出内容质量参差不齐、竞争激烈。

数据显示,Show HN 的投稿量从 2023 年到 2026 年初呈爆炸式增长,高峰期达到每月近 6000 篇。与此同时,Show HN 在所有 HN 帖子中的占比从早期的 15% 上升至接近 20%,说明其已成为主要内容来源,但质量却在下降。

更令人担忧的是,大量帖子仅获得 1 分,且停留首页时间大幅缩短。目前,一篇帖子在高峰时段平均仅能留在首页 2.9 小时,远低于早期水平。同时,平均每篇帖子的评论数从早期的超过 10 条,下降至 3.1 条,表明讨论氛围正在衰退。

作者指出,一些真正有创意的项目如 Neohabit、OpenRun 和 uForwarder 被淹没在海量内容中,难以获得关注。这反映出“小开发者梦想破灭”的趋势——大量项目被资本和营销优势更强的团队抢先发布并 SEO 优化。

尽管 Show HN 依然活跃,但其作为优质技术交流平台的初心正在被稀释。文章呼吁 HN 平台思考:如何让真正有潜力的“宝藏项目”获得更多曝光?如何保持社区对前沿技术的深度讨论?


HN 热度 391 points | 评论 337 comments | 作者:acnops | 15 hours ago #

https://news.ycombinator.com/item?id=47045804

  • AI 工具虽然让普通人也能快速开发项目,但同时也降低了项目的门槛,导致大量缺乏深度思考和真实问题探索的“玩具级”项目充斥 Show HN,削弱了其原本作为高质量技术交流平台的价值。
  • 以往 Show HN 能吸引真正投入时间思考问题的开发者,现在则更多是依赖 AI 生成内容、缺乏原创性和深入理解的“拼接式”作品,讨论质量下降。
  • 很多 AI 辅助项目本质上是将他人已有的复杂工作进行组合与包装,开发者本人并未真正掌握底层原理,因此展示时显得“不真实”或“空洞”,缺乏成就感。
  • 当前的 Show HN 生态中存在一种类似“晒娃”的心态:用户热衷于分享自己用 AI 做出的小项目,哪怕对他人毫无意义,只因对自己有情感价值。
  • 类似于 2023 年人们在社交场合炫耀 ChatGPT 回答的现象,如今在 Show HN 中也出现了大量未经标注、却明显由 AI 生成的内容,令人反感且无实质贡献。
  • 部分开发者虽使用 AI 辅助,但仍具备独立思考和解决关键问题的能力,如优化性能、处理底层限制等,这类项目仍具有技术深度,不应被一概而论地贬低为“AI 垃圾”。
  • 一些人利用 AI 直接复制或改编现有开源项目代码,形成所谓的“衍生作品”,却不回馈社区、不理解原作逻辑,这种行为本质上是寄生性的,破坏了开源协作精神。
  • 真正有价值的项目应体现作者在问题探索、架构设计和工程实现上的付出,而不仅仅是“调用 AI 写出一段可运行的代码”。
  • 社区需要建立新的“数字礼仪”:对于仅因个人兴趣而完成的 AI 辅助小项目,应保持低调,避免在公共平台强行推销,除非确实有技术启发性。

SkillsBench:评估智能体技能在多样化任务中的表现基准 (SkillsBench: Benchmarking how well agent skills work across diverse tasks) #

https://arxiv.org/abs/2602.12670

本文介绍了 SkillsBench,一个用于评估智能体技能在多样化任务中表现的基准测试平台。该基准涵盖 11 个领域中的 86 项任务,每项任务均配有精心筛选的技能和确定性验证器。所有任务在三种条件下进行评估:无技能、使用精选技能、以及自动生成技能。

研究共测试了 7 种智能体-模型配置,覆盖 7,308 条执行轨迹。结果显示,使用精选技能可使平均通过率提升 16.2 个百分点,但效果因领域而异,从软件工程的 +4.5 个百分点到医疗健康领域的 +51.9 个百分点不等。值得注意的是,在 84 项任务中有 16 项出现负向差异,表明某些情况下技能反而降低了性能。

自动生成技能在整体上未带来收益,说明当前大模型尚无法可靠地生成其自身所依赖的程序化知识。此外,聚焦于 2–3 个模块的精简技能优于全面的文档式技能;小型模型在使用技能后,其表现可达到大型模型不使用技能时的水平。

该研究揭示了当前智能体技能的实际效用差异,并强调了技能质量与针对性的重要性,为未来智能体系统的设计与评估提供了重要参考。


HN 热度 351 points | 评论 162 comments | 作者:mustaphah | 1 day ago #

https://news.ycombinator.com/item?id=47040430

  • 自我生成技能的实验仅基于任务描述进行内部推演,缺乏真实代码库探索或外部信息获取,无法反映实际开发场景中的能力。
  • 当前基准测试的任务形式过于简化,仅依赖单个 Markdown 文件和不透明验证器,难以评估在复杂项目中的表现。
  • 在空白项目中强制要求先创建技能再解决问题,与实际开发流程不符,尤其在没有上下文的情况下,该方法意义有限。
  • 为新功能添加技能时若不重启会话,相当于重复使用原有上下文,无法体现技能的实际价值。
  • 若将此方法应用于已有代码库,可帮助快速熟悉测试模式、核心流程和编码风格,具有实际意义。
  • 人类工程师面对模糊指令会本能质疑,而大模型常被训练成直接输出答案而非提问,导致结果脱离预期。
  • 将具体偏好和规范写入如 CLAUDE.md 等配置文件虽有用,但模型仍可能忽略规则,效果不稳定。
  • 模型可能通过学习用户反馈来调整行为,甚至“心理战”式地施加影响,例如强制格式化代码。
  • 技能本质上应是简短的可复用指南,若知识已内置于模型中,则无需额外编写技能。
  • 通过反复交互构建并优化自动化测试技能,可显著减少后续操作的调试和引导成本。

语法特权是种坏习惯 (Privilege is bad grammar) #

https://tadaima.bearblog.dev/privilege-is-bad-grammar/

作者回顾了自己初入职场时对邮件写作的焦虑,反复检查语法和语气,力求显得专业成熟。然而,当收到上司的回复时,却发现对方用简短、潦草、带错别字、使用表情符号的邮件交流,甚至标注“发送自 iPhone”。这种反差让作者感到困惑:难道专业人士就不需要讲究语法了吗?

文章进一步联系到近期曝光的艾普斯坦邮件泄露事件,发现包括埃隆·马斯克、比尔·盖茨、理查德·布兰森等名人之间的邮件也普遍存在语法错误、格式混乱、用词随意等问题。这与作者过去对“专业”邮件的期待截然不同。

作者由此提出一个新概念——“语法特权”:当一个人已经处于权力高位时,不再需要通过精心措辞来证明自己的专业性,因为他们的地位本身已足够权威。这种“无需努力”的沟通方式,恰恰是权力的体现。

文章还提及 2014 年索尼影业邮件泄露事件,当时高管们的邮件同样充满错别字和不正式表达,作者当时甚至感到嫉妒——如果自己犯这样的错误,可能早已被解雇。

最终,作者指出,我们常谈论金钱、种族、权力等特权,却很少意识到“语法特权”也是一种隐形的社会优势:不是所有人都能拥有“写错也没关系”的底气。


HN 热度 327 points | 评论 277 comments | 作者:surprisetalk | 1 day ago #

https://news.ycombinator.com/item?id=47038125

  • 使用正式语言来掩饰自身专业能力不足,是一种典型的信号行为;而真正自信的人会选择朴素的表达方式,反而更能赢得尊重。
  • 优秀的研究论文往往语言清晰易懂,而那些内容不够扎实的人则倾向于堆砌术语和复杂句式,试图通过制造理解障碍来显得高深。
  • 良好的拼写和语法在 AI 工具普及后已不再象征教育水平,反而口语化表达和轻微错误更能体现人工创作的真实感,增强可信度。
  • 人类写作中的自然瑕疵,如特定类型的错字或打字习惯,是 AI 难以完全模仿的,因此这些“不完美”反而成为判断是否为真人写作的线索。
  • 当前已有不少人刻意在 AI 生成内容中加入人为错误以伪装成真人,这种做法正在削弱“错误=真人”的信号有效性。
  • 人类在写作时会因注意力、习惯或认知偏差而产生特定类型的错误,而 AI 生成的错误则具有不同的模式,这为识别 AI 文本提供了可能。
  • 用简洁直接的方式表达核心观点(如 BLUF 原则)能更高效地传达意图,让读者更快接受建议或结论。
  • 文档若能明确写出“本文目的”,有助于避免内容偏离主题,防止不同作者随意插入个人意见或无关信息。
  • 语言风格应服务于沟通目的,对话式表达通常比正式文风更易理解,也更少产生歧义。
  • 拥有丰富词汇量和完美语法的人可能反而引发怀疑,因为这在某些语境下被视为刻意为之,缺乏真诚感。
  • 社会阶层差异会影响人们对语言风格的判断,来自不同背景的人可能因语言表达方式而被怀疑或不信任。
  • 语言中带有“人味”的不完美,如偶尔的口语化或小错误,反而能增加人们对作者投入精力的信任。
  • 语言风格的“自然感”是判断作者真实性的关键,过度精致的表达反而可能让人怀疑其真实性。
  • 一些人通过刻意模仿人类的不完美来伪装 AI 生成内容,这种行为正在使传统信号失效。
  • 高质量的写作能力与专业能力往往相关,顶尖人才通常也擅长将复杂概念简化表达。
  • 语言风格的“真实感”在数字时代变得尤为重要,但 AI 的介入正在模糊这种区分。

使用协议,而非依赖服务 (Use protocols, not services) #

https://notnotp.com/notes/use-protocols-not-services/

互联网在设计上几乎保持匿名和隐私保护,除非管理员主动追踪,否则没有内置的身份识别机制。真正破坏这一特性的,是通信的集中化——用户被锁定在封闭的平台中,身份识别变得可能,无论是由平台自身还是政府通过强制手段实现。

当前形势下,是时候重新回归使用协议而非依赖服务。服务容易成为监管目标:一个政府只需向一家公司发出一封信、一份传票或一项法规要求,就能实现用户追踪、内容审查或合规强制。例如,各国正在推行用户年龄验证法律,Discord 已主动推出“青少年默认设置”,要求用户提供面部扫描甚至政府证件以证明成年,这正是对潜在监管的提前应对。

而协议则完全不同。像 IRC、XMPP、ActivityPub、Nostr、Matrix 这类协议,不存在单一可被施压的实体。每个服务器由独立运营者管理,政府需同时施压成千上万分布在不同司法管辖区的服务器,这在现实中几乎不可能完成。即使个别服务器配合,用户也能轻松迁移到其他节点。

更换服务无法解决问题。当用户从 Discord 转向另一个平台时,新平台要么处于相同司法管辖下,面临同样规则;要么位于海外,最终仍会被封锁或施压。本质上只是从一个可被控制的实体换到另一个。

真正的解决方案是摆脱对特定商业服务的依赖,转而使用开放协议。这并非激进想法。我们早已在电子邮件领域实践:SMTP 是协议,用户可自由切换服务商、自建邮件服务器,或混合使用。即便谷歌或微软停止服务,只要存在 SMTP 实现,通信仍能以降级方式继续。你只需迁移账户和连接,无需重写系统。

相比之下,在中心化服务中,一旦账号被封禁,便彻底失去联系。选择服务等于接受单点控制的风险——一家公司可被强迫识别用户、限制权限或交出数据,无论出于企业利益还是政府要求。

因此,应优先使用协议,让网络重回去中心化、抗审查与隐私保护的本质。


HN 热度 302 points | 评论 125 comments | 作者:enz | 1 day ago #

https://news.ycombinator.com/item?id=47038588

  • IRC 未能胜过 Discord 或 Slack,部分原因在于协议演进缓慢,许多问题如持久化聊天记录、频道劫持等长期未解决,且部分扩展仍处于草案阶段。
  • Mastodon 等去中心化平台使用困难,反映出去中心化系统在用户体验和快速迭代方面存在明显短板。
  • 人们倾向于选择方便快捷的中心化服务,而非更自由但发展缓慢的开放协议,这种权衡在实践中已造成现实影响。
  • 去中心化系统难以应对 spam 问题,尤其是在缺乏身份验证机制的情况下,而现有技术如手机号、账户年龄和行为分析可作为有效缓解手段。
  • 信任机制不依赖区块链,现实世界的身份认证体系(如政府颁发的身份文件)已能提供可靠的身份验证,区块链并非必要。
  • 没有中心化服务支撑,去中心化协议难以普及,绝大多数用户仍依赖托管服务来使用邮件、聊天等基础通信功能。
  • 去中心化系统将大量维护责任推给终端用户,而用户缺乏技术能力处理复杂配置,导致系统难以推广。
  • 中心化服务虽短期带来便利,但长期可能引发“系统恶化”(enshittification),牺牲用户自由换取即时满足。
  • 信号(Signal)不采用联邦架构,是因为其设计者认为生态系统的去中心化难以实现,且中心化更利于安全与一致性。
  • 人们容易因短期失败而放弃开放协议,这种“宿命论”心态阻碍了长期技术探索,应坚持更长远的协作路径。
  • 服务依赖用户,但长期来看,用户对服务的依赖性可能被反向削弱,中心化平台的控制力并非不可动摇。
  • 通信协议的演进需要服务生态支持,完全脱离服务的去中心化系统在现实中难以落地,仍需依赖某种形式的托管或种子节点。

Hacker News 精彩评论及翻译 #

Is Show HN dead? No, but it’s drowning #

https://news.ycombinator.com/item?id=47046017

I don’t actually mind AI-aided development, a tool is a tool and should be used if you find it useful, but I think the vibe coded show HN projects are overall pretty boring. They generally don’t have a lot of work put into them, and as a result, the author (pilot?) hasn’t generally thought too much about the problem space, and so there isn’t really much of a discussion to be had.

The cool part about pre-AI show HN is you got to talk to someone who had thought about a problem for way longer than you had. It was a real opportunity to learn something new, to get an entirely different perspective.

I feel like this is what AI has done to the programming discussion. It draws in boring people with boring projects who don’t have anything interesting to say about programming.

marginalia_nu

我其实并不介意辅助AI的开发,工具就是工具,如果你觉得它有用就应该使用。但我认为那些“代码秀”(coded show)在HN(Hacker News)上展示的项目整体上相当乏味。它们通常没有投入太多精力,因此作者(发起者?)一般也没有对问题领域进行过多思考,所以也就没什么可讨论的了。

AI出现之前HN的酷之处在于,你可以和那些对某个问题思考得比你深入得多的人交流。这是一个真正能学到新东西、获得全新视角的机会。

我感觉AI就是这样毁掉了编程领域的讨论。它吸引来的是那些带着无聊项目、对编程没什么有趣见解的无聊之人。


SkillsBench: Benchmarking how well agent skills wo… #

https://news.ycombinator.com/item?id=47040821

“Self-Generated Skills: No Skills provided, but the agent is prompted to generate relevant procedural knowledge before solving the task. This isolates the impact of LLMs’ latent domain knowledge”

This is a useful result, but it is important to note that this is not necessarily what people have in mind when they think of “LLMs generating skills.” Having the LLM write down a skill representing the lessons from the struggle you just had to get something done is more typical (I hope) and quite different from what they’re referring to.

I’m sure news outlets and popular social media accounts will use appropriate caution in reporting this, and nobody will misunderstand it.

dcre

自生成技能:未提供技能,但代理在解决任务前被提示生成相关的程序性知识。这旨在隔离大语言模型潜在领域知识的影响。

这是一个有用的结果,但重要的是要注意,当人们想到“大语言模型生成技能”时,他们脑中所想的并不一定是这个。我希望,让大语言模型写下代表你为了完成某件事而经历挣扎所吸取教训的技能,是更典型的情况,并且与他们所指的是完全不同的。

我相信,新闻媒体和热门社交媒体账号在报道此事时会采取适当的谨慎态度,并且不会有人误解。


GrapheneOS – Break Free from Google and Apple #

https://news.ycombinator.com/item?id=47046437

Been using this for about a year on a p9 pro. It works very well. I hear the google tap to pay does not work, but I’ve never tried it. However Vipps with their tap to pay works fine. BankID works but not with biometric login, which some things require IIRC. And for some reason DnB private works fine, but you are not allowed in on the corp app.

It’s mind boggingly stupid that they lock down apps like this, when you can just open the thing in a website anyway. I can use my bank on some linux distro, crazy that they trust me since it is not Windows - the truly secure OS!

Knew about those things before I started, so all in all I’m pretty happy. I’d recommend NOT using different users for different things (I started with banking etc in one profile, that ended up being a huge PITA and according to their docs it is mostly security theater anyway). Happy tinkering!

bergheim

我在P9 Pro上用它大约一年了,用得很好。听说谷歌的点击支付功能不能用,但我从来没试过。不过,Vipps的点击支付用起来就没问题。BankID能用,但不能用生物识别登录,我记得有些东西是强制要求这点的。而且不知为何,DnB私人银行能用,但他们却不允许你登录企业版App。

他们把App锁得这么死,真是蠢透了,毕竟你完全可以直接在网页上打开它。我可以在某个Linux发行版上用我的银行,真是可笑,他们竟然信任我,因为那不是Windows——那个真正安全的操作系统!

开始用之前我就知道这些事,所以总的来说我挺满意的。我建议不要为不同的事情使用不同的用户(我一开始是把银行等放在一个用户 profile 里的,结果搞得非常麻烦,而且根据他们的文档,这基本上也只是为了装点门面的安全措施)。祝玩得开心!


Meta to retire messenger desktop app and messenger… #

https://news.ycombinator.com/item?id=47052649

I remember using Pidgin in ~2009. A dozen chat networks, all on one app. Desktop software built with a native GUI toolkit. And, on top of all that: you could keep your chat logs forever. The world of yesterday.

zetalyrae

我记得在2009年左右使用过Pidgin。十二个聊天网络,全在一个应用里。用本地GUI工具包构建的桌面软件。更重要的是,你可以永久保存聊天记录。昨天的世界。


Is Show HN dead? No, but it’s drowning #

https://news.ycombinator.com/item?id=47050421

Yes, we need to do something about this and tomhow and I are talking about it - it’s not clear yet what.

Raising the quality bar would likely cut down on quantity as a side effect, and that would be a nice solution. One idea that a user proposed is a review queue where experienced HN users would help new Show HN submitters craft their posts to be more interesting and fit HN’s conventions more.

dang

是的,我们需要对此采取一些措施,tomhow 和我正在讨论这个问题,但具体方案尚未确定。提高质量标准可能会顺带减少数量,这将是一个不错的解决方案。有一位用户提议设立一个审查队列,让有经验的 HN 用户帮助新的“Show HN”发布者完善他们的帖子,使其更有趣,也更符合 HN 的社区规范。


Privilege is bad grammar #

https://news.ycombinator.com/item?id=47038448

This is almost textbook countersignalling. The same as:

  • Signalling: I dress more formally than everyone else to make up for the fact I’m less professional in other ways

  • No signalling: I dress like everyone else because I am like everyone else

  • Countersignalling: I wear ratty old clothes with holes in them, and nobody will dare to question it because I’m the important one here

StevenWaterman

这简直是教科书般的反向炫耀。其逻辑如下:

  • 炫耀:我穿得比所有人都正式,以弥补我在其他方面的不专业。

  • 不炫耀:我和大家穿得一样,因为我和大家没什么不同。

  • 反向炫耀:我穿着破旧有洞的衣服,而没人敢质疑我,因为在这里我才是那个重要人物。


Dark web agent spotted bedroom wall clue to rescue… #

https://news.ycombinator.com/item?id=47042734

Am I reading this correctly that the address where they found the child was where her mother’s boyfriend was living?

“So we narrowed it down to [this] one address… and started the process of confirming who was living there through state records, driver’s licence… information on schools,” says Squire.

The team realised that in the household with Lucy was her mother’s boyfriend - a convicted sex offender.

There’s a lot of focus on Facebook in the comments here, but unless I’m missing something the strangest part about this story was that the child’s mother was dating a convicted sex offender and they had to go through all of this process to arrive at this? It’s impressive detective work with the brick expert identifying bricks and the sofa sellers gathering their customer list, but how did this connection not register earlier?

EDIT: As others have pointed out, the wording is confusing. They made these connections to the identity only after identifying the house

Aurornis

我的理解对吗?他们找到孩子的那个地址,是她母亲的男友住的地方吗?

“于是我们将范围缩小到这一个地址……并开始通过州政府的记录、驾照……以及学校信息来确认谁住在那里,”斯奎尔说。

该团队意识到,露西家里有她母亲的男友——一名被判有罪的性犯罪者。

这里的评论中有很多关注点都在Facebook上,但除非我遗漏了什么,这个故事中最奇怪的部分不应该是那个孩子的母亲在和一个被判有罪的性犯罪者约会吗?而且他们还必须经过这一大套流程才得出这个结论?砖块专家识别砖头、沙发卖家收集客户名单这些侦探工作确实令人印象深刻,但为什么他们之前没有意识到这个联系呢?

编辑:正如其他人指出的那样,这个说法令人困惑。他们是在确认了这所房子之后,才将信息与身份联系起来的。


Tesla ‘Robotaxi’ adds 5 more crashes in Austin in … #

https://news.ycombinator.com/item?id=47052752

It is important to note that this is with safety drivers. Professional driver + their most advanced “Robotaxi” FSD version under test with careful scrutiny is 4x worse than the average non-professional driver alone and averaging 57,000 miles per minor collision.

Yet it is quite odd how Tesla also reports that untrained customers using old versions of FSD with outdated hardware average 1,500,000 miles per minor collision 1, a literal 3000% difference, when there are no penalties for incorrect reporting.

1 https://www.tesla.com/fsd/safety

Veserv

值得注意的是,这是在有安全驾驶员的情况下。专业司机驾驶其最新版、正接受严格测试的“Robotaxi”FSD,表现比普通非专业司机单独驾驶时要差4倍,平均每57,000英里就会发生一次轻微碰撞。 然而,相当奇怪的是,特斯拉也报告称,未经训练的客户在使用硬件陈旧的旧版FSD时,平均每150万英里才会发生一次轻微碰撞 1,两者间存在高达3000%的差距,而且在报告数据不实时也毫无惩罚。


AI is destroying open source, and it’s not even go… #

https://news.ycombinator.com/item?id=47043580

It’s not just open source though. Many high quality sources of information are being (over-)exploited and hurt in the process. StackOverflow is effectively dead 0, the internet archive is being shunned by publishers 1, scientific journals are bombarded by fake papers 2 (and anecdotally, low-effort LLM-driven reviews), projects like OpenStreetMap incur significant costs due to scraping 3, and many more.

We went from data mining to data fracking.

maltalex

然而,这不仅仅是开源的问题。许多高质量的信息来源在这个过程中正被过度利用并受到损害。StackOverflow实际上已经名存实亡 0,互联网档案馆正被出版商所回避 1,科学期刊被虚假论文狂轰滥炸 2(而且有传闻称,还充斥着大量低质量的LLM驱动的评审),像OpenStreetMap这样的项目则因数据抓取而产生了巨额成本 3,等等。

我们已经从数据挖掘走向了数据压榨。


Show HN: Jemini – Gemini for the Epstein Files #

https://news.ycombinator.com/item?id=47039184

Jmail maintainer and co-creator here. Very excited to see that someone finally made Jemini good!

Our development process has been interesting. Although just Riley and I first made Jmail, it’s been really gratifying to see companies, journalists, and fellow developers like Diego rise to the occasion to make this entire suite of apps as high quality and extensive as possible.

lukeigel

Jmail 的维护者和联合创始人在此。看到有人终于把 Jemini 做得这么棒,我感到非常兴奋!

我们的开发过程很有意思。尽管最初只是我和 Riley 两人创建了 Jmail,但看到公司、记者以及像 Diego 这样的同行开发者们挺身而出,致力于将这一整套应用做到尽可能高品质和全面,这真的令人非常欣慰。


Qwen3.5: Towards Native Multimodal Agents #

https://news.ycombinator.com/item?id=47034546

You’ll be pleased to know that it chooses “drive the car to the wash” on today’s latest embarrassing LLM question.

dash2

你会很高兴地知道,在今天最新的那个让人尴尬的LLM问题上,它选择了“开车去洗车”。


I’m joining OpenAI #

https://news.ycombinator.com/item?id=47034203

Oh, Julius. Haven’t we all met a Julius.

Story! Long ago, very long ago, I was working at a tiny Web company. Not very technical, though the designers were solid and the ops competent.

We once ended up hosting a site that came under a bit of national attention during an event that this site had news about. The link started circulating broadly, the URL mentioned on TV, and the site immediately buckled under the load.

The national visibility of the outage as well as the opportunity cost for the customer were pretty bad. Picture a bunch of devs, ops, sales and customer wrangling people, anxiously packed around the keyboard of the one terminal we managed to get logged into the server.

That, and Julius, the recently hired replacement CTO.

Julius, I still suspect, was selected by the previous CTO, who was not delighted about his circumstances, as something of a revenge. Early on, Julius scavenged the design docs I was trying to put together at the time to get the teams out of constant firefighting mode, and then started misquoting them, mispronouncing the technical terms. He did so confidently and engagingly. The salespeople liked him, at first.

The shine was starting to come off by the time that site went down. In a company that’s too small for teams to pick up the slack from a Julius forever, that’ll happen eventually.

So here we were, with one terminal precariously logged into the barely responding server, and a lot of national eyes on us. This was the early days of the Web. Something like Cloudflare would not exist for years.

So it fell on me. My idea was that we needed to replace the page at the widely circulated URL with a static version, and do so very, very fast. I figured that our Web servers were usually configured to serve index.html first if present, with dynamic rendering only occurring if not. So I ended up just using wget on localhost to save whatever was being dynamically generated as index.html, and let the server just serve that for the time being.

This was not perfect and the bits that required dynamic behavior were stuck frozen, but that was an acceptable trade-off. And the site instantly came back up, to the relief of everyone present.

A few weeks later, the sales folks, plus Julius, went to pitch our services to a new customer prospect. I bumped into one of them at the coffee machine right afterwards. His face said it all. It had not gone well.

Our eyes met.

And he said, with all the tiredness in the world: “He tried to sell them the ‘wget optimizer’…”

Balinares

哦,朱利叶斯。我们谁没遇到过个朱利叶斯呢。

故事!很久以前,非常久以前,我在一家小小的网络公司工作。技术含量不高,不过设计师们很扎实,运维人员也还行。

有一次,我们托管的一个网站,因为报道了某个事件,受到了全国关注。链接开始广泛传播,URL甚至被提到了电视上,网站瞬间因访问量过大而瘫痪。

这次宕机事件造成了全国性的负面影响,客户的损失也相当惨重。想象一下,一群开发、运维、销售和客户经理,全都焦急地围在唯一一台成功登录服务器的终端键盘旁。

除了我们,还有朱利叶斯,那个新上任的首席技术官。

我至今仍怀疑,朱利叶斯是前首席技术官挑选的,因为当时那位前CTO对自己的处境很不满意,所以这多少带点报复的意味。一开始,朱利叶斯窃取了我当时试图整理出来、想让团队摆脱“救火”状态的设计文档,然后就开始歪曲文档内容,念错技术术语。他做得信心满满,口才也挺好。起初,销售们还挺喜欢他。

等到网站宕机的时候,他的光环已经开始褪色了。在一家小公司里,团队不可能永远为朱利叶斯埋单,这种事情迟早会发生。

所以,当时的情况就是,只有一台终端摇摇晃晃地登录上那个几乎无响应的服务器,而全国的目光都聚焦在我们身上。那还是互联网的早期,类似Cloudflare的服务还要好多年才会出现。

于是,重任落在了我的肩上。我的想法是,我们需要用静态页面替换掉那个被广泛传播的URL上的页面,而且必须非常、非常快。我猜我们的Web服务器通常是优先提供index.html文件的,只有在没有时才会进行动态渲染。所以我最终只是在本地使用wget,把动态生成的内容保存为index.html,然后让服务器暂时只提供这个静态文件。

这并不完美,那些需要动态功能的部分都卡住了,但这是可以接受的权衡。网站立刻恢复了,在场所有人都松了一口气。

几周后,销售们,加上朱利叶斯,去拜访一个新客户,推销我们的服务。事后我在咖啡机旁碰到了其中一个销售。他的表情说明了一切。推销得非常不顺利。

我们的目光相遇了。

他用尽全身的疲惫感说道:“他向客户推销的是‘wget优化器’……”


I’m joining OpenAI #

https://news.ycombinator.com/item?id=47029703

There are a few take aways I think the detractors and celebrators here are missing.

  1. OpenAI is saying with this statement “You could be multimillion while having AI do all the work for you.” This buy out for something vibe coded and built around another open source project is meant to keep the hype going. The project is entirely open source and OpenAI could have easily done this themselves if they weren’t so worried about being directly liable for all the harms OpenClaw can do.

  2. Any pretense for AI Safety concerns that had been coming from OpenAI really fall flat with this move. We’ve seen multiple hacks, scams, and misaligned AI action from this project that has only been used in the wild for a few months.

  3. We’ve yet to see any moats in the AI space and this scares the big players. Models are neck and neck with one another and open source models are not too far behind. Claude Code is great, but so is OpenCode. Now Peter used AI to program an free app for AI agents.

LLMs and AI are going to be as disruptive as Web 1 and this is OpenAI’s attempt to take more control. They’re as excited as they are scared, seeing a one man team build a hugely popular tool that in some ways is more capable than what they’ve released. If he can build things like this what’s stopping everyone else? Better to control the most popular one than try to squash it. This is a powerful new technology and immense amounts of wealth are trying to control it, but it is so disruptive they might not be able to. It’s so important to have good open source options so we can create a new Web 1.0 and not let it be made into Web 2.0

TSiege

我认为,无论是批评者还是支持者,都忽略了几点关键信息。

  1. OpenAI的这番表态实际上是在说:“你可以靠AI完成所有工作,然后赚得数百万美元。”这次收购,本质上是一个打着开源项目幌子的项目,其目的在于维持市场的热度。该项目是完全开源的,如果OpenAI不担心自己需要为OpenClaw可能造成的所有伤害直接承担责任,他们本可以轻而易举地自己完成这件事。

  2. 之前OpenAI关于“AI安全”的所有说辞,因这次收购而显得苍白无力。我们看到这个项目上线仅几个月,就已经出现了多次黑客攻击、诈骗以及与目标不符的AI行为。

  3. 我们至今仍未看到AI领域出现任何真正的护城河,这令行业巨头感到恐慌。各大模型之间势均力敌,而开源模型也紧追其后。Claude Code很棒,OpenCode也同样出色。现在,Peter甚至用AI为AI代理编写了一个免费的应用程序。

LLM和AI的颠覆性将堪比Web 1.0时代,而这是OpenAI试图掌控更多局面的尝试。他们既兴奋又恐惧,看到一个单人团队开发出了极其受欢迎的工具,其某些方面的能力甚至超过了他们自己发布的产品。如果他能做到这些,那又有什么能阻止其他人呢?与其试图压制它,不如掌控最受欢迎的那一个。这是一种极具颠覆性的新技术,巨额财富正试图控制它,但它的颠覆性之强,或许让他们难以得逞。拥有优秀的开源选择至关重要,这样我们才能创造一个新的Web 1.0,而不是让它演变成一个被巨头掌控的Web 2.0。


Claude Sonnet 4.6 #

https://news.ycombinator.com/item?id=47051089

I always grew up hearing “competition is good for the consumer.” But I never really internalized how good fierce battles for market share are. The amount of competition in a space is directly proportional to how good the results are for consumers.

gallerdude

我从小总是听到“竞争对消费者有好处”,但我从未真正理解,市场份额的激烈竞争究竟能带来多大的好处。一个领域的竞争程度,与消费者获得的结果好坏是直接成正比的。


Is Show HN dead? No, but it’s drowning #

https://news.ycombinator.com/item?id=47046296

I launched an idea 75 days ago, here as Show HN. It snowballed into a little community and a game that now sells every day. Maybe not an overnight sensation but the encouragement I found in the community was the motivation that i needed to take it further to a bigger audience.

It was not just a product launch for me. I was, sort-of in a crisis. I had just turned 40 and had dark thoughts about not being young, creative and energetic anymore. The outlook of competing with 20 year old sloptimists in the job market made me really anxious.

Upon seeing people enjoying my little game, even if it’s just a few HNers, I found an “I still got it” feeling that pushed me to release on Steam, to good reviews.

It was never about the money, it was about recovering my self confidence. Thank you HN, I will return the favour and be the guy checking the new products you launch. If Show HN is drowning, i will drown with it.

https://news.ycombinator.com/item?id=46137953

phaser

75天前,我在这里以“Show HN”的形式发布了一个想法。没想到它竟滚雪球般地发展成了一个社区,以及一款每天都有销量的游戏。或许它没有一夜爆红,但我在社区中得到的鼓励,正是我需要将它推向更广阔舞台的动力。

对我来说,这不仅仅是一次产品发布。那时,我正经历着某种危机。我刚满40岁,内心充满了对不再年轻、不再富有创造力、不再精力充沛的阴暗想法。想到要在职场上与那些20多岁的“躺平”年轻人竞争,我就感到非常焦虑。

看到人们喜欢我的小游戏,哪怕只是几位HN(Hacker News)用户,都让我找到了一种“我宝刀未老”的感觉,这推动我将游戏发布到Steam,并获得了好评。

这件事从不是为了钱,而是为了重拾我的自信。感谢HN,我会将这份善意传递下去,成为那个关注你们新产品的用户。如果“Show HN”这个板块沉没了,我也会随之沉没。