2025-11-03 Hacker News Top Stories #
- 作者总结了 Claude Code 的实战用法,建议用 CLAUDE.md/AGENTS.md 管理代码库上下文并保守使用自定义命令与子代理以提高可复现协作。
- Visopsys 是由单一开发者自1997年维护的开源轻量级 PC 操作系统,设计小巧、可从可移动介质启动,适合学习与嵌入式场景。
- 作者用 Claude Code 成功定位并修复了后量子签名实现中的低层加密错误,展示了 AI 在复杂 bug 定位上的实用价值但不能完全替代开发者。
- nokode 实验让 LLM 承担整个 Web 应用逻辑,证明可行性同时暴露出延迟高、成本大、状态记忆差和可靠性不足等现实瓶颈。
- 卫星影像显示苏丹大规模屠杀迹象,报告称有组织性的驱逐与处决并封锁援助通道,联合国对可能的大规模种族动机暴力发出警告。
- Sailfish OS 是一个以隐私和独立性为目标的 Linux 移动系统,功能成熟且支持 Android 应用兼容,但受限于硬件支持和开发资源。
- 文章主张尽量将前端状态放入 URL 以便分享与恢复,同时提醒不要放敏感信息并妥善处理历史记录与兼容性问题。
- djb 在 Debian 上使用 Fil-C 的实践表明其与现有生态兼容性良好但构建内存消耗大、性能通常比 clang 慢 1–4 倍,适合部分加密场景。
- Karpathy 强调理解反向传播背后机制的重要性,警告把其当黑箱使用会导致梯度消失、爆炸和实现层面的陷阱。
- Pomelli 是 Google Labs 为中小企业推出的 AI 实验,自动生成企业“品牌 DNA”并产出可编辑的定制化营销创意与素材,现为公开测试版。
How I use every Claude Code feature #
https://blog.sshh.io/p/how-i-use-every-claude-code-feature
本文是作者 Shrivu Shankar 对 Claude Code 工具使用经验的深度总结,涵盖其在个人项目和专业团队中的实际应用。文章强调,尽管当前 AI CLI 工具竞争激烈,但真正决定工具价值的并非表面功能或 UI,而是能否实现“发射后不管”式的高效协作——即设定上下文后,让 AI 自主完成任务并产出可合并的 PR。
核心内容围绕 Claude Code 的六大关键功能展开:
CLAUDE.md 文件被视作项目“宪法”,是 AI 理解代码库的基石。作者建议将其作为高阶指引而非完整手册,重点记录常见错误、使用规范和关键工具调用方式。避免直接引用大段文档,而是通过提示引导 AI 查阅外部资料。同时,该文件也推动团队简化工具接口,提升可读性。
关于上下文管理,作者反对依赖自动压缩(/compact),推荐使用“/clear + /catchup”或“文档 + 清除”策略。前者用于快速重启,后者则将复杂任务的进展持久化为 Markdown 文件,便于后续恢复,有效避免上下文溢出。
自定义斜杠命令(/slash commands)应保持简洁,仅作为个人快捷方式,如/catchup 用于加载当前分支变更,/pr 用于准备 PR。作者警告,若命令过多或过于复杂,反而违背了 AI 助手“自然对话”的初衷。
自定义子代理(Subagents)理论上能有效分离上下文,但实践中存在“上下文壁垒”问题——将测试逻辑等封装进子代理后,主代理失去全局视野,难以进行跨模块推理,反而降低整体效率。
最后,作者强调,AI 工具的真正价值在于提升开发效率而非增加学习成本。应通过优化 CLAUDE.md、简化工具链、建立清晰的上下文机制,让 AI 真正成为“可信赖的协作者”。
HN 热度 463 points | 评论 168 comments | 作者:sshh12 | 1 day ago #
https://news.ycombinator.com/item?id=45786738
- Anthropic 推荐使用 CLAUDE.md 文件中仅包含 @AGENTS.md 的引用,以保持与其他 AI IDE 的兼容性。
- 将 CLAUDE.md 重命名为 AGENTS.md 更符合行业惯例,建议 Anthropic 采纳统一命名规范。
- 使用符号链接(symlink)将 CLAUDE.md 指向 AGENTS.md 是可行方案,但在不同操作系统上可能存在问题,尤其在 Windows 上需额外配置。
- 符号链接在 Git 中是支持的,但需确保使用相对路径以保证跨平台兼容性。
- 有用户反馈 Claude Code 在处理符号链接时容易混淆,可能需要多次迭代才能正确识别文件关系。
- CLAUDE.md 和 AGENTS.md 的内容会自动被 Claude Code 加载到系统提示中,无需额外读取操作。
- AGENTS.md 文件需通过 @ 引用才能被 Claude 读取,否则不会被自动包含。
- 一些用户更倾向于使用轻量级 CLI 工具而非 MCP,因为 CLI 更简单、更易被 Claude 理解和使用。
- MCP 的核心价值应聚焦于认证、网络和安全边界管理,而非提供具体工具功能。
- 当前大多数 MCP 缺乏访问范围控制,无法限制对敏感数据(如企业 Google Drive)的访问权限。
- 有开发者尝试构建 MCP 代理,让代理在代码解释器中调用 MCP,以提升灵活性和安全性。
- 一些用户认为 MCP 本质上是面向 LLM 推理优化的 OpenAPI,适合作为内部工具网关使用。
- 有观点认为,目前 3000 字的文章已算过长,读者更倾向于将其作为参考而非完整阅读。
Visopsys: OS maintained by a single developer since 1997 #
Visopsys 是一个为 PC 兼容计算机开发的开源替代操作系统,自 1997 年开始开发。该系统以小巧、快速著称,具备完整的图形用户界面、抢占式多任务处理和虚拟内存功能。它运行在完全保护模式下,不模仿任何其他操作系统,强调独立性与创新。
系统支持从 USB 闪存盘、CD/DVD 或软盘直接启动运行,用户可无需安装即可体验其功能。最新版本为 0.92,发布于 2023 年 9 月,此前版本包括 0.91(2021 年)、0.9(2020 年)等,表明项目持续维护与更新。
Visopsys 采用自由软件许可,致力于提供一个轻量级、高效且可定制的操作系统,适合开发者学习、实验或用于特定嵌入式场景。其开发者社区活跃,提供开发文档与论坛支持,欢迎参与贡献。
HN 热度 458 points | 评论 120 comments | 作者:kome | 1 day ago #
https://news.ycombinator.com/item?id=45785858
- 有人在大学时曾参与修改 Visopsys 项目,虽被禁止联系作者,但通过自学深入理解了操作系统底层原理,这段经历令人难忘。
- 该用户使用“visopsys”作为账号名,是出于对该项目的怀念,并非项目作者,也无意误导他人。
- 有人调侃这种以小众操作系统命名账号的行为,是典型的“极客习惯”。
- Visopsys 虽然功能简单,但具备基本图形界面,对普通用户而言仍具有一定的可用性,适合老年人或基础需求用户使用。
- 有人指出,尽管 iOS 在设计上对非技术用户友好,但近年来频繁的界面改动和广告推送已使其体验变差。
- 有用户抱怨 iOS 16 升级后界面变得丑陋、功能冗余,如始终开启的显示和浮层控件,使用体验下降。
- 尽管 iOS 界面变化引发不满,但相比其他系统,仍被认为是计算机小白最合适的设备选择。
- 有人用“猩猩刷 Instagram”视频讽刺现代智能设备对非技术用户的“过度设计”。
- 有人认为,苹果对 iOS 的改动并非随机,而是刻意为之,目的是制造“新感”,而非提升实用性。
- 有人批评苹果移除长期存在的音量提示弹窗,改为顶部微小的音量条,导致信息不显眼,影响使用体验。
- 有人反驳称,旧的音量提示弹窗虽然显眼,但确实会遮挡视频内容,因此改动有其合理性。
Claude Code can debug low-level cryptography #
https://words.filippo.io/claude-debugging/
作者在实现 NIST 标准的后量子签名算法 ML-DSA 时,遇到了验证始终失败的问题,尽管签名与测试向量匹配。在尝试手动调试数小时无果后,他让 Claude Code(Anthropic 提供的 AI 工具)介入,仅用几分钟就精准定位到问题根源:在签名和验证过程中,w1Encode 函数被重复使用,导致在验证阶段对 w1 的高位进行了两次处理,造成数据错误。
Claude Code 不仅快速识别出这一低级但复杂的逻辑错误,还自行设计了一个小型测试来验证假设,并提出了修复方案。作者随后重构代码,将高位输入作为参数传入,提升了清晰度和效率。
随后作者进行了两次模拟实验,分别测试了 AI 在发现两个不同 bug 时的表现。第一个 bug 是 Montgomery 域中常量计算错误,Claude Code 在短时间内成功定位并修复;第二个 bug 是签名编码长度不足,虽然结果不完美,但 AI 仍能准确发现。三次尝试全部成功,且无需人工干预。
作者强调,AI 在此类任务中并非替代开发者,而是作为高效的问题定位助手,帮助节省大量调试时间。他呼吁开发更智能的工具,能在测试失败时自动触发 AI 分析,仅在必要时通知开发者。
文章最后附带了作者的社交媒体链接,以及对支持其工作的开源维护组织 Geomys 的感谢。
HN 热度 446 points | 评论 199 comments | 作者:Bogdanp | 1 day ago #
https://news.ycombinator.com/item?id=45784179
- 使用编码代理追踪复杂 bug 的根源非常有效,能显著节省时间,尤其适合对 LLM 保持怀疑态度的开发者,作为低风险尝试工具的方式。
- 部分编码代理过于激进,容易陷入细节而忽略整体,导致提出无关建议,可能引发不必要的工作量,尤其对初级工程师有误导风险。
- 通过在提示中明确指出可能的错误位置或要求列出疑点并由用户筛选,可有效引导代理聚焦关键问题,提升效率。
- 本地克隆大型库的源码并告知代理查找路径,比依赖内置知识或低效的网络搜索更有效,结合工具如 ast-grep 可进一步增强分析能力。
- 某些代理框架在查找引用方面表现不佳,缺乏 IDE 中“跳转到定义”般的便捷性,影响调试效率。
- 当 LLM 无法处理某些问题时,应果断放弃并自行解决,但识别这些“能力边界”本身具有挑战性且难以预测。
- 完全依赖 LLM 会削弱自身技能,应保持在必要时亲自动手,以维持解决问题的能力。
- 抽象层级的提升是合理策略,通过委托 AI 处理具体执行,可实现更高效率,但需建立在对底层原理的充分理解基础上。
- 理解底层原理(如 CPU 缓存机制)对编写高效代码仍具价值,即使使用高级语言如 Python 也如此。
- 战略思维和逻辑规划是 AI 难以替代的,开发者应学会如何有效指挥 AI 协同工作,以实现长期成功。
- 技术决策需考虑现实背景,某些任务无需长期投资,而更多是日常运营,应区分不同场景下的权衡。
- 为未来做准备是重要考量,当前选择应兼顾短期效率与长期能力积累,避免陷入“只求快”的陷阱。
Show HN: Why write code if the LLM can just do the thing? (web app experiment) #
https://github.com/samrolken/nokode
这是一个名为 nokode 的开源项目,展示了一个无需编写任何应用逻辑的 Web 服务器。项目核心思想是:让大语言模型(LLM)直接处理所有请求,完全替代传统的路由、控制器和业务逻辑代码。
项目实现了一个简单的联系人管理应用(CRUD),通过三个工具实现功能:
- database:执行 SQL 查询,AI 自主设计数据库结构和安全的参数化查询。
- webResponse:生成 HTML、JSON 等响应内容,AI 自行构建页面布局和交互。
- updateMemory:保存用户反馈,用于后续请求中改进界面。
用户通过访问 /contacts 获取网页界面,/api/contacts 获取 JSON 数据,所有逻辑均由 LLM 推理生成。页面内置反馈功能,用户可输入“把按钮变大”等指令,AI 会自动修改界面。
尽管项目运行成功,但存在明显瓶颈:每次请求耗时 30-60 秒,成本高达 0.01-0.05 美元,AI 无法记住之前生成的 UI,容易产生错误 SQL 导致 500 错误,界面风格在不同请求间不一致。
作者认为,虽然当前性能极差,但已证明 LLM 能够自主完成应用逻辑设计,包括数据库建模、API 设计、前端开发和错误处理等。这表明“AI 直接执行用户意图”的未来并非遥不可及。
项目意义在于:应用逻辑正在被基础设施(HTTP、工具定义、数据库连接)取代。真正的未来可能是每秒 120 次推理,实时响应用户输入,无需服务器、数据库或代码,仅凭意图即可运行系统。
项目使用 Node.js 和 Anthropic 的 Claude 模型,通过环境变量配置 API 密钥,启动后访问本地地址即可体验。开发者可通过修改 prompt.md 文件自定义应用行为,探索 AI 生成应用的边界。
HN 热度 409 points | 评论 290 comments | 作者:samrolken | 1 day ago #
https://news.ycombinator.com/item?id=45783640
- 人工智能生成的网页应用因缺乏确定性而不可靠,用户期望的是稳定、可预测的结果,而非每次交互都不同。
- 虽然人们真正追求的是“解决方案”而非“网页应用”本身,但这些解决方案仍需具备可靠性和一致性。
- 人类在解决复杂问题时表现出色,而传统代码的确定性方式在某些场景下可能并非最优解,但完全依赖非确定性 AI 仍不可行。
- 任何有用的产品都必须建立在对细节的深刻理解之上,仅靠“ vibe”或“感觉”无法构建可靠的系统。
- 将软件开发简化为“只要结果好就行”是一种误导性思维,忽视了逻辑流程和系统设计的重要性。
- 人类对确定性的需求体现在日常生活中,如烹饪、亲密关系等,都期望可预测的结果,而非随机变化。
- 人工智能服务的不可预测性会让人失去信任,一旦无法预知其失效边界,用户将选择放弃使用。
- 用 AI 完全替代代码虽有潜力,但当前性能与成本问题严重,尚不具备实际可行性。
- 未来若 AI 推理速度大幅提升,或许会重新思考“是否需要编写代码”的根本问题。
- 从哲学角度看,人类存在的意义在于体验和认知世界,而非仅靠化学刺激获得快感,AI 不应仅作为“快乐按钮”存在。
Visible from space, Sudan’s bloodied sands expose a massacre of thousands #
https://www.telegraph.co.uk/world-news/2025/10/28/sudan-bloodied-sands-massacre-thousands/
卫星图像显示,苏丹城市埃尔法舍尔周边的沙地因数千名平民被屠杀而呈现血红色,其规模之大,甚至从太空可见。在持续 18 个月的围困后,该城于 2025 年 10 月上旬陷落,据称由苏丹快速支援部队(RSF)实施了系统性种族清洗。耶鲁大学公共卫生学院人道主义研究实验室分析卫星影像发现,城市周边存在大量与人体大小相符的物体堆积,以及明显的红褐色地面变色,疑似血液或被扰动的土壤。
RSF 被指控针对非阿拉伯裔土著群体实施有组织的驱逐和处决,包括对妇女、儿童和老人的屠杀。有视频证据显示,RSF 武装人员在释放平民后立即开枪射杀,甚至有儿童士兵杀害成年人的画面。此外,还出现“逐户清剿”的行动迹象,表明存在有计划的暴力清除。
埃尔法舍尔曾是达尔富尔地区最后的政府军据点,超过 25 万人在长期围困中遭受饥饿与轰炸。如今,数十万难民被迫逃往西部的塔维拉,但 RSF 故意封锁向南、向西的撤离路线,强迫民众向东进入无安全与援助的区域。
联合国人权办公室和秘书长 Volker Türk 均警告,埃尔法舍尔正面临日益加剧的大规模种族动机暴力风险。美国前非洲事务国家安全委员会官员卡梅伦·哈德森指出,这与 2023 年埃尔吉内纳的悲剧如出一辙,但国际社会仍未采取行动。
苏丹内战已持续两年半,冲突源于军方领导人布尔汉与副手哈姆丹·达加洛(赫梅蒂)之间的权力斗争。战争已导致 1400 万人流离失所,死亡人数估计达 15 万,全国医疗系统崩溃,部分地区陷入饥荒,被联合国称为“全球最严重的人道主义危机”。
HN 热度 354 points | 评论 165 comments | 作者:wslh | 1 day ago #
https://news.ycombinator.com/item?id=45783699
- 阿联酋被指控向快速支援部队(RSF)提供物资和雇佣兵,并通过迪拜协助洗钱,尤其是与赫梅蒂的黄金交易有关。
- 苏丹内战已造成超过 15 万死亡,约 52.2 万名儿童死于营养不良,885 万多人国内流离失所,350 多万成为难民。
- 非洲多国参与了这场冲突,包括埃塞俄比亚曾支持 RSF,肯尼亚曾主办 RSF 会议,利比亚的哈夫塔尔曾支持 RSF,而俄罗斯在 2024 年中转而支持苏丹武装部队(SAF)。
- 有观点指出,西方媒体在战争初期对双方持相对中立态度,但随着 RSF 暴行暴露,舆论转向将其视为主要恶势力。
- 国际社会对非洲冲突普遍缺乏预见性,导致局势恶化,若早预见 RSF 的残暴行为,可能避免当前危机。
- 多国对苏丹冲突缺乏干预意愿,部分原因在于对利比亚和海地等国干预失败的教训心有余悸。
- 美国可能因阿联酋在以色列问题上的配合而默许其对苏丹的军事支持,而美国对利比亚的破坏为阿联酋的武器运输提供了便利。
- 阿联酋并非武器制造大国,其武器来源可能依赖第三方,如美国或英国,但目前尚无确凿证据表明美国直接向冲突方提供武器。
- 英国和美国的武器通过中间渠道流入苏丹冲突,尽管官方否认,但有报告指出英国军用装备被用于涉嫌种族灭绝的民兵组织。
- 俄罗斯曾支持 RSF,但在 2024 年初转而支持 SAF,并派遣瓦格纳雇佣兵参战。
- 多国对苏丹人民的苦难漠不关心,只关注战后能否获得对自身有利的资源控制权,尤其是黄金资源。
- 苏丹冲突的复杂性在于多方外部势力的介入,而这些国家的动机更多是地缘政治和资源利益,而非人道主义考量。
SailfishOS: A Linux-based European alternative to dominant mobile OSes #
Sailfish OS 起源于诺基亚时代的 MeeGo 项目,该项目由诺基亚与英特尔共同推动,旨在打造一个开放的移动操作系统。尽管诺基亚最终终止了 MeeGo 项目并转向 Windows Phone,但原团队并未放弃,于 2011 年创立了 Jolla 公司,继续发展 MeeGo,并将其演进为如今的 Sailfish OS。
Sailfish OS 于 2013 年推出首个测试版,搭载在 Jolla 智能手机上,同年发布 1.0 正式版,并迅速进入全球 36 个市场。2015 年,Sailfish OS 2.0 发布,同时推出 Jolla 平板电脑,公司也加强了授权策略。2018 年,Sailfish OS 进入第三代,提供安全、模块化的解决方案,适用于企业与政府机构,同时通过 Sailfish X 社区项目服务科技爱好者。2021 年 2 月,第四代 Sailfish 4 发布,支持更多生态系统项目,涵盖私有企业与公共部门部署。
Sailfish OS 是一款成熟的开源移动操作系统,自 2013 年以来已在多款设备上验证,具备独立性,不依赖大型科技公司,拥有完整的知识产权与商标保护。其开发由芬兰 Jolla 公司主导,团队自 2011 年起持续协作,并得到全球开源社区的支持。
系统架构基于 Linux,采用 Qt 框架与 QML 语言构建独特的用户界面,支持动画、触控交互与轻量级应用。Sailfish OS 原生支持 Android 应用,基于 Android 库运行,性能接近原生环境。借助 Qt5 与 Wayland 技术,可复用大量 Android 硬件适配资源,降低开发成本。
用户可从官网获取开源代码,参与共建。Sailfish OS 凭借其安全性、独立性与开放生态,成为企业与政府机构的战略选择,也是移动爱好者理想的替代系统。
HN 热度 331 points | 评论 151 comments | 作者:ForHackernews | 1 day ago #
https://news.ycombinator.com/item?id=45785840
- SailfishOS 是一款基于 Linux 的移动操作系统,适合熟悉 Linux 的用户,具有高度可定制性和良好的系统控制能力,如支持 SSH、rsync、vim 和 cron 等。
- 该系统在隐私和安全方面表现优异,支持通过手机作为 VPN 热点为所有连接设备提供加密流量,这是 iOS 无法实现的功能。
- 尽管 SailfishOS 界面设计多年保持一致且体验流畅,但其官网缺乏足够截图和视频展示,难以有效吸引新用户。
- 当前硬件支持有限,部分新款设备(如 Xperia 10 V)仅提供测试版系统,存在相机等关键功能无法使用的问题。
- 预测性输入法因授权问题已移除,影响用户体验,反映出小厂商在生态竞争中的脆弱性。
- 浏览器基于老旧版本的 Firefox,存在兼容性问题和崩溃风险,虽可通过 Android 兼容层运行主流应用,但并非理想方案。
- 系统维护存在 backlog,部分核心组件更新滞后,反映出开发团队资源紧张。
- 用户希望有价格在 250 欧元以下的经济型设备运行 SailfishOS,但目前主要依赖二手设备或社区支持。
- 美国市场因运营商白名单制度限制,导致 SailfishOS 难以在主流新设备上获得良好支持,影响推广。
- 中国和东南亚市场在移动技术创新方面领先,而美国运营商的封闭政策阻碍了非主流设备的发展。
- 虽然 SailfishOS 不是 Android 或 iOS 的直接替代品,但对追求自由、可控和隐私的用户而言,是一个稳定可靠的选择。
URLs are state containers #
https://alfy.blog/2025/10/31/your-url-is-your-state.html
本文探讨了 URL 作为前端应用中状态管理工具的潜在价值,强调了其在现代 Web 开发中的重要性。作者以 PrismJS 配置下载页的 URL 为例,展示了 URL 不仅能指向页面,还能完整保存配置状态——包括主题、语言、插件等,实现一键分享与恢复。
文章指出,URL 不仅是技术地址,更是用户界面的一部分,具备天然的可分享性、可书签性、支持浏览器历史和深度链接。这些特性使 URL 成为 Web 原生的状态容器,无需依赖数据库、Cookie 或 localStorage。
作者将 URL 的结构分为三部分:路径段、查询参数和锚点,分别适用于不同场景:
- 路径段适合表达资源层级关系,如用户文章或文档结构;
- 查询参数适合传递过滤条件、分页、排序、主题偏好等动态状态;
- 锚点可用于页面内定位或 SPA 路由。
文中列举了多种实用的查询参数模式,包括多值用分隔符(如 + 或,)、嵌套结构(如 key:value)、布尔标志(仅存在即为 true)、以及数组的方括号语法(如 tags[]=react),并提醒开发者注意一致性与兼容性。
真实案例包括:
- PrismJS 配置链接,完整保存语法高亮设置;
- GitHub 代码行高亮链接,精准定位代码段;
- Google Maps 的坐标与缩放信息嵌入 URL;
- Figma 设计文件链接,携带画布位置、缩放、选中元素等完整上下文;
- 电商网站的筛选条件链接,支持用户保存和复用搜索。
最后,文章提出判断哪些状态应放入 URL 的准则:搜索、筛选、分页、视图模式、时间范围、选中项等适合放入;而敏感信息(如密码、令牌、个人身份信息)则不应出现在 URL 中。
核心观点是:作为前端工程师,我们应重新认识 URL 的潜力,将其视为第一优先级的状态管理方案,而非事后补充的工具。
HN 热度 316 points | 评论 140 comments | 作者:thm | 13 hours ago #
https://news.ycombinator.com/item?id=45789474
- 将尽可能多的状态保存在 URL 中,有助于提升用户体验,使用户在刷新页面或分享链接时保持一致的状态。
- URL 中的状态信息应被视为一种临时的、短期使用的公共 API,虽然可能带来限制,但可通过迁移逻辑解决兼容性问题。
- 浏览器历史记录中保留 URL 状态可能带来困扰,例如自动补全时跳转到意外状态,因此需谨慎处理。
- 使用查询参数相比路径更有利于管理临时状态,避免污染历史记录。
- 对于非导航类的临时状态(如表单内容),应优先使用本地存储而非 URL,以避免状态丢失或混乱。
- 当页面内容发生显著变化时,应使用浏览器历史记录的新增条目,以支持合理的返回行为。
- 通过 JavaScript 可以灵活控制历史记录,但需权衡是否新增或替换历史条目,避免破坏用户预期。
- 历史记录管理的正确实现需要产品与工程团队共同关注,但现实中常因缺乏明确规范而被忽视。
- 产品经理和设计师往往忽视 URL 与历史状态的设计,导致开发人员在实现时缺乏指导和约束。
- UX 设计师应具备对 URL 和历史状态的敏感度,主动与开发协作,确保交互逻辑完整。
- 由于 URL 状态管理属于“隐形”体验,开发和设计团队若缺乏重视,极易导致后退按钮等行为异常。
- 一些网站虽有更新 URL 的功能,但错误地使用了历史记录操作,导致用户返回时跳过预期页面,体验极差。
- 从技术角度看,历史 API 足够灵活,但实际应用中仍频繁出错,反映出团队对细节关注不足。
- 在多条件筛选场景下,若每次修改都替换历史记录,可能导致用户无法通过历史返回不同查询状态,造成意外。
Notes by djb on using Fil-C #
https://cr.yp.to/2025/fil-c.html
本文是 djb 关于使用新型内存安全 C/C++ 编译器 Fil-C(filcc, fil++)的使用笔记,记录了其在实际环境中的兼容性表现与部署经验。
Fil-C 兼容性良好,多数现有库和应用无需修改即可正常运行,少数例外也较容易修复。作者目标是通过将管理的机器逐步迁移到 Fil-C 编译的代码,提升系统安全性。
测试环境为一台配备 AMD Ryzen 5 7640HS(Zen 4)CPU、12GB 内存和 36GB 交换空间的 Debian 13 小型 PC。编译过程耗时约 86 分钟(用户时间 477 分钟,系统时间 52 分钟),使用自定义脚本 filian-install-compiler 完成 Fil-C、glibc 和 binutils 的下载、编译与安装。
作者还发布了 filian-install-packages 脚本,用于使用 Fil-C 编译 Debian 源码包,目前已可成功编译 bzip2 等部分软件包。
性能方面,Fil-C 编译的代码在加密类微基准测试中,平均比 clang 编译的版本多消耗 1 到 4 倍的 CPU 周期,属于可接受范围。
Fil-C 提供了多种使用方式,包括通过 Mikael Brockman 的 Filnix 工具,普通用户可在无 root 权限下完成编译与运行(如 Nethack 游戏)。
建议初始配置包括创建 /var/empty 目录,并安装一系列开发工具(如 autoconf、clang、cmake、ninja-build 等)。作者以非特权用户 filc 身份操作,从 GitHub 克隆 Fil-C 源码。
编译过程使用 build_all_fast_glibc.sh,但因内存不足需多次重启,升级至 36GB 交换空间后成功完成。在更大服务器上(512GB RAM)仅需 8 分钟完成 Fil-C 编译。
Fil-C 源码包包含 glibc 及多个库与应用。作者使用自研的 build-parallel-20251023.py 替代原 build_all_slow.sh,支持并行构建,成功编译 60/61 个目标,仅 libcap 和 util-linux 出现问题。
libcap 编译失败因缺少 libc.so.6 共享库;util-linux 的 taskset 需要修改为使用库函数而非系统调用,或对 Fil-C 进行补丁。
其余如 bash、vim、openssl、git、zsh、nginx 等均成功编译,未发现重大问题。
额外尝试编译的软件包括:
- Boost 1.89.0:大部分为头文件,部分测试通过,但
vfork问题通过修改execunix.cpp修复。 - cdb-20251021:运行正常,仅一个内存测试输出不同错误。
- libcpucycles:通过注释配置文件解决。
- libgc:替换为轻量级
gcshim包,仅封装 malloc 等函数,已初步验证可用。
整体来看,Fil-C 具备良好的生态兼容性与实用性,适合用于构建更安全的系统环境。
HN 热度 287 points | 评论 168 comments | 作者:transpute | 19 hours ago #
https://news.ycombinator.com/item?id=45788040
- Fil-C 在某些微基准测试中表现比 C 更快,可能源于测试波动,但需警惕是否存在正确性问题。
- 有人对 Fil-C 的性能表现感到惊讶,认为其在某些场景下可能过于理想,需进一步验证。
- 用 Fil-C 重建整个 Debian 系统已提上日程,相关工具如 GC shim 库和构建脚本对他人有参考价值。
- Fil-C 编译过程内存消耗巨大,构建 LLVM+Clang 时曾用到近 19GB 交换内存,对硬件要求高。
- LLVM 构建时链接阶段内存占用高,建议每 15GB 内存仅运行一个链接任务,这是官方推荐配置。
- GCC 构建时也容易因并行链接任务过多导致内存溢出,即使仅 4 个链接任务也可能消耗 4GB 以上内存。
- cdb.cr.yp.to 域名使用了 pqconnect 加密连接,但其 DNS 查询仍通过 DNSCurve 进行,两者功能不同。
- cdb.cr.yp.to 的 CNAME 记录指向一个以 pq1 开头的域名,该前缀是服务器长期公钥的哈希值,非公钥本身。
- cdb.cr.yp.to 的 CNAME 记录在约 10 月 21 日更新,与 Fil-C 使用说明的发布时间相近。
- Fil-C 是垃圾回收语言,编译后的代码性能通常为 C 的 1 到 4 倍,虽慢于 C 但远优于解释器级别。
- 加密软件是 Fil-C 的典型适用场景,因内存管理少、计算密集,适合其运行时优化。
- 多数 C/C++ 程序在实际开发中避免运行时内存管理,尤其在紧循环中,因此 Fil-C 性能表现可接受。
- 数据库系统如 DBMS 可能涉及大量数据搬运,但多数核心操作仍基于固定缓冲区,运行时内存管理较少。
- 向量化的列式数据库(如 DuckDB)中,部分组件性能敏感,可考虑用 Fil-C 安全包装,关键内核仍用安全外挂调用。
Backpropagation is a leaky abstraction (2016) #
https://karpathy.medium.com/yes-you-should-understand-backprop-e2f06eab496b
本文由 Andrej Karpathy 撰写,探讨了理解反向传播(backpropagation)在深度学习中的重要性。尽管现代深度学习框架(如 TensorFlow)能自动计算梯度,但作者强调:反向传播是一个“有漏洞的抽象”,若不理解其底层机制,容易陷入错误假设,认为任意堆叠层都能自动学习。
文章通过多个实例说明了不理解反向传播可能带来的问题:
- Sigmoid 激活函数的梯度消失问题 当权重初始化过大或输入数据未归一化时,Sigmoid 输出会饱和(趋近于 0 或 1),导致其局部梯度 z*(1−z) 接近零,从而使反向传播中梯度消失,网络无法训练。此外,Sigmoid 的最大梯度仅为 0.25,导致梯度在深层网络中不断衰减,低层训练缓慢。
- ReLU 神经元“死亡”问题 ReLU 在输入为负时输出为零,若某个神经元在训练中始终未激活(如初始权重过小或学习率过高),其梯度将永远为零,导致该神经元永久“死亡”,无法再参与学习。这在实际训练中可能导致大量神经元失效。
- RNN 中的梯度爆炸问题 在循环神经网络中,反向传播需沿时间步回传梯度,每次乘以相同的权重矩阵。若该矩阵的最大特征值大于 1,梯度会指数级增长,导致训练不稳定。因此,使用 RNN 时必须进行梯度裁剪,或改用 LSTM 等更稳定的结构。
- DQN 实现中的一个关键错误
作者分析了一个 TensorFlow 实现的 Deep Q-Network(DQN),发现其在计算损失前对误差 delta 使用了
tf.clip_by_value进行裁剪。这看似防止异常值,但裁剪操作在反向传播中梯度为零,导致梯度信息丢失。正确做法应使用 Huber 损失,它在小误差时用平方损失,大误差时用线性损失,能保持梯度连续性。
总结:理解反向传播不是为了手动实现梯度计算,而是为了识别和避免训练中那些看似合理实则致命的陷阱。掌握其原理,才能真正构建稳定、有效的深度学习模型。
HN 热度 282 points | 评论 119 comments | 作者:swatson741 | 19 hours ago #
https://news.ycombinator.com/item?id=45787993
- 后向传播本身并非问题所在,真正的问题在于梯度和梯度下降等优化方法的抽象存在漏洞,尤其在处理复杂函数时梯度消失或极小的问题。
- 将后向传播视为“泄漏的抽象”是一种误解,因为后向传播只是计算复合函数梯度的算法,其问题本质是函数本身的数学特性,而非算法缺陷。
- 梯度消失并非后向传播的专属问题,任何优化方法在面对梯度极小或为零的情况时都会遇到挑战,全局优化算法理论上可应对,但不适用于高维空间。
- 作者的批评虽有道理,但将问题归因于后向传播本身不够准确,真正关键的是对梯度行为的理解缺失,而非计算梯度的工具。
- 卡帕蒂的文章标题虽有误导性,但其核心观点是:若只将后向传播当作黑箱使用,而不理解其原理,就容易忽视模型训练中的根本问题。
- 卡帕蒂的写作风格偏向教育普及,为非专业读者简化概念,因此在精确性上有所妥协,但这并不影响其对初学者的巨大价值。
- 对于学习者而言,亲手实现梯度计算能帮助理解梯度消失等现象,从而更深入掌握模型训练的本质。
- 一些从业者对底层技术不感兴趣,只关注模型的使用效果和应用前景,这反映了技术使用者与研究者之间的认知差异。
- 抽象是否有效取决于具体场景,当系统接近数值极限或组合复杂时,抽象可能失效,因此理解底层机制在关键时刻至关重要。
Pomelli #
https://blog.google/technology/google-labs/pomelli/
Google Labs 推出全新 AI 实验项目 Pomelli,专为中小型企业(SMBs)打造,助力其轻松创建符合品牌调性的可扩展社交营销活动。
Pomelli 通过 AI 技术分析企业网站,自动生成“品牌 DNA”档案,涵盖品牌语气、专属字体、图像风格及色彩搭配,确保所有生成内容保持一致性和真实性。
使用流程分为三步:首先,输入企业网站,系统自动构建品牌档案;其次,基于品牌 DNA 生成定制化营销活动创意,也可输入自定义提示词;最后,生成高质量、可编辑的品牌视觉素材,支持直接下载并用于社交媒体、官网及广告等多渠道。
目前,Pomelli 以公开测试版形式在美、加、澳、新四国的英语地区上线。作为早期实验项目,欢迎用户试用并提供反馈,帮助持续优化产品。
HN 热度 261 points | 评论 135 comments | 作者:birriel | 1 day ago #
https://news.ycombinator.com/item?id=45786324
- 真实、自然的视频内容,如创业者直接面对镜头讲述创业故事,往往比精心制作的 AI 生成内容更具吸引力和可信度。
- 虽然初期吸引注意力的视频可以简单真实,但后续的营销需要大量辅助性内容,如静态图片、短视频和社交媒体帖子,以持续提醒潜在客户。
- 许多普通人拍摄的视频显得尴尬和不专业,这可能是因为缺乏经验,但相比 AI 生成的“平庸内容”,真实感反而更具优势。
- 能够通过真实视频推广产品的人,往往已经具备了某种自我筛选的优势,这可能造成对成功案例的过度乐观估计。
- 有些产品本身质量优秀,无需过多营销;而有些营销手段虽好,但若产品本身不佳,也难以成功,两者缺一不可。
- 对于不擅长出镜或没有强烈个人故事的商家,使用 AI 生成内容(如 AI 缩略图、语音旁白)在广告投放中效果更佳。
- 一些商业运营者并不适合亲自出镜,因为他们的品牌故事缺乏情感共鸣,难以通过真实视频传达价值。
- 个人价值观与商业行为的一致性很重要,如果无法真诚地推广某产品,即使它有市场价值,也可能违背个人道德准则。
- 有人认为,过度消费和物质积累会让人陷入“被物品支配”的困境,这与追求简单生活的理念相悖。
- 个人经历的苦难不应被轻视,即便经历过长期饥饿和贫困,也应理解人们为生存而采取的现实选择。
Hacker News 精彩评论及翻译 #
You can’t refuse to be scanned by ICE’s facial rec… #
https://news.ycombinator.com/item?id=45781498
“ICE officials have told us that an apparent biometric match by Mobile Fortify is a ‘definitive’ determination of a person’s status and that an ICE officer may ignore evidence of American citizenship—including a birth certificate—if the app says the person is an alien,”
This is “computer says no (not a citizen)”. Which is horrifying
They’ve just created an app to justify what they were already doing right? And the argument will be “well it’s a super complex app run by a very clever company so it can’t be wrong”?
hexbin010
美国移民和海关执法局(ICE)的官员告诉我们,由“移动堡垒”(Mobile Fortify)进行的生物特征匹配是“决定性”的,可以判定一个人的身份。如果该应用程序认定某人为非法移民,那么移民官员就可以忽略其美国公民身份的证据——包括出生证明在内。
这就是“电脑说了算(你不是公民)”。这太骇人听闻了。
他们开发这款应用程序,不就是为了为他们已有的行为提供正当借口吗?而他们届时会辩称:“嗯,这是一个由非常聪明的公司运营的、极其复杂的应用程序,所以它不可能是错的”?
You can’t refuse to be scanned by ICE’s facial rec… #
https://news.ycombinator.com/item?id=45782563
Per thousands of videos on social media, it doesn’t matter what your rights are anymore, if you try to ask for them ICE will just become even more sadistic and violent, and the DOJ/government will refuse to cooperate in bringing them to justice for denying you your rights- you have no rights or recourse anymore even as a citizen. Moreover, the agents are masked and refuse to self identify as the law requires so you will never be able to say who violated your rights- they are hiding their identities because they are committing crimes. They are not police that follow laws, they are state sponsored white supremacist terrorists.
UniverseHacker
社交媒体上的成千上万个视频表明,你的权利已经无所谓了。一旦你试图主张自己的权利,移民和海关执法局(ICE)的执法人员只会变得更加残忍和暴力,而司法部/政府则会拒绝合作,追究他们侵犯你权利的责任。即便你是公民,你也已经没有任何权利或补救措施了。此外,这些执法人员都戴着面罩,拒绝像法律要求的那样表明身份,因此你永远无法指认是谁侵犯了你的权利——他们之所以隐藏身份,正是因为他们在犯罪。他们不是遵守法律警察,而是国家支持的、白人至上主义的恐怖分子。
Addiction Markets #
https://news.ycombinator.com/item?id=45777973
But if you want to outlaw this harmful activity [licensed gambling], you have to find a way to replace 6.4% of Maryland’s budget, which is slightly less than the entire amount the state brings in from corporate taxes. A fraction of the proceeds of losing bets from a fraction of Maryland’s citizens contributes almost the same to state services – EMS, education, road maintenance, etc – than the total corporate taxes levied on all businesses.
Do I misunderstand, or is this just actually incredible?
Humorist2290
但如果你想取缔这种有害活动(有执照的赌博),你就得想办法填补马里兰州6.4%的预算缺口,这笔金额略低于该州从企业税中获得的全部收入。 一小部分马里兰州公民的下注输掉金额的一小部分,其收益为州政府服务(如紧急医疗服务、教育、道路维护等)所做的贡献,几乎与所有企业所缴纳的企业税总额相当。
是我理解错了,还是这真的令人难以置信?
Visopsys: OS maintained by a single developer sinc… #
https://news.ycombinator.com/item?id=45788159
I took an OS in college in 2006 and the big project that my prof required us to do was to make modification of visopsys. The software was primitive at that time but still had UI interface.
I emailed the author to ask some questions in my project. The author had connection with my prof and informed my prof about this. My prof told me that I was not allowed to ask the author regarding this project. So I had to figured out on my own.
It was fun to play around with and learnt how things work at deep OS level. It was a good memory for me :)
And you guys notice anything about my username? :)
visopsys
我2006年在大学修了一门操作系统课,教授要求我们做的大项目就是修改Visopsys。那个软件在当时还很简陋,但已经有用户界面了。
我给软件作者发了邮件,想请教一些关于项目的问题。结果作者和我的教授有联系,他把这事告诉了我的教授。然后教授就告诉我,这个项目上我不允许去问作者。所以最后我只能靠自己琢磨了。
摆弄这个软件还挺有意思的,也让我深入了解了操作系统层面的工作原理。这对我来说是一段很棒的回忆 :)
你们注意到我用户名的特别之处了吗?:)
Show HN: Why write code if the LLM can just do the… #
https://news.ycombinator.com/item?id=45784020
The question posed sounds like “why should we have deterministic behavior if we can have non-deterministic behavior instead?”
Am I wrong to think that the answer is obvious? I mean, who wants web apps to behave differently every time you interact with them?
sunaurus
提出的问题听起来像是:“如果我们能采用非确定性行为,那为什么还要追求确定性呢?”
我的想法难道错了吗?我的意思是,谁希望每次与网页应用互动时,它们的行为都不同呢?
Updated practice for review articles and position … #
https://news.ycombinator.com/item?id=45782402
For position (opinion) or review (summarizing state of art and often laden with opinions on categories and future directions). LLMs would be happy to generate both these because they require zero technical contributions, working code, validated results, etc.
jvanderbot
对于立场(观点)或综述(总结现状并夹杂着对各类别及未来方向的评述),大语言模型会乐于生成这两种内容,因为它们无需任何技术贡献、可工作的代码、已验证的结果等。
Hard Rust requirements from May onward #
https://news.ycombinator.com/item?id=45782109
It’s about time. Critical infrastructure still written in C - particularly code that parses data from untrusted sources - is technical debt that is only going to get worse over time. It’s not as if Rust is that much more difficult to write than C. Rust is explicitly designed to be what you’d get if you were to re-create C knowing what we know now about language design and code safety.
If 32-bit x86 support can be dropped for pragmatic reasons, so can these architectures. If people really, really want to preserve these architectures as ongoing platforms for the future, they need to step up and create a backend for the Rust toolchain that supports them.
lambdaone
早就该这样了。关键基础设施依然使用 C 语言编写——尤其是那些解析来自不可信来源数据的代码——这是一笔技术债,而且只会随着时间的推移而愈发严重。Rust 并不比 C 难写多少。Rust 的设计初衷,就是在今天我们对语言设计和代码安全有了更深刻认知的前提下,重新创造一种 C 语言。
如果出于实际原因可以放弃对 32 位 x86 架构的支持,那么这些架构(指文中提到的老旧架构)也可以被放弃。如果人们真的、真的希望将这些架构作为未来的持续平台,他们需要主动站出来,为 Rust 工具链创建一个支持这些架构的后端。
Updated practice for review articles and position … #
https://news.ycombinator.com/item?id=45782897
There is a general problem with rewarding people for the volume of stuff they create, rather than the quality.
If you incentivize researchers to publish papers, individuals will find ways to game the system, meeting the minimum quality bar, while taking the least effort to create the most papers and thereby receive the greatest reward.
Similarly, if you reward content creators based on views, you will get view maximization behaviors. If you reward ad placement based on impressions, you will see gaming for impressions.
Bad metrics or bad rewards cause bad behavior.
We see this over and over because the reward issuers are designing systems to optimize for their upstream metrics.
Put differently, the online world is optimized for algorithms, not humans.
efitz
根据人们创造内容的数量而非质量来给予奖励,这是一个普遍存在的问题。
如果你激励研究人员发表论文,他们就会想方设法钻制度的空子,只达到最低的质量标准,同时付出最少的努力来发表最多的论文,从而获得最大的回报。
同样,如果你根据点击量来奖励内容创作者,他们就会追求最大化点击量的行为。如果你根据广告展示次数来付费,你就会看到为刷展示量而进行的作弊行为。
糟糕的指标或奖励机制会导致糟糕的行为。
我们一再看到这种情况,是因为奖励的制定者所设计的系统,其目标就是优化他们自身的上游指标。
换句话说,网络世界是为算法而优化的,而不是为人类。
Addiction Markets #
https://news.ycombinator.com/item?id=45778266
It feels like banning advertising for gambling would be a sweet spot between harm reduction and maintaining individual liberty.
Sports gambling ads have ruined sports media. State lottery ads are even worse. The government should not spend money to encourage its own citizens to partake in harmful activities.
shipman05
禁止赌博广告或许能 Harm Reduction(减少危害)与维护个人自由之间找到一个最佳平衡点。
体育赌博广告已经毁了体育媒体。而国家彩票广告则更糟糕。政府不应该花钱去鼓励自己的公民参与有害活动。
Claude Code can debug low-level cryptography #
https://news.ycombinator.com/item?id=45785306
Using coding agents to track down the root cause of bugs like this works really well:
Three out of three one-shot debugging hits with no help is extremely impressive. Importantly, there is no need to trust the LLM or review its output when its job is just saving me an hour or two by telling me where the bug is, for me to reason about it and fix it.
The approach described here could also be a good way for LLM-skeptics to start exploring how these tools can help them without feeling like they’re cheating, ripping off the work of everyone who’s code was used to train the model or taking away the most fun part of their job (writing code).
Have the coding agents do the work of digging around hunting down those frustratingly difficult bugs - don’t have it write code on your behalf.
simonw
使用代码代理来追踪此类错误的根本原因,效果非常好:
三次调试,三次一击即中,无需任何帮助,这堪称惊艳。重要的是,当它的作用只是帮我节省一两个小时的时间,告诉我错误所在,由我自行分析和修复时,我完全没有必要去信任大型语言模型或审查其输出。
文中所描述的方法,或许也是那些对大型语言模型持怀疑态度的开发者开始探索这些工具如何帮助他们的一条好途径,让他们不会有“在作弊”、“窃取他人成果”或是“夺走工作最有趣的部分(写代码)”的感觉。
让代码代理去做那些令人沮丧的、难以追踪的错误的挖掘工作——不要让它为你代写代码。
SQLite concurrency and why you should care about i… #
https://news.ycombinator.com/item?id=45781519
In SQLite, transactions by default start in “deferred” mode. This means they do not take a write lock until they attempt to perform a write.
You get SQLITE_BUSY when transaction #1 starts in read mode, transaction #2 starts in write mode, and then transaction #1 attempts to upgrade from read to write mode while transaction #2 still holds the write lock.
The fix is to set a busy_timeout and to begin any transaction that does a write (any write, even if it is not the first operation in the transaction) in “immediate” mode rather than “deferred” mode.
https://zeroclarkthirty.com/2024-10-19-sqlite-database-is-locked
asa400
在 SQLite 中,事务默认以“延迟(deferred)”模式启动。这意味着它们在尝试执行写操作之前不会获取写锁。
当事务 #1 以读模式启动,事务 #2 以写模式启动,然后事务 #1 尝试在事务 #2 仍然持有写锁的情况下从读模式升级到写模式时,就会发生 SQLITE_BUSY 错误。
解决方法是为数据库设置一个 busy_timeout,并将任何执行写操作的事务(任何写操作,即使它不是事务中的第一个操作)设置为“立即(immediate)”模式,而不是“延迟(deferred)”模式。
You can’t refuse to be scanned by ICE’s facial rec… #
https://news.ycombinator.com/item?id=45781183
This is going to be a huge pain. The US has a very fragmented identity system, and “move fast and break things” approaches like this to bring information from across government systems well outside the scope of what that information was collected for will result in real problems.
I worry what this app and systems like it might mean for me. I’m a US citizen, but I used to be an LPR. I never naturalized - I got my citizenship automatically by operation of law (INA 320, the child citizenship act). At some point I stopped being noodlesUK (LPR) and magically became noodlesUK (US Citizen), but not through the normal process. Presumably this means that there are entries in USCIS’s systems that are orphaned, that likely indicate that I am an LPR who has abandoned their status, or at least been very bad about renewing their green card.
I fear that people in similar situations to my own might have a camera put in their face, some old database record that has no chance of being updated will be returned, and the obvious evidence in front of an officer’s eyes, such as a US passport will be ignored. There are probably millions of people in similar situations to me, and millions more with even more complex statuses.
I know people who have multiple citizenships with multiple names, similar to this person: https://news.ycombinator.com/item?id=45531721. Will these hastily deployed systems be able to cope with the complex realities of real people?
EDIT: LPR is lawful permanent resident, i.e., green card holder
noodlesUK
这会带来巨大的麻烦。美国的身份认证系统非常零散,而这类“快速行动,打破常规”的做法,旨在跨政府系统调取信息,这些信息的收集初衷远非如此,这必然会导致实实在在的问题。
我担忧这款应用以及类似的系统会对我产生什么影响。我是美国公民,但我曾是合法永久居民(LPR)。我没有入籍——我是根据法律自动获得公民身份的(《移民与国籍法》第320条,即儿童公民身份法案)。在某个时候,我不再是“noodlesUK(LPR)”,而是“神奇地”变成了“noodlesUK(美国公民)”,但这并非通过常规流程。想必这意味着美国公民及移民服务局(USCIS)的系统中存在一些“孤儿记录”,这些记录很可能表明我是一名已放弃合法永久居民身份,或至少在续签绿卡方面严重疏忽的人。
我担心,与我处境类似的人可能会因此大难临头。某个旧数据库中毫无可能被更新的记录被调取出来,而官员眼前明明放着美国护照这样的直接证据,却可能被忽略。像我情况类似的人可能有数百万,还有数百万人的身份状况比这更为复杂。
我认识一些人与这位情况类似的人一样,拥有多个国籍和多个名字(https://news.ycombinator.com/item?id=45531721)。这些仓促上线的系统,能够应对现实生活中错综复杂的现实情况吗?
编辑:LPR 指的是合法永久居民,也就是绿卡持有者。
Updated practice for review articles and position … #
https://news.ycombinator.com/item?id=45782265
The HN submission title is incorrect.
Before being considered for submission to arXiv’s CS category, review articles and position papers must now be accepted at a journal or a conference and complete successful peer review.
Edit: original title was “arXiv No Longer Accepts Computer Science Position or Review Papers Due to LLMs”
thomascountz
HN 的提交标题不正确。
在被提交至 arXiv 的计算机科学类别之前,综述文章和立场论文现在必须已被某期刊或会议接收,并完成成功的同行评审。
编辑:原标题为“由于大型语言模型,arXiv 不再接受计算机科学的立场或综述论文”。
You can’t refuse to be scanned by ICE’s facial rec… #
https://news.ycombinator.com/item?id=45782252
Just like IBM said, a computer can’t be held responsible for its decisions. Management’s been doing this for a long time to justify layoffs and such. This is just the next step.
GarnetFloride
就像IBM所说的,计算机不能为其决策负责。管理层长期以来一直用这套说辞来解释裁员等行为。这只是接下来的又一步罢了。
Show HN: Why write code if the LLM can just do the… #
https://news.ycombinator.com/item?id=45784588
Because nobody actually wants a “web app”. People want food, love, sex or: solutions.
Okay but when I start my car I want to drive it, not fuck it.
113
因为没人真的想要一个“网络应用”。人们想要的是食物、爱、性,或者说:解决方案。
好吧,但我启动汽车时,是想开车,而不是干它。
Linux gamers on Steam cross over the 3% mark #
https://news.ycombinator.com/item?id=45792940
I just made the switch. I had been developing on Windows for the last couple of years, mostly to get used to the ecosystem. I wanted to be able to write C and C++ like I do on Linux, without an IDE and with the native toolchain (i.e. no cygwin). On top of that, I play Overwatch every night.
Windows just seems to have zero focus on performance though. React based start menu with visible lag, file Explorer (buggily) parsing files to display metadata before listing them, mysterious memory leaks not reflected in task manager processes.
I installed Linux Mint. While it didn’t just work (TM), and I had to go into recovery mode to install Nvidia drivers, it worked well enough. I can run Overwatch via Steam and pull comparable FPS to Windows (500 FPS on a 3090 with dips into the 400s). Memory usage is stable and at a very low baseline.
It is nice to come back to Linux, and with games I don’t really have a need to run Windows anymore.
TACIXAT
我刚刚转投了Linux。过去几年我一直用Windows开发,主要是为了熟悉那个生态系统。我希望能像在Linux上那样写C和C++,不用集成开发环境,用原生的工具链(也就是不用Cygwin)。除此之外,我每晚还玩《守望先锋》。
但Windows似乎完全不在意性能。基于React的开始菜单有明显卡顿,文件管理器在列出文件前会(卡顿地)解析文件以显示元数据,还有神秘的内存泄漏,这些泄漏在任务管理器的进程里都看不出来。
我装了Linux Mint。虽然它不能即插即用,我还得进入恢复模式来安装NVIDIA驱动,但它的表现足够好了。我可以通过Steam运行《守望先锋》,帧率和在Windows上差不多(在3090显卡上能跑到500帧,偶尔会掉到400多)。内存占用很稳定,并且基准水平非常低。
重新回到Linux感觉真好,有了游戏之后,我真的没有再使用Windows的必要了。
Updated practice for review articles and position … #
https://news.ycombinator.com/item?id=45782329
So what they no longer accept is preprints (or rejects…) It’s of course a pretty big deal given that arXiv is all about preprints. And an accepted journal paper presumably cannot be submitted to arXiv anyway unless it’s an open journal.
Sharlin
所以,他们现在不再接受预印本(或者说是拒稿稿……)。考虑到arXiv的核心就是预印本,这当然是个相当重大的变动。而且,一篇已经被期刊接受的论文,除非期刊本身是开放获取的,否则大概也不能再提交到arXiv上了。
You can’t refuse to be scanned by ICE’s facial rec… #
https://news.ycombinator.com/item?id=45780791
Photos captured by Mobile Fortify will be stored for 15 years, regardless of immigration or citizenship status, the document says.
The headline plus this quote reveals the real intentions — to create a comprehensive dataset that includes biometric data and can be used however the government wishes, regardless of one’s citizenship. I have no doubt that this data will also be sold to other entities.
I remember reading years ago about how facial recognition was particularly bad at correctly identifying people with darker skin and was generally not great as the sole method of identification. The possibility of a mistaken identity being captured by this app would have life-altering implications with essentially no recourse. This is really disturbing.
baubino
文件称,通过Mobile Fortify捕获的照片将被储存15年,无论移民身份或公民身份如何。
标题加上这段引文揭示了其真实意图——创建一个包含生物识别数据的综合数据集,无论一个人的公民身份如何,政府都可以随意使用。我毫不怀疑,这些数据也会被出售给其他实体。
我记得多年前读到过,面部识别技术在正确识别深色皮肤人群方面尤其糟糕,并且通常不适宜作为唯一的身份识别方法。这款应用捕捉到错误身份的可能性将带来改变人生的后果,且几乎没有任何补救措施。这真的令人不安。
Linux gamers on Steam cross over the 3% mark #
https://news.ycombinator.com/item?id=45793048
The only thing windows has focused on has been dark patterns to force users towards cloud and figuring out more and more ways to collect data to sell ads.
I’m not naive, I know a ton of huge enterprises still run huge fleets of windows “servers” but I still find it hilarious that a supposedly serious server OS would default to showing you the weather and ads in the start menu.
SteveNuts
Windows唯一专注的,就是采用暗黑模式,强迫用户转向云端,并想方设法收集更多数据来投放广告。
我并不天真,我知道许多大企业仍在运行庞大的Windows“服务器”集群,但我依然觉得可笑:一个本应是严肃的服务器操作系统,竟然默认会在开始菜单里显示天气和广告。
Dating: A mysterious constellation of facts #
https://news.ycombinator.com/item?id=45785456
I think it’s actually very simple… the paradox of choice.
You introduce somebody to your attractive single friend there’s a real chance they hit it off and form a relationship. You introduce them to 100 attractive friends, one makes more money, one has a more stable job, one is flirtier, etc then it’s both exhausting and none of them seem like a great opportunity.
I think there are certain basic psychological facts that are anti-standard-economics that nerds (and therefore tech companies) almost always tend to be completely blind to. This is one of them.
zug_zug
其实我觉得这很简单……就是选择的悖论。
你把你的单身朋友介绍给别人,他们很可能一拍即合,发展成一段关系。但如果你把100个有吸引力的朋友介绍给他们,有人赚得多,有人工作更稳定,有人更会调情,等等,这会让人筋疲力尽,而且他们中的任何一个看起来都不是一个绝佳的机会。
我认为,存在一些基本的心理学事实,它们与标准经济学背道而驰,而极客们(因此也包括科技公司)却几乎总是对此完全视而不见。这就是其中之一。
You can’t refuse to be scanned by ICE’s facial rec… #
https://news.ycombinator.com/item?id=45781662
They’ve just created an app to justify what they were already doing right?
This was also one of the more advanced theories about the people selection and targeting AI apps used in Gaza. I’ve only heard one journalist spell it out, because many journalists believe that AI works.
But the dissenter said that they know it does not work and just use it to blame the AI for mistakes.
rgsahTR
他们开发这个app,不就是为了给本就在做的事情找个借口,对吧?
这也是关于加沙地区使用的人工智能筛选和定位应用的一种较为先进的说法。我只听说过一位记者明确指出了这一点,因为许多记者都相信人工智能是有效的。
但持不同意见者却说,他们心里清楚这玩意儿根本不管用,只是用它来为错误推卸责任罢了。
Why “everyone dies” gets AGI all wrong #
https://news.ycombinator.com/item?id=45787356
I’m more optimistic about the possibility of beneficial AGI in general than most folks, I think, but something that caught me in the article was the recourse to mammalian sociality to (effectively) advocate for compassion as an emergent quality of intelligence.
A known phenomenon among sociologists is that, while people may be compassionate, when you collect them into a superorganism like a corporation, army, or nation, they will by and large behave and make decisions according to the moral and ideological landscape that superorganism finds itself in. Nobody rational would kill another person for no reason, but a soldier will bomb a village for the sake of their nation’s geostrategic position. Nobody would throw someone out of their home or deny another person lifesaving medicine, but as a bank officer or an insurance agent, they make a living doing these things and sleep untroubled at night. A CEO will lay off 30,000 people - an entire small city cast off into an uncaring market - with all the introspection of a Mongol chieftain subjugating a city (and probably less emotion). Humans may be compassionate, but employees, soldiers, and politicians are not, even though at a glance they’re made of the same stuff.
That’s all to say that to just wave generally in the direction of mammalian compassion and say “of course a superintelligence will be compassionate” is to abdicate our responsibility for raising our cognitive children in an environment that rewards the morals we want them to have, which is emphatically not what we’re currently doing for the collective intelligences we’ve already created.
roughly
我认为,总的来说,我对有益通用人工智能(AGI)的可能性比大多数人要乐观,但文章中有一点引起了我的注意,那就是它诉诸于哺乳动物的社会性,来(有效地)主张同情心是智能的一种涌现品质。
社会学家中一个众所周知的现象是,虽然人们可能富有同情心,但当你将他们集合成一个像公司、军队或国家这样的超有机体时,他们会大体上根据那个超有机体所处的道德和意识形态格局来行事和做决策。任何一个理性的人都不会无缘无故地杀人,但士兵会为了国家的地缘战略地位而轰炸一个村庄。没有人会把别人赶出家园,或者拒绝给另一个人救命药,但作为银行职员或保险代理人,他们靠做这些事谋生,晚上却能心安理得地睡去。一名CEO可能会解雇3万人——相当于将整个小城的人无情地推入市场——其反思程度不亚于蒙古酋长征服一座城市(而且可能情感更少)。人类可能是富有同情心的,但员工、士兵和政治家却不是,尽管乍看之下,他们都是由同样的东西构成的。
这么说吧,如果我们只是笼统地指向哺乳动物的同情心,然后说“当然,超级智能会是有同情心的”,那实际上是在逃避我们的责任——即我们应该在一个能奖励我们所期望道德观的环境中,来培育我们的“认知子女”。而我们目前为我们已经创造出的集体智能所做的,显然并非如此。
Leaker reveals which Pixels are vulnerable to Cell… #
https://news.ycombinator.com/item?id=45779079
GrapheneOS isn’t made by volunteers. They have a team of around 10 paid developers. They are a nonprofit foundation that receives donations and uses those to pay developers, infrastructure etc.
Ars Technica has update its article to rectify that mistake. It doesn’t mention that anymore.
tranq_cassowary
GrapheneOS 并非由志愿者开发。他们拥有一支约10名付费开发者的团队。他们是一个非营利基金会,通过接收捐款来支付开发者、基础设施等费用。
Ars Technica 已更新其文章以纠正这一错误。该文章现已不再提及这一点。
Chat Control proposal fails again after public opp… #
https://news.ycombinator.com/item?id=45784029
Great news. Now maybe we can go on the offense for once. Work to enable constitutional protections against this sort of thing, and develop systems that can work around it if and when this comes back again.
There are places in the world today where only sneakernet communication has any semblance of privacy, so we need non-specialist tools that can provide privacy and secrecy regardless of local conditions. (I’d love to see more communication tools that don’t assume an always-on connection, or low latency, or other first world conditions.)
iamnothere
好消息。也许我们现在总算可以转守为攻了。着手制定能防范此类事件的宪法保护措施,并开发出在事情重演时能够绕过它的系统。
当今世界有些地方,只有通过“网际飞鸽”(sneakernet,指通过物理介质手动传输数据)才能获得一丝隐私,因此我们需要那种不依赖专业工具、能够无视当地环境、提供隐私和保密性的工具。(我希望能看到更多不要求网络始终在线、低延迟或其他“第一世界”条件的通信工具。)
You can’t refuse to be scanned by ICE’s facial rec… #
https://news.ycombinator.com/item?id=45781864
Someone I know is in a similar situation. She doesn’t have the “naturalization documents”. She has a passport, a ssn, and became a citizen before she turned 18.
Will ICE get it right? or will she be put into a prison for months with poor conditions, with an administration that does not want lawyers involved, with little ability to be found or call out for help?
This site likes to do the cowardly take of avoiding politics as long as it’s advantageous. I’m going to look into these companies that produce this tech, and memorize the company names. If a resume ever passes my desk with a significant time at any of these companies, it’s going to be a “no” from me. That’s the small bit of power I hold.
MSFT_Edging
我认识一个人也处于类似的境地。她没有“入籍文件”。她有护照、社会保障号码,并且在18岁之前就已经成为公民。
移民和海关执法局(ICE)会处理好吗?还是说她会被关上好几个月,条件恶劣,在一个不允许律师介入、难以被外界发现或求助的行政体系下?
这个网站只要有利可图就喜欢采取懦弱的态度,回避政治问题。我会去调查这些技术的生产公司,并记住它们的名字。如果在我桌上看到任何一份在这些公司有长期任职经历的简历,我都会直接拒绝。这就是我能掌握的一点点权力。
Claude Code can debug low-level cryptography #
https://news.ycombinator.com/item?id=45786313
I understand the pitch here (“it finds bugs! it’s basically all upside because worst case there’s no output anyways”), but I’m finding some of these agents to be … uhhh… kind of agressive at trying to find the solution and end up missing the forest for the trees. And there’s some “oh you should fix this” stuff which, while sometimes isn’t wrong, is completely besides the point.
The end result being these robots doing bikeshedding. When paired with junior engineers looking at this output and deciding to act on it, it just generates busywork. Not helping that everyone and their dog wants to automatically run their agent against PRs now
I’m trying to use these to some extent when I find myself in a canonical situation that should work and am not getting the value everyone else seems to get in many cases. Very much “trying to explain a thing to a junior engineer taking more time than doing it myself” thing, except at least the junior is a person.
rtpg
我明白这里的说辞(“它能发现bug!这基本上全是优点,因为最坏的情况也不过是没输出而已”),但我发现其中一些代理工具……呃……在试图寻找解决方案时表现得有些过于激进,以至于只见树木不见森林。还有一些“你应该修复这个问题”的提示,虽然有时并非_错误_,但完全不着边际。
最终的结果就是这些机器人在进行无意义的争论。当初级工程师查看这些输出并决定采取行动时,这只会制造出许多琐碎的工作。更糟糕的是,现在每个人都及其团队都想要自动运行他们的代理工具来审查拉取请求。
当我发现自己处于一个本该正常工作的典型场景时,我尝试在一定程度上使用这些工具,但在很多情况下,我并没能获得其他人似乎都得到的价值。这非常像“向初级工程师解释一个问题,花的时间比我自己动手做还要多”的情况,只不过至少那个初级工程师是个真人。
We reduced a container image from 800GB to 2GB #
https://news.ycombinator.com/item?id=45789695
The real lesson they should learn is to not rely on running images and then using “docker commit” to turn it into an image, but instead to use proper image building tools.
If you absolutely have to do it that way, be very deliberate about what you actually need. Don’t run an SSH daemon, don’t run cron, don’t an SMTP daemon, don’t run the suite of daemons that run on a typical Linux server. Only run precisely what you need to create the files that you need for a “docker commit”.
Each service that you run can potentially generate log files, lock files, temp files, named pipes, unix sockets and other things you don’t want in your image.
Taking a snapshot from a working, regular VM and using that as a docker image is one of the worst ways to built one.
perlgeek
他们真正应该学到的教训是,不要依赖于运行容器然后使用“docker commit”来制作镜像,而应该使用合适的镜像构建工具。
如果实在必须那样做,请务必仔细斟酌你实际需要的东西。不要运行SSH守护进程、不要运行cron、不要运行SMTP守护进程,也不要运行典型Linux服务器上运行的那整套守护进程。只运行为通过“docker commit”创建所需文件而必需的精确服务。
你运行的每一个服务都可能生成日志文件、锁文件、临时文件、命名管道、Unix套接字以及其他你不希望出现在镜像中的东西。
从一台正在运行的常规虚拟机快照制作Docker镜像,是构建镜像最糟糕的方式之一。
You can’t refuse to be scanned by ICE’s facial rec… #
https://news.ycombinator.com/item?id=45782215
Your point about orphaned records resonates with me, but for a much simpler (or stupider) “use case”. I took a domestic flight earlier this year and foolishly showed my British passport as ID. I had returned to the country the day before, it just happened to be in my pocket. My green card was clipped to the front of it. After checking the identification page, the TSA agent flipped through the pages of entry stamps, visas, etc. There, they found all my old US work visas, which have long since expired. The agent was convinced that, since I have expired visas, I must be here illegally and would have to “come with [her]”. I pointed out that I have a valid green card, so I’m here legally, and that of course every visa in the book has expired because - well that’s what they do. It took 30 minutes, multiple staff being called over, supervisors, etc before I was allowed to continue. At every step, the presence of the expired visas was a mark against me. Never got an apology or recognition that they were wrong, just eventually told I could be on my way. I truly fear that overzealous thugs will use any “evidence” to prove their presuppositions, like your orphaned records. (I’ve naturalized since then, and carry my passport card around religiously, for all the good it may do…)
oddsockmachine
您提到的“孤儿记录”问题引起了我的共鸣,不过我的经历要简单(或者说愚蠢)得多。今年早些时候,我搭乘国内航班,愚蠢地掏出了我的英国护照作为身份证明。我前一天刚回国,护照刚好放在口袋里,我的绿卡就夹在护照前面。在检查了身份信息页后,TSA(美国运输安全管理局)的 agent 翻到了我的入境章、签证等页面。就在那里,他们发现了我所有的旧美国工作签证,而这些签证早已过期。那个 agent 坚信,既然我有过期签证,那我就一定是在美国非法居留,必须“跟她走”。我指出我持有有效的绿卡,所以我在这里是合法的,而且当然,护照里所有的签证都过期了——因为,嗯,这就是签证的“使命”所在。经过半小时、多名工作人员被叫过来、主管介入等一系列波折,我才得以继续行程。在每一个环节,那些过期签证都成了我的“罪证”。我从未收到过任何道歉,也没人承认他们搞错了,最后只是被告知可以走了。我真的担心那些狂热的暴徒会利用任何所谓的“证据”来证明他们固有的偏见,就像您说的那些“孤儿记录”一样。(从那以后我已经入了美国籍,并且虔诚地把我的护照卡带在身边,尽管这可能也起不了什么作用……)