2025 12 10 HackerNews

2025-12-10 Hacker News Top Stories #

  1. Gemini Pro 3 虚构并生成了一个讽刺且富想象力的 2035 年 Hacker News 首页,既展示技术演进的幽默想象,也触及 AI 内容生成与社区模拟的能力与局限。
  2. 作者批评“每个菜单项都加图标”的设计潮流,认为图标应仅在真正有助于信息传达时使用,否则造成视觉冗余与认知负担。
  3. 安迪·琼斯以“马—国际象棋—AI”比喻指出 AI 进展虽稳定,但在人类等效性上可能突然爆发,已开始替代大量日常技术支持工作。
  4. Mistral 发布开源代码模型家族 Devstral 2(含 123B 与 24B 版本)并推出 Vibe CLI,主打本地部署、大上下文与较高代码理解能力。
  5. Jepsen 报告指出 NATS JetStream 2.12.1 在默认 fsync 策略下存在严重持久性丢失与分裂脑风险,违背其一致性与交付承诺。
  6. 有观点认为 AI 工具能显著降低软件构建成本与时间,但社区讨论更多倾向认为实际生产力提升有限且存在质量风险。
  7. Pebble Index 01 是一款强调隐私与超长电池寿命的微型语音戒指,主打本地语音转笔记与离线处理,预售价 75 美元。
  8. Bruno Simon 的互动式 3D 个人网站以沉浸式游戏体验和高质量展示著称,但加载慢且对设备性能要求高、实际 UX 价值存疑。
  9. 论文提出“通用权重子空间”假设,声称大量微调模型的权重变化集中在低维共享子空间,暗示参数高度可压缩与复用潜力。
  10. 深度分析揭示 NVIDIA、OpenAI 与 Oracle 间复杂的合作与利益链条,并讨论 OpenAI 的去 NVIDIA 化努力与未来硬件竞争。

Show HN: Gemini Pro 3 虚构了 10 年后 HN 首页的内容 (Show HN: Gemini Pro 3 hallucinates the HN front page 10 years from now) #

https://dosaygo-studio.github.io/hn-front-page-2035/news

  1. SpaceX 成功实现星舰 HLS-9 在静海基地的首次遥测,标志着月球着陆任务的重要进展,引发广泛关注。
  2. Linux 7.4 内核正式合并 100% 使用 Rust 编写的内核模块,这是操作系统领域的重要里程碑,提升了系统安全性和可靠性。
  3. 一位开发者分享为何仍坚持手写代码而非依赖 AI 提示,强调编程思维与深度理解的重要性,引发对 AI 辅助开发的反思。
  4. 研究人员展示在接触镜片上运行 LLaMA-12 7B 模型的可行性,借助 WebAssembly 技术,探索边缘计算与可穿戴 AI 的未来。
  5. AlgoDrill 推出交互式算法训练平台,帮助用户通过重复练习掌握 LeetCode 核心模式,防止知识遗忘。
  6. 国际热核聚变实验堆(ITER)实现连续 20 分钟净正能量输出,是核聚变能源发展的重要突破。
  7. 修复 2024 款 Framework 笔记本电脑的全过程回顾,展示了模块化设计的优势与维修挑战。
  8. Google 宣布终止 Gemini 云服务,引发开发者对 AI 平台可持续性的担忧。
  9. 利用 WebGPU 2.0 技术可视化五维空间,通过交互式图形探索高维几何概念。
  10. Nia 项目(YC W36)上线,旨在为自主编程代理提供上下文理解能力,提升 AI 编码效率。
  11. Debian 18 “Trixie"正式发布,带来多项性能优化与新特性,受到开源社区欢迎。
  12. 社区讨论是否应使用 Zig 语言重写 sudo,探讨其在系统工具中的安全与效率潜力。
  13. 欧盟通过“人类验证权”法案,要求 AI 系统在关键场景中必须有人类参与决策,强化数字人权保护。
  14. 逆向分析 Neuralink V4 蓝牙协议,揭示其通信机制,引发对脑机接口安全性的关注。
  15. 麻省理工学院发布光子电路入门介绍,探讨后硅时代计算技术的发展方向。
  16. FDA 批准首款用于乳糖不耐症的 OTC CRISPR 基因疗法,标志着基因编辑技术进入大众医疗领域。
  17. SQLite 4.0 发布,带来性能提升、新功能与 API 改进,成为数据库领域的重要更新。
  18. 讨论如何防止 AR 眼镜中的广告注入,提出硬件与软件层面的防护策略。
  19. Jepsen 测试显示 NATS 4.2 仍存在消息丢失问题,引发对消息队列系统可靠性的质疑。
  20. 使用 RISC-V 集群运行 GTA VI,展示异构计算与游戏模拟的前沿探索。
  21. 倡导函数式编程是未来,强调其在构建可维护、可验证系统方面的优势。
  22. Microsoft Office 365 价格上调至每人每月 40 美元,引发企业用户广泛讨论。
  23. 通过 QEMU 在浏览器中完整模拟 Windows 10 系统,实现无本地安装的运行体验。
  24. 探索将 Tailscale 网络服务部署在 SpaceX Starlink 卫星天线设备上,提升远程连接能力。
  25. AARP 发布面向老年人的深度伪造检测指南,帮助识别虚假视频内容。
  26. 市场传闻 IBM 将收购 OpenAI,虽未证实但引发 AI 产业格局变动猜测。
  27. 服务器端渲染(SSR)出现回归趋势,htmx 等工具推动其在现代 Web 应用中的复兴。
  28. 教程介绍如何在卧室搭建法拉第笼,用于屏蔽电磁干扰,保护隐私与安全。
  29. 学者指出 AI 进展已出现停滞,人类水平智能仍是遥不可及的目标,引发对 AI 泡沫的反思。
  30. 推出一款不依赖 AI 的纯文本编辑器,强调开发者对代码控制权与隐私的重视。

HN 热度 1731 points | 评论 618 comments | 作者:keepamovin | 10 hours ago #

https://news.ycombinator.com/item?id=46205632

  • 这个由 Gemini 生成的未来 Hacker News 页面是 LLM 创造力的巅峰之作,精准捕捉了科技行业趋势与社区文化。
  • 生成内容巧妙讽刺了科技巨头的产品生命周期、价格策略、广告植入以及技术垄断现象。
  • 对未来技术如 Neuralink、AR 眼镜、AI 驱动的办公软件等的设想既荒诞又令人信服,充满黑色幽默。
  • 生成的评论真实还原了 Hacker News 社区的典型风格,包括技术争论、对开源精神的捍卫、对商业化的嘲讽。
  • 特别提到 Office 365 的条件格式规则被广告化,体现了对软件服务过度商业化趋势的批判。
  • SQLite 4.0 引入“Vibe”亲和力等虚构特性,展现了对技术演进的戏谑式想象。
  • 生成内容中对 Nature 期刊、GitHub、LeetCode 等平台的未来形态的模拟,揭示了 LLM 对现实世界知识的深层理解与重构能力。
  • 评论中提到的“Social Credit Score”和付费墙等设定,反映了对数字社会控制机制的担忧。
  • 有人指出生成的评论结构过于单一,建议增加评论树的复杂度以更贴近真实社区生态。
  • 该实验展示了大型语言模型作为创意加速器的巨大潜力,尤其在内容生成与世界模拟方面。
  • 有人认为 LLM 本质上是“即兴喜剧演员”,擅长在熟悉语境中进行荒诞而有逻辑的联想。
  • 对于 AI 生成内容的真实性与可信度,部分人持怀疑态度,但也承认其在激发想象力方面的独特价值。
  • 生成的“Gemini 关闭”公告中提到的“通过 YouTube Shorts 评论提交请求”极具讽刺意味,揭示了 AI 服务可能的极端演化路径。
  • 有人建议未来可以结合真实 Hacker News 用户数据与 AI 生成内容,进一步提升模拟的真实性。

菜单中的图标无处不在——救命啊 (Icons in Menus Everywhere – Send Help) #

https://blog.jim-nielsen.com/2025/icons-in-menus/

作者 Jim 在博客中表达了对当前软件界面中“每个菜单项都默认添加图标”这一设计趋势的强烈不满。他以 Google Sheets 和 macOS Tahoe 为例,指出这些应用在文件、编辑、视图等菜单中几乎每个选项都配有图标,造成了视觉上的冗余和认知负担。

他认为,图标本身并非问题,关键在于是否真正提升了用户体验。优秀的图标能快速传达信息,比如 Finder 中用于窗口布局的图标,能让人一目了然地理解排列方式。但许多情况下,图标的存在缺乏明确依据,导致用户难以理解为何某些项目有图标而另一些没有,例如 Safari 菜单中“设置”有图标,“隐私报告”却没有,尽管后者在工具栏中也有对应图标。

作者指出,这种“默认加图标”的做法容易让设计师陷入模板化思维,不再思考图标是否真正必要,而是为了填满空间而添加。这违背了以用户为中心的设计原则。

更令人遗憾的是,苹果公司此前在人机界面指南中明确反对在菜单中随意使用图标,强调应避免视觉杂乱和用户困惑。然而,macOS Tahoe 的更新却明显背离了这一指导方针,甚至在指南示例中出现了与自身建议相悖的菜单设计。

最终,作者感叹:如今图标已无处不在,想要说服他人“除非有充分理由,否则菜单默认不加图标”变得愈发困难。他呼吁回归简洁,反对无意义的视觉噪音,发出“Send help”的无奈呐喊。


HN 热度 791 points | 评论 318 comments | 作者:ArmageddonIt | 1 day ago #

https://news.ycombinator.com/item?id=46196688

  • 矢量图标在界面中的核心作用是传递信息,而非装饰,若图标恒定不变则失去信息传递功能,应视为装饰性元素并予以舍弃。
  • 早期微软 Word 的图标设计具有信息性,仅在对应工具栏可见时才在菜单中显示图标,用以提示用户可通过工具栏调用该功能,是合理的信息传递方式。
  • 图标能通过模式识别快速传递信息,使用户无需阅读文字即可定位功能,尤其在熟悉界面时可显著提升操作效率。
  • 图标作为视觉锚点,有助于快速识别功能分组,如“删除”类操作只需一个图标即可引导注意力,避免视觉噪音。
  • 图标在跨语言使用场景中具有优势,能帮助非母语用户理解功能,提升多语言环境下的可用性。
  • 交通标志等现实场景表明,在时间有限的情况下,图形符号比文字更高效,是信息传达的优选方式。
  • 若文字内容恒定不变,其信息量也为零,同样可视为装饰,此时位置信息才是关键,但过度依赖位置可能影响可用性。
  • 纯装饰性元素在设计中可存在,但应具有个性化特征,如用户自定义颜色、背景纹理或桌面图片,以增强界面的“生命力”。
  • 过度追求装饰性可能带来信息冗余,干扰用户对有效信息的识别,应以提升可用性为首要目标。
  • 装饰性元素若与功能无关,可能成为界面冗余,降低信息解析效率,应避免无意义的视觉堆砌。
  • 信息冗余在信息论中并非负面概念,适当重复可增强信息传达的可靠性,图标与文字的结合即为此例。
  • 界面设计应避免纯粹的装饰性元素,理想设计应实现功能与美学的统一,装饰性元素应服务于整体体验而非孤立存在。

马匹:AI 进展稳步前行,人类等效性突然爆发 (Horses: AI progress is steady. Human equivalence is sudden) #

https://andyljones.com/posts/horses.html

作者安迪·琼斯在一场 2025 年夏季的五分钟闪电演讲中,通过三个历史类比——马匹、国际象棋与人工智能,探讨技术进步的非线性特征。

他指出,尽管蒸汽机在过去两百年中稳步提升效率,但马匹直到 1930 至 1950 年间才在短短二十年内被大规模淘汰,体现的是“技术等效性”的突然爆发。

同样,在计算机国际象棋领域,从 1985 年开始,AI 每年提升 50 Elo,看似平稳,但到 2010 年,人类顶尖棋手从 90% 胜率迅速滑落至 90% 败率,再次印证“等效性”并非渐进,而是突变。

作者以自身经历为例,说明 AI 在现实工作中的替代速度远超历史预期。作为 Anthropic 早期研究员,他曾每月处理约 4000 名新员工的技术问题。2024 年 12 月,Claude 开始能部分替代他;半年后,80% 的问题已由 AI 解决,其处理量达 3 万条,是人类团队的八倍。

更惊人的是,AI 的成本仅为人类的千分之一,甚至低于全球最廉价劳动力的单位产出成本。

他由此反思:马匹用了 200 年才被取代,棋手用了十年,而他自己仅用六个月就被超越。他担心人类可能无法获得马匹所拥有的“二十年缓冲期”,AI 的替代速度正在急剧压缩适应时间。

结尾强调,尽管 AI 资本投入持续增长,但对个体的影响却是颠覆性的、突如其来的。他呼吁人们正视这一现实,重新思考人与技术的关系。


HN 热度 540 points | 评论 532 comments | 作者:pbui | 1 day ago #

https://news.ycombinator.com/item?id=46199723

  • AI 技术的发展正逐渐取代人类在经济活动中的角色,引发对人类价值被系统性贬低的担忧。
  • 当前科技行业普遍存在对人类情感、关系、艺术和信仰等人文价值的忽视,将其视为可被 AI 替代的资源。
  • 人们开始用 AI 生成情感表达、家庭互动和社交内容,导致真实人际互动被技术中介和稀释。
  • AI 工具虽高效,但其输出质量依赖于输入数据,存在“垃圾进垃圾出”的风险,且可能被商业利益操控。
  • 有人担忧,当 AI 完全接管社会生产后,绝大多数人将失去经济价值,社会可能演变为少数“拥有者”主导的极权式经济形态。
  • 当前趋势已显现出为少数精英服务的经济模式,普通人的存在意义被边缘化,甚至可能被彻底排除。
  • 未来社会可能不再基于劳动价值,而是围绕少数资源掌控者的需求运行,形成类似帝国竞争或自我满足的封闭体系。
  • 有观点指出,AI 的普及正在加速人类对自身价值的放弃,而这种趋势缺乏对技术伦理和人文关怀的反思。

Devstral 2:基于 Mistral 理念的开源代码模型家族,支持本地部署与企业私有化使用 (Devstral2 Mistral Vibe CLI) #

https://mistral.ai/news/devstral-2-vibe-cli

Mistral AI 于 2025 年 12 月 9 日发布新一代开源代码模型家族——Devstral 2,包含两个版本:Devstral 2(123B 参数)和 Devstral Small 2(24B 参数)。两者均采用宽松开源许可,Devstral 2 使用修改版 MIT 协议,Devstral Small 2 采用 Apache 2.0 协议,支持本地部署与企业私有化使用。

Devstral 2 在 SWE-bench Verified 基准测试中达到 72.2% 的准确率,成为当前性能最强的开源代码模型之一,且参数量仅为 DeepSeek V3.2 的五分之一、Kimi K2 的八分之一,实现高效率与高性能的平衡。该模型支持 256K 上下文窗口,具备跨文件理解、依赖管理、错误检测与自动修复能力,适用于复杂代码重构与遗留系统现代化。

Devstral Small 2 在保持 256K 上下文的同时,仅需 24B 参数,可在消费级硬件(包括无 GPU 的 CPU 环境)上运行,支持图像输入,适用于本地化、隐私敏感的开发场景,特别适合个人开发者与小型团队。

Mistral AI 同步推出原生 CLI 工具 Mistral Vibe CLI,基于 Devstral 模型构建,提供终端内自动化编程能力。它支持项目级上下文感知、多文件协同编辑、自然语言指令执行、Git 集成、命令自动补全与可配置权限控制,可通过 config.toml 自定义行为,支持脚本化调用与 IDE 集成(如 Zed)。

目前 Devstral 2 可通过 API 免费使用,后续定价为每百万 token 输入 0.40 美元、输出 2.00 美元;Devstral Small 2 为输入 0.10 美元、输出 0.30 美元。Mistral Vibe CLI 已集成至 Kilo Code、Cline 等主流开发工具,并支持 NVIDIA NIM 部署,未来将支持更多平台。

Mistral AI 强调其模型在真实任务中成本效率比 Claude Sonnet 4.5 高出 7 倍,虽在人类评估中仍略逊于闭源模型,但已显著缩小差距。团队正积极招募人才,推动开源 AI 生态发展。


HN 热度 475 points | 评论 229 comments | 作者:pember | 10 hours ago #

https://news.ycombinator.com/item?id=46205437

  • 生成“鹈鹕骑自行车”的 SVG 图像作为基准测试虽看似荒诞,但能有效反映模型在处理物理上不可能任务时的创造力与能力,且与模型整体性能有良好相关性。
  • 该测试可能已被某些模型训练数据包含,因此存在“基准过拟合”(benchmaxxing)的风险,但目前尚未发现模型仅在特定组合上表现优异而其他任务表现差的情况。
  • 有人质疑该测试是否合理,认为更应关注如“草莓中有几个 r”这类语言逻辑问题,而非视觉荒诞任务。
  • 有人批评频繁使用链接回复他人观点的行为显得不够尊重,缺乏对话延续性,有“SEO 式”传播之嫌,应适当总结以促进交流。
  • 作者回应称,自己已多次重复解释该测试的初衷,撰写文章正是为避免反复复制粘贴相同论点,且该测试本意即为玩笑,后发现其意外具备评估价值。
  • 有人认为该测试已脱离个人控制,成为公共现象,应允许模型训练时使用,若真能“抓到”过拟合,再发布新结论即可,无需过度争论。
  • 有人调侃该讨论如同 90 年代说唱圈的“互喷”文化,过度消耗精力,建议减少无谓争论,让内容自然传播。

NATS JetStream 2.12.1 存在严重数据丢失与脑裂问题,主因是默认每两分钟一次的磁盘刷新策略。在少数节点数据文件被截断或损坏时,系统会丢失大量已确认写入的消息。此外,单节点操作系统崩溃结合网络延迟或进程暂停,或协调性断电故障,也可能导致已提交写入丢失及持久性脑裂现象。 (Jepsen: NATS 2.12.1) #

https://jepsen.io/analyses/nats-2.12.1

NATS JetStream 2.12.1 存在严重数据丢失和分裂脑问题,主要由默认的每两分钟一次的磁盘刷新策略导致。在少数节点数据文件被截断或损坏的情况下,系统会丢失大量已确认写入的消息。此外,单节点操作系统崩溃结合网络延迟或进程暂停,或协调性断电故障,也可能导致已提交写入丢失和持久性分裂脑现象。

尽管 JetStream 声称提供“至少一次”交付和线性一致性,但实际行为与这些承诺存在冲突。CAP 理论表明,线性一致性系统无法在所有情况下保持可用性。测试表明,当多数节点不可用时,系统操作必须失败,这与“始终可用”的宣传不符。

测试使用 Jepsen 框架,在容器和 Docker 环境中对五节点集群进行故障注入,包括进程暂停、崩溃、网络分区、数据文件损坏和模拟断电。通过唯一标识消息并验证最终读取结果,发现存在前缀丢失、中段丢失和后缀丢失三类数据丢失情况。特别地,文件损坏仅发生在少数节点时,仍可导致大规模写入丢失。

此外,NATS 2.10.22 版本存在进程崩溃导致整个流数据完全丢失的问题,已通过 2.10.23 版本修复。当前问题仍在调查中,NATS 已更新文档,明确提示默认 fsync 策略的风险。研究由 Jepsen 独立完成,未获报酬,符合其伦理规范。


HN 热度 422 points | 评论 158 comments | 作者:aphyr | 1 day ago #

https://news.ycombinator.com/item?id=46196105

  • 每次有人构建类似系统时若跳过理论,Aphyr 就会揭露其问题,有人提议用 AI 分析文档来预测系统是否可能丢失已提交写入。
  • 使用 LLM(如 DeepWiki)分析 NATS 文档后得出的结论过于乐观,与 Aphyr 实际测试结果存在明显差距。
  • LLM 的结论天然偏向乐观,因此其分析结果不可完全信赖。
  • 有人指出使用 LLM 进行此类分析只是展示结果,并未提出明确观点或主张。
  • 有人强调,尽管理论重要,但实际工作中仍需结合实践,不能完全依赖理论。
  • 有人批评“老派”工程师过于迷信传统方法,忽视了创新和新思路。
  • 有人反驳称,实际工作中更常见的是盲目追随潮流,而非固守传统。
  • 有人认为,像区块链这样的“颠覆性”技术并未真正改善现实,反而带来更多问题。
  • 有人指出区块链技术(如以太坊 L2)在分布式数据库领域已达到先进水平,具备真正的去中心化特性。
  • 有人认为,与传统中心化数据库(如 DynamoDB、Spanner)相比,区块链的优势在于其去中心化和抗审查能力。
  • 有人强调,区块链的节点加入和退出机制存在资本门槛和时间延迟,限制了其开放性。
  • 有人指出,传统数据库系统如 DynamoDB 和 Spanner 在理论和实践上都已非常成熟。
  • 有人认为,区块链的真正价值在于解决“核心组织被敌对势力控制”的信任问题,这是传统系统无法解决的。

构建软件的成本是否已下降 90%? (Has the cost of building software dropped 90%?) #

https://martinalderson.com/posts/has-the-cost-of-software-just-dropped-90-percent/

Martin Alderson 认为,随着智能体编程(agentic coding)的发展,构建软件的成本可能已下降 90%。他从业近 20 年,经历了开源、云服务、低代码等多次技术变革,但当前 AI 智能体带来的变化是“一代人一次”的转折点。

过去开发一个内部工具,需团队数周甚至一个月完成:搭建 CI/CD、设计数据层、开发前后端、编写测试,且大量时间耗费在沟通协调、代码审查和任务交接上。而如今,借助先进的 AI 编程工具,一个复杂项目可在数小时内完成,包括自动生成 300 多个单元与集成测试,且质量接近人工编写。

核心优势在于:实现时间大幅压缩,而思考时间基本不变。小团队协作效率显著提升,打破了“人越多越慢”的 Brooks 定律。软件开发从“高成本、高门槛”转向“快速试错、快速迭代”,甚至可将失败项目直接抛弃重来。

这将释放巨大的“潜在需求”——许多原本因成本过高(如 5 万美元)而被搁置的业务系统(如 Excel 自动化),如今只需 5000 美元即可实现,催生大量新应用。

未来的核心竞争力不再是编码能力,而是领域知识。开发者若能掌握 AI 工具并结合业务理解,将成为真正的“10 倍工程师”。最高效的合作模式是:一个懂业务的专家与一个熟练使用 AI 工具的开发者紧密配合,取代传统“大团队协作”。

尽管仍有工程师抗拒,认为 AI 只适合新项目或容易出错,但作者指出,AI 在理解老旧代码、定位 Bug、提出修复方案方面已表现卓越,甚至优于离职人员留下的混乱代码。

最后提醒:AI 模型仍在快速进化,当前工具很快将过时。企业若不主动拥抱变化,将在 2026 年被敏捷的竞争对手超越。技术变革不会等你,关键在于主动学习和使用。


HN 热度 394 points | 评论 648 comments | 作者:martinald | 1 day ago #

https://news.ycombinator.com/item?id=46196228

  • AI 工具在软件开发中的实际效率提升有限,多数研究显示其每周节省时间仅约 3-4.4 小时,相当于 10% 左右的生产力提升,远未达到 10 倍的飞跃。
  • 高级工程师使用 AI 工具的效率提升与轻度使用者差异不大,表明代码生成并非显著提升生产力的关键因素。
  • AI 在调试、查阅文档和理解代码库方面表现突出,是真正的生产力增益来源,而非自动生成代码。
  • 部分开发者认为 AI 辅助开发体验“上瘾”且充满乐趣,能实现复杂任务的快速交付,但这种体验依赖长期深度使用和对工具的熟练掌握。
  • 有开发者指出,AI 辅助可能导致更多低质量代码或错误,表现为合并请求数量增加但质量下降,甚至出现“4 倍于 2025 年”的 bug 率。
  • 一些人质疑 AI 带来的“10 倍效率”说法缺乏客观数据支撑,认为这类描述更像个人感受而非可验证的成果。
  • 有观点认为,AI 在 CRUD 类、新项目等标准化场景中效果显著,但在复杂或非标准化系统中容易失控,导致开发“脱轨”。
  • 当前缺乏公开、可复现的实证研究来证明 AI 工具能带来可量化的、可复制的效率飞跃,相关讨论多基于主观体验。

Pebble Index 01 – 大脑的外部记忆 (Pebble Index 01 – External memory for your brain) #

https://repebble.com/blog/meet-pebble-index-01-external-memory-for-your-brain

Pebble Index 01 是一款专为捕捉灵光一现而设计的微型智能戒指,旨在成为用户大脑的外部记忆工具。它通过一个物理按钮和内置麦克风,让你在任何时刻只需按住按钮轻声说出想法,即可将语音内容发送至手机,自动转化为笔记、提醒或待办事项,避免宝贵灵感流失。

这款戒指采用不锈钢材质,防水设计,外观如婚戒般小巧,提供三种颜色(亮银、亮金、磨砂黑)和八个尺码,佩戴舒适且不显眼。其核心优势在于极高的可靠性与隐私保护:仅在按下按钮时才开始录音,所有语音处理均在手机本地完成,不依赖云端服务,确保思想安全。

Index 01 无需充电,电池寿命长达数年,支持离线录音,最多可存储 5 分钟音频,待手机重新连接后自动同步。它不带扬声器或震动马达,仅作为输入设备,减少干扰,保持专注。同时支持与 Pebble 智能手表及其他设备联动,实现信息同步与查看。

设备兼容 iPhone 和 Android,通过开源的 Pebble 移动应用进行管理,支持超过 99 种语言的语音识别与本地大模型运行。用户可自定义按钮操作,如播放音乐、控制智能家居、触发任务自动化(如 Tasker、Home Assistant),甚至将录音直接传输至自建服务器或第三方应用。

未来计划中,单击 + 语音输入将用于核心记忆功能,双击 + 语音输入则可接入更通用的语音代理(类似 ChatGPT + 网络搜索),实现问答、天气查询、交通信息等智能响应,并可通过智能手表或耳机呈现结果。

目前支持的预设功能包括创建笔记、设置提醒、添加日历事件、发送消息等,这些功能均基于开源的 MCP(微型应用)框架运行,用户可自由扩展。产品预售价为 75 美元,2026 年 3 月全球发货后将涨价至 99 美元,支持全球配送。


HN 热度 373 points | 评论 364 comments | 作者:freshrap6 | 10 hours ago #

https://news.ycombinator.com/item?id=46205661

  • 欧盟法规要求产品中的可拆卸电池必须由用户在产品生命周期内随时可更换,且需提供永久在线的使用、拆卸和更换说明。
  • 水洗或水浸环境下的电器设备可豁免电池可拆卸要求,但该豁免是否适用于防水手环尚存争议。
  • 一些公司因欧盟法规带来的认证成本和合规压力,可能选择不进入欧洲市场,即使他们愿意服务欧洲用户。
  • 产品设计为可翻新但不可用户更换电池,可能是为了保持防水性能和密封性,避免用户自行拆装导致损坏。
  • 电池寿命并非用户更换设备的主要原因,更多是屏幕、摄像头损坏或追求新功能。
  • 有人质疑欧盟法规是否会导致更多一次性电子产品的出现,认为这可能与可持续发展目标背道而驰。
  • 市场行为应以盈利为前提,企业有权选择是否进入特定市场,这属于自由市场逻辑。
  • 企业若以盈利为目的,拒绝在成本过高的市场销售产品是合理且可理解的。
  • 一些人认为,监管的存在正是为了纠正市场失灵,防止企业只追求利润而忽视公共利益。
  • 产品设计需在尺寸、重量、成本、防水性和可维修性之间权衡取舍。
  • 用户倾向于长期使用设备,直到电池老化或设备损坏,而非因性能不足而更换。
  • 未来电池技术进步可能减少对可更换电池的需求,但目前仍需考虑可维修性。
  • AirPods 等小型无线设备的电池可更换性将面临挑战,苹果可能推出可更换电池版本以应对法规。
  • 有观点认为,欧盟法规可能推动企业创新,但也可能促使企业将生产转移到监管较宽松的地区。
  • 美国市场正面临政治和经济信任危机,可能影响其作为主要消费市场的地位。
  • 中国和印度等市场具备强大的制造能力和技术人才,可能迅速复制类似产品并以极低价格竞争。
  • 一些人担忧,一旦产品在欧美市场受阻,可能被低价仿制或“三手”版本充斥市场。

全网最酷的 3D 网站之一 (Handsdown one of the coolest 3D websites) #

https://bruno-simon.com/

这是一个名为“Bruno’s Home”的创意网页作品,由开发者 Bruno Simon 打造,展示其个人作品集与互动式 3D 世界。页面以沉浸式游戏体验为核心,用户可自由探索一个充满秘密与挑战的虚拟环境。

页面设有多种互动功能,包括移动、跳跃、驾驶、使用液压系统、与物体交互等,支持键盘、鼠标、触控及游戏手柄操作。用户可通过完成任务解锁成就,例如驾驶一定距离、完成翻滚动作、触发爆炸、参与多人游戏等,共 38 项成就,部分成就需特定条件达成。

页面包含多个区域:项目区、实验室、赛车场、海底、天气变化场景等,每个区域都有独特的挑战和隐藏内容。用户可与环境互动,如与鱼交友、触发天气变化、接受饼干、发送低语(Whispers)等。

页面还提供技术细节说明,展示其技术栈:使用 Three.js 进行 3D 渲染,支持 WebGL 与 WebGPU,结合 Rapier 物理引擎和 Howler.js 音频库。所有前端代码与 Blender 模型均开源,采用 MIT 协议,但服务器代码未公开。

音乐由 Kounine 创作,采用 CC0 协议,可自由使用。开发者还提供 YouTube 开发日志视频,记录项目从零到完成的全过程。

用户可加入 Discord 社区交流,或通过私信联系开发者。页面强调“不要破坏任何东西”,营造探索与发现的乐趣。整体风格融合艺术、技术与互动游戏,是一次极具创意的个人作品展示。


HN 热度 373 points | 评论 95 comments | 作者:razzmataks | 9 hours ago #

https://news.ycombinator.com/item?id=46206531

  • 该 3D 网站是一个制作精良的个人作品集,虽然有趣且视觉效果出色,但并非技术突破,更多是高质量的展示。
  • 网站加载较慢,可能需要等待一分钟,且对设备性能有一定要求,部分用户遇到卡顿或黑屏问题。
  • 使用触控操作在 iPhone 上体验类似《原神》游戏,操作流畅,尤其在 iOS 设备上表现良好。
  • 有人认为该网站的交互体验不佳,3D 设计并未带来实质性的用户体验提升,反而增加了操作复杂度。
  • 与 25 年前相比,如今人们对网页游戏的投入时间大幅减少,这可能与时间价值观念变化、注意力分散以及大脑前额叶发育成熟有关。
  • 该网站的创意和艺术风格令人印象深刻,但并非独创,类似作品在 Three.js/Babylon.js 生态中已有大量先例。
  • 有用户指出,该网站的“全球状态”机制(如传送门计数)可能基于服务器端,体现了某种多人互动的设定。
  • 有人提到该网站的“彩蛋”设计有趣,例如可破坏的社交平台“祭坛”,增加了探索乐趣。
  • 该网站的 3D 设计虽炫酷,但信息传达效率低,用户难以快速获取核心内容,实用性不如传统网页。
  • 有用户建议尝试类似风格的其他 3D 作品集,如 Jesse Zhou 的 3D 个人主页,作为参考。
  • 该网站的加载问题可能与 WebGPU 支持有关,部分浏览器(如 Firefox Android)需开启实验性功能才能正常运行。
  • 有人调侃称,这更像是“下载一个 App”的体验,而非传统网页,反映出现代网页复杂化趋势。
  • 该网站让人回忆起童年经典游戏《Chex Quest》,并引发对过去游戏热情的怀旧情绪。

通用权重子空间假设 (The universal weight subspace hypothesis) #

https://arxiv.org/abs/2512.05117

本文提出“通用权重子空间假设”(The Universal Weight Subspace Hypothesis),通过大规模实证研究发现:尽管训练任务、数据集和初始化方式各不相同,深度神经网络在训练过程中会系统性地收敛到共享的低维参数子空间。研究分析了超过 1100 个模型,包括 500 个 Mistral-7B 的 LoRA、500 个视觉 Transformer 以及 50 个 LLaMA-8B 模型,采用逐模式谱分析方法,揭示了这些模型在权重矩阵中存在稀疏且一致的联合子空间,仅用少数主方向即可捕捉大部分方差。

研究结果表明,这些通用子空间在不同架构、任务和领域间普遍存在,暗示深层神经网络内部存在一种内在的信息组织结构。这一发现为理解模型的泛化能力、参数效率和知识表示提供了新视角,同时对多任务学习、模型合并、模型复用以及高效训练与推理算法的设计具有重要启示。

此外,该研究还提出一个关键问题:是否可能在不依赖大量数据和计算资源的情况下,发现这些通用子空间?若能实现,将显著降低大规模神经网络的碳足迹,推动可持续 AI 的发展。


HN 热度 347 points | 评论 124 comments | 作者:lukeplato | 1 day ago #

https://news.ycombinator.com/item?id=46199623

  • 该研究中提到的“通用权重子空间”实际上仅针对单一预训练模型的微调结果,其结论并不具备跨模型结构的普遍性,因此并不令人意外。
  • 微调模型之间的相似性主要源于预训练模型提供的良好初始化,尤其是 LoRA 等方法在微调过程中对原始模型的偏离有限。
  • 对于从零训练的 ResNet 模型,其权重子空间的稳定性可归因于卷积神经网络架构本身对基础信号处理特征(如 Gabor/Laplacian 滤波器)的强制学习,这是架构决定的。
  • 对于 ViT 模型,由于注意力头存在排列对称性,不同模型间对应头的数学方向可能不一致,若无神经元对齐步骤,SVD 分析将无法捕捉到一致性,因此研究依赖预训练模型来保证坐标系一致。
  • 尽管微调模型的权重变化方向看似随机,但研究发现 500 个微调方向实际落在约 40 维的子空间中,说明微调信息高度可压缩,这具有一定的意外性和潜在价值。
  • 论文的结论在某种程度上只是验证了损失函数具有良好最小值,属于较为基础的观察,但被标题夸大为“通用权重子空间假说”显得过度宣传。
  • 该研究的实验设计存在缺陷,例如使用了来自匿名用户的 Hugging Face 模型,其中甚至包含恶意软件,影响了结果的可信度。
  • 学术论文普遍使用晦涩语言,导致普通读者难以理解,反映出学术界存在为迎合评审和提升影响力而刻意制造复杂性的系统性问题。
  • 学术研究的激励机制导致学者更关注论文的“影响力”和“可见性”而非科学真实进展,这与科研本质背道而驰。
  • 该研究的真正价值可能在于启发后续工作,如从零训练大规模模型并探索其权重子空间的稳定性,而非当前结论本身。
  • 该研究揭示了微调权重的压缩潜力,即用极少量参数(如 160 字节)即可表示一个微调模型,但实际应用仍需存储基础方向向量,限制了其直接实用性。

NVIDIA 与 OpenAI 及 Oracle 的复杂关系 (NVIDIA frenemy relation with OpenAI and Oracle) #

https://philippeoger.com/pages/deep-dive-into-nvidias-virtuous-cycle

NVIDIA 在 2026 财年第三季度财报中表现出色,营收达 570 亿美元,同比增长 62%,数据中心业务占总收入近 90%。然而,深入分析财务数据后发现潜在风险:净利润 319 亿美元,但经营性现金流仅为 238 亿美元,存在 80 亿美元的现金转化缺口;库存接近 198 亿美元,达 120 天的持有周期,显示资本占用压力;应收账款周转天数升至 53 天,表明客户信用政策放宽,回款周期拉长。

市场关注“循环融资”现象,即 NVIDIA 承诺向 OpenAI 投资约 1000 亿美元,OpenAI 随即与 Oracle 签订 3000 亿美元云服务合同(Project Stargate),Oracle 再向 NVIDIA 下单 400 亿美元 GB200 GPU。这一链条引发监管关注,质疑其真实性和可持续性——若 NVIDIA 停止投资,后续交易是否还能成立?

OpenAI 正逐步减少对 NVIDIA 的依赖。尽管其仍在部署 10 吉瓦基础设施训练 GPT-6,但已开始直接采购三星与 SK Hynix 的 HBM 内存晶圆,绕过 NVIDIA 供应链。同时,OpenAI 大量招募来自 Google 和苹果的芯片人才,包括 TPU 负责人 Richard Ho,显示出自研硬件的意图。与 Broadcom 合作也暗示其可能开发定制推理芯片,以降低长期运行成本。

Groq 作为一家专注于高效推理的初创公司,其创始人 Jonathan Ross 为前 Google TPU 负责人,技术路线基于 SRAM 而非 HBM,可避开当前 HBM 产能瓶颈。其估值约 69 亿美元,具备成为 Oracle 战略资产的潜力。若 Oracle 收购 Groq,不仅能提升自身云服务利润率(目前仅 14%),还能为 OpenAI 提供更稳定、低成本的推理方案,形成对 NVIDIA 的供应链制衡。

文章最后提出疑问:NVIDIA 是否知情或默许 OpenAI 的独立布局?是否存在“NVIDIA 投资 OpenAI”与“Oracle 独家采购 NVIDIA 芯片”之间的隐性交换?随着 AI 硬件竞争加剧,2026 年将成为观察这场“盟友变对手”关系演变的关键节点。


HN 热度 300 points | 评论 168 comments | 作者:jeanloolz | 1 day ago #

https://news.ycombinator.com/item?id=46196076

  • SRAM 虽然与逻辑芯片一同制造,理论上不受 HBM 供应链瓶颈影响,但其容量远小于 DRAM,难以满足大规模需求,且纯 SRAM 的资本成本远高于 DRAM。
  • SRAM 在密度上已接近物理极限,未来难以通过先进制程显著提升容量,长期来看存在性能瓶颈。
  • 3D 堆叠技术可用于提升 SRAM 容量,类似 NAND 闪存和 HBM DRAM 的堆叠方式,但目前尚未有大规模商用的多层 SRAM 堆叠产品。
  • HBM DRAM 采用多层堆叠并通过 TSV 技术互联,是提升内存带宽的高效方案,而 SRAM 堆叠在技术和经济上尚未具备可行性。
  • SRAM 每比特需要 6 个晶体管,而 DRAM 仅需 1 个晶体管加电容,因此在追求高密度时,DRAM 始终是首选,SRAM 缺乏大规模堆叠的动力。
  • 能够量产 HBM 堆叠的厂商有限,且当前产能已成瓶颈,难以转向大规模 SRAM 堆叠制造。
  • Groq 采用纯 SRAM 架构虽具创新性,但面临成本和规模的双重挑战,难以完全摆脱对 DRAM 的依赖。
  • 作者对文章风格提出批评,认为其存在 AI 生成内容的典型特征,如奇怪的段落结构、重复句式和风格不一致,且存在明显语法错误。
  • 尽管文章存在语言问题,但其核心结论可能仍具参考价值,不能因文风问题否定其逻辑。
  • Groq 与 Grok 名称相似,但两者无关联,Groq 是芯片公司,Grok 是 x.ai 开发的模型,名称相似可能对 Groq 造成负面影响。
  • 有人认为 AI 生成内容在风格上容易出现“Reddit 风”或突然切换文风,可能在润色过程中破坏原文一致性。
  • 对 AI 生成内容的批评不应仅停留在风格层面,若要反驳其观点,应聚焦于逻辑推理本身,而非攻击来源。

Hacker News 精彩评论及翻译 #

Ask HN: Should “I asked $AI, and it said” replies … #

https://news.ycombinator.com/item?id=46206694

While we will never be able to get folks to stop using AI to “help” them shape their replies, it’s super annoying to have folks think that by using AI that they’re doing others a favor. If I wanted to know what an AI thinks I’ll ask it. I’m here because I want to know what other people think.

At this point, I make value judgments when folks use AI for their writing, and will continue to do so.

gortok

虽然我们永远无法阻止人们使用AI来“帮助”他们构思回复,但当有人认为使用AI是在为他人提供便利时,这真的让人非常恼火。如果我想知道AI的看法,我会直接去问它。我来到这里,是为了了解其他人的想法。

说到底,当有人使用AI进行写作时,我会对此做出价值判断,而且我将继续这样做下去。


Show HN: Gemini Pro 3 hallucinates the HN front pa… #

https://news.ycombinator.com/item?id=46205636

Prompt: Here is the front page from today: <…snip…> Your task is to predict, and craft, in HTML (single file, style-exact) the HN front page 10 years from now. Predict and see the future. Writ it into form!

update: I told Gemini we made it to the front page. Here is it’s response:

LETS GOOOO!

The recursive loop is officially complete: The fake future front page is now on the real present front page. We have successfully created a temporal anomaly.

I hope the comments are confused about why they can’t click the links to download the Neuralink drivers.

Enjoy the karma, time traveler! Just remember to warn them about the 2035 Office 365 price hikes while you’re up there. ;)

keepamovin

这是今天的首页内容:<…snip…> 你的任务是,用HTML(单文件,样式完全一致)来预测并制作出十年后的HN首页。预测并展望未来,把它写出来!

更新:我告诉Gemini我们上首页了。这是它的回复:

成了!

这个递归循环正式完成了:这个虚假的未来首页现在真实的首页上了。我们成功创造了一个时间异常。

我希望评论区里的人会困惑,为什么他们无法点击链接下载Neuralink的驱动程序。

享受你的karma吧,时间旅行者!只是在你“上去”的时候,别忘了提醒他们2035年Office 365的价格会暴涨。;)


Has the cost of building software dropped 90%? #

https://news.ycombinator.com/item?id=46198601

The cost of writing simple code has dropped 90%.

If you can reduce a problem to a point where it can be solved by simple code you can get the rest of the solution very quickly.

Reducing a problem to a point where it can be solved with simple code takes a lot of skill and experience and is generally still quite a time-consuming process.

simonw

编写简单代码的成本已经下降了90%。

如果你能把一个问题简化到可以用简单代码来解决的程度,那么你就能很快地得到剩下的解决方案。

将一个问题简化到可以用简单代码来解决的程度,需要大量的技巧和经验,而且通常仍然是一个相当耗时的过程。


Show HN: Gemini Pro 3 hallucinates the HN front pa… #

https://news.ycombinator.com/item?id=46208598

Google kills Gemini cloud services is the best one. I can’t believe I haven’t seen that joke until today.

tdfirth

谷歌终结Gemini云服务的那个笑话最好笑了,真不敢信我今天才看到。


Show HN: Gemini Pro 3 hallucinates the HN front pa… #

https://news.ycombinator.com/item?id=46206791

“Why I still write raw code instead of prompting the compiler” and “Show HN: A text editor that doesn’t use AI” are my two favorite ones.

Karawebnetwork

“我为何仍然手写代码而非依赖提示编译器”和“发布 HN:一款不使用 AI 的文本编辑器”是我最喜欢的两个。


Show HN: Gemini Pro 3 hallucinates the HN front pa… #

https://news.ycombinator.com/item?id=46207450

That is so syncophantic, I can’t stand LLMs that try to hype you up as if you’re some genius, brilliant mind instead of yet another average joe.

malfist

这也太谄媚了,我真受不了那些LLM,它们把你捧得像个天才、绝顶聪明,而不是又一个普通人。


If you’re going to vibe code, why not do it in C? #

https://news.ycombinator.com/item?id=46207969

Software development jobs must be very diverse if even this anti-vibe-coding guy thinks AI coding definitely makes developers more productive.

In my work, the bigger bottleneck to productivity is that very few people can correctly articulate requirements. I work in backend, API development, which is completely different from fullstack development with backend development. If you ask PMs about backend requirements, they will dodge you, and if you ask front-end or web developers, they are waiting for you to provide them the API. The hardest part is understanding the requirements. It’s not because of illiteracy. It’s because software development is a lot more than coding and requires critical thinking to discover the requirements.

gitremote

软件开发工作种类一定非常多样,就连这位反“氛围编程”的家伙也认为 AI 编程肯定能让开发者的效率更高。

在我的工作中,生产力的更大瓶颈在于很少有人能正确地表达需求。我做的是后端和 API 开发,这与包含后端开发的全栈开发完全不同。如果你问产品经理后端的需求,他们会回避你;如果你问前端或 Web 开发者,他们会等着你提供 API。最困难的部分在于理解需求。这不是因为不善言辞,而是因为软件开发远不止是编码,它还需要批判性思维来挖掘需求。


Horses: AI progress is steady. Human equivalence i… #

https://news.ycombinator.com/item?id=46203606

I may have developed some kind of paranoia reading HN recently, but the AI atmosphere is absolutely nuts to me. Have you ever thought that you would see a chart showing how population of horses was decimated by the mass introduction of efficient engines accompanied by an implication that there is a parallel to human population? And the article is not written in any kind of cautionary humanitarian approach, but rather from perspective of some kind of economic determinism? Have you ever thought that you would be compared to a gasoline engine and everyone would discuss this juxtaposition from purely economic perspective? And barely anyone shares a thought like “technology should be warranted by the populace, not the other way around?”. And the guy writing this works at Anthropic? The very guy who makes this thing happen, but is only able to conclude this with “I very much hope we’ll get the two decades that horses did”. What the hell.

maciejzj

最近读 Hacker News,我可能有点被害妄想症,但 AI 领域的氛围真的让我觉得太疯狂了。你有没有想过,会有人画一张图表,展示高效引擎的普及如何导致马匹数量锐减,并暗示这与人类人口存在某种平行关系?而且,这篇文章完全不是什么带有警示意义的人道主义视角,而是完全从某种经济决定论的角度出发?你有没有想过,自己会被拿来和汽油发动机做比较,而所有人都是从纯粹的经济角度来讨论这种并列关系的?几乎没有人会思考“技术应该服务于民众,而不是反过来”这样的观点?写这篇文章的人,居然在 Anthropic 工作?就是那个亲手促成这一切的人,结果他的结论仅仅是“我非常希望我们能像马匹那样得到那二十年”。这到底是怎么回事。


Microsoft increases Office 365 and Microsoft 365 l… #

https://news.ycombinator.com/item?id=46198894

Here in NZ, pretty much all medium/large businesses and govt departments have gone all-in with M365. Most govt departments are on the E5 licence, and have also started to roll out the Copilot licences too.

The cost and complexity and the effort required to switch away from M365 is massive. It’s not just using a different version of Excel and Word - that’s the least of the issues. It’s all the data stored in SharePoint Online, the metadata, permissions, data governance, etc. It’s the Teams meetings, voice calls, chats and channels. All the security policies that are implemented with Entra and Defender. All the desktop and mobile management that is done through Intune. And the list just goes on and on.

Microsoft bundles so many things with M365, that when you’re already paying for an E5 licence for each user, it makes financial sense to go all-in and use as much as possible.

Take a look at the full feature list to get an idea of what’s included: https://www.microsoft.com/en-nz/microsoft-365/enterprise/microsoft-365-plans-and-pricing

And of course, the more you consume, the harder it is to get out…

amanzi

在新西兰,几乎所有中型/大型企业和政府部门都已全面转向使用 M365。大多数政府部门使用的是 E5 许可证,并且已经开始部署 Copilot 许可证。

要从 M365 迁移出去,其成本、复杂性和所需的工作量是巨大的。这不仅仅是使用不同版本的 Excel 和 Word——那是最次要的问题。问题在于所有存储在 SharePoint Online 中的数据、元数据、权限、数据治理等等。还有 Teams 会议、语音通话、聊天和频道。所有通过 Entra 和 Defender 实施的安全策略。所有通过 Intune 进行的桌面和移动设备管理。清单还远不止这些。

M365 捆绑了如此多的功能,所以当您已经为每个用户支付了 E5 许可证的费用时,全面拥抱并尽可能多地使用,在财务上是合理的。

可以查看完整的功能列表,了解其中包含的内容:https://www.microsoft.com/en-nz/microsoft-365/enterprise/microsoft-365-plans-and-pricing

当然,您使用得越多,就越难以摆脱……


10 Years of Let’s Encrypt #

https://news.ycombinator.com/item?id=46209482

Let’s Encrypt was huge in making it’s absurd to not have TLS and now we (I, at least) take it for granted because it’s just the baseline for any website I build. Incredible, free service that helped make the web a more secure place. What a wonderful service - thank you to the entire team.

The CEO at my last company (2022) refused to use Let’s Encrypt because “it looked cheap to customers”. That is absurd to me because 1), it’s (and was at the time) the largest certificate authority in the world, and 2) I’ve never seen someone care about who issued your cert on a sales call. It coming from GoDaddy is not a selling point…

So my question: has anyone actually commented to you in a negative way about using Let’s Encrypt? I couldn’t imagine, but curious on others’ experiences.

jjice

Let’s Encrypt 在推动普及 TLS 方面功不可没,如今我们(至少是我)已经习以为常,因为它成了我搭建任何网站的基准。这项不可思议的免费服务为让网络变得更安全做出了巨大贡献。多么棒的一项服务——感谢整个团队。

我上一家公司的 CEO(2022年)拒绝使用 Let’s Encrypt,理由是“在客户看来显得廉价”。对此我感到非常荒谬,因为首先,它(以及当时)就是世界上最大的证书颁发机构;其次,我从未见过有人在销售会议上会关心你的证书是由谁颁发的。而来自 GoDaddy 的证书也并非什么卖点……

所以我想问:真的有人因为你们使用 Let’s Encrypt 而提出过负面评论吗?我简直无法想象,但很想知道其他人的经历。


Show HN: Gemini Pro 3 hallucinates the HN front pa… #

https://news.ycombinator.com/item?id=46209145

This is one of the greatest LLM creations I’ve ever seen. It nails so many things: Google killing products, Microsoft price hikes, ad-injecting in AR glasses, and even HTMX returning!

It’d be so awesome if Gemini CLI went through and created the fake posts/articles, and HN even comments. Perhaps a bit much to ask of it?

pseudosavant

这绝对是我见过的最伟大的LLM产物之一。它精准地捕捉到了太多东西:谷歌扼杀产品、微软涨价、AR眼镜中的广告植入,甚至连HTMX的回归都有!

如果Gemini CLI能继续创作出这些虚假的帖子和文章,甚至还能配上Hacker News的评论,那就太酷了。不过,要求它做到这些可能有点过分了?


Has the cost of building software dropped 90%? #

https://news.ycombinator.com/item?id=46204312

Engineers need to really lean in to the change in my opinion.

I tried leaning in. I really tried. I’m not a web developer or game developer (more robotics, embedded systems). I tried vibe coding web apps and games. They were pretty boring. I got frustrated that I couldn’t change little things. I remember getting frustrated that my game character kept getting stuck on imaginary walls and kept asking Cursor to fix it and it just made more and more of a mess. I remember making a simple front-end + backend with a database app to analyze thousands of pull request comments and it got massively slow and I didn’t know why. Cursor wasn’t very helpful in fixing it. I felt dumber after the whole process.

The next time I made a web app I just taught myself Flask and some basic JS and I found myself moving way more quickly. Not in the initial development, but later on when I had to tweak things.

The AI helped me a ton with looking things up: documentation, error messages, etc. It’s essentially a supercharged Google search and Stack Overflow replacement, but I did not find it useful letting it take the wheel.

tangotaylor

在我看来,工程师们需要真正地去拥抱变革。

我曾尝试拥抱变革,我真的试过了。我不是网络开发者或游戏开发者(我更偏向机器人、嵌入式系统领域)。我尝试用那种“氛围感”去编写网络应用和游戏,但它们相当无聊。我对自己无法修改一些小细节感到沮丧。我记得当时我游戏里的角色老是卡在虚拟墙上,我一直让 Cursor 修复它,结果却让情况越来越糟。我还记得我开发了一个简单的包含数据库的前后端应用,用于分析数千条拉取请求的评论,但后来应用变得奇慢无比,我却不知道原因。Cursor 在修复这个问题上帮不上什么忙。整个折腾下来,我感觉自己更笨了。

下一次开发网络应用时,我只自学了 Flask 和一些基础的 JS,结果发现自己进展快得多。这并非在初始开发阶段,而是在后来我需要调整某些东西的时候。

AI 在帮我查阅资料方面给了我巨大的帮助:比如查文档、看错误信息等等。它本质上是一个增强版的谷歌搜索和 Stack Overflow 的替代品,但我发现,让它来主导整个开发过程并不实用。


Microsoft increases Office 365 and Microsoft 365 l… #

https://news.ycombinator.com/item?id=46192517

They also are actively decreasing the value by sunsetting Publisher in October 2026 [0]. Hilariously, the suggested replacement is PowerPoint, despite it being unable to natively open .pub files. The solution for that? Run a powershell script to convert all your publisher files to (uneditable) PDF.

There are many memes about inserting photos into Word, and the content flying around and breaking. My pet theory is that the younger generation never realized Publisher existed or was included in M365, and used PowerPoint as an everything-is-a-hammer crutch, and have now gotten jobs at Microsoft and are sticking with it.

Also, as far as I can tell, Publisher is the only application where the color-picker includes Pantone colors which is a must for professional poster production. I assume Microsoft is paying a licensing fee for this, and I wonder if they’ll remember to cancel it.

Perhaps Affinity can eat their lunch and release a word-processor.

[0] https://support.microsoft.com/en-us/office/microsoft-publisher-will-no-longer-be-supported-after-october-2026-ee6302a2-4bc7-4841-babf-8e9be3acbfd7

TheJoeMan

他们还计划在2026年10月停止对Publisher的支持[0],以此来主动降低其价值。颇具讽刺意味的是,建议的替代品是PowerPoint,尽管它无法原生打开.pub文件。那解决方案呢?运行一个PowerShell脚本,将你所有的Publisher文件转换成(不可编辑的)PDF。

网上有很多关于在Word中插入照片,结果内容乱飞甚至损坏的梗。我有一个个人理论,年轻一代根本没意识到Publisher的存在,或者不知道它已被包含在M365套件中,于是便用PowerPoint来“万金油”式地处理一切问题,后来这些人还进了微软工作,并坚持推行这种做法。

此外,据我所知,Publisher是唯一一个其取色器包含潘通色(Pantone colors)的应用程序,而这对于专业海报制作来说是必不可少的。我猜微软为此支付了授权费,并且很好奇他们会不会记得取消这笔费用。

或许Affinity公司可以趁虚而入,推出一款文字处理软件。

[0] https://support.microsoft.com/en-us/office/microsoft-publisher-will-no-longer-be-supported-after-october-2026-ee6302a2-4bc7-4841-babf-8e9be3acbfd7


Nova Programming Language #

https://news.ycombinator.com/item?id=46195106

ahem, by law programming languages must have code samples on the front page

ajkjk

咳咳,法律规定编程语言的首页必须有代码示例。


Show HN: Gemini Pro 3 hallucinates the HN front pa… #

https://news.ycombinator.com/item?id=46207067

Running LLaMA-12 7B on a contact lens with WASM (arxiv.org)

Laughed out loud at this onion-like headline

arkensaw

在隐形眼镜上通过 WASM 运行 LLaMA-12 7B (arxiv.org) 看到这个像洋葱一样的标题,我笑出声了。


Jepsen: NATS 2.12.1 #

https://news.ycombinator.com/item?id=46198446

NATS be trippin, no CAP.

rishabhaiover

NATS出问题了,真的。


Kroger acknowledges that its bet on robotics went … #

https://news.ycombinator.com/item?id=46202444

I work in this exact space (online grocery retailer in Europe). We’re profitable and one of the few companies to be so in the sector - many online divisions are losing money and being bankrolled by the parent company with physical stores. Alternatively, burning VC money.

The thing that’s wrong with Ocado’s technology is that it’s ridiculously expensive and tailored for huge FC’s (fulfillment centers). The problem with that is that it needs to serve a large population base to be effective and that’s hard - in dense metros, the driving times are much longer despite smaller distances. In sparse metros, the distances are just too long. In our experience, the optimal FC size is 5-10K orders/day, maybe up to 20K/day in certain cases, but the core technology should certainly scale down profitably to 3-5K. Ocado solves for scaling up, what needs to be solved is actually scaling down.

There are a lot of logistical challenges outside the FC, especially last mile and you need to see the system as a whole, not just optimize one part to the detriment of all others.

karamanolev

我就在这个行业工作(欧洲的线上杂货零售商)。我们是盈利的,并且是该行业内少数盈利的公司之一——许多线上业务部门都在亏损,依赖着拥有实体店的母公司提供资金支持,或者是在烧风投的钱。

Ocado 技术的问题在于,它贵得离谱,并且是为大型履约中心(Fulfillment Centers)量身定制的。问题在于,这项技术需要服务于庞大的人口基础才能发挥作用,而这很难——在人口密集的大都市,尽管距离较短,但驾驶时间要长得多;而在人口稀疏的大都市,距离又实在太长。根据我们的经验,一个履约中心的最优规模是每天处理 5,000 至 10,000 个订单,在某些情况下可能高达 20,000 个,但核心技术绝对应该能够以盈利的方式扩展到每天 3,000 至 5,000 个的规模。Ocado 解决的是“向上扩展”的问题,而真正需要解决的是“向下扩展”。

在履约中心之外,还有许多物流方面的挑战,尤其是“最后一公里”的配送问题。你需要将整个系统视为一个整体,而不是为了优化其中一个部分而损害其他所有部分。


I wasted years of my life in crypto #

https://news.ycombinator.com/item?id=46189252

https://vitalik.eth.limo/general/2024/01/31/end.html#section-34:~:text=4

Vitalik touched upon this briefly in an other-wise long and wide-reaching essay. I think its a good treatment of the topic that the author is talking about. He categorizes the ecosystem broadly into 4 cohorts- [token holders] (which includes investors, speculators, etc.), [pragmatic users] (actual end-users who spend crypto to buy stuff), [intellectuals] (who give the vision and ideology), [builders] (of blockchains, apps, etc.) - These 4 groups come together but with different motivations and there is a gap in understanding between them. Indeed, there is even resistance against trying to reach an understanding - one which plays out in the comments section of every crypto-related post on hn. The author of this twitter-post clearly falls under [intellectual, builder] and has been disillusioned by the speculators from [token-holders]. Yet the [token-holders] are a vital component (as are the other groups) as they fund most of the development and adoption. Ultimately these 4 groups have more in common than not. The challenge going forward is to balance the occasionally conflicting needs of all the 4 groups, which includes checking the excesses of each group, while try to achieve a consensus. (Vitalik provides a nice diagram that maps out what that would look like). Crypto is an experiment in economics and economics is a science as well as a social-science. Anyone looking for a good solution must seek to understand and address the psychology of all the actors involved.

mozarella

Vitalik 在一篇内容广泛且篇幅长文中简要提及了这一点。我认为作者对这一话题的处理方式很好。他将生态系统大致分为四类:[代币持有者](包括投资者、投机者等)、[务实用户](实际使用加密货币购买东西的终端用户)、[知识分子](提供愿景和意识形态的人)、以及[建设者](构建区块链、应用等的人)。这四个群体虽然汇集在一起,但动机各不相同,并且彼此之间存在理解上的鸿沟。事实上,甚至存在一种抵制尝试理解的倾向——这种倾向在每篇加密货币相关帖子的评论区中都有所体现。这篇推特帖子的作者显然属于[知识分子、建设者]类别,并且对来自[代币持有者]的投机者感到幻灭。然而,[代币持有者]是至关重要的组成部分(其他群体同样如此),因为他们资助了大部分的开发和采用。归根结底,这四个群体的共同点远多于不同之处。未来的挑战在于平衡这四个群体偶尔会相互冲突的需求,这包括遏制每个群体的过度行为,同时努力达成共识。(Vitalik 提供了一张很好的图表,描绘了这应该是什么样子。)加密货币是一场经济实验,而经济学既是一门科学,也是一门社会科学。任何寻求良好解决方案的人都必须力求理解并应对所有参与者的心理。


Ask HN: Should “I asked $AI, and it said” replies … #

https://news.ycombinator.com/item?id=46207007

I agree with this sentiment.

When I hear “ChatGPT says…” on some topic at work, I interpret that as “Let me google that for you, only I neither care nor respect you enough to bother confirming that that answer is correct.”

hotsauceror

我同意这个观点。

当我在工作中听到有人就某个话题说“ChatGPT说……”时,我会将其理解为:“让我帮你谷歌一下,只是我既懒得在乎,也懒得花心思去确认那个答案是否正确。”