2026 01 13 HackerNews

2026-01-13 Hacker News Top Stories #

  1. macOS Tahoe 窗口圆角过大压缩了可点击的调整大小区域,使用户不得不在窗口外操作,严重降低可用性。
  2. 美联储主席鲍威尔称司法部向他发出大陪审团传票并以刑事指控相威胁,但他强调将独立、依据证据与经济状况履行促稳物价与促进就业的职责。
  3. 借助廉价迷你 PC、Ubuntu、Tailscale 与能在服务器上运行的 AI CLI 代理,普通用户可以更简单、有趣地在家自托管并自动部署多项服务与备份策略。
  4. iCloud Photos Downloader 是一款跨平台命令行工具,可增量同步 iCloud 照片(含 Live Photos、RAW 与元数据)并支持多种安装方式,但需调整 iCloud 设置以使用。
  5. 苹果与谷歌达成多年合作,计划在2026年内用定制的 Gemini 为 Siri 提供 AI 能力并在设备与私有云中计算,这可能涉及约每年十亿美元的支付并改变 AI 竞争格局。
  6. 作者将旧软盘与双微控制器结合制作了带真实插拔感与咔哒声的儿童电视遥控器,硬件与软件设计已开源并注重物理交互体验。
  7. TimeCapsuleLLM 仅用1800–1875年间的文本训练,旨在再现19世纪语言风格、研究时间偏见并探讨历史语料对模型行为的影响与局限。
  8. 鲍威尔在一段约7分钟的视频中指出美国通胀已回落但仍高于目标、劳动力市场放缓,美联储将以数据为依据审慎决定利率以实现长期物价与就业目标。
  9. 基于约15万户交易数据的研究发现,使用 GLP‑1 类药物(如 Ozempic)六个月后美国家庭平均食品支出下降约5.3%,高热量加工食品减少且部分效应可逆。
  10. Anthropic 在服务条款中禁止使用 Claude Code 构建竞争对手,引发关于条款执行、法律合规性及对中国用户更严格限制的争议。

macOS Tahoe 窗口缩放时边角圆角过大带来的操作困境 (The struggle of resizing windows on macOS Tahoe) #

https://noheger.at/blog/2026/01/11/the-struggle-of-resizing-windows-on-macos-tahoe/

文章讨论了 macOS Tahoe 系统中窗口边角圆角过大带来的用户体验问题,尤其是窗口调整大小时的困难。

作者指出,macOS Tahoe 的窗口边角圆角非常大,导致可点击的调整区域被大幅压缩。原本在无圆角情况下,62% 的调整区域位于窗口内部,但在 Tahoe 中,由于圆角过大,约 75% 的有效点击区域已移出窗口范围。

用户习惯性地在窗口内部靠近角落的位置点击以调整大小,但该区域已超出系统识别的有效范围。真正有效的点击区域位于窗口角外,这与直觉相反,导致操作困难且容易出错。

作者认为,这种设计虽然可能出于美学考虑,但严重影响了可用性,使原本简单直观的操作变得不自然且易失败。最终,用户必须学会在窗口外部点击才能成功调整大小,这种反直觉的操作方式增加了出错概率。

文章强调,美观不应以牺牲基本功能为代价,尤其在涉及长期使用习惯的系统操作中。


HN 热度 2541 points | 评论 1093 comments | 作者:happosai | 1 day ago #

https://news.ycombinator.com/item?id=46579864

  • macOS Tahoe 版本存在严重的窗口焦点丢失问题,导致用户在输入时意外切换应用,严重影响使用体验。
  • 该问题在苹果官方支持页面无法有效反馈,用户反馈常被删除,被认为“不够建设性”。
  • 类似焦点抢夺问题在 Windows 系统中也存在,尤其在系统启动或应用加载期间更为明显。
  • Windows 11 在唤醒睡眠后无法正确激活窗口,导致快捷键失效,需手动切换才能恢复。
  • 尽管 Windows 11 存在诸多问题,但用户仍普遍接受其不稳定性,认为这是当前主流操作系统的常态。
  • macOS 过去以稳定著称,如今也频繁出现需要重启的情况,稳定性明显下降。
  • Linux 系统在稳定性、性能和资源占用方面表现优异,尤其在个人电脑上体验优于 Windows 和 macOS。
  • 部分用户在 Linux 上运行游戏性能甚至优于 Windows,例如 Cyberpunk 2077 在 Linux 上帧率更高。
  • 多数用户在不同操作系统间切换时,均会遇到随机异常,重启是常见的解决方式。
  • Chrome 浏览器在 macOS 上关闭标签页时偶尔导致界面卡顿,而 Windows 和 Linux 上较少出现类似问题。
  • 有人指出,某些系统问题可能源于硬件层面,如内存位错误,使用 ECC 内存可缓解。
  • 有用户怀疑焦点问题与公司使用的 JIT 权限管理软件有关,可通过 Python 脚本追踪焦点窃取来源。
  • 有人指出,Android 虽安装量最大,但若按桌面操作系统衡量,Windows 和 macOS 仍占主导地位。
  • 普通用户对 Linux 和 macOS 的认知有限,多数人仅了解 Windows。
  • 系统的稳定性与用户熟悉度密切相关,熟悉度高则容忍度高。
  • 一些用户尝试在 Mac 硬件上安装 Ubuntu,但实际体验仍受硬件兼容性影响。

杰罗姆·鲍威尔的声明 (Statement from Jerome Powell) #

https://www.federalreserve.gov/newsevents/speech/powell20260111a.htm

美联储主席杰罗姆・鲍威尔于一场声明中表示,周五美国司法部向美联储发出了大陪审团传票,威胁将对他在去年六月参议院银行委员会的证词提出刑事指控。该证词部分涉及对美联储历史建筑进行多年的翻修项目。

鲍威尔在声明中强调,他对法治和民主中的问责制有深刻的尊重,指出任何人,包括美联储主席,都不能凌驾于法律之上。然而,他认为这一前所未有的行动应该放在更广泛的背景下看待,认为这是行政部门对美联储的威胁和持续施压的体现。

鲍威尔指出,这一新的威胁并不是针对他去年六月的证词或美联储建筑的翻修项目,而是因为美联储在制定利率时依据的是对公众利益的最佳评估,而不是遵循总统的偏好。他认为,这关系到美联储是否能够继续根据证据和经济状况来设定利率,还是会受到政治压力或恐吓的影响。

鲍威尔回顾自己在四个不同的政府任职的经历,无论是共和党还是民主党,他始终专注于美联储的使命,即实现价格稳定和最大就业。他表示,公共服务有时需要在面对威胁时坚定立场,他将继续履行参议院确认的职责,以诚信和对美国人民的承诺服务。


HN 热度 848 points | 评论 760 comments | 作者:0xedb | 1 day ago #

https://news.ycombinator.com/item?id=46582420

  • 美国正沿着亚当·柯蒂斯《超正常化》中描述的路径发展,权力阶层持续欺骗公众,而公众虽知其虚伪却无力改变。
  • 认为局势不可逆转是一种自我实现的预言,真正的改变取决于民众相信并团结行动的能力,历史上已有先例。
  • 当前多数美国选民的政治意愿并非支持现状,而是对现状的不满,但其行为并未体现这种意愿。
  • 投票支持某候选人并不等于完全认同其未来所有政策,这种观点常被用来合理化对反对派的指责。
  • 现任政府的净支持率迅速转负并持续下滑,所谓“高支持率”是自我安慰式的误判。
  • 国会未能体现选民不满,是因为共和党领袖对特朗普的绝对忠诚,导致议员不敢违逆。
  • 议员们虽有意愿反对特朗普,但担心失去党内支持和选民,陷入两难境地。
  • 特朗普的政策虽有争议,但其支持者认为他正在兑现竞选承诺,如驱逐非法移民、降低油价等。
  • 支持者对政策本身缺乏一致立场,更看重特朗普个人,其支持随其立场变化而变化。
  • 特朗普的政策核心并非具体议题,而是“对抗”与“羞辱”对手,体现为一种情绪化政治。
  • 某些支持者的真实诉求是压制特定群体,如非裔、移民或自由派,而非单纯关注移民或能源政策。
  • 一些支持者对政策的合理化解释是事后附会,其真实动机并非政策本身,而是身份认同与情绪宣泄。

CLI 智能代理让家庭服务器自托管变得更简单、更有趣 (CLI agents make self-hosting on a home server easier and fun) #

https://fulghum.io/self-hosting

2026 年被作者称为“自托管元年”,得益于 CLI 智能代理(如 Claude Code)的出现,自托管家庭服务器变得前所未有的简单和有趣。

过去自托管因复杂的配置而令人望而却步,但如今三大因素让这一切改变:廉价高性能迷你 PC、安全私密的 Tailscale 网络工具,以及能直接在服务器上运行的 AI CLI 代理。

作者选用 Beelink Mini N150 迷你 PC(约 379 美元),搭配 8TB NVMe SSD,构建了一个安静、低功耗的自托管平台。系统基于 Ubuntu Server 22.04,通过 Tailscale 实现安全远程访问。

核心流程是:安装 Linux → 配置 Tailscale → SSH 连接 → 安装 Claude Code → 用自然语言描述需求,AI 自动完成部署。

通过 Claude Code,作者轻松搭建了多个自托管服务:

  • Vaultwarden:自建 Bitwarden 密码管理器,支持所有原生客户端,甚至可设为 iOS 系统默认密码管理器。
  • Immich:功能完整的 Google Photos 替代品,支持自动上传、人脸识别、地图时间线,体验良好。
  • Readeck:替代已关闭的 Pocket,界面清爽,支持跨设备同步阅读进度。
  • Plex、Caddy(反向代理 + 自动 HTTPS)、Home Assistant、Uptime Kuma(服务监控)等也全部容器化运行。

作者还让 Claude Code 生成了一个基于 Go 和 Svelte 的单页监控仪表盘,集成各服务状态与备份日志。

在数据安全方面,作者设置每日本地备份(USB 硬盘)和每周远程备份至 AWS S3(使用 Glacier Deep 存储,成本仅约每月 20 美分),并实现自动监控。

整体系统运行高效,14 个容器仅占用不到 10% CPU 和三分之一内存,硬件有充足余量。

作者强调,这不再是“技术极客的专属游戏”。只要熟悉终端、愿意掌控自己的数字生活,又不想成为系统管理员,2026 年正是尝试自托管的最佳时机。

现在自托管不再繁琐,而是充满掌控感和乐趣,真正实现了“用软件,而非维护软件”。


HN 热度 734 points | 评论 506 comments | 作者:websku | 1 day ago #

https://news.ycombinator.com/item?id=46580326

  • Tailscale 通过简化远程访问配置,显著降低了家庭服务器的安全风险,使用户无需直接暴露端口即可安全访问服务器。
  • 相比 Tailscale,一些用户更倾向于使用 WireGuard 自行管理密钥,认为这能提供更高的控制权和安全性。
  • 暴露端口会增加攻击面,需要更高的技术能力来防范,而家庭用户往往缺乏这种资源和经验。
  • 互联网并非天生安全,家庭服务器不应盲目遵循“开放互联”的原则,而应遵循最小权限原则,仅暴露必要服务。
  • 使用 Tailscale 并未真正减少攻击面,反而引入了第三方依赖,一旦其系统被攻破,整个网络可能面临风险。
  • 从安全角度看,Tailscale 和直接暴露端口都存在风险,关键在于用户对自身威胁模型的理解和管理能力。
  • 将网络设备使用不当(如未打补丁)可能导致设备被用于发起 DDoS 攻击,危害他人,因此应加强安全责任意识。
  • 用“驾驶执照”类比网络使用安全,认为随着网络风险上升,未来可能需要类似监管机制来规范设备使用。
  • 但网络使用与驾驶不同,其“危险”不直接伤害他人,因此不应简单类比为需要强制许可。
  • 将所有联网设备纳入监管或许可制度不现实,且可能加剧中心化,与去中心化初衷相悖。
  • 个人用户应为自身设备安全负责,但不应被强制要求“持证上网”或接受政府监管。

iCloud 照片下载工具 (iCloud Photos Downloader) #

https://github.com/icloud-photos-downloader/icloud_photos_downloader

iCloud Photos Downloader 是一个命令行工具,用于从 iCloud 下载照片,支持 Linux、Windows 和 macOS 系统,适用于笔记本、台式机和 NAS 设备。

该工具提供三种运行模式:

  • 复制模式:仅下载 iCloud 中新增的照片(默认模式)
  • 同步模式:下载新增照片,并删除本地已从 iCloud 移除的文件(通过 –auto-delete 选项启用)
  • 移动模式:下载照片后从 iCloud 删除(通过 –keep-icloud-recent-days 选项控制保留时间)

支持 Live Photos(图像与视频分离保存)、RAW 图像(含 RAW+JPEG)、照片元数据(EXIF)更新,并具备自动去重功能。可设置定时监控 iCloud 变化(–watch-with-interval),并优化增量下载(–until-found 和 –recent 选项)。

使用前需确保 iCloud 账户满足以下条件:

  • 在 iPhone/iPad 上开启「通过网页访问 iCloud 数据」
  • 关闭「高级数据保护」功能,否则会返回 ACCESS_DENIED 错误

可通过以下方式安装和运行:

  • 从 GitHub 发布页下载对应平台的可执行文件
  • 使用包管理器安装(Docker、PyPI、AUR、npm)
  • 从源码构建并运行

项目采用 MIT 许可证,由志愿者开发维护,每周五发布新版本。目前项目正在寻找新的维护者。

更多详细信息请查阅官方文档,或查看 Issues 页面获取帮助。


HN 热度 620 points | 评论 229 comments | 作者:reconnecting | 2 days ago #

https://news.ycombinator.com/item?id=46578921

  • 作者开发的 Photos Backup Anywhere 工具以 Apple Photos 应用本身为数据源,确保在恢复时能完整保留相册、Live Photo、连拍、慢动作、编辑记录及位置、创建和修改时间等复杂元数据,避免了传统工具因仅依赖文件系统元数据而导致的信息丢失或部分重建的问题。
  • 手动修改照片日期后,该修改信息存储在 Photos 应用内部数据库中,并不直接保存在图像文件本身,因此使用某些备份工具(如 Immich)可能无法正确保留编辑后的日期。
  • 在使用 Linux 系统通过 libimobiledevice 工具挂载 iPhone 并同步照片时,可将整个设备的 DCIM 目录及其他相关目录进行备份,但需注意设备设置是否启用了“下载并保留原始文件”选项,否则可能无法获取完整的原始照片。
  • 若手机开启了“优化存储空间”功能,部分照片的原始文件可能并未保留在本地,仅保留缩略图,因此直接从本地读取可能无法获得全部原始素材。
  • 第三方应用(如 PhotoSync)通常只能访问已处理过的照片版本,无法直接获取未经编辑的原始文件,这出于隐私保护考虑,防止敏感内容被第三方轻易恢复。
  • 使用 iTunes/ Finder 备份或第三方工具(如 ios_backup_extractor)从 iPhone 备份中提取照片是一种可靠的方法,可绕过 iCloud 的中间环节,同时也能保留完整的元数据和组织结构。
  • 对于 Android 设备,可通过安装 simpleSSHD 等 SSH 服务应用,实现通过 rsync 进行高速、自动化文件传输,支持密钥认证,适合批量迁移。
  • 某些老旧或存储满的 Android 手机在提取数据前需要先清理空间,甚至通过 root 权限操作,且需控制提取速度以防设备崩溃或中断。

苹果选择谷歌 Gemini 为 Siri 提供动力 (Apple picks Google’s Gemini to power Siri) #

https://www.cnbc.com/2026/01/12/apple-google-ai-siri-gemini.html

苹果公司宣布与谷歌达成多年合作,将采用谷歌的 Gemini 人工智能模型来升级其语音助手 Siri,这一更新预计将在 2026 年内推出。此次合作标志着苹果在人工智能领域迈出重要一步,此前该公司在 AI 浪潮中相对低调,主要依赖 OpenAI 的 ChatGPT 为 Siri 提供复杂查询支持。

根据双方联合声明,苹果经过评估认为谷歌的技术为苹果基础模型提供了最强大的技术基础,将用于未来 AI 功能的开发。尽管使用 Gemini 模型,但所有 AI 运算仍将在苹果设备和其私有云基础设施上完成,确保用户数据隐私。

报道指出,苹果可能每年向谷歌支付约 10 亿美元以使用定制化的 Gemini 模型。这一合作也反映出谷歌在 AI 领域的快速崛起,其市场估值在 2025 年创下新高,首次超越苹果,成为全球市值最高的公司之一。

此外,谷歌目前每年从苹果处获得数十亿美元的收入,作为其搜索服务在 iPhone 上的默认设置。尽管此前因涉嫌垄断受到法律挑战,但最新法院判决允许谷歌维持现有合作模式,包括与苹果的 AI 合作。

目前,苹果尚未对 ChatGPT 在 Siri 中的现有集成做出调整,OpenAI 也未就此发表评论。谷歌则在 2025 年底推出了升级版 Gemini 3 模型,并在云服务领域签下多笔超 10 亿美元的大单,显示出其在 AI 商业化方面的强劲势头。

受此消息提振,谷歌股价一度突破 4 万亿美元大关,苹果股价也短暂上涨,但随后回落。这一合作被视为科技行业 AI 竞争格局变化的重要信号。


HN 热度 605 points | 评论 337 comments | 作者:stygiansonic | 17 hours ago #

https://news.ycombinator.com/item?id=46589675

  • Apple 选择 Google 的 Gemini 来驱动 Siri,是出于对训练大型模型高昂成本的规避,转而专注于边缘推理和设备端优化,将自己定位为“最后一公里”的智能服务交付者。
  • Apple 并非真正放弃自研大模型,而是通过 App Intents、Core Spotlight 等技术整合应用数据与功能,构建以自身生态为核心的智能系统,具备随时切换供应商的能力。
  • 与 Google 合作可能带来深度绑定,通过定制化微调 Gemini 模型,使 Siri 性能显著提升,从而形成较高的迁移成本,不利于未来更换其他供应商。
  • 当前 Siri 体验极差,任何改进都算提升,但一旦升级为 Gemini 驱动,用户对 Siri 的期待将大幅提高,后续若换模型可能面临更大挑战。
  • Apple 不应依赖外部大模型,而是应采用 Ollama 等本地化框架运行开源模型,以实现更好的隐私控制和用户体验。
  • Google 的 Gemini 在实际交互中表现不佳,用户体验远不如预期,甚至在某些场景下比旧版助手更差。
  • Apple 当前的策略是等待 AI 技术发展进入“启蒙期”后的稳定阶段,短期内租赁或采购 SOTA 模型比自建训练基础设施更合理。
  • AI 模型的性能提升速度正在放缓,未来几年内开源模型将快速逼近甚至超越当前闭源模型,届时在设备端运行高性能模型将成为可能。
  • AI 领域同样存在“学习曲线”效应,随着技术积累,模型效率和成本将持续优化,长期来看设备端运行先进 AI 模型是可行的。
  • 若 AI 模型真如某些人所言是“商品”,则 Apple、Meta、Amazon 等巨头不会投入巨资研发自有的 SOTA 模型。

软盘竟成为孩子最棒的电视遥控器 (Floppy disks turn out to be the greatest TV remote for kids) #

https://blog.smartere.dk/2026/01/floppy-disks-the-best-tv-remote-for-kids/

作者为 3 岁儿子设计了一款基于老式软盘的电视遥控装置,旨在让儿童能独立、直观地选择观看内容,摆脱现代智能电视复杂操作和自动播放的困扰。

软盘被用作物理存储介质,不仅具有真实的插入声音(咔哒声、马达转动声),还能通过格式化存储一个名为“autoexec.sh”的脚本文件,实现即插即用的自动播放功能。这种设计让内容“看得见、摸得着”,甚至损坏软盘就有真实后果,增强了孩子的掌控感。

项目采用双微控制器架构:AVR 芯片(ATmega)负责精确控制软盘驱动器读取数据,ESP8266 负责 Wi-Fi 通信。通过在软盘驱动器中加装机械开关检测插入状态,并用逻辑 MOSFET 控制电源,解决了驱动器无法可靠检测磁盘插入的问题。

供电方面使用 18650 锂电池,配合升压模块提供 5V 电源驱动软盘马达。初期因启动电流过大导致系统复位,通过在主控芯片侧添加 1000μF 电容并优化接地设计,最终解决了稳定性问题。

整个系统工作流程为:插入软盘触发中断,唤醒主控芯片,启动软盘读取数据,通过串口发送给 ESP8266,后者将指令发送至 Chromecast 播放视频。播放结束后自动暂停,磁盘取出时发送“弹出”信号。

后端使用“netcat | bash”脚本处理指令,支持多种播放模式,如随机播放“爸爸音乐”或顺序播放指定视频列表。

最终成品为激光切割 MDF 外壳,所有代码和设计均开源在 GitHub 仓库中,实现了一种兼具怀旧情怀与教育意义的儿童互动设备。


HN 热度 470 points | 评论 281 comments | 作者:mchro | 19 hours ago #

https://news.ycombinator.com/item?id=46587934

  • 现代电视对儿童和成人来说都难以使用,复杂的遥控器和不断诱导观看其他内容的界面设计令人困扰。
  • 与正规渠道相比,盗版资源反而更需要用户主动选择观看内容,有助于打破被动消费的“成瘾”循环。
  • 电视用户界面响应迟缓,从输入指令到界面反馈延迟可达 10 至 20 秒,用户体验极差。
  • 高端电视配备性能更强的处理器,能流畅运行复杂系统;而低端电视虽画面差异不大,但系统界面极其卡顿,甚至开机后长时间黑屏加载。
  • 电视内置智能系统(如基于 JavaScript 框架)过于臃肿,导致性能下降,高价购买的不仅是画质,更是背后强大的计算能力。
  • 使用外部设备如 Chromecast 可绕过电视原生系统,避免其糟糕的用户界面,提升使用体验。
  • 即使是性能较老的 Apple TV,某些应用如 Peacock 仍存在严重延迟,包括“下一集”推荐更新缓慢、切换节目时播放旧内容等问题。
  • Apple TV 应用普遍开发质量不佳,界面卡顿、交互不直观,尤其在旧款设备上表现更明显。
  • 应用开发者通常针对最新款高性能 Apple TV 进行优化,导致旧款设备(如 Apple TV HD)运行时体验极差。
  • 某些应用如 Paramount+ 不仅卡顿严重,还频繁崩溃,用户体验极差,几乎无法正常使用。
  • 通过网络过滤工具(如 Pi-hole)排除 Apple TV 的广告追踪请求,可显著减少应用崩溃频率。
  • 将部分流媒体服务(如星战相关节目)通过 Apple TV+ 频道订阅,可避免使用原生应用,从而获得更稳定流畅的播放体验。

TimeCapsuleLLM:仅使用 1800–1875 年数据训练的大型语言模型 (TimeCapsuleLLM: LLM trained only on data from 1800-1875) #

https://github.com/haykgrigo3/TimeCapsuleLLM

这是一个名为 TimeCapsuleLLM 的语言模型项目页面,旨在通过仅使用特定历史时期和地点的数据训练模型,减少现代偏见,还原历史时期的语言风格与思想观念。

项目分为多个版本:

  • v0 和 v0.5 基于 nanoGPT 构建,使用约 187MB 的训练数据,语言风格接近 19 世纪初,但句子多不连贯,存在 OCR 噪音问题。
  • v0.5 显著改进,具备维多利亚时代的写作风格,语法更规范,但仍存在较高事实幻觉。
  • v1 基于 Microsoft 的 Phi 1.5 模型,首次能关联真实历史事件与人物,例如在提示“1834 年”时,模型能提及伦敦的抗议活动与帕默斯顿勋爵。
  • v2mini-eval1 使用 15GB 的数据样本训练,仅运行 10,000 步,但因 tokenization 问题导致输出出现乱码,经修正后可读性提升。

项目数据来源为互联网档案馆(Internet Archive)的 8,894 个 ID,聚焦于 19 世纪伦敦的历史文本,包括报纸、文件、文献等。

项目开源,提供 Hugging Face 链接,支持多语言,强调“让 AI 真正成为历史的回声”,而非简单模仿。

项目文件包括训练脚本、数据集处理代码、模型文件及评估数据,适合研究历史语言模型与时间偏见问题的开发者与学者。


HN 热度 449 points | 评论 188 comments | 作者:admp | 16 hours ago #

https://news.ycombinator.com/item?id=46590280

  • 训练一个截止到 1900 年的先进模型,并用其推导出量子力学和相对论,若能得出合理结论,则可视为大模型通往更高级智能的重要证据。
  • 1900 年前已有大量接近量子力学和相对论的科学发现,如迈克尔逊-莫雷实验、洛伦兹变换、光电效应及克利福德对时空曲率的预言。
  • 模型若能整合 19 世纪末的科学知识,形成统一理论,可能证明其具备类似爱因斯坦的创造性思维能力。
  • 爱因斯坦的成就并非完全凭空而来,而是建立在已有科学积累之上,因此模型可能通过整合已有信息实现类似突破。
  • 人类无法读完所有相关文献,而大模型具备快速处理海量信息的能力,这使其在知识整合方面具有独特优势。
  • 若大模型能独立完成类似科学范式转变(如牛顿力学到广义相对论),可能表明其具备通用智能的特征。
  • 科学革命的范式转变可能并非完全不可通约,大模型可能揭示旧范式与新范式之间的深层结构相似性。
  • 爱因斯坦的成就既体现个人智慧,也反映时代背景,其突破可能是“时代必然”与“天才智慧”的结合。
  • 大模型若能完成类似爱因斯坦的工作,可能本身就是通用人工智能的标志,但不必然意味着超级智能。

美联储主席杰罗姆·鲍威尔讲话视频 (Statement by Federal Reserve Chair Jerome F. Powell [video]) #

https://www.youtube.com/watch?v=KckGHaBLSn4

该网页是美国联邦储备系统主席杰罗姆·鲍威尔于 2026 年 1 月 11 日发表的讲话视频,时长 6 分 54 秒,播放量已达 95.6 万次。视频发布于 YouTube 平台,由联邦储备系统官方频道发布,旨在传达美联储的政策立场与经济展望。

讲话内容聚焦于当前美国经济形势,强调美联储在实现最大就业、价格稳定及长期利率温和方面的货币政策目标。鲍威尔指出,尽管通胀已有所回落,但仍高于目标水平,劳动力市场依然强劲,但存在放缓迹象。美联储将继续采取审慎态度,根据经济数据决定是否进一步调整利率。

视频还介绍了美联储的五大核心职能:制定和执行货币政策、维护金融系统稳定、监督金融机构安全、保障支付系统效率,以及推动消费者保护与社区经济发展。这些职能共同服务于美国经济的整体健康与公共利益。

视频下方附有相关链接,包括美联储官网、过往 FOMC 会议声明与新闻发布会视频,以及更多关于货币政策、金融稳定与消费者权益的专题内容。观众可通过这些资源深入了解美联储的工作机制与政策动态。


HN 热度 362 points | 评论 4 comments | 作者:sprawl_ | 1 day ago #

https://news.ycombinator.com/item?id=46582441

  • 建议将原始链接从 YouTube 视频改为美联储官网的页面链接,以提供更权威和完整的文本内容。
  • 该帖子已被标记为重复,相关评论已移至另一条讨论帖中。
  • 原始帖子内容已包含视频和文字稿,建议使用美联储官网链接以确保信息完整。

Ozempic 使美国人均食品支出平均下降 5.3% (Ozempic reduced grocery spending by an average of 5.3% in the US) #

https://news.cornell.edu/stories/2025/12/ozempic-changing-foods-americans-buy

美国民众开始使用奥昔康(Ozempic)等抑制食欲的药物后,其饮食消费行为发生了显著变化。一项发表于 2025 年 12 月 18 日《市场营销研究杂志》的新研究发现,使用 GLP-1 受体激动剂类药物的美国家庭,在用药六个月后,平均食品支出下降 5.3%,高收入家庭降幅超过 8%。在快餐店、咖啡馆等有限服务餐饮场所的消费也下降约 8%。

研究基于约 15 万个家庭的交易数据与重复调查问卷,对比了用药家庭与未用药家庭的消费模式。结果显示,药物使用后,整体食品购买量减少,尤其在高热量、高度加工食品方面降幅明显:咸味零食减少约 10%,甜点、烘焙食品和饼干消费也大幅下降,连面包、肉类和鸡蛋等日常主食也出现减少。

少数品类出现小幅增长,包括酸奶、新鲜水果、营养棒和肉干,但增幅远小于整体下降幅度。

这些变化不仅限于超市,也延伸至外食消费。研究还显示,美国家庭中使用 GLP-1 药物的比例从 2023 年底的约 11% 上升至 2024 年中旬的 16% 以上。以减重为目的的使用者多为年轻且收入较高人群,而用于治疗糖尿病的使用者则年龄偏大,收入分布更均衡。

值得注意的是,约三分之一的使用者在研究期间停药,其食品支出随之恢复至用药前水平,且购物篮中高糖高脂食品占比上升,表明药物对饮食行为的影响具有可逆性。

研究团队指出,尽管无法完全排除其他生活方式改变的影响,但临床试验与停药后消费模式回归的证据表明,药物带来的食欲抑制是主要驱动因素。

这一趋势对食品制造、餐饮业和零售业具有深远影响,可能促使企业调整产品包装、配方与营销策略。同时,也为政策制定者和公共卫生专家提供了新视角:生物医学干预或许能有效改变饮食行为,这在税收与标签等传统手段难以奏效的领域具有重要意义。


HN 热度 317 points | 评论 570 comments | 作者:giuliomagnifico | 20 hours ago #

https://news.ycombinator.com/item?id=46587536

  • 美国约有 16% 的家庭至少有一名成员使用 GLP-1 类药物,这一比例在德国也存在,但未达到美国水平,且该现象并非美国独有。
  • GLP-1 药物主要减少食欲和食物摄入量,并不直接导致人们停止食用加工食品,是否选择健康饮食仍取决于个人。
  • 有估算认为,若美国人均每日摄入多余 400-700 卡路里,而 GLP-1 使用者平均减少 20-30% 摄入,16% 使用者群体可解释约 3-5% 的杂货支出下降。
  • 有人指出,将卡路里与支出直接挂钩的假设不准确,因为高热量但低营养的超加工食品往往价格更高,而非更便宜。
  • 有观点质疑“平均美国人每日摄入多余 400-700 卡路里”的说法,认为若长期保持 500 卡路里盈余,体重将呈指数级增长,与现实不符。
  • 体重增长存在生理极限,随着体重增加,基础代谢率也上升,导致体重增长趋于平缓,因此长期维持巨大卡路里盈余不现实。
  • 有评论指出,杂货支出下降是家庭层面的统计结果,16% 家庭使用药物导致整体支出下降约 1% 左右,而非 5%。
  • 多数使用 GLP-1 药物的人在达到目标体重后仍继续用药以维持效果,而非仅用于减重阶段。
  • 超加工食品如薯片等在价格上常高于大米、干豆类或土豆等基础食材,因此“加工食品更便宜”的说法缺乏依据。
  • 平均美国人每日摄入 3600 卡路里这一数据与权威推荐摄入量(男性 2000-2800,女性 1600-2200)严重不符,存在明显夸大。

Anthropic:禁止使用 Claude Code 开发 Claude Code 的竞争对手 (Anthropic: Developing a Claude Code competitor using Claude Code is banned) #

https://twitter.com/SIGKITTEN/status/2009697031422652461

页面显示为 X(原 Twitter)平台的网页,内容为一条用户发帖及评论互动。

发帖人 @SIGKITTEN 表示:虽然自己不是律师,但认为某人声明的内容与其消费者条款存在矛盾,提醒他人谨慎对待。

随后 @trq212 回复,解释使用 Claude 的推荐方式是通过官方 API,强调 Anthropic 公司支持开发者基于 Claude 构建各类工具,包括其他编码代理和开发框架,并尊重开发者在工具使用上的多样化偏好。

该帖发布于 2026 年 1 月 10 日,上午 2:41,已获得超过 82.6 万次浏览,引发 1724 条回复,互动活跃。

页面底部显示当前热门话题,包括“Brains”“Randy Fine”“James Smith”“WE’RE SCREWED”等,均位于美国地区趋势榜。


HN 热度 314 points | 评论 169 comments | 作者:behnamoh | 2 days ago #

https://news.ycombinator.com/item?id=46578701

  • Anthropic 禁止使用 Claude Code 开发其竞争对手,但允许用 Claude Code 编写代码来开发其他产品,关键在于是否通过 OAuth 获取令牌并构建类似 Claude Code 的系统。
  • 该条款在实际执行中可能未严格 enforcement,但对其他大模型实验室的使用则被严格限制。
  • Anthropic 对通过第三方平台(如 Cursor)使用其服务的用户也实施政策限制,甚至曾切断 xAI 员工的访问权限。
  • 中国用户已无法使用 Claude 服务,Anthropic 采取了比其他模型提供商更严格的限制措施,且 CEO 公开表态对华政策。
  • 利用 VPN 或欧洲 IP 地址可能规避地理限制,但云服务商 IP 容易被识别并审查,使用住宅 IP 更有效。
  • 有人提出通过购买欧洲 VPS 服务,既能获得欧盟 IP,又能获得长期可用的开发环境。
  • 该条款可能构成反竞争行为,在欧盟等地区可能被认定为无效条款,但实际法律执行仍存争议。
  • 即使条款无效,公司仍可基于自身判断终止服务,但需注意是否存在滥用市场支配地位的问题。
  • 有观点认为,用户无法因违反 ToS 被起诉,因为大多数 ToS 条款在法律上难以强制执行,且用户通常不会因违反条款而被追责。
  • 第三方工具开发者未公开其绕过 OAuth 限制的行为,导致争议升级,而 Anthropic 近期加强了对请求负载格式的限制。
  • 该争议被部分社交媒体人物放大,涉及多个 AI 开发工具的开发者在个人账户中获利,加剧舆论发酵。
  • 使用 API 按量付费的用户通常不受影响,只要不涉及 OAuth 或构建类似 Claude Code 的系统。

Hacker News 精彩评论及翻译 #

The chess bot on Delta Air Lines will destroy you … #

https://news.ycombinator.com/item?id=46593910

Last time I flew Delta they no longer had this bot, which made me sad. One of my favorite parts of flying was getting absolutely crushed into a tiny cube by the airplane seat’s easy chess bot, and then again by the airplane seat itself when the person in front of me reclines their seat.

woopwoop

上次坐达美航空,他们居然没了这个“机器人”,真让我伤心。坐飞机我最享受的,就是被座椅上那个“一键躺平”的机器人压成一个小方块,然后前面的人躺下时,又被座位本身再压一遍。


I’d tell you a UDP joke… #

https://news.ycombinator.com/item?id=46581968

“Hi, I’d like to hear a TCP joke.”

“Hello, would you like to hear a TCP joke?”

“Yes, I’d like to hear a TCP joke.”

“OK, I’ll tell you a TCP joke.”

“Ok, I will hear a TCP joke.”

“Are you ready to hear a TCP joke?”

“Yes, I am ready to hear a TCP joke.”

“Ok, I am about to send the TCP joke. It will last 10 seconds, it has two characters, it does not have a setting, it ends with a punchline.”

“Ok, I am ready to get your TCP joke that will last 10 seconds, has two characters, does not have an explicit setting, and ends with a punchline.”

“I’m sorry, your connection has timed out. Hello, would you like to hear a TCP joke?”

LeoPanthera

你好,我想听一个TCP的笑话。 你好,你想听一个TCP的笑话吗? 是的,我想听一个TCP的笑话。 好的,我给你讲一个TCP的笑话。 好的,我会听一个TCP的笑话。 你准备好听一个TCP的笑话了吗? 是的,我准备好听一个TCP的笑话了。 好的,我马上要发这个TCP笑话了。它会持续10秒,有两个字符,没有铺垫,最后是笑点。 好的,我准备好接收你那个会持续10秒、有两个字符、没有明确铺垫、并以笑点结尾的TCP笑话了。 抱歉,你的连接超时了。你好,你想听一个TCP的笑话吗?


TimeCapsuleLLM: LLM trained only on data from 1800… #

https://news.ycombinator.com/item?id=46590534

Would be interesting to train a cutting edge model with a cut off date of say 1900 and then prompt it about QM and relativity with some added context.

If the model comes up with anything even remotely correct it would be quite a strong evidence that LLMs are a path to something bigger if not then I think it is time to go back to the drawing board.

dogma1138

用比如1900年作为截止日期来训练一个前沿模型,然后给它一些额外背景,提示它关于量子力学和相对论的问题,这会很有趣。如果这个模型能提出哪怕稍微正确的东西,那将是非常有力的证据,证明LLMs是通向更高级事物的路径;如果不是,那我认为是时候回到绘图板重新思考了。


Cowork: Claude Code for the rest of your work #

https://news.ycombinator.com/item?id=46593628

It’s so important to remember that unlike code which can be reverted - most file system and application operations cannot.

There’s no sandboxing snapshot in revision history, rollbacks, or anything.

I expect to see many stories from parents, non-technical colleagues, and students who irreparably ruined their computer.

Edit: most comments are focused on pointing out that version control & file system snapshot exists: that’s wonderful, but Claude Cowork does not use it.

For those of us who have built real systems at low levels I think the alarm bells go off seeing a tool like this - particularly one targeted at non-technical users

jryio

我们必须记住,与代码不同,代码可以回滚,但大多数文件系统和应用程序操作是无法撤销的。它的修订历史、回滚机制或任何其他功能中都没有沙盒快照。我预见会有很多来自家长、非技术同事和学生的故事,他们无可挽回地弄坏了他们的电脑。 编辑:大部分评论都在指出版本控制和文件系统快照的存在:这很好,但 Claude Cowork 并没有使用它们。对于我们这些底层构建过真实系统的人来说,看到这样的工具,警报声就会响起——尤其是针对非技术用户的工具。


The struggle of resizing windows on macOS Tahoe #

https://news.ycombinator.com/item?id=46580317

This post is very well presented and it highlights how absolutely bizarre the latest update was. The video demonstration was also very well done.

I remember a few years ago, people complained when Apple merely made the entire operating system uglier. (Something about a gradient on the battery?) A lot of people would talk hyperbolically (“apple KILLED macos!”), and that’s indistinguishable to an outsider when an update like this brings other people out of the woodwork to say, “Hey, these changes are genuinely bizarre and absurd, what happened?”

lynndotpy

这篇帖子写得非常好,并且突出展示了最新更新是多么的离奇。视频演示也同样做得非常出色。

我记得几年前,当苹果只是让整个操作系统变得更丑时,人们就开始抱怨了。(好像是电池那儿加了渐变色之类的?)很多人会言过其实地大喊大叫(比如“苹果毁了macos!”)。而当这次更新让其他一些人也站出来说“嘿,这些改动真的很古怪和荒谬,到底发生了什么?”时,对于局外人来说,这两种情况是无法区分的。


Don’t fall into the anti-AI hype #

https://news.ycombinator.com/item?id=46583900

non-trivial coding tasks

I’ve come back to the idea LLMs are super search engines. If you ask it a narrow, specific question, with one answer, you may well get the answer. For the “non-trivial” questions, there always will be multiple answers, and you’ll get from the LLM all of these depending on the precise words you use to prompt it. You won’t get the best answer, and in a complex scenario requiring highly recursive cross-checks— some answers you get won’t be functional.

It’s not readily apparent at first blush the LLM is doing this, giving all the answers. And, for a novice who doesn’t know the options, or an expert who can scan a list of options quickly and steer the LLM, it’s incredibly useful. But giving all the answers without strong guidance on non-trivial architectural points— entropy. LLMs churning independently quickly devolve into entropy.

unyttigfjelltol

我重拾了LLMs是超级搜索引擎的想法。如果你向它提出一个狭窄且具体、只有一个答案的问题,你很可能会得到那个答案。但对于那些“非平凡”的问题,总会有多种答案,并且你会从LLM那里得到所有这些答案,这取决于你用来提示它的确切措辞。你不会得到最佳答案,而在一个需要高度递归交叉验证的复杂场景中——你得到的一些答案将无法奏效。

乍一看,LLM这样做——给出所有答案——并不显而易见。对于不知道有哪些选项的新手,或者能快速浏览选项列表并引导LLM的专家来说,这非常有用。但对于非平凡的架构要点,在没有强有力指导的情况下就给出所有答案——这只会导致混乱(熵)。多个LLMs独立运转很快就会演变成混乱(熵)。


CLI agents make self-hosting on a home server easi… #

https://news.ycombinator.com/item?id=46581018

I’d rather expose a Wireguard port and control my keys than introduce a third party like Tailscale.

I am not sure why people are so afraid of exposing ports. I have dozens of ports open on my server including SMTP, IMAP(S), HTTP(S), various game servers and don’t see a problem with that. I can’t rule out a vulnerability somewhere but services are containerized and/or run as separate UNIX users. It’s the way the Internet is meant to work.

drnick1

我宁愿暴露一个 Wireguard 端口并自己管理密钥,也不愿引入像 Tailscale 这样的第三方服务。

我不明白为什么人们如此害怕暴露端口。我的服务器上开放了数十个端口,包括 SMTP、IMAP(S)、HTTP(S)、各种游戏服务器,但我并没有觉得这有什么问题。我不能排除某个地方存在漏洞,但所有服务都进行了容器化和/或以独立的 UNIX 用户身份运行,这才是互联网本该有的工作方式。


Floppy disks turn out to be the greatest TV remote… #

https://news.ycombinator.com/item?id=46589053

Modern TVs are very poorly suited for kids. They require using complicated remotes or mobile phones, and navigating apps that continually try to lure you into watching something else than you intended to.

I’d argue that’s not too different for grown-ups. ;)

tete

现代的电视非常不适合孩子。它们需要使用复杂的遥控器或手机,还要在各种试图不断诱导你去看别的内容的App之间进行导航。我倒是认为这对成年人来说也没太大区别。;)


Statement from Jerome Powell #

https://news.ycombinator.com/item?id=46582515

This is… just crazy. One of those mostly boring bits of plumbing that has been left to professionals throughout the entire 50 years of my life - and they’re trying to wreck it.

davidw

这也太离谱了。在我50年来,这种无聊的管道活儿一直都是交给专业人士做的,他们现在却想把它给搞砸了。


The next two years of software engineering #

https://news.ycombinator.com/item?id=46586972

TBH, it all feels like a huge gamble at this point. Neither skills, education, institutional ties, nor current employment can guarantee a stable foundation for life.

This hits harder depending on how much money, social capital, or debt you accumulated before this volatility began. If you’ve paid off your debts, bought a house, and stabilized your family life, you’re gambling with how comfortable the coming years will be. If you’re a fresh grad with student debt, no house, and no social network, you’re more or less gambling with your life.

maciejzj

说实话,在当下,感觉这一切都像是一场巨大的赌局。无论是技能、教育背景、人脉资源,还是当前的工作,都无法保证你拥有一个人生的稳定基础。而这份冲击感有多强,则取决于你在这种波动开始前,积累了多少资金、社会资本或债务。如果你已经还清了债务,买了房,稳定了家庭生活,那么你就是在赌未来的几年会有多舒适。如果你是个背着学生贷款的应届毕业生,没有房,也没有人脉,那你基本就是在拿自己的生命做赌注了。


I Cannot SSH into My Server Anymore (and That’s Fi… #

https://news.ycombinator.com/item?id=46581698

The idea that an “observability stack” is going to replace shell access on a server does not resonate with me at all. The metrics I monitor with prometheus and grafana are useful, vital even, but they are always fighting the last war. What I need are tools for when the unknown happens.

The tool that manages all my tools is the shell. It is where I attach a debugger, it is where I install iotop and use it for the first time. It is where I cat out mysterious /proc and /sys values to discover exotic things about cgroups I only learned about 5 minutes prior in obscure system documentation. Take it away and you are left with a server that is resilient against things you have seen before but lacks the tools to deal with the future.

crawshaw

所谓“可观测性栈”将取代服务器Shell访问的说法,我完全无法认同。我用Prometheus和Grafana监控的指标很有用,甚至至关重要,但它们总是在“打上一场战争”。我需要的是用于应对未知情况的工具。

管理我所有工具的工具就是Shell。它是我附加调试器的地方,是我安装并首次使用iotop的地方。它是我用cat命令查看神秘的/proc和/sys值,借此发现关于cgroups一些新奇特性的地方——而这些特性,我5分钟前才刚刚在一本晦涩的系统文档里读到。如果拿走它,你得到的服务器将只能抵御已知问题,却缺乏应对未来的工具。