2025 06 16 HackerNews

2025-06-16 Hacker News Top Stories #

  1. 加里·马库斯讨论了苹果公司关于大型推理模型推理能力局限性的论文及七种反驳的不足。
  2. 详细介绍了如何改装Starlink Mini终端,移除内置WiFi路由器板,改用以太网连接。
  3. 作者在Rust中构建了交互式Datalog,并分享了其在Minnowbrook会议上的实现经验与挑战。
  4. 探讨了无限电阻网格中任意两节点间的有效电阻计算方法及其物理学应用。
  5. 分析了Q-learning算法在可扩展性上的局限性,并探讨了可能的解决方案。
  6. 记者因报道活动被拒入美国,反映了美国Palantir监控技术对言论自由的破坏。
  7. 教程展示了如何使用Raspberry Pi修改HDMI假插头的EDID,以欺骗设备识别。
  8. 探讨了Lisp编程语言的独特魅力及其在编程创造性表达中的重要性。
  9. 研究发现,社交焦虑障碍患者的肠道微生物可增加小鼠的社交恐惧,暗示其因果作用。

Seven replies to the viral Apple reasoning paper and why they fall short #

https://garymarcus.substack.com/p/seven-replies-to-the-viral-apple

这篇文章由加里・马库斯(Gary Marcus)撰写,讨论了苹果公司关于大型推理模型(Large Reasoning Models, LRM)在推理能力方面的局限性所引发的广泛讨论与反响。苹果的研究论文指出,当前的 LRM 在处理复杂问题和执行算法时存在严重缺陷,这一发现引起了媒体和社交媒体的热烈讨论。

马库斯总结了七种对苹果论文的反驳,这些反驳从轻微的挑剔到较为聪明的论点都有,但他认为大多数都缺乏说服力:

  1. ** 人类在复杂问题和记忆要求上也有困难 **:反驳者认为这与人类的局限性相似,但马库斯指出,机器应当能够超越人类,完成我们无法做到的任务。人类并不总是可靠的计算工具,因此不能把机器的错误归结于人类的不足。
  2. ** 大型推理模型无法解决问题是因为输出要求过多 **:这一论点部分正确,但马库斯认为即使在输出长度的限制内,LRM 在某些问题(如汉诺塔)上的表现依然不佳。有效的符号人工智能系统能够胜任这些任务,而 AGI 应该能够做到这一点。
  3. ** 论文是由实习生撰写的 **:马库斯对此反驳表示愤怒,认为这是一种人身攻击。他强调,论文的第一作者虽然是实习生,但她是一名优秀的博士生,并且论文有多个作者,且大部分具有博士学位。
  4. ** 更大的模型可能会表现更好 **:这一观点是普遍接受的,但马库斯指出,我们无法预测哪个模型足够大,能够处理特定任务的特定规模,这使得依赖模型的表现变得不可靠。
  5. ** 系统可以通过代码解决这些难题 **:虽然有些系统可以通过编写代码来解决问题,但马库斯认为,这并不能证明 LRM 具备概念理解能力。理解问题的本质远比单纯获得答案重要。
  6. ** 论文只提供了四个示例,其中一个(汉诺塔)并不完美 **:尽管示例数量有限,马库斯认为这些例证为已有的研究提供了支持,许多类似的失败案例在未来可能会被发现。
  7. ** 这篇论文的发现并不新鲜 **:马库斯承认,这一结果早已被学界所关注,但苹果的研究终于让人们更加重视 LRM 的局限性,揭示了生成性人工智能的一个重要弱点。

马库斯总结道,目前针对苹果论文的反驳并不令人信服,许多 AI 领域的专家对此感到担忧,认为单靠扩展模型规模并不能解决现有问题。他还提到,Salesforce 的一项研究显示,在 “多轮” 条件下,LRM 的表现仅为 35%,进一步证实了当前技术的不可靠性。他期待未来能有更好的 AI 系统出现。


HN 热度 323 points | 评论 287 comments | 作者:spwestwood | 1 day ago #

https://news.ycombinator.com/item?id=44278403

  • 人类在复杂问题和记忆需求上存在困难,但我们有理由期待机器能做我们做不到的事情。
  • 人类使用工具来扩展能力,LLM 也可以做到。
  • 人类可以通过理解问题、思考解决方案并写出解决方案来解决汉诺塔问题,而不需要“工具”。
  • 当没有可参考的解决方案时,LLM 可能无法像人类那样推理出解决方案。
  • 论文没有给出证据表明人类能够不使用工具解决汉诺塔问题,甚至 Gary Marcus 也承认人类可能会犯错。
  • 很多人无法不借助工具解决汉诺塔问题,所以它不是衡量一般智能的好测试。
  • LLM 完全有能力编写代码来解决不在训练集中的问题。
  • 人类能够根据对汉诺塔问题的理解推导出解决规则,然后使用很少的工作记忆来解决问题。
  • LLM 目前只是模式匹配,而人类在模式匹配后推导出一般规则。
  • LLM 也可以给出一般指令来解决任何情况的汉诺塔问题,并且能够写出详尽的移动列表。
  • 有人类无法解决汉诺塔问题,所以它不能作为衡量 LLM 一般智能的好测试。
  • LLM 编写的代码编译和执行第一次就正确的情况非常少。
  • LLM 能够解决的问题可能是训练集中已有问题的组合。
  • 人类也是基于训练数据进行推理,对于未经训练的问题难以推理。
  • 第一个解决数学和棋类问题的人是如何在没有先例的情况下解决问题的?
  • 技能和问题的解决是逐渐积累和发展的,问题通常是在解决方案之后构建的。
  • 任何提出的问题都可以声称在训练集中,但 LLM 在训练集中的问题上失败却没有受到重视。
  • 知识是组合的,这对人类和机器都是如此。

https://olegkutkov.me/2025/06/15/how-to-modify-starlink-mini-to-run-without-the-built-in-wifi-router/

这篇文章是关于如何将 Starlink Mini 终端改装,以便在没有内置 WiFi 路由器的情况下运行。

Starlink Mini 终端改装介绍: Starlink Mini 终端设计为一个集成了 WiFi 路由器的紧凑型一体化解决方案。这种设计适合普通消费者使用,但对于需要定制网络设置、嵌入式安装或在电源受限环境中使用的用户来说,去除内部路由器可能更有利。文章详细介绍了如何物理移除 Starlink Mini 中的内置 WiFi 路由器板,使终端仅通过以太网运行,为高级用户提供更大的灵活性。

改装注意事项: 改装仅适用于截至 2025 年 6 月 14 日的 Starlink Mini 1。未来型号,如预期的 Mini 2,可能会使这个过程无效。

Starlink Mini 拆解过程: 拆解过程需要耐心和精确度,建议使用金属撬棒和塑料撬棍。此外,还需要一把薄而灵活的刀或细金属线来移除路由器的 PCB。作者提供了一个关于拆解过程的视频手册。需要注意的是,不需要移除 Starlink PCB 上的金属板,因为该板既作为散热片也作为电磁干扰屏蔽。移除金属板可能会导致 CPU 或天线阵列因过热而降频,并且可能会增加电磁干扰,影响附近电子设备。

Starlink Mini PCB 连接器: 连接器的确切类型未知,可能是定制的。但连接器的间距为 2 毫米,因此任何标准的 2 毫米头都可以很好地适配。连接器用导电胶和大的非屏蔽接地区域固定,路由器 PCB 上的连接器上方还放置了一个屏蔽罩,这些都是为了帮助控制电磁干扰。

连接器引脚分配: Starlink Mini 在主单元和路由器之间使用 1 Gbps 以太网链接。请注意,这里没有使用以太网变压器;而是使用了直接的 PHY 到 PHY 连接,并进行了一些去耦处理。这对于短距离是可以接受的。在任何自定义设计安装中,以太网变压器是必需的。主电压总线为 12 VDC。连接器引脚分配(Starlink Mini 侧)如下所示。以太网线路信号映射到相应的 T568B 双绞线颜色。引脚 11、14、16、17 和 18 在当前修改中未使用,主要用于 Starlink-Router 监控目的。

直接以太网连接: 文章提供了一个直接以太网连接到 Starlink Mini_1 PCB 连接器的示例原理图。这个原理图提供了所需的以太网隔离和最小功率过滤,以确保正常运行。建议在 U1 连接器周围放置一个防护地。最优化的设计包括导电胶和屏蔽。请保持连接器和以太网变压器之间的电线尽可能短。12V 的标称运行电流约为 3A,短时峰值可达 5A。请选择适当额定电流的 L1,以避免过热。

网络配置: Starlink 终端在未连接到 Starlink 卫星时,在 192.168.100.0/24 网络中提供 DHCP IP 地址。终端本身可在地址 192.168.100.1 上找到,运行一个简单的 Web UI 和 gRPC 监控/控制服务器。使用 grpcurl 获取 Starlink 调试数据非常方便。文章提供了一个示例请求(获取终端的当前状态)。

连接到 Starlink 网络后: 以太网接口提供隧道 DHCP 服务,为客户分配来自 Starlink 池的 IP 地址,通常是 CGNAT IPv4 地址(例如 100.72.116.102)和全局链接 IPv6 地址。这种网络配置提供了访问互联网的能力。请注意,Starlink DHCP 服务器只提供一个 IP 地址,因此你只能直接连接一个主机或上游路由器,以共享连接到多个设备。

解决连接问题: 在获取“外部”IP 地址后,你的客户端自然失去了对 192.168.100.1 主机的访问。为了解决这个问题,你可以向终端添加一个静态路由。

gRPC 状态代码: gRPC get_status 输出包含许多有用信息。如果出现连接问题,“outage”部分应该出现在 gRPC 输出中。文章提供了一个示例,并解释了“cause”的可能值,包括启动、过热关闭、无法与卫星通信、未能检测到卫星、路径受阻、无法接收卫星数据、卫星与地面失去连接等。

监控 Starlink 账户状态: 文章还提到了如何监控 Starlink 账户的状态,包括不同的禁用代码,如未知状态、账户正常、账户被移除或服务暂停、超出注册服务地址区域、位于海洋区域、位于 Starlink 服务不允许的国家、数据超出限制、本地服务单元被禁用、漫游限制、未知位置、账户被禁用、固件不兼容或过时、移动速度过快违反政策限制、位于航空飞行限制区域、位于 Starlink 不支持的国家、位于 Starlink 缺乏监管批准的国家等。这些禁用代码在成功连接到卫星后应该总是可用的,由 Starlink 系统提供。用户终端本身不了解服务计划、国家、区域或速度限制。


HN 热度 237 points | 评论 62 comments | 作者:LorenDB | 11 hours ago #

https://news.ycombinator.com/item?id=44282017

  • 使用模调板对板以太网代替 RGMII 从 MAC 到 MAC 可能是出于原型设计方便的考虑。
  • RGMII 并非以太网的竞争对手,而是以太网设计的模块化两部分,RGMII 是最新版本。
  • 许多以太网支持的 SoC 仍然使用各种 MII 风格接口,因为将物理层外包给外部芯片更有意义。
  • 直接使用笔记本电脑的以太网适配器进行测试可能更为方便和可靠。
  • 制作一个带有 RGMII PHY 和 MagJack 的 $3 breakout PCB 可以解决这个问题。
  • RGMII 不适用于板对板连接,因为它的数据速率较高,且所有信号都需要延迟匹配。
  • 可能出于重量考虑,需要移除 Wi-Fi 模块。
  • 即使关闭 Wi-Fi,设备仍然会消耗电力,最有效的节能方式是完全移除 Wi-Fi 模块。
  • 有些人可能想要确保设备不会发射任何 Wi-Fi 信号。
  • 操作卫星通信天线时,Wi-Fi 辐射可能是最不需要担心的问题。
  • 有些人可能对减少设备重量感兴趣。
  • 有人猜测这种改装可能用于乌克兰的某种长距离无人机。
  • 技术工程师和科学家参与不对称战争技术可能会成为敌方的高价值目标。
  • 如果俄罗斯也使用马斯克的卫星,他们可能也会发现这些信息有用。
  • 卫星在俄罗斯领土上可以工作,需要在允许的国家注册账户并使用特定计划。
  • 乌克兰的 Starlink 计划可能与美国有所不同,可能涉及美国国防部和其他志愿者的资助。
  • 波兰为乌克兰购买的超过 2 万个终端支付订阅费用。

Datalog in Rust #

https://github.com/frankmcsherry/blog/blob/master/posts/2025-06-03.md

作者分享了他在纽约州北部的 Minnowbrook 会议中心参加的一个逻辑编程研讨会的经历。这个研讨会是由 Kris Micinski 主持的,作者以一种幽默的方式描述自己是一个“臭名昭著的恶棍”,并被邀请参加这次活动。他原本以为这可能是他长期应得的惩罚,但结果却是一次愉快的经历,与许多友好和支持的人一起,他们有着共同的目标。

研讨会有一个要求,那就是参与者需要写一篇博客文章来反思这次活动,Kris 会收集这些文章并与更广泛的世界分享。作者提到,尽管研讨会上有很多关于 Datalog(以及其他逻辑编程语言)的讨论,但最引人注目的是 Denis Bueno 关于 ctdal 的最后一次演讲,这是一个 Datalog 中的程序分析工具。然而,作者也提到,理解这个演讲是一个挑战,许多工具不起作用,只有 Soufflé 能够工作,但需要正确使用。

作者决定将自己的时间和资源投入到构建一个既实用又“高性能”的东西上,他认为这是一个值得尝试的挑战。他提出,每个人都能从构建这样一个东西的过程中受益,并且还能学习逻辑编程。因此,他决定在 Rust 中构建一个交互式 Datalog,并邀请读者通过 datatoad 仓库跟随他的构建过程。

作者之前已经构建过一些类似 Datalog 的东西,但他还没有尝试过同时使一个东西简单、可用和高性能。他认为他们可以尝试在这里做到这一点。他不会从 datafrog 开始,但会使用许多相同的算法思想。如果读者熟悉 datafrog,他们应该能够跟上;如果不熟悉,也没关系。

作者原本有一个计划和帖子,从构建一个糟糕的 Datalog 开始,一个缓慢且笨拙的 Datalog,然后随着学习的深入一起改进。但由于这个版本实在太糟糕,他认为应该直接从好的版本开始,并在过程中更详细地讨论关键的时刻。到文章结束时,他们将拥有一个可以批量加载事实、随时添加规则,并保持相当好性能的交互式 Datalog。

文章中还提供了一个例子,展示了如何对 httpd 数据流图进行空值分析。作者提到,这个例子在 datafrog 中大约需要 2 秒,而在这里需要 8.3 秒,尽管 datafrog 的例子使用的是(u32,u32)数据,但在这里使用 Vec数据和没有编译的查询,只比 datafrog 慢了 4 倍。作者希望将来能够缩短这个时间。他还没有确认这个 Datalog 在所有问题上都做得很好,甚至还没有确认它是否普遍正确,尽管在这些可达性问题上,它产生的输出元组数量与 datafrog 实现相同。因此,目前还不要太担心。


HN 热度 225 points | 评论 23 comments | 作者:brson | 12 hours ago #

https://news.ycombinator.com/item?id=44281727

  • Datalog 在实时策略游戏逻辑管理中的应用被认为充满新意和挑战。
  • 有人对不再积极维护的 DDLog 实现表示好奇,并关注其进展。
  • 有开发者正在将 mangle datalog 移植到 Rust,并提到了内存映射与 golang 实现的对比。
  • 有人对作者使用二元连接的教学方法持保留意见,认为通用连接风格更易于理解。
  • 有评论提到,经过适当调整查询计划,二元连接可以实现最坏情况下的最优运行时间。
  • 在程序分析等物化工作负载中,优化的二元连接计划往往优于最坏情况下的最优计划。
  • 尽管 Datalog 复兴似乎在衰退,但仍有一些核心爱好者在坚持,他们在构建数据质量流程以准备大规模软件迁移。
  • 有人指出,Datalog 2.0 会议的参与度低可能更多是因为其作为 LPNMR 的一个卫星研讨会的地位,而不是 Datalog 本身缺乏热情。
  • 有人赞赏技术博客文章的开头和叙述方式,认为它既技术深入又有趣。
  • 有评论认为 Datalog 在处理递归查询/规则方面比 SQL 容易得多。

Infinite Grid of Resistors #

https://www.mathpages.com/home/kmath668/kmath668.htm

这篇文章讨论了一个关于无限电阻网格的经典谜题。在这个谜题中,每个相邻节点之间都有一个电阻 R,网格在所有方向上无限延伸。文章的任务是确定网格中任意两个指定节点之间的有效电阻。

文章首先解释了对于相邻节点,通常的解决方案是将电流场视为两个分量的总和:一个分量是将电流注入单个节点的网格的电流场,另一个分量是从单个(相邻的)节点提取电流的网格的电流场。通过这两个单独情况的对称性,我们可以推断出紧邻电阻器中的电流流速,从而得出两个相邻节点之间的有效电阻是 R/2 的结论。这个解决方案具有一定的直观合理性,因为它类似于如何将电偶极子的势场表示为正电荷和负电荷的场的总和,每个场都围绕其各自的电荷球对称。

文章进一步解释了电压网格节点满足离散形式的拉普拉斯方程,即每个节点的电压是四个周围节点电压的平均值。解决方案是可加的,这意味着对于给定的边界条件,任意两个解决方案的总和也是一个解决方案。

文章接着讨论了通过简单对称性考虑来解决这个谜题的方法。如果我们向一个节点注入(比如说)四安培的电流,而网格中没有电流被移除,电流将通过四个电阻器平均流出,因此每个相邻节点会有一安培流向它。这一安培电流必须通过从该相邻节点发出的其他三条线路流出。

文章还提到了这种方法的局限性,即它依赖于将电流注入无限网格的节点的概念,而没有充分解释这些电流的去向。一个“手挥”的解释是我们可能将网格视为在“无限远”处接地,但这并不严格有效,因为从任何给定节点到“无限远”的电阻是无限的。这是因为一个给定节点被一系列同心正方形包围,从中心节点开始向外扩展到连续同心正方形的电阻连接数是 4、12、20、28 等,这意味着到无限远的总电阻至少是奇数谐波级数的和,这个级数是发散的,所以电阻是无限的。

为了使论证严谨,文章建议考虑一个大型但有限的网格,并说服自己,当网格大小增加时,行为接近预期结果的极限。这并不完全简单,因为我们必须确保两个扩展网格序列,一个围绕正节点,一个围绕负节点,在极限中接近相互兼容的边界条件,使得“到无限远”的净流量为零。为了评估这个极限,中心节点的电压(相对于无限远处的电压)必须接近无限大,以提供固定的电流。文章还讨论了对于一个真正的“无限”网格,解决方案是不确定的,除非施加一些渐近边界条件(这在问题的通常陈述中没有指定)。

文章最后指出,这个问题的非物理方面也可以从假设电流场已经完全发展到无限远的事实中看出,这种情况不可能通过任何现实的物理过程在任何有限的时间内建立。当然,所假设的网格仅由理想的电阻组成,没有电容或电感,因此没有动态需要考虑,因此人们可能会认为整个电流场可以瞬间建立到无限远——但这仅仅说明了所假设的网格被理想化到了违反物理定律的程度。所有真实的电路都有电容和电感,这就是为什么传播速度不能无限。人们可能会认为这种理想化对于这个问题是无害的,但如果我们严格应用它们,它们实际上会使问题完全不确定。我们对有一个唯一答案的直觉恰恰来自于我们无意识地强加的“物理上合理”的渐近行为,这些行为来自一个局部化的源,基于有限网格的渐近行为,随着大小的增加——这种概念来自于我们对局部性和有限效应传播的物理概念,这些概念在理想化的环境中是没有理由的。

文章最后指出,如果我们简单地采用关于网格渐近条件的通常假设,我们可以考虑更一般的问题,即确定任何两个节点之间的电阻。最常见的方法是基于叠加基本差分方程的解决方案。同样,这种方法默认强加了合理的边界条件以迫使一个唯一的答案,基本上是通过要求网格表现得像一个大有限网格的极限。文章首先考虑了一个一维“网格”的单位电阻器的简单例子,其中从第 n 个节点发出的净电流由差分方程给出,其中规定 I0 = -1 安培,对于所有 n ≠ 0,In = 0。注意,对于所有 n ≠ 0,我们可以在不改变方程的情况下否定右侧的索引的符号,因为净电流…


HN 热度 205 points | 评论 105 comments | 作者:niklasbuschmann | 1 day ago #

https://news.ycombinator.com/item?id=44279181

  • 硅基板的电阻可以看作是一个无限大的网格电阻,对于集成电路中的局部点来说,这种模型是相关的。
  • 光刻技术非常困难,有人用埃及女神来形容其难度。
  • 祈祷 Unut(电阻单位欧姆的拟人化)的词是“欧姆”。
  • 连续的情况在数学上更简单,因为它是离散情况的极限条件。
  • 软件工具通过数值方法解决这类问题,将连续的基板划分为离散元素,用线性代数模拟电路。
  • 电阻率的单位是欧姆·厘米,而不是欧姆/厘米。
  • 电阻网格是 4 连通而不是 8 连通,或者任何其他拓扑结构,如六角网格。
  • 电阻本质上是耗散性的,电子在电阻晶格中总是与电阻相互作用。
  • 电子群体会因为电压差异而稍微向一个方向移动,而不是单独测量。
  • 无限大的电阻网格永远不会达到平衡。
  • 无限电阻网格是一个理论模型,用于评估数学能力和对方程的理解。
  • 无限电阻网格的问题描述显然荒谬,但这种模型有助于理解更实际的场景。
  • 无限电阻网格需要无限的时间来达到稳态。
  • 无限电阻网格只存在于理想化的电路模型中。
  • 无限电阻网格是天体物理学家试图理解宇宙的一个玩具模型,可能存在盲点。
  • 给定无限电阻网格,可能会形成行星。
  • 氢气在足够数量和时间下会变成人,同样的情况也可能适用于电阻。
  • 电阻由更重的元素制成,一切事物都倾向于变成铁,可能有足够的能量使任何事情成为可能。
  • 无限电阻网格会稳定地产生某种东西。

Q-learning is not yet scalable #

https://seohong.me/blog/q-learning-is-not-yet-scalable/

这篇文章由 Seohong Park 在 2025 年 6 月发表,讨论了强化学习(Reinforcement Learning, RL)的可扩展性问题。文章首先提到,近年来,诸如下一个词预测、去噪扩散、对比学习等任务的可扩展性已经得到了证明,这些任务能够训练具有数十亿参数的模型。然而,对于强化学习,尤其是 Q-learning 算法,其可扩展性仍然是一个问题。

文章指出,尽管强化学习在 2016 年就在围棋和国际象棋等游戏中达到了超人水平,并且在大型语言模型(Large Language Models, LLMs)中解决了复杂的数学和编码推理任务,但这些成功大多基于需要新鲜、新采样的策略执行的 on-policy RL 算法(例如 REINFORCE、PPO、GRPO 等),这些算法不能重用旧数据。这在棋盘游戏和 LLMs 中不是问题,但在大多数现实世界问题中,尤其是在机器人领域,生成样本的成本非常高,且需要人工干预。

文章强调,off-policy RL 算法原则上可以重用任何数据,无论何时何地收集,这使得它们通过多次重用数据来提高样本效率。例如,off-policy RL 可以在 20 分钟内从零开始训练一个机器狗在现实世界中行走。Q-learning 是最广泛使用的 off-policy RL 算法,它最小化了时间差(TD)损失。然而,作者认为当前的 Q-learning 算法并不具备可扩展性,至少对于需要超过 100 个语义决策步骤的长视野问题来说是这样的。

文章进一步解释了为什么 Q-learning 难以扩展到复杂、长视野的问题。主要原因是 Q-learning 的预测目标存在偏差,并且这些偏差会随着视野的增加而累积。这种偏差累积是 Q-learning(TD 学习)独有的基本限制。相比之下,其他可扩展目标(如下一个词预测、去噪扩散、对比学习等)的预测目标中没有偏差,或者这些偏差不会随着视野的增加而累积。

最后,文章通过一系列控制的扩展研究来实证验证上述观点。研究者们准备了一些高度复杂的、之前未解决的任务,并收集了几乎无限的数据,以确保过拟合几乎不可能。他们还尽可能地排除了干扰因素,例如专注于离线 RL 以抽象化探索,并确保数据集有足够的覆盖范围,以及所有任务都可以从给定的数据集中解决。研究结果表明,如果 Q-learning 甚至在这种控制设置中,即使有几乎无限的数据,也无法扩展,那么在更现实的环境中,我们有理由怀疑它是否能够扩展,因为在现实环境中我们的数据和计算资源是有限的。


HN 热度 205 points | 评论 44 comments | 作者:jxmorris12 | 22 hours ago #

https://news.ycombinator.com/item?id=44279850

  • Q 学习不具可扩展性的一个主要原因是随着时间范围的增加,可能的状态数量呈指数级增长,这就需要越来越多的数据来训练 Q 学习模型。
  • 在策略学习中,只有接近策略的状态才重要,因此即使可能的状态数量呈指数级增长,训练数据也集中在重要状态上。
  • Q 学习中的 Max 操作会导致噪声随时间步放大,从而产生过近似偏差,一些方法如减少这种偏差可以提高 RL 代理的性能。
  • 如果状态之间存在某种模式,网络可以学习到这些模式,那么状态数量呈指数级增长就不重要了,深度学习的优势在于能够捕捉到这些模式。
  • MuZero 和其他基于模型的 RL 系统可能是解决作者担忧的方案,它们可以通过重新分析先前的轨迹来提高训练效率。
  • 有些任务尽管“深”,但可能是“均匀”的,即使样本质量差也能胜任,这些任务被称为“遍历”任务。
  • 人类通过将长视野任务分解成短视野任务并层次化组合来学习长视野任务。
  • 模型可能无法从零开始处理长视野任务,但可以先学习一些短视野技能,然后通过利用这些较小技能的组合来学习更长视野的任务。
  • 离策略学习的好处受到限制,因为早期无效探索的数据对于改进后来更精细的策略并不十分有用,更好的泛化/样本效率是解决这个问题的关键。

Journalists Wary of Travelling to US Due to Palantir Surveillance #

https://bsky.app/profile/alistairkitchen.bsky.social/post/3lrjsdecc5c2x

Alistair Kitchen 在社交媒体上发表了一篇帖子,讲述了他最近的经历。他提到自己在过去的 48 小时内因为报道哥伦比亚学生抗议活动而被美国拒绝入境、拘留并最终被驱逐出境。他刚刚回到墨尔本,并在落地后拿回了自己的手机。帖子中提到的日期是 2025 年 6 月 14 日。


HN 热度 200 points | 评论 168 comments | 作者:Kapura | 8 hours ago #

https://news.ycombinator.com/item?id=44282754

  • 美国政府对互联网流量进行大规模监控已有数十年历史。
  • 奥巴马政府大规模扩展了布什时代的监控系统,但几乎没有受到反对。
  • 现在美国政府使用这些监控手段的程度甚至超过了中国。
  • 俄罗斯特工领导的情报机构协调和 Palantir 公司提供的技术支持使得监控能力增强。
  • 以“打击反犹太主义”为借口进行监控是极其虚伪的。
  • 美国现在对批评声音的敏感程度与北朝鲜相似,不再欢迎和拥抱批评。
  • 言论自由应包括保护人们不会因为言论而受到法律后果。
  • 外国人和活动家参与大学抗议活动被拒绝入境美国并不令人惊讶。
  • 作为美国公民,可以自由表达观点,不会被驱逐出境,并且可以通过投票来改变现状。

Modifying an HDMI dummy plug’s EDID using a Raspberry Pi #

https://www.downtowndougbrown.com/2025/06/modifying-an-hdmi-dummy-plugs-edid-using-a-raspberry-pi/

这篇文章是由 Doug Brown 在 2025 年 6 月 15 日发表的,主题是关于如何使用 Raspberry Pi 修改 HDMI 假插头的 EDID(Extended Display Identification Data)。文章首先介绍了 HDMI 假插头的基本概念,它们是一些小型设备,可以插入 HDMI、DVI 等端口,但不处理视频信号,只是让视频源设备(如电脑)认为有显示器连接。这些假插头包含一个 I2C EEPROM 芯片,存储着 EDID,包含了显示器的制造商、生产日期、支持的分辨率、音频通道、色彩空间等信息。

作者的目标是将假插头的 EDID 替换为一个 1080p HDMI 捕捉设备的 EDID,以便电脑会认为连接的是捕捉设备而非 4K 显示器。文章中提到,作者不确定假插头的 EDID EEPROM 是否可以编程,但他决定尝试。他发现 Raspberry Pi Zero 有一个 I2C 控制器连接到 HDMI 端口的正确引脚上,这使得 Pi 能够读取连接显示器的 EDID。文章中还提供了不同型号 Raspberry Pi 设备对应的 I2C 控制器信息。

在确保安全的情况下,作者从 Raspberry Pi OS Lite 安装开始,进行了以下修改:启用 I2C,安装 i2c-tools。由于需要网络访问,这对于 Raspberry Pi Zero 是个问题,作者提出了使用 USB-Ethernet 适配器或将 SD 卡插入桌面 PC 并使用 chroot 来安装软件的解决方案。

接下来,作者详细描述了如何使用 Raspberry Pi Zero 和 HDMI 转 Mini-HDMI 适配器来检测和读取假插头的 EDID EEPROM。他使用 i2cdetect 命令检测到了地址为 0x50 的 I2C 设备,这是 EDID 使用的地址。然后,他使用 get-edid 命令备份了原始 EDID,并使用 od 命令将其以十六进制格式输出,以便在 edidreader.com 等网站上查看。

确认备份后,作者将假插头从 Pi 上拔下,连接了 HDMI 捕捉设备,并重复了相同的过程来备份其 EDID。最后,他将捕捉设备的 EDID 写入假插头的 EEPROM,并使用 diff 命令验证了新的 EDID 与原始文件的一致性。

文章最后,作者将修改后的假插头插入测试电脑,并成功地让电脑识别为 HDMI 捕捉设备而非 4K 显示器,从而完成了他的目标。


HN 热度 165 points | 评论 36 comments | 作者:zdw | 7 hours ago #

https://news.ycombinator.com/item?id=44282998

  • 便宜的 HDMI 假插头 EEPROM 只有 256 字节,不足以存储高刷新率高分辨率配置所需的扩展 EDID 块。
  • 这些假插头不处理 HDCP,适用于强制特定分辨率输出的无头机器,但不适用于需要 HDCP 的情况。
  • HDMI 分流器可以设置预编程的 EDID 或从 HDMI 输出 1 学习 EDID,并在分流器插入时作为已连接的显示器出现。
  • 有设备声称可以终止 HDCP 并转发 HDMI。
  • HDCP 终止困难,需要降级到 HDCP 1.4 并有一个 1.4 兼容的接收设备才能作为假监视器工作。
  • Monoprice 多视图器可以协商 HDCP,无需连接显示器,但无法剥离 HDCP。
  • 有些 HDMI 分流器被宣传为“HDCP 剥离器”。
  • 假插头只是一个连接到 I2C 线的 256 字节 EEPROM,壳内没有其他东西。
  • 有些情况下需要特定分辨率或功能,但没有设备可以设置。
  • 可以通过 HDMI 假插头为旧系统提供更高分辨率显示器的信号。
  • 有些显示器在关闭时会虚拟断开连接,导致问题,而 HDMI 假插头可以解决这个问题。
  • 有些人不明白为什么需要假插头,因为他们使用软件就能设置多个虚拟显示器。

The Art of Lisp and Writing (2003) #

https://www.dreamsongs.com/ArtOfLisp.html

这篇文章探讨了 Lisp 语言的魅力以及编程与艺术之间的关系。文章首先引用了查尔斯·达尔文的话,强调了无知往往比知识更容易产生自信。接着,作者将 Lisp 描述为一种美丽的语言,伟大的程序员可以通过它创造出既美观又实用的程序。

文章指出,许多人将编程视为一种常规的工程活动,难以将其视为写作的模型或隐喻。作者认为,写作是一种创造性的自我表达,是一种艺术形式,与科学和工程不同,它不是一种严肃的活动。然而,这种判断往往来自于那些没有真正参与科学和艺术创作的人。艺术、工程和科学是寻找世界和自我真相的连续体。

艺术家通过创作来表达自己,他们的作品不仅仅是为了体现艺术声明,也是在探索物理世界与人类想象、内在世界之间的关系。艺术家在创作过程中,不仅在制作一件物品,也在绘制可能的世界地图,探索物理世界与人类想象的联系。艺术家通过创作,有时也在挑战人们对世界的认知,例如古代艺术家如何建造某些艺术结构至今仍有争议。

文章提到,艺术家通过写作或其他形式的作品,为世界可能的发展方向绘制蓝图。当艺术家在故事和神话中需要技术解释时,科学家和工程师往往会探索如何构建他们从童年或成年时期就梦寐以求的东西。例如,1587 年出版的《德国浮士德书》中描述了浮士德博士骑龙车飞向太阳的故事,随着时间的推移,工程师和科学家发明了飞行机器,就像 16 世纪的帆船一样普遍。文章还提到了手机与《星际迷航》中的通讯器相似,以及古代对海底旅行的迷恋。

随着人们对材料和世界的需求或欲望,具有特殊技能的人开始探索如何操纵物理世界来实现这些需求。为了避免未来的错误,这些制造者记录下了经验法则、创造和制造的模式以及安全因素。今天我们称他们为工程师。文章提到,尽管工程知识通常先于科学知识,并且在科学理论更迭中保持不变,但工程师能够创造复杂的烹饪和金属加工火源,而科学家则在理论之间摇摆不定。

科学家在最后出现,他们接受艺术家和工程师对世界的发现或梦想,并试图编织一个简化的叙述来解释这一切。科学家需要找到导致我们体验到的美丽复杂性的小一组事实、条件、法则、力量和原则。自伽利略以来,科学家们同意使用数学作为科学知识的语言。

然而,由于对准确性和精确性的追求,科学家在确定宇宙真相方面可能运气最差。哲学家和科学史学家指出,科学理论如何通过精细化、革命甚至无政府状态来更迭。例如,随着 20 世纪的发展,量子力学理论和复杂性科学的日益合理性使我们对世界的认知变得不确定,使我们许多最好的理论充其量只是近似值,或者至少为描述现实真相提供了一种新的公式(除了数学之外)。

文章最后提到,我们之所以如此喜爱科学家,可能是因为他们在理解世界方面是最一贯的失败者。我们不断地告诉他们,他们是指出真相的唯一真正灯塔;我们为他们的大型实验提供资金和资助,而从艺术中撤资。文章最后提到了作家和制图师,作家是创造虚假现实的最富有想象力的创造者,他们创造的世界和角色几乎像真实的东西,但我们永远不会在任何地方找到那些地方、人或情况。尽管如此,他们作品中所包含的基本上是真实的——可能没有尼克·亚当斯和塞尼的大二心河,但海明威捕捉到了关于真实生活的一些东西,使他的故事不是一种谎言。

制图师则是一种工程师,他们设计和创造现实世界的表示,通常是为了理解地形或如何从一个地方到达另一个地方。制图师努力在代表地理学方面追求准确性和精确性。然而,文章指出,实际上并非如此。首先,地球区域的地图涉及某种数学投影,除非以可能很少有人理解的方式理解,否则会显著扭曲现实的某些方面。墨卡托投影将恒定方位路径(如海路)表示为直线……


HN 热度 155 points | 评论 59 comments | 作者:Bogdanp | 16 hours ago #

https://news.ycombinator.com/item?id=44281016

  • Lisp 语言的灵活性和可塑性使其成为理想的编程工具,适合独立探索和分析。
  • 随着年龄的增长,编程的神秘感消失,更享受户外活动,AI 工具简化了编程过程,让人们更关注结果而非过程。
  • 现在更欣赏那些持久、向后兼容、不随意破坏用户代码、不需要外部依赖管理器或构建工具的语言。
  • 编程曾经被看作是被守门人严密把守的活动,但现在 AI 和开源代码的普及打破了这种观念。
  • Richard Gabriel 的写作风格独特,将编程语言革命的结构写得既深刻又美丽。
  • Lisp 不仅仅是一种编程语言,更像是一种编程媒介,允许程序员以自我表达的方式塑造和改变语言。
  • 编程可以被视为一种社会活动,构建共享知识和理解,不断精炼直至软件被“遗弃”。
  • 编程语言的发展模式(独立与社交、动态与静态)产生了哲学上和实践上不兼容的工具和方法论。
  • Lisp 与写作之间的关系被误解,Java 等语言的编程更类似于写作,因为它们有固定的词汇和语法规则。
  • 诗歌通过操纵共同的语法规则来传达更深层的意义,Lisp 的语法可以在程序间变化,类似于诗歌。

Social anxiety disorder-associated gut microbiota increases social fear #

https://www.pnas.org/doi/abs/10.1073/pnas.2308706120

这篇文章是关于社交焦虑障碍(Social Anxiety Disorder, SAD)与肠道微生物群之间关联的研究。社交焦虑障碍是一种使人在社交场合感到极度恐惧或焦虑,并倾向于回避这些场合的精神疾病。然而,SAD 的生物学基础尚不清楚,需要更好的治疗方法。近年来,肠道微生物群被认为可以调节大脑和行为,尤其是与社交功能相关的行为。此外,越来越多的数据支持免疫功能和催产素信号在社交反应中的作用。

为了探究肠道微生物群是否在调节与 SAD 相关的行为中起因果作用,研究人员将 SAD 患者的肠道微生物群移植到小鼠体内。通过 16S rRNA 测序,发现 SAD 患者的肠道微生物组成与健康对照组存在差异。接受 SAD 患者微生物群的小鼠在一系列测试中表现出正常的行为,这些测试旨在评估抑郁和一般的焦虑行为,但它们对社交恐惧表现出特定的高度敏感性,这是 SAD 的一个模型。这种特殊的社交恐惧反应伴随着中枢和外周免疫功能的变化以及纹状体床核中的催产素表达。

这项工作展示了社交恐惧反应的跨领域基础,并提出微生物群可能是 SAD 的潜在治疗靶点。研究结果不仅有助于理解 SAD 的生物学机制,还可能为开发新的治疗方法提供方向。研究中使用的人类 16S rRNA 测序数据可以在欧洲核酸档案库(ENA)下找到,访问编号为 PRJEB68191。小鼠的宏基因组测序数据可以在 figshare 上找到,链接为: https://figshare.com/projects/Social_Anxiety_Disorder-Associated_Gut_Microbiota_Increases_Social_Fear/185134。文章和/或补充材料附录中包含了所有数据。研究感谢参与研究的志愿者捐赠者,以及为研究提供技术协助和知识共享的各位博士,以及 P. Fitzgerald、C. Manley、J. Riley 和 A.等人。


HN 热度 148 points | 评论 96 comments | 作者:thunderbong | 7 hours ago #

https://news.ycombinator.com/item?id=44283095

  • 吃糖会增加焦虑,减少糖摄入可以减少焦虑感。
  • 有些人对糖特别敏感,应该根据个人情况调整饮食。
  • 零糖饮食可能也应该包括零水果。
  • 用蔬菜替代水果可能有助于减少糖摄入。
  • 奶酪可能是糖的替代品,对某些人来说影响不大。
  • 长时间禁食水可能对某些人有不良影响,不建议超过 72 小时。
  • 奶酪中的乳糖可能对消化和糖吸收有影响。
  • 葡萄糖和果糖对健康的影响不同,果糖摄入过多可能导致炎症。
  • 运动员可以摄入大量果糖和葡萄糖,普通人可能需要训练。
  • 纤维与果糖一起摄入可能减少果糖的影响。
  • 纤维摄入与身体胰岛素水平有关,可能与减少焦虑有关。
  • 喝奶可能导致不适,可能是乳糖不耐受。
  • 肠道微生物可以显著影响大脑化学。
  • 肠道微生物的变化可能与社交恐惧有关。
  • 吃糖与糖尿病风险之间存在复杂关系,不仅仅是糖本身。
  • 肥胖是糖尿病的风险因素,但不是糖本身。
  • 微生物组的变化可能触发社交恐惧反应,对社交生物有益。