2024-12-02 Hacker News Top Stories #
- AoC 2024 是一个编程挑战网站,提供每日编程任务,旨在帮助程序员提高编程技能。
- Privastead 是一个保密的家庭安全摄像头解决方案,使用端到端加密技术,适合隐私意识强的用户。
- 一家巴西证书授权机构为 google.com 签发了一个未经授权的证书,可能导致恶意用户能够截获流量。
- Ntfs2btrfs 是一个工具,可以原地将 Microsoft 的 NTFS 文件系统转换为开源文件系统 Btrfs。
- AMD 的 Zen 4 处理器核心包含一个循环缓冲器,用于存储最近执行的指令,最近的 BIOS 更新禁用了该功能。
- OpenWrt One 是第一个专门为 OpenWrt 设计和制造的路由器,具有完全的软件自由和维修权。
- AlphaChip 的有效性被质疑,Jeff Dean 回应了 EDA 社区的质疑,指出许多质疑源自于一篇有缺陷的论文。
- 读书是取得成功的关键,尽管自己还没有达到最高水平,作者通过阅读一本叫《Drawing On The Right Side Of The Brain》的书,取得了巨大的进步。
- 世界上最稀有的矿物是 Kyawthuite,它只有一块标本被发现,最初被误认为是琥珀或黄玉。
- 大型语言模型(LLM)在推理任务中的表现,特别是探讨了它们如何利用预训练数据来进行推理。
Advent of Code 2024 #
https://adventofcode.com/2024/about
Advent of Code 是一个编程挑战网站,提供每日编程任务,旨在帮助程序员提高编程技能。网站由 Eric Wastl 创建和维护。
网站提供了一个 Advent 日历,包含 24 个编程任务,每个任务都有一个独特的主题和难度级别。任务可以使用任何编程语言完成,网站提供了一个在线编辑器和调试工具,方便用户编写和测试代码。
网站还提供了一个全球排行榜,显示所有用户的完成任务数和完成时间。用户可以通过 OAuth 认证登录网站,使用他们的 Reddit 或 GitHub 账户。
网站的目标是提供一个友好的编程环境,帮助程序员提高编程技能和解决问题的能力。网站鼓励用户分享他们的解决方案和经验,形成一个编程社区。
网站还提供了一些常见问题和提示,帮助用户解决任务和提高编程技能。例如,网站建议用户先完成任务的示例,然后再尝试完成任务本身。网站还提供了一些测试用例,帮助用户验证他们的解决方案。
总的来说,Advent of Code 是一个有趣和挑战性的编程网站,适合所有水平的程序员。
HN 热度 1023 points | 评论 419 comments | 作者:thinkingemote | 16 hours ago #
https://news.ycombinator.com/item?id=42287231
- 有人去年用移动设备和 LLM(主要是 ChatGPT4)解决了所有问题,今年计划使用 Claude 的自定义样式解决
- 有人连续 2-3 年用 Rust 解决 AoC 问题,今年尝试用 Rust 和 Golang 解决,以学习性能优化技巧或验证 Golang 的优劣
- 有人对 Rust 的性能优化方法感兴趣,特别是 SIMD 技术
- 有人分享了自己用 Rust 和 Clojure 解决第一天问题的代码和性能数据
- 有人提到 Reddit 上有更快的 Rust 解决方案
- 有人询问是否可以分享用于速度优化的 Discord 链接
- 有人推荐了一个活跃的 AoC Discord 服务器
- 有人认为 Go 的编译速度比 Rust 快,且不强制使用不兼容的并发方式
- 有人喜欢 Rust,认为它比 Go 更好
- 有人提议在 AoC 子线程中解决 Go 与 Rust 的争论
- 有人指出 Go/Rust 之争对 AoC 影响不大,因为大多数挑战可以用标准 C 解决
- 有人去年尝试在 C 语言中实现 AoC 挑战,但因内存保护缺失而放弃,今年计划使用升级后的 Amiga
- 有人去年在 C 语言中解决了所有问题,没有使用外部库,今年计划继续这样做
- 有人提醒在 32KB RAM 的限制下,某些问题可能会非常具有挑战性,特别是内存密集型问题
- 有人允许自己使用 5GB 的磁盘空间来分页内存
- 有人提出仅使用 sh 和非图灵完备的 CLI 工具来解决挑战
- 有人指出 Awk 是图灵完备的,可以用来解决挑战
- 有人认为只要能进行 RPC 调用,32KB RAM 的限制就不是问题
- 有人计划使用裸机 Rust 在 STM32F7 上解决挑战,该设备有 320KB RAM
Show HN: Open-source private home security camera system (end-to-end encryption) #
https://github.com/privastead/privastead
Privastead 是一个保密的家庭安全摄像头解决方案,使用端到端加密技术。它有三个主要的好处:端到端加密使用 OpenMLS 实现的 Messaging Layer Security (MLS) 协议;软件解决方案,适用于现有的 IP 摄像头,且对 IP 摄像头的信任假设最小;Rust 实现(摄像头中心、MLS 代码用于移动应用程序和不受信任的服务器)。
Privastead 摄像头解决方案有三个组件:摄像头中心,运行在本地机器上,直接与 IP 摄像头交互;移动应用程序,允许接收事件通知(例如运动)和远程直播摄像头;不受信任的服务器,中继(加密)消息 между 中心和应用程序。此外,Privastead 使用 Google Firebase Cloud Messaging (FCM) 进行通知。与服务器类似,FCM 不受信任。
威胁模型和保证 Privastead 摄像头解决方案的主要优势在于,它提供了强大的隐私保证,使用端到端加密。具体来说,它做出以下假设:本地机器运行中心和智能手机运行移动应用程序是安全的,不受损害;服务器是完全不受信任的,受对手控制;它对 IP 摄像头的信任假设最小,即它假设摄像头没有秘密、未公开的网络接口卡(例如蜂窝网络)连接到互联网(因此,最好由用户显式检查和验证)。除了这些之外,IP 摄像头是不受信任的,因此 Privastead 不直接连接摄像头到互联网,而是将摄像头连接到中心。
它提供以下保证:它保证只有中心和移动应用程序可以访问未加密的视频;它保证服务器无法解密视频;它提供 MLS 中的前向保密性和后期安全性(见下定义)。它不隐藏事件和直播的时间信息,不受信任的对手(我们假设对手控制服务器和/或 FCM 通道)。
定义:根据 MLS 的定义,“前向保密性”意味着在某个时间点发送的消息在以后某个组成员被破坏的情况下是安全的。“后期安全性”意味着即使组成员在过去的某个时间点被破坏,消息也是安全的。在 Privastead 中,摄像头中心和移动应用程序是 MLS 组的唯一成员,用于视频传输。它们的意思是,如果用于加密视频的密钥被破坏,那么该密钥不能用于解密发送之前和之后的视频。
支持的摄像头 Privastead 摄像头理论上支持任何 IP 摄像头(或任何其他具有开放接口的摄像头)。当前的原型依赖于 RTSP 和 ONVIF 的支持。前者用于从摄像头流式传输视频,后者用于查询事件。到目前为止,已经测试了以下摄像头:Amcrest,型号:IP4M-1041W(亚马逊链接);软件版本:V2.800.00AC006.0.R,生成日期:2023-10-27;WEB 版本:V3.2.1.18144;ONVIF 版本:21.12(V3.1.0.1207744)。
支持的移动操作系统 Android 测试的智能手机(操作系统版本) Google Pixel 8 Pro(Android 14)
测试的中心执行环境 Ubuntu(需要 ffmpeg)
当前的关键限制 应用程序只能与一个摄像头配对。摄像头中心只支持一个摄像头。摄像头中心只能与一个应用程序实例配对。性能可能会成为高摄像头分辨率和帧率的瓶颈。
说明 请参阅此处的说明以设置 Privastead。
邮件列表 如果您有兴趣接收有关 Privastead 进展的电子邮件更新,请使用此表单注册。
贡献 我们欢迎对该项目的贡献。在开始贡献之前,请通过电子邮件联系我们:privastead@gmail.com。贡献遵循 Privastead 的许可证。
项目成员 项目创始人:Ardalan Amiri Sani(加州大学尔湾分校计算机科学教授,计算机安全和隐私专家)。注意:这是 Ardalan Amiri Sani 的一个副项目,他在业余时间工作。
免责声明 本项目使用加密库/软件。在使用之前,请检查您所在国家的法律和法规。
HN 热度 462 points | 评论 136 comments | 作者:arrdalan | 1 day ago #
https://news.ycombinator.com/item?id=42284412
- 该项目解决了家庭安全摄像头的隐私问题,使用端到端加密,适合隐私意识强的用户
- 结合 OpenMiko 开源固件,可以进一步增强隐私保护
- 安全摄像头和行车记录仪的安装越早越好,有助于保护自己和家人
- 行车记录仪现在也有使用云存储的,选择本地存储的设备需要费心
- 使用点云技术代替视频,可以提供更深入的空间入侵信息,但数据存储量未知
- 引入不可信的“服务器”组件是为了能够在云端托管服务器而不必信任它,例如使用 DigitalOcean 的廉价 VM
- 本地 NVR 服务器比允许摄像头直接访问互联网更安全,建议使用可信的本地服务器
- 摄像头硬件如果被物理获取,使用密钥封装机制可以提供额外的隐私保护
A Brazilian CA trusted only by Microsoft has issued a certificate for google.com #
https://follow.agwa.name/notice/AoZSMI38xcA3TrN1sm
一位名为 Andrew Ayer 的用户在推特上提到,一家仅被微软信任的巴西证书授权机构(CA)似乎未经授权地为 google.com 签发了一个证书。这一事件可能导致恶意用户能够截获从微软 Edge 浏览器及其他 Windows 应用程序(不包括 Chrome 和 Firefox)到 Google 的流量。
Ayer 指出,微软对此 CA 的历史问题是非常清楚的。他在 2021 年曾向微软表达过对该 CA 的担忧,并在 2022 年的公共 CCADB 讨论中进一步提出了相关问题。然而,微软对此似乎并未采取任何实质性的行动。Ayer 对此表示失望,并希望此次事件能够促使改变,因为 Windows 用户应当获得更好的安全保障。他强调,企业级的中间人攻击(MitM)代理是非常有害的,影响了用户的网络安全。
HN 热度 444 points | 评论 189 comments | 作者:sanqui | 1 day ago #
https://news.ycombinator.com/item?id=42284202
- ICP-Brasil 已正式停止发放公共 SSL/TLS 证书,但有人绕过了禁令并违反了 Google 的 CAA 规则。
- 攻击者获取 google.com 证书后,可以通过中间人攻击在用户不知情的情况下提供恶意软件。
- 攻击者的目标是让用户误以为访问的是可信网站,如 google.com,从而实现钓鱼或窃取信息。
- 由于该 CA 被默认信任,用户的设备无法保证与使用该证书的系统连接的机密性。
- 如果政府强制使用其 CA,用户可能不得不继续使用,即使对其安全性有疑虑。
- CAA 记录是当前防范此类问题的机制,Google 正在使用 CAA 记录。
- 微软继续信任其他大厂商已不信任的 CA,这使得微软的声誉进一步受损。
- 微软在安全方面表现不稳定,虽然有强大的网络安全团队,但在 Azure 等产品中仍存在严重漏洞。
Ntfs2btrfs does in-place conversion of NTFS filesystem to the open-source Btrfs #
https://github.com/maharmstone/ntfs2btrfs
Ntfs2btrfs 是一个工具,可以原地将 Microsoft 的 NTFS 文件系统转换为开源文件系统 Btrfs。该工具的使用方法包括在 Windows 下使用管理员命令提示符执行 ntfs2btrfs.exe D:\,以及在 Linux 下使用 ntfs2btrfs /dev/sda1 命令。
该工具的安装方法包括在 Windows 下下载最新的 Zip 文件或使用 Scoop,在 Linux 下使用 Arch、Fedora、Gentoo、Debian、Ubuntu 和 openSUSE 等发行版的包管理器安装。
Ntfs2btrfs 的更新日志包括:
- 20240115:修复了 GCC 14 编译问题
- 20230501:修复了内联 extent 项的写入顺序问题、元数据项的写入级别值问题、ADS 名称过长的问题
- 20220812:添加了 –no-datasum 选项、LXSS/WSL 元数据保留、修复了小写驱动器字母识别问题、修复了迭代器失效问题、修复了 NTFS 文件放置在磁盘最后一兆字节的问题
- 20210923:添加了 Btrfs 压缩支持、其他哈希算法支持、回滚到 NTFS 支持、NT4 风格安全描述符支持、转换速度优化
- 20210523:改进了大型压缩文件处理
- 20210402:修复了非 amd64 架构编译问题
- 20210105:添加了 NTFS 压缩支持、WOF 压缩数据支持、修复了稀疏文件问题
- 20201108:改进了错误处理、添加了更好的错误消息、改进了重新定位处理
- 20200330:初始版本
Ntfs2btrfs 支持的功能包括:
- 文件
- 目录
- 符号链接
- 其他重解析点
- 安全描述符
- ADS
- DOS 属性
- 回滚到原始 NTFS 镜像
- LXSS 元数据保留
不支持的功能包括:
- Windows 旧扩展属性
- 大 ADS
- 保留大小写敏感标志
- 非 4KB 集群大小
- 加密文件
该工具是否可以从 Btrfs 启动 Windows 取决于具体情况。
HN 热度 382 points | 评论 156 comments | 作者:Sami_Lehtinen | 1 day ago #
https://news.ycombinator.com/item?id=42283950
- Ntfs2btrfs 可以将 NTFS 文件系统原地转换为开源的 Btrfs
- Quibble 是一个开放且可扩展的 Windows 内核引导加载程序逆向工程,非常有趣
- 有人正在考虑如何为 ZFS 实现类似的功能
- Btrfs 当前的稳定性得到了一些用户的肯定,但也有用户对其可靠性表示担忧
- Btrfs 的用户空间工具仍在不断变化,这可能影响其生产环境的稳定性
- Btrfs 的设计存在缺陷,导致开发者需要对文件系统结构进行重大更改
- Btrfs 的修复工具 btrfs-check 存在风险,使用时需要谨慎
- Btrfs 在某些情况下可能会导致数据丢失,尤其是在驱动器空间不足时
- Btrfs 在压缩文件系统方面表现出色,可以有效节省存储空间
- 但尝试在压缩的 Btrfs 文件系统中刷新备份分区时遇到了问题
- 其他文件系统如 ext4 和 ZFS 似乎没有类似的负面评论,被认为更加可靠
AMD Disables Zen 4’s Loop Buffer #
https://chipsandcheese.com/p/amd-disables-zen-4s-loop-buffer
AMD 的 Zen 4 处理器核心包含一个循环缓冲器(loop buffer),用于存储最近执行的指令。该缓冲器可以在某些情况下节省功耗并提高性能。然而,最近的 BIOS 更新似乎已经禁用了该功能。
测试结果显示,禁用循环缓冲器对性能影响不大。SPEC CPU2017 测试结果表明,整数和浮点测试的总分差异不到 1%。SMT 性能增益也不受影响。
进一步分析发现,循环缓冲器主要用于节省功耗,而不是提高性能。测试结果显示,禁用循环缓冲器后,核心的前端仍然可以正常工作,主要依赖于操作缓存(op cache)来提供指令。
测试还发现,禁用循环缓冲器后,核心的前端仍然可以在大多数情况下正常工作,主要依赖于操作缓存来提供指令。然而,在某些情况下,禁用循环缓冲器可能会导致核心的前端更频繁地活跃,可能会增加功耗。
总的来说,禁用循环缓冲器对 Zen 4 处理器核心的性能和功耗影响不大。
HN 热度 304 points | 评论 129 comments | 作者:luyu_wu | 1 day ago #
https://news.ycombinator.com/item?id=42283933
- 禁用 Zen 4 的循环缓冲区可能是为了防止未公开的硬件漏洞。
- 循环缓冲区禁用可能与微代码缓解措施有关,因为禁用后性能有所下降。
- 另一种可能是逻辑错误,最近没有出现过严重的问题。
- 从 Spectre 和 Meltdown 事件中,我们应该吸取教训,避免再次出现类似的安全问题。
- 如果新的游戏 CPU 速度提升 3 倍但存在 Meltdown/Spectre 类漏洞,它们可能会很快售罄。
- 大多数游戏现在主要依赖 GPU,即使 CPU 有漏洞,对游戏性能的影响可能不大。
- 在现代计算机中,主要的安全边界是网络与其它部分的隔离,包括保护不同网页之间的数据。
- 可以通过将安全敏感的线程调度到专门的“S 核心”上来提高安全性,例如浏览器和虚拟机中的代码。
- 安全处理器可以用于处理加密、TLS、SSH 等长期保存秘密信息的操作,而其他操作则可以运行在性能更高的核心上。
- TPM(受信任平台模块)虽然可以提供一些安全功能,但其功能远不如现代安全处理器强大。
- 许多游戏已经安装了监控内存的 rootkit,因此 Meltdown/Spectre 类漏洞在游戏机上的威胁相对较小。
OpenWRT One Released: First Router Designed Specifically for OpenWrt #
https://sfconservancy.org/news/2024/nov/29/openwrt-one-wireless-router-now-ships-black-friday/
软件自由保护组织(Software Freedom Conservancy)和 OpenWrt 项目联合宣布推出 OpenWrt One 无线路由器,这是第一个专门为 OpenWrt 设计和制造的路由器。OpenWrt One 的价格为 89 美元,具有完全的软件自由和维修权,用户可以自由地更改和修复软件。
OpenWrt One 采用 MediaTek MT7981B SoC 芯片,配备 1GB DDR4 内存、128MB SPI NAND 闪存和 4MB SPI NOR 闪存,支持 2.5GbE 和 1GbE 以太网端口、USB 主机端口、M.2 2042 接口和 mikroBUS 扩展头。路由器还支持 Power over Ethernet(PoE)和 USB-C 供电,具有 USB 串行接口和独立的 NOR 和 NAND 闪存。
OpenWrt One 的开发是为了证明软件自由和维修权与 FCC 合规性并不冲突。软件自由保护组织和 OpenWrt 项目通过 OpenWrt One 的开发证明了完全的 copyleft 合规性、软件维修权和 FCC 合规性可以在同一产品中实现。
OpenWrt One 的发布是软件自由保护组织和 OpenWrt 项目为推进软件自由和维修权而做出的努力的一部分。该产品的销售将为 OpenWrt 项目提供资金支持,帮助改进和维护重要的软件和软件自由。
HN 热度 246 points | 评论 113 comments | 作者:m463 | 23 hours ago #
https://news.ycombinator.com/item?id=42285689
- GL.iNet 的 Flint 2 几乎与 OpenWrt One 相同,但有更多端口,且能运行标准 OpenWrt
- GL-iNet 的产品虽然声称运行 OpenWrt,但并非完全开源,不提供完整源代码,不符合 GPL 协议
- 中国法院曾有执行 GPL 协议的案例,因此认为 GL-iNet 产品不符合 GPL 并非无根据
- OpenWrt One 有更好的 CPU 性能和 2.5Gbe 端口,适合需要高性能网络的用户
- Flint 2 的默认界面更适合初学者,但 vanilla OpenWrt 更强大,支持更多功能
- 一些 GL.iNet 产品运行的是 CPU 制造商提供的 OpenWrt 版本,包含二进制驱动,没有源代码
- Flint 2 在作为接入点使用时性能良好,但用于其他需要高带宽的任务时可能表现不佳
- OpenWrt One 在开发和测试新功能方面更具优势,适合开发者使用
- Flint 2 的硬件支持 fq_codel,有助于减少缓冲区膨胀问题,提升网络体验
- OpenWrt One 和 Flint 2 各有优缺点,选择时应根据个人需求和偏好来决定
Jeff Dean responds to EDA industry about AlphaChip #
https://twitter.com/JeffDean/status/1858540085794451906
在 X 平台上,Jeff Dean (@🏡) 分享了一篇技术回应,旨在回应 EDA(电子设计自动化)社区对他们的 AlphaChip 方法是否有效的无根据质疑。他与同事 Anna Goldie 和 Azali Amirh 共同撰写了这篇回应,标题为《那块芯片已经启航:对电子设计领域无根据怀疑的批判》。
他们指出,许多对 AlphaChip 的质疑源自于 Cheng 等人所发表的一篇非同行评审的 flawed publication。Cheng 等人声称能够复制 AlphaChip 的方法,但在关键方法上没有遵循原有的流程,尤其是没有进行预训练。尽管在他们的《自然》论文中提到预训练 37 次,但 Cheng 等人的实验缺乏这一重要步骤,导致他们的学习方法无法从其他芯片设计中学习。此外,他们还使用了 20 倍更少的计算资源,且没有训练到收敛,这使得他们的方法无法充分学习即便是他们所用的芯片设计。Dean 用 AlphaGo 的例子来说明这种问题,强调如果没有经过数百万局的预训练,无法得出 AlphaGo 的真正实力。
此外,他们还对 Igor Markov 在 2024 年 11 月的《计算机与通信杂志》中发表的 “元分析” 进行了回应。Markov 的文章未透露他是 Synopsys 公司的高层员工,而 Synopsys 是与他们的开源 AlphaChip 竞争的商业软件公司。Markov 在文章中 “元分析” 了 Cheng 等人的有缺陷的论文和一篇没有列出作者的匿名 PDF,实际上是重新提出他自己未发表的论点,且含有无根据的暗示。Dean 对这类毫无证据的指控表示惊讶,并对出版这样的指控而没有任何技术数据或有效证据的行为表示失望。
Dean 的帖子旨在澄清 AlphaChip 的有效性,并反驳那些缺乏实质依据的批评。他们希望通过这一回应,重新审视这些质疑,并为 AlphaChip 的研究与应用提供支持。
HN 热度 226 points | 评论 146 comments | 作者:nsoonhui | 1 day ago #
https://news.ycombinator.com/item?id=42285128
- Jeff Dean 的过往记录无可挑剔,但这次对 EDA 行业的质疑做出了不学术的个人攻击和模糊的引用
- Jeff Dean 可能过于相信 AlphaChip 的革命性,忽略了 Chaterjee 的担忧
- Jeff Dean 可能被年轻有魅力的骗子误导,现在无法退出,导致在 Google 的地位下降
- Jeff Dean 在机器学习研究方面的能力可能被高估,他并不是芯片设计或 EDA 领域的专家
- ISPD 作者的工作结论仍然有效,尽管他们使用的计算资源较少,但 CMP 和 AutoDMP 在质量和运行时间上优于 CT
- Google 没有提供证据证明 AlphaChip 在大量计算资源下优于商业布局工具
- 公开承认偏见增加了评论的可信度,但 Google 在比较商业工具时可能受到许可协议的限制
- 学术 EDA CAD 论文中通常会与商业工具进行比较,尽管具体的工具供应商会被模糊处理
You must read at least one book to ride #
https://ludic.mataroa.blog/blog/you-must-read-at-least-one-book-to-ride/
作者是一名工程师,自认为在专业环境中是顶尖的,但同时也觉得自己比那些通过电子邮件联系他的人差远了。作者认为自己之所以能在职业上取得成功,是因为读了很多书,特别是那些专业领域的书籍。
作者回忆起自己曾经学画画的经历,起初很失败,但后来通过阅读一本叫《Drawing On The Right Side Of The Brain》的书,取得了巨大的进步。作者认为,这本书帮助自己突破了对绘画的障碍,尽管自己仍然不是最好的画家。
作者将工程师分为三类:一类是读过一本以上专业书籍的工程师,他们通常非常有能力;一类是从未努力学习的工程师,他们占大多数;还有一类是像作者自己一样,只读过一本专业书籍,但仍然能取得一定的成就。作者认为,读书是取得成功的关键,尽管自己还没有达到最高水平。
作者与一位高水平工程师 Seth Newman 交流后,了解到很多专业领域都存在大量不努力学习的从业者。作者认为,读书和学习是取得成功的必要条件,即使自己还没有达到最高水平。
HN 热度 217 points | 评论 145 comments | 作者:Kinrany | 1 day ago #
https://news.ycombinator.com/item?id=42282717
- 有经验的工程师具备初学者缺乏的隐性技能,建立同理心有助于理解这种差距
- 作者低估了工程师的隐性技能,但阅读书籍仍然是一个很好的起点
- 书籍的质量很重要,有时需要找到合适的书籍才能有效学习
- 优秀的工程师不一定通过阅读书籍提升,实践经验和技术文档同样重要
- 高水平的工程师可能因为其他原因(如 ADHD)不阅读书籍,但他们的能力来自大量实践
- 棋类大师通过大量刻意练习形成直觉,这种直觉在编程中同样重要
- 与比自己更有教育背景的人相处可以提高同理心
- 编程是一项需要不断学习和改进的工艺,缺乏好奇心和兴趣的工程师难以提升
- 工作中常遇到由于缺乏基本编程知识导致的严重问题,如安全漏洞和性能问题
Kyawthuite is so rare it’s only ever been found once #
https://www.sciencealert.com/the-worlds-rarest-mineral-is-so-rare-its-only-ever-been-found-once
世界上最稀有的矿物是 Kyawthuite,它只有一块标本被发现。该矿物是一种微小的、棕黄色的颗粒,重约 0.33 克(1.61 克拉),最初被误认为是琥珀或黄玉。2010 年,Kyaw Thu 在缅甸的市场上购买了这块矿物,他最初以为它是一种叫做白钨矿的矿物。后来,他将其送到了泰国曼谷的美国宝石学院实验室,矿物学家们发现它与合成的 BiSbO4(硫酸铋锑)有关,但其化学式为 Bi3+Sb5+O4,这在自然界中从未发现过。
该矿物的颜色呈饱和的橙色,带有红色调和白色条纹。它的形成方式可能与火成岩有关,可能是在一种叫做伟晶岩的火成岩中形成的。伟晶岩是一种常见的火成岩,含有各种矿物,常见于缅甸的矿区。实验室测试表明,Kyawthuite 的形成温度与火成岩的冷却温度相符。
目前,Kyawthuite 的价值被列为无价之宝。世界上第二稀有的宝石是痛石,其价格为每克拉 50,000 美元到 60,000 美元。目前,世界上唯一的 Kyawthuite 标本被保存在洛杉矶县自然历史博物馆。
HN 热度 195 points | 评论 74 comments | 作者:pseudolus | 12 hours ago #
https://news.ycombinator.com/item?id=42288449
- 这种矿物之所以罕见,可能是因为没有人专门去开采或寻找它
- 自然形成这种矿物的过程可能在发现地形成了更多类似的矿物,只是尚未被发现
- 世界上已开采的黄金总量如果堆成一个立方体,体积大约为 10,000 立方米
- 发现这种矿物的地方也曾是 Painite 宝石的主要发现地,因此可能有更多矿工和科学家在该地区寻找
- 许多自然过程会产生长尾分布,导致大量非常罕见的矿物
- 矿物可能已经被发现但未公布
- 冰岛的姓氏系统基于父名或母名,每代人都会变化
- 新生儿在某些文化和国家中可能在出生后一段时间内没有名字
- IT 系统需要能够处理没有名字的人的相关记录,例如记录未命名婴儿的治疗情况
Procedural knowledge in pretraining drives reasoning in large language models #
https://arxiv.org/abs/2411.12580
本文研究了大型语言模型(LLM)在推理任务中的表现,特别是探讨了它们如何利用预训练数据来进行推理。研究人员使用了两个不同大小的模型(7B 和 35B)和 2.5B 的预训练 token,来分析模型在三个简单的数学推理任务中的表现。他们发现,模型在回答事实性问题时,通常依赖于不同的数据集,但在回答推理性问题时,模型往往依赖于相同的数据集,这表明模型在推理中使用了程序化知识。
进一步的分析发现,模型在回答事实性问题时,答案通常出现在最具影响力的数据中,但在回答推理性问题时,答案通常不出现在最具影响力的数据中,甚至中间步骤的答案也不出现在最具影响力的数据中。研究人员通过对模型输出的分析,发现模型在推理中使用了程序化知识,例如使用公式或代码来解决问题。
总的来说,这项研究表明,大型语言模型在推理任务中使用了程序化知识,而不是简单的检索,这也解释了为什么模型在推理任务中表现良好。
HN 热度 164 points | 评论 57 comments | 作者:reqo | 9 hours ago #
https://news.ycombinator.com/item?id=42289310
- LLMs 通过外推生成新问题的解决方案,但这些解决方案可能与现有示例相差不大
- 使用“推理”一词来描述 LLMs 的解决方案生成过程是不恰当的,这可能是为了引发情感上的共鸣
- LLMs 真正的潜力在于作为自然语言与形式语言之间的“编译器”层,帮助解决需要精确逻辑的问题
- LLMs 目前的限制反映了互联网上人类认知的限制,但独立学习能力可能会使这些模型超越人类智能
- 人类在大多数情况下并不擅长推理,容易受到自身成长背景的影响而犯同样的错误
- LLMs 的“失败”可能是适应性的,而人类可能过于强调“推理”作为智能的解释
- 人类在熟悉环境中使用智力捷径通常是合理的,这有助于与他人合作和预测性
- 人类可以被赋予正确性的责任,而计算机则不能,因为人类有激励机制和补偿路径
- 人类在某些任务上表现出色,即使这些任务的训练数据中没有智能成分,例如编程