2024 11 23 HackerNews

2024-11-23 Hacker News Top Stories #

  1. 一个项目使用稀疏自编码器(SAE)来解释大型语言模型(LLM)的行为,特别是 Llama 3.2 模型,旨在提取 LLM 中的可解释特征。
  2. 处理 Cookie 是一个复杂的问题,Cookie 设置时容易出现隐蔽问题,如 cookie shadowing,导致多个几乎相同的 cookie 同时存在。
  3. 亚马逊将再投资 40 亿美元于人工智能初创公司 Anthropic,这是继今年 3 月宣布投资 27.5 亿美元后,又一笔重大投资。
  4. 大型语言模型(LLM)在国际象棋方面的表现,特别是针对 gpt-3.5-turbo-instruct 这一模型表现出的异常强大棋力的原因。
  5. Netlify庆祝其开发者用户数量达到五百万,推出了一款互动游戏,让用户可以通过这个旅程了解Netlify的成长历程,以及每位开发者在其中所扮演的角色。
  6. 美国俄勒冈州的克拉玛斯河在拆除四座水坝后,成千上万的鲑鱼回归了它们的故乡。
  7. ChipWits 游戏的 40 周年纪念:原始 FORTH 代码开源!游戏的开发团队还分享了游戏开发过程中的故事,包括如何使用 FORTH 编程语言开发游戏。
  8. Autoflow 是一个基于 TiDB Serverless Vector Storage 的图形 RAG(知识图谱)工具,旨在提供一个开源的知识图谱平台。
  9. 普林斯顿大学和华盛顿大学的研究团队开发出了一种名为 “超光学” 的新型相机,这种相机的体积只有一颗盐粒大小。
  10. WebGPU 规范一直在不断发展,Google、Mozilla、Apple、Intel 和 Microsoft 等大公司每周都会开会讨论其开发进度。

Show HN: Llama 3.2 Interpretability with Sparse Autoencoders #

https://github.com/PaulPauls/llama3_interpretability_sae

这个网页是一个 GitHub 仓库的页面,介绍了一个名为“Llama 3 Interpretability with Sparse Autoencoders”的项目。该项目旨在使用稀疏自编码器(SAE)来解释大型语言模型(LLM)的行为,特别是 Llama 3.2 模型。

项目概述 该项目的目标是使用 SAE 来提取 LLM 中的可解释特征,这些特征可以帮助理解模型的行为、检测错误信息、分析信息流等。项目的灵感来自于最近的研究,包括 Anthropic、OpenAI 和 Google DeepMind 的工作。

项目的主要特点包括:

  • 一个完整的端到端管道,从激活捕获到 SAE 训练、特征解释和验证,使用 PyTorch 编写,依赖性最小。
  • 使用自定义的句子分割 OpenWebText 数据集变体捕获大型语言模型的残差激活作为 SAE 训练数据集。
  • 对训练数据进行预处理(预批处理、统计计算)以实现高效训练。
  • 支持分布式训练和批量处理。
  • 提供了一个用于解释和可视化 SAE 学习特征的工具集。

项目的当前状态是版本 0.2,虽然它已经是一个高效且可扩展的状态,但它仍然是一个非最终版本,未来可能会有更新和改进。项目的作者鼓励贡献代码或反馈,并感谢任何发现的错误报告。


HN 热度 527 points | 评论 77 comments | 作者:PaulPauls | 1 day ago #

https://news.ycombinator.com/item?id=42208383

  • 机械解释性解决了大型语言模型在自我解释时的不真实性问题
  • 人类也会对自己无法解释的想法或行为编造看似合理的解释
  • 数学中的非正式想法可以在后续通过形式化来验证
  • 一些系统旨在听起来合理,而另一些系统旨在说出真相
  • 人类和 LLM 在解释行为时都存在编造合理理由的现象,这并不罕见
  • 人类在进行解释时,有时会无意识地将假设提升为信念
  • 对 LLM 的可解释性要求可能比对人类更高,因为 LLM 被视为工具,需要更可靠
  • LLM 的解释能力如果不可靠,会影响其在某些领域的实用性,如创意写作之外的应用

Handling cookies is a minefield #

https://grayduck.mn/2024/11/21/handling-cookies-is-a-minefield/

这篇文章由 April King 撰写,主要讨论了 HTTP Cookie 在不同浏览器和编程库中的处理差异,以及这些差异可能引发的问题。

** 文章概述 **

HTTP Cookie 是由 JavaScript 或 HTTP 服务器设置的小数据块,主要用于在原本无状态的万维网中维护状态。尽管 Cookie 的工作原理似乎简单,但实际操作中却充满了复杂性和潜在的问题。文章通过一个简单的 JavaScript 示例来引入问题,该示例将一个 JSON 对象序列化后存储为 Cookie,但在使用 Go 标准库时却引发了解析错误。

**Cookie 的规范 **

文章回顾了 Cookie 的定义及其演变,提到 RFC 2109、RFC 2965 和 RFC 6265 等规范。其中涉及两个关键部分:

  1. ** 服务器发送 Cookie 的方式 **(RFC 6265,第 4.1.1 节):规定了 Cookie 的格式和可接受的字符。
  2. ** 浏览器接受 Cookie 的方式 **(RFC 6265,第 5.6 节):定义了浏览器解析 Cookie 的算法,指出如果包含控制字符,则应忽略整个 Cookie。

作者指出,规范之间的矛盾使得服务器和浏览器在处理 Cookie 时出现了不一致,特别是在允许的字符范围上。

** 浏览器的处理差异 **

  • Firefox: 接受了一些 RFC 中不推荐的字符(如空格、双引号、逗号等),同时也存在配置选项可以阻止 Unicode 字符的使用。
  • Chromium: 相较于 Firefox,略微严格,拒绝接受水平制表符,但允许空格、双引号、逗号、反斜杠和 Unicode 字符。
  • Safari (WebKit): 处理方式不同,遇到不允许的字符时不会忽略整个 Cookie,而是接受直到那个字符为止。Safari 还存在一个奇怪的 bug,即在处理包含逗号的 Cookie 时会删除逗号周围的空格。

** 编程库的处理差异 **

文章以 Go 语言的 Cookie 处理为例,展示了编程库在处理 Cookie 时的挑战。Go 的标准库在发送 Cookie 时相对严格,只允许一些常见字符,但在解析浏览器发送的 Cookie 时则较为宽松。这样一来,就可能导致兼容性问题,尤其是在涉及到不同浏览器和不同标准库时。

** 结论 **

整篇文章强调了 Cookie 处理的复杂性,指出了浏览器和服务器之间在 Cookie 处理上的不一致性,以及在不同的编程环境中所遇到的挑战。这种不一致性可能导致开发者在处理状态保持时面临各种问题,因此需要特别关注和测试 Cookie 的设置和解析过程,以避免潜在的错误。作者呼吁在 Cookie 处理的标准和实现之间进行更好的协调,以减少这些问题的发生。


HN 热度 514 points | 评论 234 comments | 作者:todsacerdoti | 1 day ago #

https://news.ycombinator.com/item?id=42206556

  • Cookie 设置时容易出现隐蔽问题,如 cookie shadowing,导致多个几乎相同的 cookie 同时存在
  • 在同一域名下设置不同环境(如 staging 和 dev)是一个巨大的错误,容易导致配置错误
  • 使用不同的顶级域名来隔离开发、测试和生产环境,可以避免 cookie 干扰
  • 通过 CNAME 设置子域名,可以有效隔离环境同时保持一致性
  • 使用子域名如*.dev.example.com、*.test.example.com、*.prod.example.com 可以避免 cookie 冲突
  • 企业客户和邮件发送时,使用相同的顶级域名会更有帮助
  • 规范中关于 cookie 域名前缀的点号(.)是无效的,但浏览器会忽略它以保持向后兼容
  • jshttp/cookie 库的 serialize()方法应严格遵循规范,避免设置无效的 cookie 头
  • 严格验证 cookie 值可以避免潜在的安全问题,如代码注入

Amazon to invest another $4B in Anthropic #

https://www.cnbc.com/2024/11/22/amazon-to-invest-another-4-billion-in-anthropic-openais-biggest-rival.html

亚马逊宣布将再投资 40 亿美元于人工智能初创公司 Anthropic,这是继今年 3 月宣布投资 27.5 亿美元后,又一笔重大投资。Anthropic 是由前 OpenAI 研究高管创立的公司,开发了 Claude 聊天机器人和 AI 模型。

亚马逊的投资将使其成为 Anthropic 的主要云计算和培训合作伙伴,Anthropic 将使用亚马逊的 AWS Trainium 和 Inferentia 芯片来训练和部署其最大的 AI 模型。Anthropic 的 Claude 聊天机器人是近期人工智能领域的热门产品之一,其他公司如 OpenAI 的 ChatGPT 和谷歌的 Gemini 也在此领域展开竞争。亚马逊和微软等科技巨头也在积极投资和开发人工智能技术。


HN 热度 446 points | 评论 242 comments | 作者:swyx | 8 hours ago #

https://news.ycombinator.com/item?id=42215126

  • Claude Sonnet 3.5 的表现令人惊讶,能够生成详细的答案和图表,甚至编写和运行 Python 代码。
  • Claude 在理解用户意图方面优于 ChatGPT,能够提供完整文件而无需重复指令。
  • Claude 会提出澄清问题以更好地理解用户目标,而 ChatGPT 从未这样做。
  • Claude 在编程语言如 Swift 上的表现不如 GPT,GPT 在数学和语法方面也更好。
  • GPT 和 Claude 的优劣取决于特定领域和子领域,GPT 在不常见语言如 Applescript 上表现更好。
  • Claude 在对话中更具有同理心和个性,而 ChatGPT 则较为机械。
  • Claude 的 API 使用没有速率限制问题,可以通过自定义前端轻松切换模型。
  • 用户建议在长时间对话中导出聊天记录和总结,以避免上下文窗口过载。
  • Claude 在高负载下存在请求响应延迟问题,需要改进服务质量。

OK, I can partly explain the LLM chess weirdness now #

https://dynomight.net/more-chess/

这篇文章探讨了大型语言模型(LLM)在国际象棋方面的表现,特别是针对 gpt-3.5-turbo-instruct 这一模型表现出的异常强大棋力的原因。作者首先提出了几个可能的理论来解释这种现象:

  1. 基础模型的能力在通过指令微调后未能保持。
  2. gpt-3.5-turbo-instruct 可能接受了更多的国际象棋数据训练。
  3. 某些 LLM 架构可能具有独特的优势。
  4. LLM 的训练数据中需要包含大量棋局数据。

作者还提到了一些网络上流传的其他理论,比如 OpenAI 作弊,LLM 根本无法真正下棋等,这些理论并不成立。

经过实验,作者证明了其实最近的聊天模型也可以很好地下棋,只要使用合适的提示语。接下来,作者详细描述了不同模型在国际象棋对弈中的表现,包括 gpt-3.5-turbo-instruct 和 gpt-4o-mini、gpt-4o 等模型。在与国际象棋引擎 Stockfish 对战的实验中,gpt-3.5-turbo-instruct 表现优异,而 gpt-4o 系列模型则表现较差。

为了改进这些模型的表现,作者尝试了不同的提示方法,包括重复系统提示、提供例子和微调等。结果显示,仅仅提供三条小示例就显著提高了模型的表现。微调也同样有效,但将例子和微调结合使用时,结果显示例子反而使微调变得冗余。

此外,作者尝试通过列出合法走法来帮助模型,但结果却是让模型的表现变差。因此,作者最终提出,LLM 的基础模型本身在下棋方面具有一定的能力,但如何引导模型理解棋局和做出决策是关键。

总结而言,文章揭示了如何通过适当的提示和微调,提升 LLM 在国际象棋方面的表现,并探讨了影响其能力的多个因素。作者强调,gpt-3.5-turbo-instruct 模型的成功并不是由于任何作弊行为,而是源于其内在的训练和架构优势。


HN 热度 439 points | 评论 405 comments | 作者:dmazin | 1 day ago #

https://news.ycombinator.com/item?id=42206817

  • 文章没有提供非法移动的频率数据,因此无法得出有意义的结论
  • 检测非法移动在计算上是简单的,与过滤错误的医疗建议不同
  • 国际象棋规则虽然不简单,但已经是一个解决的问题,检测合法移动已被多次实现
  • LLM 在国际象棋中表现优于随机选择合法移动,即使有时尝试非法移动
  • 检测有效的医疗建议比检测国际象棋的合法移动复杂得多,两者不可比较
  • 国际象棋规则的实现难度被高估了,实际上比其他算法简单
  • LLM 可能通过模仿和讨论展示出与数学教授相当的能力,特别是在提供上下文的情况下
  • 通过脚本纠正错误数学,不能证明 LLM 对数学有良好理解
  • 对于“理解”的定义尚不明确,LLM 可能通过图灵测试的对话方式展示理解
  • 数学和自然语言是不同的领域,擅长自然语言并不意味着擅长数学
  • 数学问题通常只有一个正确答案,而自然语言问题则更难区分模仿和理解

Show HN: A Marble Madness-inspired WebGL game we built for Netlify #

https://5-million-devs.netlify.com/

Netlify 最近庆祝其开发者用户数量达到五百万。这个里程碑标志着 Netlify 在支持开发者和推动网站构建方面的重要成就。在这个庆祝活动中,Netlify 提供了一次互动体验,用户可以通过这个旅程了解 Netlify 的成长历程,以及每位开发者在其中所扮演的角色。

该活动不仅回顾了 Netlify 的发展历程,还展现了许多有趣的瞬间,体现了开发者与平台之间的紧密联系。Netlify 邀请大家一同参与,感受这一路走来的乐趣。

整体来看,Netlify 的五百万开发者庆祝活动不仅是对过去成就的回顾,也是在激励更多开发者加入这个不断发展的社区。


HN 热度 423 points | 评论 178 comments | 作者:franck | 14 hours ago #

https://news.ycombinator.com/item?id=42212644

  • 游戏中的白色发光点应作为动力或奖励,而不是惩罚。
  • 游戏的控制非常流畅,物理效果也很出色。
  • 游戏比预期的广告宣传要好得多,设计精良,控制完美,有多个路线可选。
  • 物理碰撞在帧率下降时容易出问题,导致球卡在物体中。
  • 游戏开发用了大约 8 周时间,团队有两人。
  • 选择 Three.js 和 Rapier 而不是 Unity WebGL 的原因是支持移动设备。
  • 游戏中存在一些 bug,例如在特定情况下球会掉入平台下方并无法重生。
  • Unity WebGL 在移动设备上的支持已经存在多年,但 Unity 6 的 Web 导出功能将进一步改善这一点。

Salmon return to lay eggs in historic habitat after dam removal project #

https://www.opb.org/article/2024/11/17/salmon-return-to-lay-eggs-in-historic-habitat-after-largest-dam-removal-project-in-us-history/

美国俄勒冈州的克拉玛斯河(Klamath River)在拆除四座水坝后,成千上万的鲑鱼回归了它们的故乡。这些鲑鱼在过去几十年里由于水坝的阻塞而无法返回。水坝的拆除是美国历史上最大的水坝拆除项目,旨在恢复河流的自然流动和改善鲑鱼的栖息环境。

拆除水坝后,鲑鱼迅速回归了它们的故乡。据报道,仅在斯宾塞溪(Spencer Creek)就发现了 42 个鲑鱼卵巢,共有 115 条鲑鱼。这些鲑鱼的回归标志着河流生态系统的恢复和鲑鱼种群的复苏。

克拉玛斯河是美国西海岸第三大鲑鱼产卵地,但由于水坝的阻塞,鲑鱼数量大幅减少。水坝的拆除是当地土著部落多年斗争的结果,他们希望恢复河流的自然流动和保护鲑鱼的栖息环境。

水坝的拆除不仅恢复了河流的自然流动,也改善了水质。据报道,拆除水坝后,河水温度下降了 8 摄氏度,水质也得到了改善。这些变化有利于鲑鱼的生长和繁殖。

鲑鱼的回归是河流生态系统恢复的重要标志,也是当地土著部落多年斗争的成果。随着鲑鱼种群的复苏,河流生态系统也将得到进一步的恢复和保护。


HN 热度 295 points | 评论 205 comments | 作者:gmays | 11 hours ago #

https://news.ycombinator.com/item?id=42213663

  • 鲑鱼返回出生地的行为主要依赖于化学感应,如特定的气味记忆
  • 鲑鱼可能具备类似信鸽的地球磁场导航能力
  • 鲑鱼的迁徙行为可能是为了寻找适合繁殖的环境,而不是特定的记忆
  • 鲑鱼在寻找繁殖地时,可能会受到环境特征(如较低的有害藻类浓度和较凉的水温)的吸引
  • 鲑鱼返回出生地的行为并非 100% 准确,部分鲑鱼会随机游向其他区域
  • 鲑鱼的这种行为可能是为了在特定溪流消失时,仍有机会在其他地方繁殖
  • 鲑鱼返回出生地的行为可能受到遗传适应特定溪流特征的选择优势驱动
  • 人工孵化的鲑鱼在返回时,现在可以游向支流自然繁殖,而不是被收集回孵化场
  • 鲑鱼梯的设计中加入人工瀑布声可以提高效果,因为鲑鱼在静水中会寻找水流声

The FORTH code for Chipwits is released in the game’s 40th anniversary #

https://chipwits.com/2024/11/16/chipwits-40th-birthday-original-forth-code-open-sourced/

ChipWits 游戏的 40 周年纪念:原始 FORTH 代码开源!

ChipWits 是一款编程逻辑/益智游戏,于 1984 年首次发布。游戏的创作者 Doug Sharp 和 Mike Johnston 在 1984 年开始开发这款游戏,当时他们还在为其他公司开发游戏。他们选择使用 FORTH 编程语言,因为它在当时的 8 位微型计算机上非常流行。

游戏的开发过程非常艰难,Doug 和 Mike 需要在短时间内完成游戏的开发。他们使用 MacForth Plus 编程语言开发游戏,并在 7 个月内完成了游戏的开发。游戏于 1984 年圣诞节期间发布。

游戏在发布后获得了广泛的好评,包括 MacUser 编辑选择奖和 MacWorld 杂志的好评。游戏还被列入 2008 年 MacLife 杂志的“十大 Apple II/Mac 游戏”榜单。

在游戏发布 40 周年之际,Doug Sharp 找到了原始的游戏代码,并将其开源。游戏的原始代码使用 FORTH 编程语言编写,共有 3000 行代码。游戏的开发团队还提供了一个在线模拟器,允许玩家在浏览器中玩到原始的 ChipWits 游戏。

游戏的开发团队还分享了游戏开发过程中的故事,包括如何使用 FORTH 编程语言开发游戏,以及如何将游戏移植到其他平台。他们还分享了游戏的设计理念,包括如何使用图标式语言来教玩家编程概念。

总之,ChipWits 游戏的 40 周年纪念是一个值得纪念的事件,游戏的开发团队通过开源原始代码和分享开发过程中的故事,向玩家展示了游戏开发的历史和文化。


HN 热度 229 points | 评论 67 comments | 作者:JoeDaDude | 1 day ago #

https://news.ycombinator.com/item?id=42207304

  • Forth 语言在硬件开发和驱动程序中长期被使用,是一种基于栈的语言
  • 选择 Forth 编写 ChipWits 是因为可以在 128k Mac 上原生开发,且 Forth 通常是新计算机上最先实现的语言之一
  • Forth 语言比裸机编程容易得多,尽管它可能看起来有些奇怪,但比从头开始要好得多
  • 基本的 Lisp 方言需要至少 4 个通用寄存器,而 65C02 微处理器只有 1 个或 3 个寄存器,这使得 Lisp 在该环境下难以实现
  • Forth 在寄存器资源有限的环境中表现良好,只需要栈指针和几个寄存器即可实现基本操作
  • 《Lisp in Small Pieces》是一本非常好的书,展示了如何构建多个不同的 Lisp 解释器和编译器
  • 编写 Lisp 的高级特性如逃逸闭包、延续和条件处理需要更多的努力和谨慎
  • Forth 代码实际上是一系列子例程调用,没有语法树,没有指针算术,没有基本类型检查,甚至没有数组类型
  • 使用 Forth 编写代码需要策略和自律,否则调试可能会很棘手,但一旦掌握,可以比汇编语言更高效
  • 垃圾回收不是实现 Lisp 引导所必需的,但手动内存管理的 Lisp 使用起来会显得很奇怪
  • 从 Rust 的内存模型中借鉴可以有助于实现手动内存管理的 Lisp,RAII 也很容易实现

Autoflow, a Graph RAG based and conversational knowledge base tool #

https://github.com/pingcap/autoflow

pingcap/autoflow 是一个基于 TiDB Serverless Vector Storage 的图形 RAG(知识图谱)工具,旨在提供一个开源的知识图谱平台。该项目的主要特点包括:

  • Perplexity 风格的对话搜索页面:该平台具备一个内置的网站爬虫,可以爬取官方网站和文档网站,提供全面的搜索结果。
  • 可编辑的知识图谱:用户可以编辑知识图谱,以添加更多信息或纠正不准确的信息。
  • 可嵌入的 JavaScript 代码段:用户可以将对话搜索窗口嵌入到自己的网站中,提供即时的产品相关查询响应。

部署:

  • 该项目可以使用 Docker Compose 部署,需要 4 个 CPU 核心和 8GB RAM。

技术栈:

  • TiDB:用于存储聊天记录、向量、JSON 和分析数据的数据库。
  • LlamaIndex:RAG 框架。
  • DSPy:用于编程基础模型的框架。
  • Next.js:前端框架。
  • shadcn/ui:设计框架。

联系我们:

  • 用户可以通过 Twitter 联系开发团队。

贡献:

  • 该项目欢迎社区贡献者参与开发。感兴趣的开发者可以阅读贡献指南。

许可:

  • 该项目遵循 Apache License 2.0 许可协议。

HN 热度 218 points | 评论 31 comments | 作者:jinqueeny | 22 hours ago #

https://news.ycombinator.com/item?id=42210689

  • 该工具在回答具体问题时速度更快,但回答“什么是 TiDB”这样的基础问题时显得过于复杂和缓慢
  • 界面美观对于演示产品来说很重要,不应被简单地否定
  • 自托管版本的需求强烈,用户希望能在家庭服务器上运行类似工具
  • 个人浏览历史的自动收集和搜索功能具有很高的实用价值
  • 本地 LLM 的应用可以更好地保护个人隐私
  • 希望 Mozilla 能够开发类似功能的个人助手
  • 个人知识管理工具应提供更多定制化选项,以满足不同用户的需求
  • 自动归档和管理书签的内容可以提高信息检索的效率
  • 本地归档工具的测试反馈良好,但需注意与商业利益的冲突
  • 用户对隐私和选择权的关注很高,反对默认开启上传至云端的功能
  • 自托管的开源项目更受用户欢迎,商业公司开发的闭源组件则面临更多质疑

A “meta-optics” camera that is the size of a grain of salt #

https://cacm.acm.org/news/a-camera-the-size-of-a-grain-of-salt-could-change-imaging-as-we-know-it/

一项来自普林斯顿大学和华盛顿大学的研究团队开发出了一种名为 “超光学” 的新型相机,这种相机的体积只有一颗盐粒大小。研究人员利用一种称为 “超表面” 的技术,该技术由 160 万个微型圆柱形柱体构成,类似于计算机芯片的生产方式。这种超光学相机能够以与传统相机相同的质量捕捉全彩图像,而其体积比传统相机小 500,000 倍。

** 研究的创新点 **

  1. ** 超表面的应用 **:超表面是一种人造材料,能够以独特的方式操控光线。研究团队通过调节每个纳米天线的性质,实现了在仅 0.5 毫米厚的超表面上聚集更多的光学性能,从而使相机体积显著缩小。
  2. **AI 技术的整合 **:研究团队还利用人工智能优化了纳米天线的设计和图像处理。这种 AI 驱动的方法使得超光学相机能够捕捉清晰的全彩图像,并去除了图像中的畸变。

** 潜在应用 **

超光学相机的潜在应用非常广泛,尤其是在以下几个领域:

  • ** 医疗成像 **:由于其微小的尺寸,超光学相机可以被应用于内窥镜,使得非侵入性诊断和手术成为可能。
  • ** 消费电子 **:这种相机可以被集成到智能手机、可穿戴设备、增强现实(AR)和虚拟现实(VR)头显中,允许更轻便、更高质量的摄像功能。
  • ** 无人机 **:更小的相机将使无人机更轻、更省电,从而提高它们的效率和性能。
  • ** 天文观测 **:更大尺寸的超表面可以取代传统望远镜的镜头,简化设计并提高发射到太空中的光学设备的能力。

** 技术生产 **

由于超表面可以用类似于计算机芯片的成熟技术生产,这为其大规模应用提供了可能,预计生产成本会显著降低。

总体而言,这项研究为相机技术的未来发展开辟了新的思路,可能会在多个行业中产生深远的影响。


HN 热度 203 points | 评论 125 comments | 作者:rbanffy | 13 hours ago #

https://news.ycombinator.com/item?id=42212992

  • 评论者对纳米相机能否产生与传统相机质量相等的全彩图像表示怀疑,但原论文中的示例令人印象深刻
  • 图像质量明显不如传统相机,缺乏锐度和色彩
  • 传统超薄镜头相机主要用于内窥镜,纳米相机与之相比有一定优势
  • 评论者不确定所展示的图像是否真实,比如一张被误认为是腹部脂肪的图像
  • 由于相机尺寸极小,光圈受限,低光和景深将是挑战
  • 评论者推测图像可能是通过将纳米相机粘贴在另一相机镜头中心拍摄的
  • 评论者建议使用多个纳米相机组成类似昆虫复眼的结构,以实现 3D 成像
  • 纳米相机的工作原理是利用基于物理的神经网络处理图像,去除相机产生的像差
  • 评论者认为应该对任何声称绕过衍射极限的技术持怀疑态度
  • 评论者提到这种技术在 1972 年的科幻小说《Other Days, Other Eyes》中已有设想,书中描述了这种微型相机可能带来的监控社会
  • 评论者希望看到纳米相机拍摄完全随机的分形噪声图像,以验证其是否只是重建已知图像模式

What’s Next for WebGPU #

https://developer.chrome.com/blog/next-for-webgpu

WebGPU 规范一直在不断发展,Google、Mozilla、Apple、Intel 和 Microsoft 等大公司每周都会开会讨论其开发进度。在最近一次 Web 工作组会议上,我们简要介绍了 WebGPU 的下一迭代计划实现的主要目标和功能。

会议的重点是讨论里程碑 0 的进展,并确定在该规范达到 W3C 候选推荐状态之前需要解决的问题。这是标准化流程的下一步,可更好地保证稳定性和知识产权保护。会议参与者普遍认为这些问题不构成障碍,并且可以及时解决,为 W3C 推荐 WebGPU 候选标准铺平了道路。

会议参与者也优先考虑了新功能。他们首先从开发者、实现者和利益相关方的反馈中汇总了功能请求列表。经过讨论,我们确定了以下适用于 AI 的 WebGPU 关键功能:子群组和子群组矩阵、纹理缓冲区、UMA 缓冲区映射。我们还在考虑和优先考虑以下 WebGPU 功能,以解锁新类型的渲染算法:无绑定、多绘制间接、64 位原子操作。

为了增强 WebGPU 的功能并与更广泛的 Web 平台集成,我们讨论了以下 WebGPU 功能:兼容模式、WebXR、Canvas2D。会议还就改进 WGSL 工具和库的努力进行了演讲和讨论。一个值得注意的计划是开发 WESL(WGSL 扩展着色语言),旨在为 WGSL 提供一组由社区驱动的扩展。

会议强调了 WebGPU 工作组、开发者和更广泛的图形社区之间通力协作对于塑造 WebGPU 未来的重要性。该工作组正在积极征求有关提议功能的反馈,并致力于与开发者合作,确保 WebGPU 能够满足他们的需求。WebGPU 的后续演变有望取得重大进展,为 Web 图形开拓新的可能性,并让开发者能够为 AI 打造更加沉浸且富有吸引力的 Web 体验。


HN 热度 192 points | 评论 176 comments | 作者:mariuz | 1 day ago #

https://news.ycombinator.com/item?id=42209272

  • Bindless 是 WebGPU 中最重要的特性,缺乏该特性导致状态变化频繁,严重影响性能
  • Bindless 的缺失对 Rust 3D 图形渲染造成了毁灭性影响,限制了高性能游戏的开发
  • WGPU 性能下降是因为 Mozilla 的开发者目前更关注兼容性和安全性,而非性能优化
  • WGPU 是一个开源项目,除了 Mozilla 的贡献者外,还有其他贡献者根据自己的需求添加特性
  • WGPU 的性能和功能主要取决于资源投入,需要更多贡献者参与
  • WGPU 在浏览器外应作为中间件存在,要么保持与 WebGPU 兼容,要么转向原生代码开发
  • WebGPU 的设计层级导致即使只扩展其 API,也会产生多种不同的使用方式,增加开发复杂性