2024 03 23 HackerNews

2024-03-23 Hacker News Top Stories #

一句话摘要 #

  1. Show HN: Memories – FOSS Google Photos alternative built for high performance Memories 是一个高性能的照片管理套件,作为 Nextcloud 应用,支持自动上传、相册创建和数据加密等功能。
  2. Picotron Is a Fantasy Workstation Picotron 是一个创意工作站,提供玩具操作系统和内置工具,用于制作像素艺术、动画、音乐等,支持跨平台运行。
  3. Mapping almost every law, regulation and case in Australia 文章介绍了澳大利亚法律的首次地图化,通过二维地图展示法律、法规和案例之间的相似性和联系。
  4. Boom announces successful flight of XB-1 demonstrator aircraft Boom Supersonic 宣布 XB-1 超音速演示机成功首飞,为超音速客机 Overture 的发展奠定了基础。
  5. DuckDB as the New jq 文章介绍了如何使用 DuckDB 和 SQL 处理 JSON 数据,提供了一种简单易懂的替代方案来替代 jq。
  6. Users say Glassdoor added real names to user profiles without their consent Glassdoor 被指控未经用户同意添加真实姓名到用户资料,引发隐私和数据安全担忧。
  7. How Chain-of-Thought Reasoning Helps Neural Networks Compute 研究显示,当神经网络在解决问题时展示出解题过程,它们的表现会更好,这种现象被称为“链式思维推理”。
  8. Why is it so hard to build an airport? 文章探讨了建造机场的困难,包括政治冲突、噪音问题和土地使用争议等因素。
  9. The Bulma CSS framework reaches 1.0 Bulma CSS 框架发布了 1.0 版本,使用 Dart Sass 重写,提供了更好的主题和颜色定制功能。
  10. Chronos: Learning the Language of Time Series Chronos 是一个预训练的概率时间序列模型框架,通过量化时间序列数据并使用 Transformer 架构进行训练,提高了预测的准确性。

Show HN: Memories – FOSS Google Photos alternative built for high performance #

https://memories.gallery/

网站 https://memories.gallery/ 是一个快速、现代和先进的照片管理套件。它是一个免费且开源的 Nextcloud 应用程序,旨在让用户自主管理照片。

该应用支持自动上传照片、照片时间轴、创建相册、自动标记、编辑元数据、视频转码、地图查看照片等功能。

Memories 专注于性能,设计优化以处理大型照片库,即使在运行于较低硬件配置(如树莓派)时也能表现出色。此外,Memories 采用 Nextcloud 平台作为底层存储层,确保数据安全性和可靠性。

该应用还支持用户拥有数据的理念,让用户可以加密数据并自由迁移至其他解决方案。


HN 评论 219 comments | 作者:radialapps | 1 day ago #

https://news.ycombinator.com/item?id=39783223

  • 有关于 Memories 项目的评论中,有人认为 Nextcloud 是一个不错的框架,可以整合照片管理,未来也可以选择其他后端。
  • 有人提到自托管照片存储的一个主要缺失功能是缺乏真正的搜索功能,希望能像 Google Photos 那样实现文本搜索。
  • 有人推荐使用 Immich 来实现高级搜索功能,认为其表现甚至超过 Google Photos。
  • 有人关注数据加密问题,希望了解数据中心中的数据是否加密。
  • 有人提到对于自托管照片存储来说,缺乏真正的搜索功能是一个主要缺失的特性。
  • 有人关注照片共享功能,希望能够分享相册并设置密码保护,允许评论等功能。
  • 有人对于 Nextcloud 的稳定性和功能感到满意,认为 Memories 项目也应该注重稳定性。
  • 有人提到希望能够实现联邦功能,即在本地实例上上传大量图片,然后仅同步子集到远程实例。
  • 有人赞赏项目的用户体验,特别是在浏览照片时的流畅性和便捷性。
  • 有人询问配置的复杂程度和是否有移动应用程序,以便在手机上查看照片。
  • 有人提到使用 Nextcloud 的 Android / iOS 应用程序进行自动上传,Memories 会自动检测上传的所有内容。
  • 有人建议更新文本或图像以链接到 Nextcloud,以便用户了解更多信息。
  • 有人比较了 Memories 和 Immich 项目,认为 Memories 在可扩展性和稳定性方面更胜一筹。

Picotron Is a Fantasy Workstation #

https://www.lexaloffle.com/picotron.php

网站名称:Picotron by Lexaloffle

内容摘要:Picotron 是一个用于制作像素艺术游戏、动画、音乐、演示和其他奇思妙想的幻想工作站。它拥有一个玩具操作系统,旨在成为一个舒适的创意空间,但可以在 Windows、MacOS 或 Linux 上运行。Picotron 应用程序可以使用内置工具制作,并以特殊的 256k png 格式与其他用户共享。

规格

  • 显示:480x270 / 240x135,64 种可定义颜色
  • 图形:混合表、tline3d、模板剪切
  • 音频:64 节点合成器和 8 通道跟踪器
  • 代码:Lua 5.4,带有 PICO-8 兼容功能
  • CPU:每秒 8M Lua 虚拟机指令
  • 载具:.p64.png(256k)/ .p64(无限制)

用户可以定制自己的机器,制作自己的动态壁纸、屏幕保护程序、小部件、自定义工具,并按自己的喜好设置工作流程。Picotron 目前处于 Alpha 阶段,主要由胶带粘合,但运行时和 API 相当完整,当前的二进制文件允许基本编辑代码、图形、地图和声音,并导出为.p64.png 以在 BBS 上共享。Web 导出器即将推出。

截至 3 月底,Picotron 售价为 $11.99。之后将为 $19.99,或者与其他幻想主机一起购买时为 $11.99。所有未来更新均包含在内,二进制文件无 DRM,适用于 Windows、Mac 和 Linux。

以上为对网站内容的详细中文摘要。


HN 评论 179 comments | 作者:celadevra_ | 21 hours ago #

https://news.ycombinator.com/item?id=39786984

  • 有人转向使用新一代机器如 CX16、Mega65 或 Agon Light,认为这些机器在设计、芯片和 I/O 端口方面更加紧凑,能够实现更多功能。
  • 有人希望在复古风格的 2D/位图机器上使用更先进的硬件,如 Cortex-M、z8000、68000 或低端 Risc-V,以获得更多发展空间。
  • 一些人认为嵌入式 2D 微处理器/操作系统如 Linux4SAM 可能适合这种需求。
  • 有人推荐尝试使用 Cortex M-7 的 Colour Maximite 2,具有早期家用计算机的精神,但性能更强。
  • 有人想象了 z8k 或 68k 在 IBM PC 上完成并投入使用的另一个世界。
  • 有人认为 STM32 Discovery 板是重现 90 年代中期魔力的好选择,具有基本硬件 2D 加速器。
  • 有人认为微控制器不适合这个问题,而应该使用微处理器,推荐使用 500MHz 或 600MHz 的处理器,如 STM32MP1。
  • 有人提到 PicoPico 项目使用 ESP32 Wrover,具有 4MB PSRAM,解决了内存问题。
  • 有人希望在 Pico8 克隆中使用 Forth 语言。
  • 有人分享了对 Picotron 的积极体验,认为它充满乐趣,类似于 Pico-8,是一款令人愉悦的软件。

Mapping almost every law, regulation and case in Australia #

https://umarbutler.com/mapping-almost-every-law-regulation-and-case-in-australia/

这篇文章介绍了澳大利亚法律的首次地图化。每个点代表澳大利亚法律、法规或案例中的一个独特内容。

文章展示了如何将所有法律、法规和案例投影到二维地图上,使它们之间的距离与意义上的相似性成比例。文章还提到了不同类别的法律内容,如行政、刑事、诽谤、过失、就业、商业、合同、知识产权、产权、土地、环境、发展、交通、社会服务、健康、家庭和移民等。文章指出了澳大利亚法律中的隐藏联系和分离方式,以及案例和立法之间的隐形界限。文章还探讨了不同司法管辖区之间的边界、司法和立法之间的联系,以及案例之间的连续性。

文章还提到了澳大利亚法律中的一些特殊洞见,如移民、家庭和刑事法是地图上最孤立的案例分支,发展法是最接近立法的案例分支。文章总结了地图揭示的澳大利亚法律的各种洞见,以及如何将数据进行语义映射的过程。


HN 评论 68 comments | 作者:ubutler | 16 hours ago #

https://news.ycombinator.com/item?id=39788322

这篇帖子中的评论观点包括:对网站、音乐和艺术家之间的关联进行图谱化的兴趣、对法律案例和法规的语义结构进行视觉化的探索、对法律领域的数据分析和语义聚类的讨论、以及对法律知识结构的不同理解和观点。


Boom announces successful flight of XB-1 demonstrator aircraft #

https://boomsupersonic.com/flyby/inaugural-first-flight-xb1-supersonic-demonstrator

这篇文章是关于 Boom Supersonic 宣布成功进行了 XB-1 超音速演示机的首次飞行。XB-1 的首飞标志着超音速旅行的回归迈出了重要的一步,为 Boom 的超音速客机 Overture 奠定了基础。XB-1 是世界上第一架独立开发的超音速喷气机,利用碳纤维复合材料、先进航空电子设备、数字优化空气动力学和先进的超音速推进系统等最新技术实现了高效的超音速飞行。飞行由 Boom Supersonic 的创始人兼首席执行官 Blake Scholl 宣布成功,他表示这是通往向全球乘客提供超音速旅行的道路上迄今为止最重要的里程碑。

XB-1 由首席试飞员 Bill “Doc” Shoemaker 驾驶,从加利福尼亚州莫哈韦空间港起飞,并在包括贝尔 X-1、北美 X-15 和洛克希德 SR-71 黑鸟在内的许多历史性首飞飞行的同一空域飞行。XB-1 成功实现了所有测试目标,包括安全并成功达到 7120 英尺的高度和 238 节(273 英里/小时)的速度。XB-1 的成功首飞标志着民用超音速飞机重返天空的开始,为 Overture 的复兴铺平了道路。

XB-1 项目为 Overture 的设计和开发奠定了基础,同时在工程和制造中建立了以安全为首要考虑的文化。XB-1 验证了关键技术和 Boom 自己的创新,包括增强现实视觉系统、数字优化空气动力学、碳纤维复合材料和超音速进气口等。文章还提到了 XB-1 的设计和发展,以及 Overture 的生产进展和订单情况。

总的来说,这篇文章详细介绍了 XB-1 超音速演示机的首次飞行,标志着超音速旅行的重要进展,展望了 Overture 超音速客机的未来。


HN 评论 308 comments | 作者:rbanffy | 6 hours ago #

https://news.ycombinator.com/item?id=39793044

这篇帖子中的评论观点归纳如下:

有人认为 Boom 计划在未来 5 年内设计新飞机和引擎的时间表不切实际,可能只是在浪费资金;

另一方认为创新总是可能的,但需要注意技术挑战和商业可行性;

还有人指出项目规划不切实际可能导致产品和公司失败;

有人对 Boom 的商业模式和技术发展提出质疑,认为其可能只服务富裕人群和国家;

同时也有人对超音速飞行的技术和环境影响提出担忧。


DuckDB as the New jq #

https://www.pgrs.net/2024/03/21/duckdb-as-the-new-jq/

这篇博文介绍了 DuckDB 作为新的 jq 的应用。DuckDB 是一个面向数据应用的类似 SQLite 的项目,具有许多内置的数据导入工具,无需额外依赖即可读取和解析 JSON 等多种格式作为数据库表。

作者指出,相比于 jq 的复杂和定制化语法,他更熟悉 SQL 并且几乎每天都在使用。文章中举例说明了如何使用 DuckDB 和 SQL 来处理 JSON 数据,与使用 jq 相比,SQL 语法更简单易懂,作者能够在不查看文档的情况下编写查询语句。此外,DuckDB 还支持从 URL 直接读取 JSON 数据,不仅限于本地文件。

文章还提到了 DuckDB 可以用于导入各种数据格式,如 CSV、parquet、Excel 文件等,并且可以选择创建表并持久化数据,或者仅用于数据查询而无需持久化。


HN 评论 62 comments | 作者:pgr0ss | 1 day ago #

https://news.ycombinator.com/item?id=39782356

  • 有人认为 jq 语法和数据模型优雅且强大,但标准库缺乏,建议结合基本 shell 工具使用。
  • 一些人认为 jq 是一个文本处理工具库的入口,不需要成为编程语言本身。
  • 有人提到 Unix 哲学,认为 jq 是一个文本处理工具,而不是编程语言。
  • 有人认为 SQL 比 jq 更强大,结合基本 shell 工具使用效果更佳。
  • 有人分享了学习 Unix shell 的资源和经验。
  • 有人推荐 DuckDB 和 SQL 在某些情况下更适合解决问题。
  • 有人分享了使用 DuckDB 处理 JSON 数据的例子。
  • 有人提到 Benthos 作为数据转换工具。
  • 有人推荐 Nushell 作为数据处理工具。
  • 有人介绍了 pq (prql-query) 结合 DuckDB、DataFusion 和 PRQL 的工具。
  • 有人质疑使用 jq 相比编程语言处理 JSON 数据的优势。

https://techcrunch.com/2024/03/20/glassdoor-added-real-names-profiles-without-consent/

2024 年 3 月 20 日,TechCrunch 报道称,Glassdoor 网站的用户表示,该网站在未经他们同意的情况下收集并添加了他们的真实姓名到用户个人资料中。一位用户 Monica 在她的个人博客上写道,Glassdoor 在与客户支持的邮件往来后,未经她同意就将她的姓名和所居城市添加到了她的 Glassdoor 个人资料中。Monica 指责 Glassdoor 从她发送给客户支持的电子邮件中获取了她的全名,并将其添加到了她的 Glassdoor 个人资料中。尽管 Monica 多次抗议,告诉客户支持公司没有得到她的同意或许可,但 Glassdoor 表示 Monica“必须”将她的姓名添加到她的个人资料中,并表示这不会影响她过去所做的匿名评论的匿名性。Monica 担心如果 Glassdoor 遭遇黑客攻击或数据泄露,她的匿名性可能会受到影响。Glassdoor 还表示,如果了解到用户的真实姓名等信息,将会将其添加到用户的账户中,而唯一的选择是删除账户。

Glassdoor 用户对 Monica 的故事表示担忧,担心他们的匿名性可能会因为收集并添加到他们个人资料中的数据而受到影响。Glassdoor 长期以来允许用户匿名注册。2021 年,Glassdoor 收购了 Fishbowl,一个半匿名的专业社交网络网站,允许用户“匿名提问”。根据 Ars Technica 的报道,Fishbowl 要求用户在使用该网站之前验证其身份。作为收购协议的一部分,Glassdoor 为每位用户注册了 Fishbowl 账户,这意味着 Glassdoor 必须更改其服务条款,以便每位 Glassdoor 用户也可以进行验证。

Glassdoor 的数据收集政策引发了一些担忧,因为 Glassdoor 现在正在收集更多可能识别用户的信息。用户如 Monica 等只能选择删除他们的账户,如果不愿意在其个人资料中显示他们的姓名。根据 Monica 的说法,关闭账户只是停用它。如果您想完全删除 Glassdoor 账户,可以访问 Glassdoor 的特定隐私请求页面,并填写数据请求表格,选择“删除我的个人数据”。

Glassdoor 表示,他们致力于提供一个平台,让人们匿名分享他们对工作和公司的看法和经验,而不必担心受到恐吓或报复。Glassdoor 社区中,用户始终可以选择使用他们的姓名发布内容,或者匿名发布与公司名称或职位相关的内容。Glassdoor 从未并永远不会在用户的内容旁边显示用户的姓名,除非用户选择这样做。


HN 评论 41 comments | 作者:cgoodmac | 19 hours ago #

https://news.ycombinator.com/item?id=39787559

  • Glassdoor 的商业模式依赖于公司付费来拥有自己的页面,可以挑选性删除负面评论,使其不太客观。
  • Glassdoor 添加真实姓名到用户档案,可能导致用户隐私泄露和就业风险。
  • 雇主可能通过 Glassdoor 等网站获取员工的薪资信息,可能影响谈判和招聘。
  • Glassdoor 等评论网站可能接受公司付费删除差评或提升好评,信誉度受质疑。
  • 用户反映 Glassdoor 添加真实姓名到档案,引发隐私担忧和数据泄露问题。
  • Glassdoor 等网站可能不准确报告行业收入,可能导致薪资低估。
  • Glassdoor 可能从供应商购买大量数据,存在数据交易风险。
  • Glassdoor 添加用户真实姓名到档案,可能违反欧洲 GDPR 数据保护法规。

How Chain-of-Thought Reasoning Helps Neural Networks Compute #

https://www.quantamagazine.org/how-chain-of-thought-reasoning-helps-neural-networks-compute-20240321/

这篇文章讨论了如何利用“链式思维推理”帮助神经网络进行计算。研究人员发现,大型语言模型在解决问题时表现更好,当它们展示出解题过程时。他们开始理解这种现象背后的原因。

文章以一个简单的加法问题为例,说明了人类如何通过“步步为营”的方式解决问题。这种思维方式启发了研究人员对驱动聊天机器人等系统的大型语言模型进行研究。这些系统可能能够很好地回答涉及几个步骤的算术问题,但在涉及多个步骤的问题时,例如计算两个大数的和时,它们通常会出错。然而,谷歌研究人员在 2022 年展示,要求语言模型生成逐步解决方案使得模型能够解决先前似乎超出其能力范围的问题。他们提出的“链式思维提示”技术很快变得广泛应用,尽管研究人员仍在努力理解其有效性原因。

现在,几个团队通过使用计算复杂性理论中的技术,探索了链式思维推理的威力。这是研究语言模型固有能力和局限性的研究领域的最新进展之一。这些努力澄清了我们应该期望模型失败的地方,并可能指向构建模型的新方法。

总的来说,文章深入探讨了神经网络如何进行计算,以及链式思维推理如何帮助克服模型在处理复杂问题时的局限性。通过理论分析和实践案例,研究人员正在努力揭示神经网络的潜力和限制,为未来构建更强大的模型提供指导。


HN 评论 131 comments | 作者:amichail | 22 hours ago #

https://news.ycombinator.com/item?id=39786666

  • 评论中有人认为模型的推理过程更类似于搜索相关上下文,而不是像人类那样纯粹从逻辑出发推理;
  • 另一观点认为 LLMs 实际上在潜在空间中进行序贯蒙特卡洛采样,需要一定的“热身”时间才能开始有效采样;
  • 有人将 LLMs 与贝叶斯采样进行比较,指出两者的关键区别在于采样的初始值,以及采样之间的依赖关系;
  • 评论中提到人类推理结构与思维链类似,但人类的转换功能目前在模型中表现更好;
  • 还有人讨论了逻辑推理和统计推理的差异,以及如何教导 LLMs 进行更形式化的推理。

Why is it so hard to build an airport? #

https://www.construction-physics.com/p/why-is-it-so-hard-to-build-an-airport

这篇文章探讨了为什么建造机场如此困难。机场作为现代基础设施的重要组成部分,对全球 GDP 有着重要贡献,直接和间接影响着全球 GDP 的 8%,并且约 25% 的公司销售额依赖于空运。然而,尽管机场的重要性,建造机场却是一项极具挑战性的任务,不仅在美国,在全球范围内也是如此。文章指出,机场建设几乎总是受到各种利益集团的激烈反对,而且往往取得成功。在过去的几十年里,随着航空业的迅速扩张,机场建设引发了许多激烈的争议,尤其是在美国。文章还探讨了建造机场的困难之处,以及美国是如何在这种困难中应对不断增长的航空需求的。文章还提到了航空业的发展历程,以及飞机引擎噪音问题对机场建设的影响等方面。最后,文章总结指出,尽管机场建设困难重重,但通过增加跑道、优化基础设施、提高飞机载客量等方式,机场仍然能够不断扩大航空交通量,避免严重拥堵。


HN 评论 488 comments | 作者:gmays | 12 hours ago #

https://news.ycombinator.com/item?id=39789920

这篇帖子中的评论观点归纳如下:

  • 日本政治冲突导致建设机场困难;
  • 在日本建设机场时选择在海上人工岛上建设;
  • 有人主张关闭机场以保留农田,引发讨论;
  • 有人对短暂占有土地的情况表示不关心;
  • 重视土地和传统的重要性;
  • 对机场交通方式进行讨论,包括出租车、火车、巴士等;
  • 提出在偏远地区建设机场以减少噪音投诉;
  • 比较羽田和成田机场的便利性;
  • 讨论行李处理和交通方式选择的便利性。

The Bulma CSS framework reaches 1.0 #

https://github.com/jgthms/bulma/releases/tag/1.0.0

Bulma v1 是使用 Dart Sass 进行全面重写的框架,Dart Sass 是 Sass 的主要实现。尽管这影响了一些开发细节,但一切都已经做好了使过渡尽可能简单。

保持不变的内容:

所有 HTML 片段保持不变,这意味着您无需更新标记。这很重要,因为这意味着,如果您直接使用 Bulma,您无需更改任何内容。 您只需将 bulma@0.9.4/css/bulma.min.css 替换为 bulma@1.0.0/css/bulma.min.css,一切都将正常工作。外观会略有不同,但仍将正常工作。

变化的内容:

  • 使用 Dart Sass 构建 Bulma
  • 使用 CSS 变量而不是文字:例如 color: var(–bulma-primary);而不是 color: hsl(171deg, 100%, 41%);,这意味着您可以仅使用 CSS 自定义 Bulma(而无需使用 Sass)。
  • 通过设置自己的 Sass 变量值进行自定义的方式发生了变化。

新增内容:

  • 引入了主题的概念:主题是上下文中的一组 CSS 变量,是自定义 Bulma 的最佳方法。
  • 因此,包含了一个暗黑模式的主题。
  • 为每个 7 种主要颜色创建了调色板。
  • 存在骨架加载器作为独立组件,也作为其他组件的变体。
  • 您可以为所有 Bulma 类添加前缀,使.button 变为.my-prefix-button。
  • 预构建的带前缀版本作为备选版本之一存在。

HN 评论 102 comments | 作者:imjonse | 11 hours ago #

https://news.ycombinator.com/item?id=39790365

根据您提供的链接,这篇帖子中的评论观点可以归纳为:


Chronos: Learning the Language of Time Series #

https://arxiv.org/abs/2403.07815

这篇论文介绍了一种名为 Chronos 的简单而有效的预训练概率时间序列模型框架。Chronos 将时间序列值使用缩放和量化分成固定词汇,并通过交叉熵损失训练现有的基于 Transformer 的语言模型架构。

我们在 T5 系列(参数范围从 20M 到 710M)上预训练了 Chronos 模型,使用大量公开数据集,辅以我们通过高斯过程生成的合成数据集以提高泛化能力。在包含 42 个数据集的全面基准测试中,涵盖了传统的本地模型和深度学习方法,我们展示了 Chronos 模型:

(a) 在训练语料库中的数据集上明显优于其他方法;

(b) 相对于专门针对它们进行训练的方法,在新数据集上具有可比甚至更优的零样本性能。

我们的结果表明,Chronos 模型可以利用来自不同领域的时间序列数据,提高对未见预测任务的零样本准确性,将预训练模型定位为极大简化预测流程的可行工具。


HN 评论 51 comments | 作者:Anon84 | 21 hours ago #

https://news.ycombinator.com/item?id=39787176

  • 有人认为在时间序列预测中,线性模型表现出色,而机器学习模型通常是树模型的变体。
  • 有人指出,Transformer/机器学习模型容易过拟合过去的模式,而线性模型则更适合处理偏差-方差权衡。
  • 有人讨论了 Transformer 模型的集成与 dropout 之间的关系。
  • 有人提到金融领域中使用大型预训练模型的挑战,认为金融数据的非平稳性可能使预训练模型难以应用。
  • 有人谈到时间序列的量化和标记化,以及如何将连续信号转换为离散词汇。
  • 有人讨论了分类与回归在处理连续输出值时的优劣,以及如何通过分类来获得近似分布。
  • 有人提到 HTM 在时间序列中的应用,认为这一领域值得关注。
  • 有人分享了对时间序列分析的实践经验,推荐了一些统计库和模型。
  • 有人讨论了时间序列工具的实际需求,包括简单操作、短训练时间、CPU 运行、性能和回归变量的简单性。
  • 有人讨论了算法交易员目前使用的模型类型。