2024-03-17 Hacker News Top Stories #
一句话摘要 #
- Nix is a better Docker image builder than Docker’s image builder Nix 作为 Docker 镜像构建工具的优势在于其确定性和构建共享层的能力,以及节省时间和成本的二进制缓存功能。
- Fuzzing Ladybird with tools from Google Project Zero 文章介绍了使用 Google Project Zero 的 DOM fuzzer 工具“Domato”对 Ladybird 浏览器进行安全研究的过程和发现的问题。
- Brain waves appear to wash out waste during sleep in mice 研究表明,在小鼠睡眠期间,脑波似乎负责协调泵的作用,通过大脑组织冲洗脑脊液,清除废物。
- Cloudflare loses 22% of its domains in Freenom .tk shutdown Freenom 顶级域名的关闭导致 Cloudflare 失去了 22% 的域名,显著减少了其托管的网站数量。
- Great ideas in theoretical computer science 网站提供了关于理论计算机科学中伟大思想的课程,涵盖计算本质、算法、计算复杂性等核心概念。
- Libraries struggle to afford e-books, seek new laws in fight with publishers 美国图书馆面临电子书成本高昂的问题,正在寻求新法律来对抗出版商的价格限制。
- Affordable Wheel Based Refreshable Braille Display 项目笔记介绍了开发一个既便宜又易于制造的盲文显示器的挑战和可能的解决方案。
- The United States has its first large offshore wind farm, with more to come 美国首个商业规模的海上风电场启用,预示着更多大型风电场的建设,以应对气候变化。
- Mozilla will be retiring the Mozilla Location Service Mozilla 决定停止 Mozilla Location Service,原因是服务准确性下降和专利诉讼问题。
- Show HN: Flash Attention in ~100 lines of CUDA 项目展示了使用 CUDA 和 PyTorch 对 Flash Attention 机制进行最小化实现的代码,旨在教育和展示其工作原理。
Nix is a better Docker image builder than Docker’s image builder #
https://xeiaso.net/talks/2024/nix-docker-build/
这篇文章讨论了如何使用 Nix 作为比 Docker 更好的 Docker 镜像构建工具。作者指出,Nix 是一个包管理器、一种语言和一个操作系统,它允许您提前了解依赖关系,并将其分解为尽可能少的 Docker 层。相比之下,Docker 构建不是确定性的,这可能导致在构建过程中出现问题。Nix 还允许您构建具有共享层的 Docker 镜像,这对于多个服务共享依赖项非常有用。此外,Nix 还具有二进制缓存功能,可以避免重复构建代码,从而节省时间和成本。
文章详细介绍了如何使用 Nix 构建 Docker 镜像,包括构建 Go 程序、将其转换为 Docker 镜像以及如何创建分层镜像以最大程度地减少上传的内容。作者还提到了 Nix 的优势之一是能够在未来重建软件,这对于需要重新创建特定时间点的软件状态非常有用。最后,作者总结了 Nix 相对于 Docker 的优势,并鼓励读者尝试使用 Nix 构建 Docker 镜像,以便更好地了解 Nix 的潜力。
文章内容涵盖了 Nix 的基本概念、与 Docker 的比较、构建 Docker 镜像的具体步骤以及 Nix 的优势,为读者提供了全面的指导和见解。
HN 评论 267 comments | 作者:tosh | 1 day ago #
https://news.ycombinator.com/item?id=39720007
- 有评论者认为 Nix 的文档和教程难以理解,使用起来像是炼金术而非科学,需要深入了解才能避免出错。
- 另一观点指出 Docker 的优势在于混乱本身,易于构建各种内容,容易诊断和修复问题,因为工具已经成熟。
- 有人提到在裸机上工作时也需要确定性构建,使用 DNS + Vhosts 和 bash+rsync 等工具解决问题。
- 有评论者认为 Docker 的基础镜像可能被覆盖或删除,难以保持稳定性,建议使用 image digest 以确保获得相同的镜像。
- 还有人提到了 StableBuild 项目,提供基于 Ubuntu、Debian 或 Alpine 的确定性构建,获得了积极评价。
- 有人认为 Nix 解决了 Docker 无法解决的问题,允许在不同项目中使用不同软件版本,避免了构建大量 Docker 镜像的问题。
- 评论者指出 Nix 的文档存在错误,特别是对于新的 CLI 和 flakes,需要从源代码中获取信息以使其正常工作。
- 还有人提到使用 NixOS 时需要处理大量不可重现的状态,但通过一些方法可以解决这个问题。
- 有人分享了在 Ubuntu 上使用 Nix 的经验,认为 Nix 提供了简单的解决方案,使得在不同机器上安装和使用软件变得更加简单。
- 最后,有人提到了 Fedora Atomic 和 rpm-ostree,认为这些技术可能会取代 Nix。
Fuzzing Ladybird with tools from Google Project Zero #
https://awesomekling.substack.com/p/fuzzing-ladybird-with-tools-from
这篇文章讨论了作者 Andreas Kling 对 Ladybird 浏览器进行安全研究的过程。作者使用了来自 Google Project Zero 的 DOM fuzzer 工具“Domato 🍅”来对 Ladybird 进行压力测试,并修复在测试过程中发现的一些问题。
作者首先介绍了 Domato 工具生成的大约 500 KiB 大小的 HTML 页面,其中包含大量“有趣”的 JS、CSS 和 HTML,用于测试浏览器引擎的反应。在测试过程中,作者发现了一些问题,比如 null 指针解引用错误,这是因为在实现中假设了某些元素总是在 DOM 树中有一个包含它们的表格元素,但实际上这并非总是如此。
接着,作者讨论了另一个问题,涉及到在文档中创建的 window 对象,导致在特定情况下出现验证失败。作者指出这是因为对于通过 DOMParser 创建的文档,其并不一定具有 window 对象,而我们的实现却错误地假设了每个文档都有 window 对象。
此外,文章还提到了对 SVG 渐变引用自身的问题以及处理循环引用的解决方案,以及在处理 iframe 元素时可能导致崩溃的 bug,作者指出这实际上是 HTML 规范中的一个错误,并提出了修复方案。
最后,作者分享了在实现中修复了一个关于元素插入顺序的 bug,该 bug 导致 CPU 占用过高。通过这些测试,作者总结了在面对奇怪和意外输入时软件容易出现问题的事实,并强调了像 Domato 这样的 fuzzer 工具对于提高软件鲁棒性的重要性。
总的来说,这篇文章详细介绍了作者在使用安全研究工具对 Ladybird 浏览器进行测试时发现的各种问题,并分享了修复这些问题的过程。
HN 评论 40 comments | 作者:awesomekling | 13 hours ago #
https://news.ycombinator.com/item?id=39725057
- 多种实现规范的价值:发现规范中的漏洞,多个独立实现对 Web 平台的长期健康至关重要。
- 项目展示了小团队创造出优秀产品的可能性,与公司开发项目的挑战相比,更容易实现。
- 对于浏览器设计方法的质疑:从“做好处理良好的网页内容”开始,逆向修复规范和浏览器行为可能导致难以生产浏览器。
- 开发者希望严格遵循规范的浏览器,专注于确保网页应用在此浏览器上最佳运行,从而提高跨浏览器兼容性。
- 现代浏览器的历史兼容性问题已经融入规范或仅适用于特定网站,对于用户而言,这些问题可能导致部分网页无法正常工作。
- 对于设计方法的讨论:从头开始构建真正的浏览器可能需要更多基础性的设计考量,而非后期修复。
- “真正的浏览器”应该是一个稳健高效、易于维护的浏览器,Chrome 和 Firefox 在这方面表现并不出色。
- 项目在实现 SVG 规范方面取得进展,但仍有部分功能未完成。
- 开发者应该深入了解问题根源,而非仅仅修复表面问题,以提高软件质量。
- 项目是否会参加 Web 引擎 Hackfest 仍有待确认。
- 项目负责人停止发布黑客视频,但仍在每天继续开发项目,得到 Shopify 等赞助支持。
- 观众感谢项目负责人的视频内容,对其清晰和务实的风格表示赞赏。
- 项目负责人停止发布黑客视频后,观众仍在重看旧视频,对其长期努力表示感谢。
Brain waves appear to wash out waste during sleep in mice #
https://jamanetwork.com/journals/jama/fullarticle/2816616
这篇文章介绍了关于睡眠过程中大脑清除废物和毒素的重要细胞功能。研究人员之前缺乏对这一复杂过程背后机制的理解。最近在《自然》杂志上发表的涉及小鼠的研究表明,脑波似乎负责自我清洁。
研究人员观察了睡眠中小鼠大脑中的神经元。当神经元发出电信号时,它们作为协调的泵,产生节律波,似乎通过大脑组织冲洗脑脊液,清除废物。在研究人员关闭大脑的某些区域以停止波动后,脑脊液失去了流动的能力,使废物留在原地。
首席作者、华盛顿大学医学院的李峰江博士在新闻发布会上指出,这一发现对神经疾病如阿尔茨海默病和帕金森病具有潜在影响,因为代谢废物和“垃圾蛋白”的积累可能导致神经退行性疾病。
这项研究有助于揭示睡眠对大脑清除废物的重要性,为神经疾病的治疗和预防提供了新的理解。
HN 评论 223 comments | 作者:hdevarajan | 19 hours ago #
https://news.ycombinator.com/item?id=39723704
- 有关睡眠质量和数量的疑虑,提到了新发现的脑淋巴系统对睡眠的重要性;
- 有人分享了伴侣长期睡眠困难的经历,包括心理根源的问题和治疗挑战;
- 有人讨论了睡眠对心理和身体的重要性,以及通过日记记录和解决问题的方法;
- 有人分享了控制梦境的经验,以及使用大麻减少梦境记忆的建议;
- 有人提到了使用药物如 Promethazine 和 Phenibut 来帮助睡眠;
- 有人建议尝试大麻、Ketamine 等治疗方法,以及使用加权毯等辅助工具;
- 有人分享了改善睡眠质量的方法,如使用耳塞、背景噪音和黑暗窗帘;
- 有人讨论了睡眠障碍的根源,包括心理创伤和身体健康等因素;
- 有人提到了睡眠研究的未来方向,包括是否能在清醒状态下进行大脑清洁。
Cloudflare loses 22% of its domains in Freenom .tk shutdown #
https://www.netcraft.com/blog/cloudflare-loses-22-of-its-domains-in-freenom-tk-shutdown/
文章标题:Cloudflare 在 Freenom .tk 关闭中失去了 22% 的域名 | Netcraft
Freenom 控制的.tk、.cf 和.gq 顶级域名中有惊人的 1260 万个域名被关闭,不再解析,导致 Cloudflare 托管的网站数量显著减少。
这些网站的消失是在我们每月的 Web 服务器调查中发现的,代表了与上个月可解析的 Freenom 域名数量相比下降了 98.7%。几乎所有的.tk、.cf 和.gq 域名实际上已经消失。.tk、.cf 和.gq 顶级域名是托克劳、中非共和国和赤道几内亚的国家代码顶级域名(ccTLDs)。它们原本是为与这些国家有关联的实体使用的,但这种情况非常罕见。
这种巨大的下降可能是一系列事件的结果,从去年 Freenom 被 Meta 起诉开始,因为忽视滥用投诉。 Freenom 随后在 2023 年 3 月暂停了新的域名注册,Netcraft 注意到两个后来远离该提供商的 TLD 上的网络犯罪数量急剧减少(.ga 和.ml)。
最终,在 2024 年 2 月 12 日,Freenom 宣布决定退出域名业务,包括运营注册表。同一份新闻稿(后来已被删除,但在此处存档)还宣布 Freenom 已解决了 Meta 的起诉,具体条款保密。受影响的域名对 Cloudflare 来说是一个巨大损失,.tk、.cf 和.gq 以前占其平台上所有域名的 23.1% - 几乎所有这些域名现在都消失了。
自 2024 年 3 月我们的 Web 服务器调查以来,Cloudflare 托管的.tk、.cf 和.gq 域名总数已经下降了 99.8%,导致 Cloudflare 托管的所有域名总数下降了 22.0%。Freenom 网站声称由于“技术问题”,新注册暂时无法进行。 关于 Freenom 原始公告后网络犯罪影响的更多信息,请阅读 Netcraft 博客。
HN 评论 187 comments | 作者:speckx | 13 hours ago #
https://news.ycombinator.com/item?id=39725303
这篇帖子中的评论观点大致分为以下几类:
- 许多人怀念 .tk 域名,因为它是他们小时候唯一能够在线发布网站的途径;
- 一些人提到其他类似 .tk 的免费域名服务,如 de.vu、.fr.st、.fr.fm、.de.tf 等;
- 一些人分享了早期免费域名服务的经历,如 NameZero、Angelfire、8m.com 等;
- 有人讨论 .tk 域名注入广告的问题,以及与 .tk 相关的德国爱好者和盗版活动;
- 一些人回忆起早期在 .tk 等域名上托管个人网站的经历;
- 有人讨论 Cloudflare 在关闭 .tk 域名中的角色,以及对 Cloudflare 在托管犯罪网站方面的看法。
Great ideas in theoretical computer science #
网站 https://www.cs251.com 是关于理论计算机科学中伟大思想的课程网站。该课程旨在严谨地研究计算,这是我们的宇宙、我们生活的社会、我们发现的新技术以及我们用来理解这些事物的思维的基本组成部分。课程内容涵盖了关于计算本质的一些核心结果和问题。
课程分为三个部分:
第一部分:形式化计算
- 模块 1 介绍了理论计算机科学的高层次概述和未来所涵盖内容。
- 模块 2 介绍了确定性有限自动机,作为定义算法的基础。
- 模块 3 介绍了图灵机的定义,作为任何计算设备的标准数学模型。
- 模块 4 证明了大多数问题是不可判定的。
- 模块 5 探讨了人类推理的局限性。
第二部分:计算复杂性
- 模块 6 讨论了时间复杂性,研究问题的实际可计算性。
- 模块 7 介绍了图论在计算复杂性中的重要作用。
- 模块 8 讨论了 P vs NP 问题,介绍了 NP 类和 NP 完全性。
- 模块 9 介绍了随机算法的概念。
- 模块 10 介绍了密码学的基本概念。
第三部分:理论计算机科学亮点
- 模块 11 展示了理论计算机科学的一些亮点内容。
该课程内容涵盖了计算的基本概念、算法、计算复杂性、图论、随机算法、密码学等内容,旨在帮助学习者深入理解计算的本质和相关概念。
HN 评论 87 comments | 作者:rito | 1 day ago #
https://news.ycombinator.com/item?id=39720388
- 有人认为这种教学方法锻炼了解决问题的能力,但也可能导致沮丧;
- 另一些人认为这种教学方式并不适合,可能会增加学生的压力,影响学习效果;
- 也有人认为这种教学方法在算法课程中效果不错,但在其他课程可能不适用;
- 有人认为这种自学的方式在学术界曾经很常见,但现在教学方式已经发生变化;
- 也有人认为通过自主研究能更好地理解课程内容;
- 有人喜欢这种学习方式,认为这是最佳途径;
- 也有人认为如果问题足够有趣,这种方式是可行的;
- 有人觉得理论计算机科学有趣但也可能令人恼火;
- 还有人提出了对于给定问题的解决方法。
Libraries struggle to afford e-books, seek new laws in fight with publishers #
https://abcnews.go.com/US/wireStory/libraries-struggle-afford-demand-books-seek-new-state-108035200
这篇文章讨论了美国各地图书馆在支付电子书费用方面所面临的困难。随着电子书的流行,许多图书馆发现自己难以承担其高昂的成本。电子书的价格通常远高于消费者购买的价格。例如,一本畅销书的硬皮版售价为 18 美元,但租赁数字副本的费用却高达 55 美元,且通常在一到两年后或借阅 26 次后就会过期。这对于图书馆来说是一个挑战,因为他们需要不断更新租赁的电子材料。
一些州的图书馆管理员一直在推动立法以限制电子材料的成本和限制,尤其是在 COVID-19 大流行之后,电子材料的需求量不断增加。一些州的立法者提出了旨在缩小价格差距的法案,但受到了出版行业的强烈反对,后者认为这些立法会损害知识产权价值并对出版生态系统造成伤害。
一些州的图书馆联盟每月花费约 2 万美元购买电子书,而替换过期书籍占据了联盟预算的 20%。一些州的立法提案试图通过不同的方式解决这个问题,例如废除包括限制图书馆确定授权电子材料借阅期限的条款在内的图书馆与出版商之间的合同。没有立法变化,图书馆管理员将继续面临财务压力,并将不得不审查即将到期的数字租赁清单,以决定是否值得花更多的钱来续订每一本书。
HN 评论 145 comments | 作者:notRobot | 17 hours ago #
https://news.ycombinator.com/item?id=39724045
观点归纳如下:
- 出版行业需要更多监管,自由市场难以运作;
- 降低版权时限和要求销售的一定比例免费提供给图书馆是减少市场扭曲的方法;
- 减少版权可能导致出版商继续以卡特尔行为为代价继续获利;
- 航空公司等行业在减少监管后价格更便宜,但可能牺牲服务质量;
- 品质、价格、安全等因素在自由市场中常常受到影响;
- 数字产品的版权问题需要新的解决方案,如对数字产品实行“首次销售”原则;
- 学生对教科书高价普遍采取盗版方式,教授应该为教材费用负责。
Affordable Wheel Based Refreshable Braille Display #
https://jacquesmattheij.com/refreshablebraille/BrailleDisplayProject.html
这个网页是关于盲文显示器项目的笔记。项目的初衷是为了开发一个既便宜又易于制造的盲文阅读器。作者与 Mahmoud Al-Qudsi 合作,探讨了制造盲文显示器的挑战和可能的解决方案。
文章提到全球有 4000 万盲人,其中许多生活在不发达国家,即使在发达国家,盲文阅读器的获取也受限。作者讨论了制造盲文显示器所需的各种部件和机制,以及现有市场上的产品和价格范围。他还介绍了一些创新的设计想法,如使用类似于汽车里程表的机制来驱动盲文显示器。文章还提到了一些挑战,包括机械部件的精度、电子元件、软件等方面的要求,以及制造原型所需的时间和成本。
作者强调了安全、耐用性、价格等因素的重要性,并掐掉了一些可能的设计方案。文章详细介绍了作者进行的一些研究和实验,以及对不同设计方案的评估和改进。整体而言,这篇文章涵盖了盲文显示器项目的各个方面,探讨了制造盲文显示器的挑战和可能的解决方案。
HN 评论 64 comments | 作者:jacquesm | 16 hours ago #
https://news.ycombinator.com/item?id=39724312
- 有人提出使用连续旋转可重复使用的磁带“打印”盲文字符的想法,以增加触感。
- 有盲人表示,如果便宜且有效,盲文显示器将对许多人有所帮助,尤其在数学方面。
- 有人建议使用类似于 3D 打印机的 XY 门式机构,通过坐标移动来查看简单的 2D 图形或方程式。
- 提出结合低保真盲文显示器与触摸敏感和上下文敏感的语音合成技术的想法。
- 讨论使用温度变化来传达信息,如通过热电制冷器和金属棒的组合。
- 提出使用小型电磁铁注入冷却路径的设计,以实现快速冷却和加热。
- 有人提出使用类似 Force Touch 的设计,将触觉表面分成小点阵。
- 讨论使用气流通过微小针孔来实现触觉反馈。
- 提出使用电压在两个接触点之间产生触感的设计,以制造常规 PCB。
- 讨论使用织物带和 Nitinol 线来制造带有凸起盲文点的显示器。
- 探讨了使用微机电系统(MEMS)或气压喷嘴阵列等技术来实现盲文显示的可能性。
- 提出使用类似点阵打印机头的设计,通过推动金属球来实现凸起点。
- 讨论了使用磁珠和弹簧墙的设计,以实现盲文点的升降。
- 探讨了使用热辊和打印头来重复使用塑料介质的可能性。
- 提出使用气流或电流等技术来实现盲文显示的设计。
- 讨论了使用微型电机来驱动盲文显示器的设计。
- 有人提到在数学课程中使用盲文显示器的重要性,尤其在考试和作业中。
- 探讨了使用机械 7 段显示器的设计来实现盲文显示。
- 讨论了现代商业盲文终端的设计挑战,以及轮式和气动驱动等替代方案的优缺点。
The United States has its first large offshore wind farm, with more to come #
美国首个商业规模的海上风电场正式启用,这一期待已久的时刻有助于为一系列大型风电场铺平道路。丹麦风能开发商 Ørsted 和公用事业公司 Eversource 在纽约蒙托克角东部 56 公里处建造了一个名为 South Fork Wind 的 12 台风力发电机风电场。纽约州州长凯西·霍库尔(Kathy Hochul)前往长岛宣布,这些风力发电机正在向当地电网输送清洁能源,她翻转了一个巨大的开关,“打开了未来”。内政部长黛布·哈兰德(Deb Haaland)也在场。
实现商业规模是该行业的一个转折点,但接下来会发生什么?专家表示,为了应对气候变化,国家需要大规模建设这种清洁电力。海上风电是国家和各州过渡到无碳电力系统的核心。拜登政府已批准了六个商业规模的海上风能项目,并首次在太平洋和墨西哥湾海岸拍卖了海上风租赁区域。纽约上个月选定了另外两个项目,为超过 100 万户家庭供电。
霍库尔表示,这只是个开始。她表示,South Fork 的完成表明纽约将积极追求气候变化解决方案,以拯救未来世代免受可能危险的世界。South Fork 可以产生 132 兆瓦的海上风能,为超过 7 万户家庭供电。
Ørsted 首席执行官马兹·尼珀(Mads Nipper)称开业是一个重要的里程碑,证明了大型海上风电场可以在美国和其他目前几乎没有海上风能的国家建造。随着 South Fork 的完成,Ørsted 和 Eversource 将把注意力转向今年春季开始的一个比其规模大五倍以上的风电场的海上工作。Revolution Wind 将是罗德岛和康涅狄克的第一个商业规模海上风电场,明年能为超过 35 万户家庭供电。罗德岛将连接电缆的地点已经在建设中。
纽约州上个月表示,将与 Ørsted 和 Eversource 就一个更大的风电场 Sunrise Wind 进行谈判,以为 60 万户家庭供电。挪威公司 Equinor 被选中为其 Empire Wind 1 项目,为 50 多万纽约家庭供电。两者都计划在 2026 年开始供电。
2024 年是行动的一年,将建设能够向电网提供大量清洁能源的项目,Ørsted 美洲集团执行副总裁兼首席执行官大卫·哈迪(David Hardy)表示。Ørsted,前身为 DONG 能源,从 2008 年开始在丹麦、英国和德国海岸积极建设风电场。该公司出售了建立其身份的北海石油和天然气资产,专注于清洁能源,成为 Ørsted。它现在是最大的风电开发商之一。
美国首个海上风电场原本应该是马萨诸塞州海岸的一个名为 Cape Wind 的项目。马萨诸塞州的一家开发商在 2001 年提出了该项目。经过多年的当地反对和诉讼,该项目失败了。
2016 年,罗德岛的布洛克岛开始旋转风力发电机作为一个试点项目。但仅有五台风力发电机,不构成商业规模的风电场。
去年对于新兴的美国海上风电行业来说是充满挑战的一年,Ørsted 和其他开发商取消了他们表示不再具备财务可行性的东北部项目。高通胀、供应链中断以及资本和建筑材料成本上升使得项目变得更加昂贵,而开发商们正试图开通美国首批大型海上风电场。行业领导人预计 2024 年将是一个更好的一年,随着利率下降,各州要求更多的海上风力以实现其气候目标。第二个大型海上风电场 Vineyard Wind 预计今年晚些时候也将在马萨诸塞州海岸开通。前五台风力发电机为马萨诸塞州约 3 万户家庭和企业提供电力。当 62 台风力发电机全部运转时,它们将为 40 万户家庭和企业提供足够的电力。Avangrid 和哥本哈根基础设施合作伙伴是该项目的联合所有者。
拜登政府希望到 2030 年有足够的海上风能供电以满足 1000 万户家庭的需求。内政部长哈兰德表示,“美国的清洁能源转型不是遥远未来的梦想——它正在此时此地发生。”
HN 评论 105 comments | 作者:geox | 1 day ago #
https://news.ycombinator.com/item?id=39721158
- 离岸风电场比陆上风电场更昂贵,因此一些国家选择投资离岸风电场是因为土地稀缺或地理条件不适合在陆地上建设;
- 美国的离岸风电发展受到“琼斯法案”的限制,需要使用美国制造的船只进行工作,增加了成本和复杂性;
- 美国国会应该通过立法解决相关问题;
- 荷兰投资离岸风电主要是因为地价昂贵和 NIMBY(不要在我家后院建设)现象;
- 离岸风电可以减缓飓风等自然灾害;
- 美国需要在能源发展方面做出更多努力。
Mozilla will be retiring the Mozilla Location Service #
https://github.com/mozilla/ichnaea/issues/2065
这个 GitHub 页面是关于 Mozilla Location Service (MLS)的问题,编号为#2065。内容概括如下:
Mozilla Location Service (MLS)的准确性逐渐下降,因此他们决定停止该服务,原因是没有计划重新启动 stumbler 程序或增加对 MLS 的投资。 MLS 于 2013 年作为一个开放服务启动,用于基于公开可观察的无线电信号提供地理位置查找。该服务接收了来自开源 MozStumbler Android 应用的 GPS 数据社区提交。 2019 年,Skyhook Holdings, Inc 联系 Mozilla,声称 MLS 侵犯了他们的一些专利。双方达成协议避免了诉讼,但这导致了对 MLS 政策的更改,使其难以投资和扩展 MLS。 2021 年初,他们停止了 MozStumbler 程序。 为了最小化中断并让人们有时间做出替代安排,他们制定了一个分阶段实施退役计划。 退役计划包括五个阶段,包括停止发放新的 API 访问密钥,停止接受 API 的 POST 数据提交,删除细胞数据下载等。 最终,MLS 源代码将继续以 Apache 许可证 2.0 的形式提供。
除此之外,还有关于 MLS 的未来替代方案、数据隐私和安全性等方面的讨论。
HN 评论 106 comments | 作者:foresterre | 15 hours ago #
https://news.ycombinator.com/item?id=39724505
- 评论中提到 Skyhook 的专利索赔对 Mozilla Location Service 的影响;
- 评论指出 Mozilla Location Service 随着技术发展逐渐被取代;
- 评论讨论了 Mozilla Location Service 的数据规模和用途;
- 评论中提到了一些设备使用位置服务的案例,如夜间红色调整、天气应用程序、壁纸切换等;
- 评论中有关于语言选择、商店位置查找、货币选择等方面的讨论;
- 评论中涉及到 Skyhook 的商业模式和专利问题;
- 评论中提到了 Mozilla Location Service 在开源项目中的应用;
- 评论中有关于 Mozilla Location Service 的技术细节和隐私问题的讨论;
- 评论中提到了 Mozilla Location Service 的替代方案和未来发展。
Show HN: Flash Attention in ~100 lines of CUDA #
https://github.com/tspeterkim/flash-attention-minimal
这个 GitHub 仓库是一个名为"flash-attention-minimal"的项目,它是使用 CUDA 和 PyTorch 对 Flash Attention 进行了最小化的重新实现。Flash Attention 是一种注意力机制,在这个项目中,作者试图以简洁且具有教育意义的方式展示其前向传递过程,代码仅有大约 100 行。
项目中的变量名遵循原始论文的符号表示。使用前需要安装 PyTorch(带有 CUDA)和 Ninja 用于在 C++ 中加载。
在项目中提供了一个基准测试脚本"bench.py",可以比较手动注意力和最小化 Flash Attention 之间的墙钟时间。作者在 T4 上进行了示例输出,展示了最小化 Flash Attention 相比手动注意力的加速效果。
需要注意的是,项目目前没有提供反向传递的实现。作者发现反向传递比前向传递复杂得多。此外,作者在内部循环中将每个线程分配给输出矩阵的一行,这与原始实现有所不同。
项目中的 Q、K、V 矩阵使用的是 float32,而原始实现使用的是 float16。此外,块大小在编译时固定为 32。
未来计划包括添加反向传递、加速矩阵乘法以及动态设置块大小等功能。
总体来说,这个项目提供了一个简洁的 CUDA 实现,旨在帮助理解 Flash Attention 的工作原理。
HN 评论 28 comments | 作者:tspeterkim | 9 hours ago #
https://news.ycombinator.com/item?id=39726781
- 有人认为 Triton 写内核更容易集成,提供有用构造而不影响性能;
- 有人讨论 FlashAttention 的实现,提到从 cutlass 到 triton 的转变;
- 有人质疑使用 OpenAI 发明的新编程语言,认为开源代码应该清晰易懂;
- 有人讨论 Triton DSL 以及 CUDA 的相关问题;
- 有人提供了机器学习训练中 Transformer 和注意力机制的背景知识;
- 有人建议提供简短摘要,解释机器学习模型的概念;
- 有人讨论零样本学习的定义和应用;
- 有人询问 CUDA 中的 __syncthreads() 作用;
- 有人分享关于 CUDA 同步的文章和资源;
- 有人讨论在 GPU 上启动独立内核的适当方式。