2024 06 20 HackerNews

2024-06-20 Hacker News Top Stories #

  1. KidPix 网站展示了一个像素画板项目,用户讨论了其画笔工具的抗锯齿问题。
  2. Lambda School 创始人 Austen Allred 的故事揭示了该教育初创公司的兴衰,涉及夸大数据和不当交易。
  3. Neofetch 开发者 dylanaraps 归档了所有仓库,并宣布开始务农。
  4. 《自然》杂志撤回了一篇关于成体干细胞转化的争议论文,该论文被引用近4500次。
  5. 欧盟理事会即将投票决定是否实施聊天扫描提案,以打击儿童性虐待材料。
  6. Fern Hollow 桥的坍塌事件揭示了桥梁维护的不足和工程失误。
  7. Amphi 是一个基于 Python 的开源 ETL 工具,用于数据提取和准备。
  8. 1/25-Scale Cray C90 Wristwatch 项目将超级计算机核心制作成手表,展示了技术创新。
  9. 3D Gaussian Splatting 被重新定义为马尔可夫链蒙特卡洛样本,提高了渲染质量和初始化稳健性。
  10. Meta FAIR 发布了新的AI研究成果、模型和数据集,强调开放性和协作。

KidPix #

https://kidpix.app

该网站主要展示了一个名为“JSKIDPIX v1.0.2021”的项目,提供了 提供了像素画板功能。

主要修饰键:Shift、Ctrl、Alt、Meta(^、⌘、⌥、⇧)。很多时候它们可以一起使用。

  • ‘c’ - 更改为下一个颜色集。隐藏功能:某些工具在随机颜色选择中使用当前颜色集。
  • ‘n’ - 将当前颜色更改为下一个颜色。在按顺序排列的颜色集中很有用,例如灰度颜色集。
  • ‘r’ - 将当前颜色更改为随机颜色。
  • ’s' - 保存文件。

Ctrl+Z - 撤消。


HN 评论 119 comments | 作者:wonger_ | 1 day ago #

https://news.ycombinator.com/item?id=40723220

  • 评论中提到 KidPix 在 90 年代早期使用,有人提到画笔和线条工具有平滑的 alpha 边缘,使用油漆桶时会出现不必要的白色轮廓;
  • 有人指出这是因为使用了 HTML5 Canvas 工具,无法避免抗锯齿效果,提到可以通过设置全局标志来关闭抗锯齿;
  • 评论中有人认为通过 CSS 和 JS 标志无法实现真正的锯齿画笔,建议手动实现线条绘制算法;
  • 有人提到使用 Canvas 的克隆版本,通过使用小数像素坐标来避免问题;
  • 评论中提到可以通过 context SVG 滤镜来改善问题;
  • 有人评论说 KidPix 可能是原版的忠实复刻,但线条工具和多彩工具之间的交互有点奇怪;
  • 有人提到可以通过使用小数像素坐标来避免问题;
  • 评论中有人表示这种方式在 JS 中速度较慢;
  • 有人提到可以通过手动实现线条绘制算法来解决问题;
  • 评论中有人提到背景色用于抗锯齿被称为“matte”;
  • 有人提到 KidPix 不仅仅是怀旧,他的 10 岁孩子也很喜欢使用;
  • 评论中有人表示这种工具设计得很巧妙,鼓励发现和实验,对于儿童来说是一个很好的创造性玩具;
  • 有人表示即使在移动设备上 KidPix 出现问题,但仍然喜欢 90 年代的怀旧风格;
  • 评论中有人提到 TuxPaint 是一个类似的应用,自 2002 年以来一直很受欢迎;
  • 有人提到 TuxPaint 即使对成年艺术家也很有趣,特别是使用触摸屏幕;
  • 评论中有人回忆起 Atari 的 Art for Kids,提到 KidPix 唤起了许多回忆;

Fast Crimes at Lambda School #

https://www.sandofsky.com/lambda-school/

这篇文章详细介绍了 Lambda School 的创始人 Austen Allred 的故事。Lambda School 是一家教育初创公司,承诺在几个月内教会学生编程。

文章描述了 Austen Allred 的个人经历,从摩门教传教士到大学辍学生,再到硅谷最热门初创公司的创始人。Lambda School 通过“收入份额协议”吸引了投资者,该协议允许学生在未来收入中支付学费的一部分。然而,随着时间推移,Lambda School 的问题逐渐暴露,包括招聘数据的夸大、学生就业率的下降以及与投资者的不当交易。

最终,Lambda School 陷入困境,面临着法律问题和财务挑战。文章还探讨了 Austen Allred 的行为,包括对学生的欺骗和对批评者的攻击。最终,Austen Allred 和 Lambda School 被美国消费者金融保护局处以罚款,并被禁止从事学生贷款业务。Lambda School 的命运不明,Austen Allred 则试图通过新的风险投资基金来重振自己的事业。


HN 评论 219 comments | 作者:plinkplonk | 8 hours ago #

https://news.ycombinator.com/item?id=40729501

  • 某评论指出 Hacker News 会为“受保护的人”更改账户名称,但 HN 对所有用户都采取相同的处理方式;
  • 另一评论提到,Lambda School 类似于 Make School,但难以吸引足够有天赋、有毅力完成课程并找到工作的学生;
  • 有人怀疑编程教育的模式,认为不是每个人都能成为优秀的软件工程师,需要具备坚韧不拔的问题解决能力;
  • 评论指出,软件工程师需要处理各种挑战,需要习惯处于压力下,这个领域的工作有时会让人感到沮丧;
  • 有人认为,编程类似挖掘一个洞,每次挖掘都可能遇到困难,需要坚韧不拔,这种工作有时会让人感到痛苦;
  • 评论提到,有些人在尝试数学或编程时感到的不仅是挫折,而是一种近乎身体上的痛苦,这可能与智力无关。

Neofetch developer archives all his repositories: “Have taken up farming” #

https://github.com/dylanaraps

dylanaraps 是一个程序员,同时也是 @kisslinux 的创始人。他在 GitHub 上有 71 个仓库,其中包括一些备受关注的项目,比如 neofetch(一个用 bash 编写的命令行系统信息工具)、pure-bash-bible(纯 bash 编写的替代外部进程的集合)、pywal(用于动态生成和更改配色方案的工具)等。除此之外,他还有一些其他有趣的项目,如 fff(用 bash 编写的简单文件管理器)、pfetch(用 POSIX sh 编写的漂亮系统信息工具)等。

他最新的 Github 简介显示,他已经开始务农。


HN 评论 280 comments | 作者:Y444 | 13 hours ago #

https://news.ycombinator.com/item?id=40726974

  • 农业是艰苦的工作,现代农民拥有大量设备和经验,建议有兴趣的人先在农场工作一年;
  • 有人认为可以通过在低规模种植蔬菜来逃离长期从事的职业,享受简单的生活;
  • 有人选择搬到农场,但也从农场经营中获得收入,保持平衡;
  • 有人认为随着年龄增长,会更喜欢安静的生活,远离城市喧嚣;
  • 有人喜欢城市生活,认为农村生活不吸引人;
  • 有人认为只有在大城市和农村生活过的人才能发表意见;
  • 有人选择在城市生活,但认为欧洲城市更适合步行和骑自行车;
  • 有人尝试过农场生活,但最终选择回到城市生活;
  • 有人认为在城市生活更自由,但也有人向往农场生活;
  • 有人认为随着年龄增长,对安静的生活更感兴趣;
  • 有人选择在农场工作,但也有人认为城市生活更适合自己;
  • 有人认为城市和农村生活各有利弊,取决于个人偏好;
  • 有人认为在大城市生活需要不断竞争,而在农村更宁静;
  • 有人选择在农场工作,但也有人认为城市生活更适合自己;
  • 有人认为农业生产规模不同,不一定需要大规模设备和学历;
  • 有人选择小规模农场种植,以满足个人需求为主;
  • 有人认为农业生产可以是小规模的,不一定需要大规模设备和学历;

Nature retracts paper that claimed adult stem cell could become any type of cell #

https://retractionwatch.com/2024/06/18/nature-retracts-highly-cited-2002-paper-that-claimed-adult-stem-cells-could-become-any-type-of-cell/

《自然》撤回了一篇 2002 年的论文,该论文来自 Catherine Verfaillie 实验室,声称一种成体干细胞在特定情况下可以“对大多数,如果不是全部,体细胞类型做出贡献”。这篇被撤回的文章名为“来源于成人骨髓的间充质干细胞的多能性”,自发表以来一直备受争议,但根据 Clarivate 的 Web of Science 数据,它已被引用近 4500 次,成为迄今为止被引用次数最多的被撤回论文。

2007 年,《新科学家》报道了关于《自然》论文和 Verfaille 在《血液》杂志上的另一篇文章数据的质疑。《自然》杂志在那一年发表了更正声明。作者在通知中写道,他们更正的错误“不会改变文章的结论”。

明尼苏达大学双城分校在明尼阿波利斯,Verfaillie 在该校工作时发表了这篇《自然》论文,2008 年发现《血液》论文中包含伪造的图像,但 Verfaillie 并非负责这些操纵。《血液》在作者的要求下于 2009 年撤回了这篇文章。

Verfaillie 后来转到了库鲁文大学,现在是名誉教授。她尚未回应我们的置评请求。

库鲁文大学在 2019-2020 年对 Verfaillie 的工作进行了调查,此前 Elisabeth Bik 在 PubPeer 上发布了关于她论文中数据的质疑,包括 2002 年在《自然》上的那篇。该大学发现在调查的出版物中“没有研究诚信的违规行为”。

Bik 在推特上发表了关于撤回的推文。通知提到了 Bik 在 PubPeer 上写的两个图像重复。因为作者无法检索到原始图像,通知中指出:编辑不再相信多能成体祖细胞(MAPCs)在骨髓中植入的结论得到支持。

鉴于上述担忧,编辑不再对本文报道的数据的可靠性表示信任。根据通知,大多数作者,包括 Verfaillie 在内,都同意撤回。据我们统计,她现在已经有四次撤回。

如果您喜欢《撤稿观察》?您可以进行捐款以支持我们的工作,订阅我们的免费每日摘要或付费每周更新,关注我们的推特,点赞我们的 Facebook 页面,或将我们添加到您的 RSS 阅读器中。如果您发现一篇撤稿不在《撤稿观察数据库》中,您可以在此处告诉我们。如有评论或反馈,请通过电子邮件联系我们:team@retractionwatch.com。


HN 评论 173 comments | 作者:susam | 1 day ago #

https://news.ycombinator.com/item?id=40720629

  • NIH 应拨出 25% 预算用于审查其资助研究成果,以减少夸大和 p-hacking,提高文献质量。
  • 应奖励质量胜过数量,避免以发表数量为要求。
  • 重复实验是任何经验科学的核心问题,证实结果或假设是科学构想的基础。
  • 研究论文应提供足够信息以便复制/验证,NIH 可要求资助条件包括详细的可复制性要求。
  • 社会科学领域 98% 的论文可能无法复制,应考虑复制研究的重要性。
  • 研究应以独立复制为基础,无法从论文复制的论文未达到其主要目的。
  • 论文撤回应该受到重视,应增加对成功撤回有影响的人的声誉。
  • 对于无法复制的研究,应考虑建立奖励机制,或者改善出版质量,如支付良好的同行评审费用。
  • 如果无法复制,原始研究论文不披露所有信息,应该被拒绝发表。
  • 方法部分应提供足够信息以确保准确复制,否则论文不应通过审查。
  • 研究机构应考虑实施审计制度,以威慑研究人员违规行为。
  • 研究论文应提供详细信息,以便同行能够重复结果,确保科学质量。

EU Council to Vote on Chat Scanning Proposal on Thursday #

https://www.patrick-breyer.de/en/posts/chat-control/

这篇文章是关于欧盟提出的 CSEM 扫描器提案,旨在要求提供商自动搜索所有私人聊天、消息和电子邮件中的可疑内容,以打击儿童性虐待材料(CSEM)。提案引发了对数字通信隐私的担忧,可能导致全面自动化的实时监视,结束数字通信隐私。

提案还包括无效的网络阻塞、筛选个人云存储内容、强制年龄验证导致匿名通信的结束、应用商店审查以及排除未成年人参与数字世界。文章详细介绍了提案的内容、欧洲议会提出的修改、欧盟各国政府的立场以及相关的时间表和文件。此外,还提到了欧洲议会、欧盟理事会和欧盟委员会之间的协商过程,以及民间社会对提案的批评和进一步阅读材料。

文章还探讨了提案对个人隐私、通信内容、年龄验证和未成年人使用互联网的影响,以及可能的替代方案和相关文件池。


HN 评论 284 comments | 作者:tdsone3 | 16 hours ago #

https://news.ycombinator.com/item?id=40725983

  • “EU Council 将在周四投票,委员会支持扫描,议会反对”
  • “EU 被用作国家政策的替罪羊,代表被选举的政府支持反民主政策”
  • “代表民主的特征是多数意愿可能被忽略,代表民主不等同于直接民主”
  • “聊天控制问题与民主无关,不影响人们决定政府”
  • “聊天控制是先前约束言论,自动内容过滤是审查,可能被滥用”
  • “聊天控制问题是否民主取决于广泛支持,不同意见”
  • “欧盟法案影响国家,不需要成为国家”
  • “欧盟法规对国家有影响,不需要成为国家”

Fern Hollow Bridge should have been closed years before it collapsed #

https://practical.engineering/blog/2024/6/18/this-bridge-should-have-been-closed-years-before-it-collapsed

这篇文章讲述了匹兹堡的 Fern Hollow 桥在 2022 年 1 月 28 日黎明前突然坍塌的事件。这座桥自 2005 年以来已经被检查了 14 次,每次都有关于桥梁状况恶化的报告。文章详细描述了桥梁的设计和材料,以及在多年来由于排水问题导致的腐蚀情况。

检查报告指出,桥梁的支撑结构明显可见,但相关部门未能及时采取措施修复。文章还提到了一些工程上的失误,如对桥梁承载能力的错误评估,以及未能识别关键部件的问题。最终,NTSB 的调查发现,桥梁的坍塌是由于一个小的结构元件的腐蚀引发的。

文章强调了对桥梁安全的重要性,以及在维护和修复基础设施方面的挑战。最后,文章提到了对于未来如何避免类似事件再次发生的建议和改进措施。


HN 评论 157 comments | 作者:freetime2 | 18 hours ago #

https://news.ycombinator.com/item?id=40725214

  • 有关桥梁结构的安全问题,评论指出应该有更有效的方法来标记潜在崩塌的桥梁,而不是简单地将其归类为“结构不良”;
  • 讨论了桥梁检查和维护的重要性,以及如何在维修和替换桥梁方面的支出与其他政府开支之间进行权衡;
  • 评论提到了桥梁维护的重要性,指出应该优先考虑修复危险的桥梁,而不是将资金用于其他项目;
  • 讨论了桥梁维护与政府预算分配之间的关系,以及如何在维护和新建之间取得平衡;
  • 提到了桥梁维护对公共安全的重要性,以及政府在维护基础设施方面的责任。

Open Source Python ETL #

https://amphi.ai/

Amphi 是一个基于 Python 的微型 ETL 工具,旨在从各种来源和格式中提取、准备和清洁数据。它擅长于从文件到数据库的数据集成,数据提取和准备用于数据科学和基于 LLM 系统,以及 API 检索和丰富化。您可以使用 Amphi 设计数据管道,并生成可以在任何地方部署的本机 Python 代码。

Amphi 旨在简化数据整理过程,支持高效的文件集成、数据提取和准备,处理诸如 CSV、JSON 等格式。此外,Amphi 还提供结构化和非结构化文件摄入(如 CSV、PDF、HTML)、数据提取、清洗和准备、API 检索和丰富化等功能。

通过低代码工具,Amphi 可以加速数据和 ETL 管道的开发,大大减少与传统编码相比的开发和维护时间。作为混合式平台,Amphi 生成的 Python 代码可以在各种环境中本地部署,从本地到云端都能灵活应用,无需担心锁定。Amphi 注重灵活性和开放性,管道定义存储为文件,方便共享,促进协作和社区参与。

所有数据都存储和处理在本地,不会传输到 Amphi 的服务器,确保完全的隐私和控制。Amphi 还是一个 AI 本地化工具,旨在整合生成式 AI 功能,解决面向 AI 的用例,如 RAG。Amphi 致力于建立一个全球数据从业者社区,欢迎初学者和专家加入。

您可以通过邮件联系 hello@amphi.ai,也可以在 LinkedIn 上关注他们。


HN 评论 114 comments | 作者:justjico | 24 hours ago #

https://news.ycombinator.com/item?id=40723356

  • 一些评论认为 AI-washing 和虚假宣传不会让 Amphi 与传统 ETL 工具有所不同。
  • 有人认为 Amphi 利用 JupyterLab 作为服务器很好,因为数据工程师/科学家已经在使用 Jupyter,这是个好主意。
  • Amphi 基于 JupyterLab 还能受益于现有的扩展生态系统,如 Git 扩展或使用不同文件系统(S3)。
  • 有人提出是否可能生成 Airflow 代码,Amphi 生成 Python 代码,可以通过 Airflow 进行编排,但不会生成“Airflow 代码”。
  • 有人认为让非 CS 背景的人处理数据工作可能不是好事,应该鼓励学习而不是简化工具。
  • 评论指出,数据工程领域已经有很多非技术人员,导致整体结果一般,建议提高技能而不是依赖工具。
  • 有人认为 ETL 工具应该在数据着陆之前完成,而不是在 SQL 中进行转换,以避免数据流程中的问题。

1/25-scale Cray C90 wristwatch #

http://www.chrisfenton.com/1-25-scale-cray-c90-wristwatch/

这篇文章介绍了一个名为 1/25-Scale Cray C90 Wristwatch 的项目。作者在与同事合作复兴 Cray 超级计算机的过程中,开发了这个有趣的项目。他通过在 FPGA 上实现了一个 Cray Y-MP/C90/J90 核心,并将其制作成手表。文章详细介绍了项目的背景、硬件架构和软件实现。

作者使用了 Diligent CMOD-A7 FPGA 板和 Teensy 3.6 微控制器,以及圆形 OLED 显示屏。手表上运行着一个模拟木星和 63 颗卫星的 N 体引力模拟程序,展示了 J90 核心的向量处理能力。作者描述了项目的设计过程,展示了最终成品,强调了这个项目的可编程性和复杂性。

最终的手表可以佩戴在手腕上,但更适合作为桌面装饰品。


HN 评论 34 comments | 作者:akkartik | 7 hours ago #

https://news.ycombinator.com/item?id=40729906

  • 父亲与 Seymour Cray 共事,描述 Cray 如摇滚明星,在早期计算机革命中占据重要地位。
  • 观点认为这款手表可成为科幻电影道具,展示时间旅行的故事。
  • 想象外星文明挖掘这款手表,猜测其显示木星卫星将成为谜团。
  • 评论认为这项目荒谬但令人喜爱。
  • 项目使用 FPGA、圆形 LCD、模拟木星卫星等元素,引发好奇。
  • 评论称这项目毫无意义却值得赞扬。
  • 作者表示大部分项目源自对现状不满,认为超级计算机手表的实现是必然的。
  • 评论问手表是否运行 vim,引发讨论。
  • 评论关注手表的电池寿命问题,作者回应称不太理想。
  • 评论称手表的时间系统比星际迷航的星日期还难懂,引发讨论。
  • 评论认为对于天文爱好者来说,这是一种完全直观的时钟。

3D Gaussian Splatting as Markov Chain Monte Carlo #

https://ubc-vision.github.io/3dgs-mcmc/

这个网页是关于“3D 高斯喷洒作为马尔可夫链蒙特卡洛”的内容。该研究提出了一种新的方法,将 3D 高斯喷洒视为从描述场景物理表示的潜在概率分布中随机抽取的样本,即马尔可夫链蒙特卡洛(MCMC)样本。通过这种视角,研究表明 3D 高斯更新可以通过引入噪声简单地转换为随机梯度朗之万动力学(SGLD)更新。

作者将 3D 高斯喷洒中的稠密化和修剪策略重新定义为 MCMC 样本的确定性状态转换,从而消除了这些启发式方法。为了鼓励高效使用高斯,他们引入了一个正则化器,促进未使用的高斯的移除。

在各种标准评估场景中,作者展示了他们的方法提供了改进的渲染质量、对高斯数量的简单控制以及对初始化的稳健性。此外,还展示了更多的实验结果。


HN 评论 55 comments | 作者:smusamashah | 1 day ago #

https://news.ycombinator.com/item?id=40719975

  • 该帖讨论了 3D 高斯喷洒技术的优化,包括使用传统 COLMAP 流程生成的点云,以及随机初始化和结构从运动中初始化的观点。
  • 高斯喷洒技术通过对输入图像进行对齐来生成点云,实现了免费获取点云的效果。
  • 数值优化中的一个秘密是优化算法擅长找到局部最小值,但对初始化非常敏感,因此良好的启发式初始化对于找到良好的最小化器至关重要。
  • 高斯喷洒技术是一种令人印象深刻的技术,目前在虚拟现实中展示逼真场景的最佳方式,但还有更多的用途等待发掘。
  • 高斯喷洒技术对数字孪生空间可能产生巨大影响,有望在自动和半自动工厂、仓库和车库等领域引发巨大变革。
  • 高斯喷洒技术可能会在数字孪生服务的广告中出现,但对于一般市场可能不会广泛传播,可能会成为一场悄然的革命。
  • 高斯喷洒技术可能会被广泛应用于 CAD、摄影、地图、视频游戏、手术、卫星图像地理校正、诊断放射学、超声波、雷达、声纳、动画、导弹制导等领域。
  • 高斯喷洒技术在 SLAM 领域有一些应用,有助于快速生成合理的高斯表示。
  • 高斯喷洒技术在视频游戏中的应用可能性较小,但在其他领域可能会得到广泛应用。
  • 该论文提出了一种新的视角来解决问题,利用统计学中的工具,而不仅仅是梯度相关的工具。

Sharing new research, models, and datasets from Meta FAIR #

https://ai.meta.com/blog/meta-fair-research-new-releases/

这篇文章介绍了 Meta FAIR 发布的新研究成果、模型和数据集。Meta FAIR 公开发布了几项新的研究成果,希望研究社区可以利用它们来创新、探索,并发现应用 AI 的新方法。这些工作基于他们的关键原则:开放性、协作、卓越和规模化。Meta FAIR 团队长期致力于通过开放研究推动人工智能领域的技术进步。他们相信与全球 AI 社区的合作比以往任何时候都更为重要。通过保持开放科学的方法并与社区分享工作,他们希望构建适用于所有人且能让世界更加紧密联系的 AI 系统。

在这篇文章中,他们分享了最近发布的六个研究成果,涵盖了创新、创意、效率和责任等核心主题。这些发布包括图像到文本和文本到音乐生成模型、多令牌预测模型以及检测 AI 生成语音的技术。通过公开分享他们的早期研究成果,他们希望激发创新,并最终帮助以负责任的方式推动 AI 的发展。他们还分享了 Meta Chameleon 模型,这是一个能够将文本和图像结合作为输入,并使用单一统一架构进行编码和解码的模型系列。

此外,他们还介绍了多令牌预测方法,以提高语言模型的能力和训练效率。还有关于文本到音乐生成的新模型 JASCO,能够接受各种条件输入,如特定和弦或节拍,以提高对生成音乐输出的控制。他们还发布了 AudioSeal,这是专门设计用于定位 AI 生成语音的水印技术,以确保这些工具的负责任使用。

此外,他们还支持发布了 PRISM 数据集,该数据集映射了来自 75 个国家的 1,500 名多样化参与者的社会人口统计和陈述偏好。他们还详细介绍了如何衡量和改善文本到图像生成系统中的地理差异。

总的来说,这篇文章详细介绍了 Meta FAIR 最新的研究成果和模型发布,展示了他们在 AI 领域的前沿工作,以及他们致力于推动 AI 技术发展并促进社区合作的承诺。


HN 评论 54 comments | 作者:TheAceOfHearts | 1 day ago #

https://news.ycombinator.com/item?id=40719921

  • 评论中提到希望包括图像生成,特别是多模态生成与参考输入相关的内容。
  • 讨论了图像标记模型可能对此有用,但也提到了类似 ControlNet 的内容。
  • 提到了多模态模型,可以给出像“[图片]这个人但穿着企鹅服做手倒立”这样的提示。
  • 讨论了多标记预测看起来很有趣且优雅,比起预测性采样更有效。
  • 提到了他们训练模型以具有上下文的某种形式表示,用于生成接下来的 n 个标记,这是迈向“更智能”模型的一步。
  • 讨论了控制网络和 LoRA 嵌入结合的可能性。
  • 提到了 Meta 似乎比大多数公司更擅长开源他们的 AI 研究。