2025 04 03 HackerNews

2025-04-03 Hacker News Top Stories #

  1. 一位艺术家使用13个圆圈设计了13种不同的动物形状,展现了创造力和艺术技巧。
  2. Tailscale团队成功将其软件移植到Plan 9操作系统上,实现了分布式系统的通信和连接。
  3. 科技行业的从业者反思了电影《天才反击》对他们的影响和启发,尤其是在创造力和技术进步方面。
  4. 开发者创建了一个工具包来提取和解码打印文档中的追踪点,保护了打印文档的隐私和安全。
  5. Myst游戏的图谱分析揭示了游戏中相互关联的结构和元素,展现了游戏设计的复杂性和深度。
  6. 世界似乎正在失去色彩,趋向于中性色调和单色设计,反映了人们审美观念和文化趋势的变化。
  7. 音乐遗产和相互影响的研究揭示了不同音乐作品之间的联系和演变,展现了音乐创作的复杂性和多样性。
  8. 网络工程师Dave Täht去世,留下了他在缓冲区拥塞和互联网质量方面的贡献和遗产。
  9. 空气污染的来源和对人类健康的影响被讨论和分析,强调了环境保护和公共卫生的重要性。
  10. 最新开源OCR模型Qwen-2.5-32B的性能评估显示其在OCR任务中取得了优异的成绩,超越了其他模型和传统OCR提供商。

Animals Made from 13 Circles (2016) #

https://www.dorithegiant.com/2016/05/13-animals-made-from-13-circles.html

这个网页是一篇博客文章,作者是 Dori the Giant,发布于 2016 年 5 月 28 日。文章的标题是“13 Animals Made From 13 Circles”,作者受 Twitter 的 Logo 启发,使用 13 个完美的圆圈设计了 13 种不同的动物。作者表示,这个设计挑战是为了展示简单而美丽的作品,并将其添加到自己的作品集中。

文章中,作者展示了 13 种动物的设计,每种动物都是由 13 个圆圈组成的。这些设计包括猫、兔子、鸟、鱼等各种动物。作者的设计非常创意和独特,吸引了许多读者的关注和赞赏。

在文章的评论区,读者们对作者的设计表示了极大的赞赏和兴趣。一些读者询问作者是否可以购买这些设计的印刷品,作者回复表示可以通过 Email 联系购买。其他读者则询问作者的设计过程和所使用的软件,作者表示使用了 Illustrator 和 Shape Builder 工具。

此外,作者还提到将会撰写一篇关于如何创建这些设计的教程,并将其发布在自己的社交媒体上。读者们也对作者的其他作品表示了兴趣,例如作者的蜡笔名片设计。

整体来说,这篇文章是一篇关于设计和创意的博客文章,作者通过自己的作品展示了圆圈在设计中的应用和创意潜力。文章的评论区也显示了读者们对作者作品的热情和兴趣。


HN 热度 406 points | 评论 79 comments | 作者:jihadjihad | 9 hours ago #

https://news.ycombinator.com/item?id=43557873

  • 只使用圆圈来绘制动物形状是一种有趣的挑战和艺术形式
  • 学习绘画时,通常从基本形状开始,如圆圈、正方形、圆柱体和椭圆体
  • 限制条件可以激发创造力,带来更有趣的艺术作品
  • 使用圆圈来绘制形状可以帮助创造出更完美的曲线和形状
  • Twitter 的鸟标志也是使用圆圈绘制的
  • 限制条件可以带来更好的建筑设计和艺术作品
  • 练习和学习基本形状可以提高绘画技能
  • 使用圆圈来绘制形状可以帮助创造出更完美的曲线和形状,并且可以应用于各种艺术形式中

Porting Tailscale to Plan 9 #

https://tailscale.com/blog/plan9-port

Tailscale 网站的博客文章介绍了他们如何将 Tailscale 移植到 Plan 9 操作系统上。文章开始时提到,Tailscale 的开发团队最初认为将 Tailscale 移植到 Plan 9 会很容易,但实际上却遇到了许多困难。

文章的作者提到,他们最初尝试使用 Go 语言编译 Tailscale 的二进制文件,但结果却出现了许多错误。他们发现 Go 语言的编译器对 Plan 9 的支持已经过时,导致了许多问题。作者还提到,他们曾经尝试过使用特殊的编译标志和路径来解决问题,但仍然无法成功编译。

直到 2025 年 3 月,Tailscale 的开发团队才重新开始了将 Tailscale 移植到 Plan 9 的工作。他们联系了 Russ Cox,一位前 Go 语言团队成员和 Plan 9 专家,请求他的帮助。Russ Cox 同意帮助他们,并开始解决 Plan 9 内核中与 SSE 指令相关的问题。

文章的作者提到,Plan 9 内核不支持 SSE 指令,这导致了许多问题。Russ Cox 修复了这些问题,并将修复后的内核提交到了 Plan 9 的源代码仓库中。之后,Tailscale 的开发团队才能够成功编译 Tailscale 的二进制文件。

然而,Tailscale 的开发团队仍然遇到了许多其他问题,例如内存不足和 IPC 通信问题。他们解决了这些问题,并最终成功地将 Tailscale 移植到了 Plan 9 上。文章的作者还提到,他们使用了一个特殊的开发环境,包括一个 diskless Plan 9 qemu 虚拟机和一个 9P 根文件系统,以便更快速地开发和测试 Tailscale。

最后,文章的作者提到,Tailscale 的开发团队成功地将 Tailscale 移植到了 Plan 9 上,这是一个非常有挑战性的任务。他们感谢 Russ Cox 的帮助,并希望能够继续改进 Tailscale 在 Plan 9 上的支持。


HN 热度 323 points | 评论 81 comments | 作者:adriangrigore | 9 hours ago #

https://news.ycombinator.com/item?id=43557790

  • Tailscale 的开发者表示,Tailscale 现在支持 Plan 9,并且可以让分布式系统的通信通过 Tailnet 运行。
  • Plan 9 的用户表示,Plan 9 可以通过自己的 VPN-like 功能实现通信,但这可能不如 Tailscale 方便。
  • 有人提到,Plan 9 的代码相比于现代浏览器的代码更加简单易懂,一个人就可以理解整个代码库。
  • 有人希望能够完全替代现代的 web 技术,使用 Plan 9 实现分布式计算。
  • 有人建议使用 VNC 或其他方法在 Plan 9 上运行浏览器,但也有人认为这不是必要的。
  • 有人提到,Plan 9 的 9p 协议可以让任意实现该协议的系统参与到网络中,实现统一的资源访问。
  • 有人认为,Porting Tailscale 到 Plan 9 是一个很有趣的项目,值得尝试。

RIP Val Kilmer: Real Genius .. the Film Nerd Culture Deserves (2015) #

https://reactormag.com/30-years-later-real-genius-is-still-the-geek-solidarity-film-that-nerd-culture-deserves/

本文讨论了 1985 年上映的电影《天才反击》(Real Genius),这是一部科幻喜剧电影,讲述了一个名叫米奇·泰勒(Mitch Taylor)的 15 岁天才少年被提前录取到太平洋理工学院(Pacific Tech),并与他的室友克里斯·奈特(Chris Knight)一起参与一个秘密的激光项目。这个项目实际上是为中央情报局(CIA)开发的一种用于暗杀的太空激光技术,但学生们并不知道这一点。

电影中,米奇和克里斯的关系是故事的核心。克里斯是一个自由奔放、富有创造力的天才,他已经对学校的教育失去了兴趣,而米奇则是一个年轻的、渴望学习的学生,他非常崇拜克里斯。随着故事的发展,米奇逐渐了解到克里斯的过去和他为什么变成了现在这样。克里斯曾经是一个非常认真的学生,但他在发现自己的发明被用于伤害他人之后,变得失望并改变了自己的生活方式。

电影还探讨了天才和智力带来的压力和孤独。米奇和克里斯都是非常聪明的人,但他们也面临着巨大的压力和期望。电影中有一场戏,大家在一起学习,突然有人站起来大喊,然后跑出了房间,这场景非常真实地描绘了学生在考试前紧张和压力的状态。

与其他大学电影不同,《天才反击》并没有采用传统的“书呆子对抗运动员”的套路,而是关注了天才之间的竞争和冲突。电影中,克里斯和他的同学肯特(Kent)之间的竞争是故事的重要组成部分。肯特是一个非常刻苦的学生,他希望通过自己的努力成为最好的,但克里斯的自由奔放和创造力使他感到威胁。

电影的结尾是非常感人的,克里斯和米奇终于完成了他们的激光项目,但他们也意识到自己的发明被用于伤害他人。克里斯的态度和行为激励了米奇,米奇也开始质疑自己对学习和生活的态度。电影的最后一幕是克里斯和米奇一起走向新的开始,伴随着 Tears for Fears 的音乐,这是 80 年代的一首经典歌曲。

总的来说,《天才反击》是一部非常特别的电影,它不仅仅是一部大学喜剧,更是一部探讨天才、智力、压力和孤独的电影。它以独特的方式描绘了大学生活和学生之间的关系,值得一看。


HN 热度 317 points | 评论 95 comments | 作者:MPSimmons | 14 hours ago #

https://news.ycombinator.com/item?id=43555334

  • 电影《天才反击》对很多人产生了深远的影响,尤其是在科技行业中。
  • 电影中关于权力和技术的负面影响的主题仍然具有现实意义和警示意义。
  • 有些人认为,科技从业者应该考虑自己的工作对社会的影响,而不是仅仅追求技术进步。
  • 电影中关于质疑权威和挑战现状的精神仍然值得人们学习和借鉴。
  • 有些人反思,自己在工作中是否过于关注技术问题,而忽视了更广泛的社会影响。
  • 电影《天才反击》在当时对很多人来说是一种启发和鼓励,尤其是在逆境中寻找自己的位置。
  • 有些人认为,科技行业中存在一种忽视技术负面影响的倾向,需要更多的人站出来发声。
  • 电影中关于友谊和团队合作的描绘仍然让人感到温暖和鼓舞。

DEDA – Tracking Dots Extraction, Decoding and Anonymisation Toolkit #

https://github.com/dfd-tud/deda

这个网页主要介绍了一个名为 DEDA 的工具包,用于跟踪、提取和匿名化打印文档中的追踪点。追踪点是商用彩色激光打印机中嵌入的小型系统点,用于编码有关打印机和打印输出的信息。

DEDA 工具包提供了多种功能,包括读取和解码追踪点、分析未知追踪模式、创建自己的追踪点矩阵以及匿名化扫描图像。工具包还提供了一个图形用户界面和终端应用程序,用户可以使用命令行参数来执行不同的操作。

工具包的安装过程包括安装 Python 3 和 DEDA 包,可以通过 PyPI 或从当前目录安装。工具包还需要一些可选的依赖项,例如 Wand,用于匿名化扫描图像。

工具包的使用方法包括读取追踪数据、比较打印文档、分析未知追踪模式、创建自己的追踪点矩阵以及匿名化扫描图像。工具包还提供了一些示例和文档,帮助用户了解如何使用工具包。

工具包的开发背景是为了应对打印文档中的追踪点带来的隐私问题。追踪点可以用来追踪打印文档的来源和内容,工具包的开发者希望通过提供一个匿名化工具来保护用户的隐私。

工具包的开发者还提供了一些故障排除方法,包括解决安装错误、匿名化错误和其他问题。工具包的文档还包括了一些关于工具包的使用方法和参数的详细信息。


HN 热度 280 points | 评论 95 comments | 作者:pavel_lishin | 1 day ago #

https://news.ycombinator.com/item?id=43551397

  • 有人利用黄色追踪点重建了碎纸机破碎的文件,并使用此技术赢得了 DARPA 的碎纸机挑战。
  • 黄色追踪点可以用来追踪打印机的序列号、打印日期和时间。
  • 可以通过创建自己的追踪点或使用其他打印机的校准页面来伪造打印机的追踪点。
  • 伪造追踪点可能会对调查和司法程序产生影响。
  • 有人建议使用蓝光手电筒可以更容易地看到打印页面上的追踪点。
  • 有人质疑打印机制造商在没有用户知情的情况下添加追踪点的行为是否合理。
  • 追踪点可能会被用作证据,但也可能被伪造或篡改。
  • 有人认为,了解追踪点的存在和作用可以帮助用户保护自己的隐私和安全。

The Myst Graph: A New Perspective on Myst #

https://glthr.com/myst-graph-1

《Myst 图谱:对 Myst 的新视角》

作者:Guillaume Lethuillier

这篇文章介绍了 “神秘图谱” 的概念,旨在通过图分析揭游戏《Myst》的结构及其关联。作者指出,《Myst》游戏早期版本(1993 年发布)使用 HyperCard 实现,呈现出一种互联的图形结构。通过对游戏源代码的访问,作者能够程序化地生成一个图谱,展示游戏中各个视图和位置之间的连接。

文章内容概述 #

  1. ** 引言与背景 **:

    • 文章回顾了《Myst》的历史,强调其图形化的结构。
    • 作者提到自己曾经尝试制作简单的拓扑图,并在此基础上决定生成整个游戏的图谱。
  2. ** 图谱的基本性质 **:

    • 游戏由 6 个 HyperCard 堆栈组成,共有 1,355 个卡片,图谱抽象为 1,364 个节点,连接 3,189 条边。
    • 三个虚拟节点存在于图中,它们指代实际未在游戏中发布的卡片。
  3. ** 路径与集群 **:

    • 路径是节点之间的边序列,但不一定代表游戏内的可行路径。
    • 图谱呈现出自然的集群结构,主岛在中央,各个年龄层(Ages)在外围。
  4. ** 图谱解读指南 **:

    • ** 节点 **:不同的颜色代表不同的年龄层,节点标签格式明确,包含堆栈名称、卡片 ID 和图像名称。

    • ** 特殊节点 **:

      • **Sink 节点 **:只接收连接,无出口。
      • **Source 节点 **:无入边,仅有出边,游戏中不可达。
      • ** 孤立节点 **:在图中不可达。
  5. ** 边的性质 **:

    • 图谱是有向图,大部分边是单向的或双向的,少数自环边连接自身。
    • 特殊边包括跨年龄层的边(用粗线表示)和反向边(回溯边)。
  6. ** 传递性 **:

    • 游戏中存在三种传递性,涉及中介节点的可达性。
  7. ** 局限性 **:

    • 图谱未捕捉游戏机制,专注于结构连接。
    • 渲染的集群存在重叠,可能影响图谱的清晰性。
  8. ** 后续计划 **:

    • 文章提到将发布后续文章,进一步探索通过图谱获得的新发现和见解。

总体来说,这篇文章探讨了如何利用图论工具对经典游戏《Myst》的结构进行分析,从而获得新的洞见,进而推动对游戏设计和玩家体验的理解。


HN 热度 248 points | 评论 69 comments | 作者:tobr | 1 day ago #

https://news.ycombinator.com/item?id=43549293

  • Myst 的现代化版本可能是新玩家更好的选择,拥有现代化的图形和可探索的世界。
  • 原版 realMyst 是一个更好的选择,尽管它可能存在一些技术问题,但它提供了更原汁原味的 Myst 体验。
  • Real Myst: Masterpiece Edition 不是很好,导入的旧资产和随机的纹理/资产交换使得灯光和氛围没有得到很好的保留。
  • 使用旧资产和锁定玩家的位置可能是 Riven 重制版中更好的选择,而不是使用 CGI 人物。
  • Riven 重制版中使用 CGI 人物感觉不太对劲,尽管这是一个必要的技术选择。
  • Myst: Masterpiece Edition 是一个更好的选择,拥有更好的界面和更忠实于原版的体验。
  • 重制版中简化了一些谜题,这可能会让一些玩家感到失望。
  • Myst 的原始视频素材已经被存档,可能可以用于未来重制或模组中。

Why is the world losing color? #

https://www.culture-critic.com/p/why-is-the-world-losing-color

世界正在失去色彩,这是一种叫做色彩恐惧症(Chromophobia)的现象。这种趋势在各个领域都有体现,例如汽车、消费品、图形设计和电影。现在,超过 80% 的新车都是灰色调的,红、蓝、绿等鲜艳颜色正在逐渐消失。同样,消费品的颜色也在变得更加中性,图形设计和电影也在采用更为单调的色彩。

这种色彩恐惧症的根源可以追溯到西方哲学的早期。从柏拉图到康德,哲学家们一直认为色彩是感官的干扰,会阻碍我们对真理的追求。他们认为形式和结构才是艺术的真正价值所在,而色彩只是附属品。这种观点一直影响着现代社会,我们可以看到它在建筑、设计和艺术中的体现。

现代主义建筑和设计强调简洁和功能性,色彩被认为是多余的装饰。这种趋势也影响了音乐,流媒体时代的音乐往往被削弱了动态范围和复杂性,以适应更广泛的听众。色彩恐惧症也体现在品牌设计中,很多公司选择使用中性色彩的标志,以显得更加严肃和专业。

但是,历史上也有很多例子表明色彩和形式可以合作,创造出惊人的效果。例如巴洛克艺术,它使用了丰富的色彩和复杂的结构,创造出一种既感性又理性的体验。这种艺术形式挑战了色彩恐惧症的观点,证明色彩不一定是混乱和幼稚的象征。

总之,色彩恐惧症是一种深刻的文化现象,它影响着我们对色彩和形式的理解和使用。我们需要重新评估色彩在艺术和设计中的价值,认识到色彩和形式可以合作,创造出更加丰富和多彩的世界。


HN 热度 242 points | 评论 226 comments | 作者:trevin | 9 hours ago #

https://news.ycombinator.com/item?id=43557471

  • 世界并没有失去颜色,而是人们的审美观念发生了变化,现代人更偏爱中性色调的基础搭配上色彩的点缀。
  • 技术的进步使得颜色的选择变得更加丰富,但这并不意味着人们会滥用颜色,反而会更加注重色彩的搭配和协调。
  • 颜色的选择与社会地位和财富有关,昂贵的颜色曾经是身份的象征,但现在颜色变得廉价和普遍,失去了原有的吸引力。
  • 过多的颜色会产生视觉疲劳,中性色调的环境可以让人们的注意力集中在重要的事物上。
  • 颜色只是设计中的一个元素,需要与其他元素如形状、质地等协调搭配,才能产生最佳的视觉效果。
  • 现代设计更注重简洁和低调,色彩的使用也变得更加克制和有节制。

Shared DNA in Music #

https://pudding.cool/2025/04/music-dna/

这个网页是一个关于音乐遗产和相互影响的项目。它探讨了不同音乐作品之间的联系,展示了如何一首歌曲的元素可以被其他歌曲继承和演变。网页以一系列的例子来说明这一点,包括从古典音乐到嘻哈音乐的演变。

网页首先介绍了一个例子,展示了如何一首古典音乐作品《在山王的殿堂》可以通过一系列的采样和演变,影响到嘻哈音乐歌曲《Hit ‘Em Up》。这个例子展示了音乐元素如何被传递和演变,形成了一种音乐的家族树。

网页接着介绍了其他的例子,展示了不同音乐作品之间的联系。例如,歌曲《Walk on By》如何被重新演绎和采样,形成了一系列的新歌曲。网页还展示了如何一首歌曲的元素可以被其他歌曲继承和演变,形成了一种音乐的 DNA。

网页还讨论了音乐采样和演变的过程,展示了如何一首歌曲的元素可以被其他歌曲采样和演变。网页指出,这个过程可以形成一种音乐的家族树,展示了不同音乐作品之间的联系。

网页最后展示了一个庞大的音乐家族树,包含了 833 首歌曲,展示了如何这些歌曲之间的联系和演变。这个家族树展示了音乐元素如何被传递和演变,形成了一种音乐的遗产。

总的来说,这个网页是一个关于音乐遗产和相互影响的项目,展示了不同音乐作品之间的联系和演变。它通过一系列的例子和音乐家族树来说明音乐元素如何被传递和演变,形成了一种音乐的 DNA。


HN 热度 240 points | 评论 58 comments | 作者:ksampath02 | 1 day ago #

https://news.ycombinator.com/item?id=43551352

  • 音乐创作中借鉴和模仿是非常常见的,很多歌曲的旋律和节奏都有相似的元素。
  • 不同流派的音乐之间也存在着相似的模式和结构,例如 hip-pop 音乐中的采样和重混。
  • 音乐创作中存在着“万物相似”的问题,人们如何识别和区分不同的音乐元素和模式。
  • 采样和重混是音乐创作中的一个重要部分,很多歌曲都借鉴和模仿了其他歌曲的元素。
  • 音乐中的相似之处不仅仅体现在旋律和节奏上,还包括了和弦进程和曲调等方面。
  • 人们对音乐的认知和记忆能力使得我们能够识别和区分不同的音乐元素和模式,即使它们被以不同的方式呈现。

Dave Täht has died #

https://libreqos.io/2025/04/01/in-loving-memory-of-dave/

这篇文章是对一位名叫 Dave Täht 的人的一篇悼词。Dave Täht 是一位杰出的网络工程师,他在改善互联网质量方面做出了重大贡献,尤其是在缓冲区拥塞(bufferbloat)方面的工作。他与 Jim Gettys 合作,致力于改善全球互联网的质量,使实时通信更加顺畅。

Dave Täht 的工作对互联网产生了深远的影响。他的算法,如 FQ-CoDel,已被全球数百万设备采用,改善了网络连接的质量。他的工作使得视频通话在以前难以实现的地方成为可能,例如农村地区。这不仅使人们能够与亲人保持联系,还使得远程医疗和社区服务成为可能。

Dave Täht 的贡献不仅仅局限于技术领域。他是一位坚持原则的人,他拒绝了许多利润丰厚的合同,选择将他的代码开源,这使得他的工作能够惠及全球。他的工作对许多人的生活产生了影响,包括一位居住在农村的残疾女性,她能够通过远程医疗获得医疗服务,并与她的孙子们进行视频通话。

Dave Täht 的工作也对下一代网络工程师产生了影响。他的工作为改善互联网质量铺平了道路,尤其是在发展中国家。他的工作使得许多年轻的企业家能够创办自己的互联网服务提供商(ISP),扩大了互联网的覆盖范围。

这篇文章最后表达了对 Dave Täht 的感激和怀念。他将被人们铭记为一位改变了互联网的先驱,他的工作将继续惠及全球。


HN 热度 235 points | 评论 47 comments | 作者:mhandley | 1 day ago #

https://news.ycombinator.com/item?id=43550098

  • Dave Täht 对互联网的贡献非常大,尽管很多人不知道他的工作,但他的成果会被几乎所有互联网用户感受到
  • 他对缓冲区溢出(bufferbloat)问题的研究和解决方案对互联网的性能和速度产生了重大影响
  • Dave Täht 的工作精神和对技术的热情是值得学习和尊敬的
  • 他对 OpenWrt 和 LibreQos 的贡献使得许多人能够更好地使用和优化他们的网络设备
  • Dave Täht 的去世是互联网技术社区的损失,他的工作和精神将被人们铭记
  • 他对 Starlink 的研究和分析虽然未完成,但仍然给人们带来了很多启发和思考
  • 他的独立性和拒绝大公司的工作邀请是他个性和价值观的体现
  • Dave Täht 的工作和思想将继续影响和激励后来的网络技术人员和爱好者

Where does air pollution come from? #

https://ourworldindata.org/air-pollution-sources

本文讨论了空气污染的来源和对人类健康的影响。空气污染每年导致数百万人过早死亡,这是一个长期存在的环境和公共卫生问题。为了有效地解决这个问题,了解空气污染的来源至关重要。

文章使用了社区排放数据系统(CEDS)作为主要数据来源,该系统提供了从 18 世纪到 2022 年的全球和国家排放数据。CEDS 的数据基于燃料燃烧、技术进步、污染控制、肥料使用和农业生产等输入进行计算和建模。虽然这些数据有一定的不确定性,但它们提供了一个合理且一致的全球数据集来了解空气污染物排放趋势的变化。

空气污染对人类健康有三种主要影响途径:直接暴露、形成颗粒物和形成臭氧。直接暴露指的是某些气体的毒性可以对健康产生急性的影响。形成颗粒物是指许多污染物可以分解形成较小的颗粒,这些颗粒可以进入肺部和血液,导致呼吸和心血管问题。形成臭氧是指某些污染物可以形成臭氧气体,导致呼吸问题和加重急性条件如哮喘和慢性阻塞性肺疾病(COPD)。

文章还讨论了不同污染物的来源,包括二氧化硫(SO2)、氮氧化物(NOx)和颗粒物(PM)。二氧化硫主要来自燃烧含硫燃料,氮氧化物主要来自燃烧化石燃料和农业活动,颗粒物主要来自燃烧化石燃料、生物质燃烧和工业活动。

空气污染的来源可以分为几个类别,包括农业、建筑、能源、工业、交通和废物处理。农业是氮氧化物和颗粒物的重要来源,建筑和能源是二氧化硫和颗粒物的重要来源,工业是各种污染物的重要来源,交通是氮氧化物和颗粒物的重要来源,废物处理是颗粒物和其他污染物的重要来源。

总之,空气污染是一个复杂的问题,需要了解其来源和对人类健康的影响。通过使用 CEDS 数据和分析不同污染物的来源,可以更好地了解空气污染的趋势和变化,并采取有效的措施来减少空气污染,保护人类健康和环境。


HN 热度 226 points | 评论 132 comments | 作者:kamaraju | 20 hours ago #

https://news.ycombinator.com/item?id=43553663

  • 空气污染对公众健康的影响是隐性的和普遍的,会减少寿命和生活质量,但往往没有戏剧性的头条新闻。
  • 空气污染对贫困人口的影响更大,例如伦敦靠近码头地区的儿童哮喘发病率最高。
  • 国际监管压力可以有效减少船舶燃油中的二氧化硫排放。
  • 伦敦的空气污染主要来自汽车和公交车,而不是船舶。
  • 使用岸电可以减少船舶在港口的污染。
  • 哮喘药物并不是提高运动表现的兴奋剂,也不是掩盖其他兴奋剂的检测手段。
  • 哮喘在运动员中较为常见,可能是由于过度呼吸等因素造成的。

Show HN: Qwen-2.5-32B is now the best open source OCR model #

https://github.com/getomni-ai/benchmark/blob/main/README.md

Omni OCR Benchmark 是一个评估不同大型多模态模型(如 GPT-4O)在 OCR 和数据提取方面的性能的 benchmarking 工具。该 benchmark 的目标是发布一个综合的 OCR 准确性评估报告,涵盖传统 OCR 提供商和多模态语言模型。评估数据集和方法都是开源的,鼓励扩展该 benchmark 以涵盖更多提供商。

该 benchmark 的主要目标是评估 JSON 提取的准确性。为了实现这一目标,Omni benchmark 运行 Document ⇒ OCR ⇒ Extraction 的流程,测量模型从文档中提取 JSON 数据的准确性。评估指标包括 JSON 准确性和文本相似性。JSON 准确性使用修改后的 json-diff 来计算预测结果和真实 JSON 对象之间的差异。文本相似性使用 Levenshtein 距离来衡量提取的文本和真实文本之间的相似性。

要运行该 benchmark,需要克隆仓库,安装依赖项,准备测试数据,并配置模型。支持的模型包括闭源 LLM(如 Anthropic、OpenAI、Gemini)和开源 LLM(如 Gemma 3、Qwen 2.5、Llama 3.2)。每个模型都需要配置特定的环境变量。benchmark 还支持云 OCR 提供商,如 AWS、Azure、Google 和 Unstructured。

benchmark 的结果将保存在 results//results.json 文件中。用户可以使用 benchmark dashboard 来轻松查看每次测试运行的结果。该项目遵循 MIT 许可协议。


HN 热度 207 points | 评论 47 comments | 作者:themanmaran | 1 day ago #

https://news.ycombinator.com/item?id=43549072

  • Qwen 2.5 VL 模型在 OCR 任务中表现出色,准确率达 75%,超越了 mistral-ocr 模型。
  • Qwen 2.5 VL 模型可以输出 bounding box 坐标,方便后续处理和校验。
  • Gemma-3 模型在 OCR 任务中表现不佳,准确率仅为 42.9%。
  • 开源模型在 OCR 任务中仍然存在一定的准确率问题,需要人工校验和纠错。
  • Qwen 2.5 VL 模型的输出格式为 HTML,方便后续处理和开发。
  • Mistral-ocr 模型在某些任务中表现良好,但在其他任务中表现不佳。
  • 开源模型的成本和延迟取决于提供商和模型大小,需要考虑这些因素进行选择。
  • Llama 90b 模型的成本较高,可能是由于供应商的定价策略。