2024 07 11 HackerNews

2024-07-11 Hacker News Top Stories #

  1. Zed文本编辑器支持Linux,由创建Atom、Electron和Tree-sitter的团队开发,强调超高响应性和实时协作。
  2. AMD计划以6.65亿美元收购芬兰AI初创公司Silo AI,扩展AI服务,与Nvidia竞争。
  3. GitHub Copilot编程助手在非法复制代码的指控中大部分被驳回,仅剩两项指控。
  4. 欧洲的新一代重型运载火箭阿丽亚娜6号成功完成首次飞行,展示其太空运行能力。
  5. 视觉语言模型在一些简单视觉任务上表现糟糕,引发对模型评估准确性的质疑。
  6. 编写x86模拟器时学到的奇怪事情,如多种编码方式和指令怪癖。
  7. 紧密盘的“预间隙”历史,如何在1990年代引领隐藏曲目潮流。
  8. Deep-ML网站提供机器学习编程挑战,但评论认为其解决方案可能不如行业标准。
  9. RouteLLM框架旨在节省大型语言模型成本,通过智能路由优化查询分配。
  10. SimSig是一个铁路信号模拟器,让玩家体验信号员的工作和铁路运行挑战。

Zed on Linux Is Here #

https://zed.dev/linux

这个网站上的内容主要是关于在大多数 Linux 发行版上安装 Zed 的说明。你可以通过运行提供的 shell 脚本来安装 Zed。该网站提供了博客文章和文档链接,以及安装 Zed 的方法。如果你有兴趣在 Linux 上使用 Zed,可以访问该网站获取更多详细信息。

我们是 Zed Industries,一个充满激情的小团队,致力于构建世界上最好的文本编辑器 —— 为您和您的团队。

Zed 并不是我们的第一个编辑器。它是超过十年经验的结晶,我们曾创建过可编程文本编辑器 Atom,推出了开创性的软件平台 Electron,也构建了 Tree-sitter,一个被世界上最流行的编辑器使用的先进语法解析框架。我们的 DNA 中蕴含着构建有意义工具的基因。

现在,我们又一次怀着同样的动力和全新的愿景构建着新事物。我们相信最好的软件是经过精心制作的,注重细节。我们相信软件开发是更好的共享体验。我们相信有更好的写软件的方式 —— 这只是冒险的开始。

我们认为有更好的写代码的方式,从以下假设开始。

  • 关键任务工具应该具有超高响应性。每当您移动光标或输入字符时,您应该在下一次显示刷新时看到像素。即使是亚感知暂停也会在一天中累积起来,造成不必要的压力。
  • 实时协作可以产生更好的软件。拉取请求有其用处,但有时您只是想一起编码。这比代码审查更有趣,可以建立同事间的信任,也是向团队传递知识的最佳方式。但必须简便。
  • 如果您想要某人对代码的看法,应该像发送消息那样容易地将他们拉入您的工作副本并开始编码。
  • 对话应该发生在靠近代码的地方。如果您想在 GitHub 上讨论代码,您必须先提交和推送它,而将代码粘贴到聊天应用程序中并不方便。通过将击键视为变更的基本单位,并将聊天集成到编辑器中,我们可以轻松地就任何工作副本中的任何代码行展开对话 —— 无论它是去年提交的还是刚刚输入的十秒前。
  • 您的编辑器应该消失。如果您每天在工具中花费数小时,那么每个像素都必须发挥其作用。您正在创建的软件应始终是焦点。因此,我们不断问自己如何最大程度地减少干扰,让每个编码任务的完成变得更加高效且易于访问。愉快的编码始于一个不干扰您的编辑器。

HN 热度 407 points | 评论 362 comments | 作者:0xedb | 6 hours ago #

https://news.ycombinator.com/item?id=40928893

  • 希望编辑器增加对比例字体的 UI 支持,固定宽度字体导致 UI 元素截断或过宽;
  • 对 Zed 在 Mac 上的喜爱,但对协作功能表示疑虑,认为团队使用不同编辑器会导致功能浪费和安全风险;
  • Jetbrains 和 VS Code 也提供实时协作功能,VS Code 实现令人满意,提供配置以便快速加入实时协作;
  • 尝试 Zed 一段时间,支持本地应用想法,但最终回归 VS Code;
  • 对编辑器的速度和性能提出疑问,认为 VS Code 在大型代码库上表现良好;
  • 对编辑器的性能和速度有不同的容忍度,Neovim 的速度让人满意;
  • Sublime Text 3 仍是最喜欢的编辑器之一,对 VS Code 的速度和延迟表示赞赏;
  • 使用 ST 打开大文件效果良好;
  • 对 Sublime Text 的忠实用户,认为其是最好的软件之一;
  • 希望编辑器 UI 更简洁,认为协作功能可能会让编辑器变得复杂;
  • 对编辑器速度和性能提出疑问,认为 VS Code 的性能问题在大型文件上表现;
  • 讨论了 Vim 和 VS Code 在打开大文件时的性能差异;
  • 讨论了 VS Code 和 Sublime Text 的性能和速度比较;
  • 讨论了 Neovim 和 Sublime Text 的编辑体验;
  • 讨论了编辑器的 UI 设计对用户体验的重要性;
  • 讨论了 VS Code 的资源占用和性能问题;
  • 讨论了屏幕刷新率对用户体验的影响;
  • 讨论了编辑器的响应时间和性能;
  • 讨论了 VS Code 的资源占用和性能问题;
  • 讨论了编辑器的自动保存功能;
  • 讨论了 Neovim 的撤销设置;
  • 讨论了 Sublime Text 的速度和性能;
  • 讨论了 Helix 编辑器的配置和性能;

AMD to buy Silo AI for $665M #

https://www.ft.com/content/7b8d2057-2687-45b3-bae4-1488a75ac5b2

美国芯片制造商 AMD 将以 6.65 亿美元收购芬兰人工智能初创公司 Silo AI,这是欧洲规模最大的 AI 收购之一。此举旨在扩展 AMD 的 AI 服务,与市场领导者 Nvidia 竞争。收购预计将于今年下半年完成,需要获得监管批准。

Silo AI 拥有 300 名团队成员,将利用其软件工具构建定制的大语言模型(LLMs),这种人工智能技术支撑着诸如 OpenAI 的 ChatGPT 和谷歌的 Gemini 等聊天机器人。AMD 的 AI 技术与 Nvidia 竞争,后者在高性能芯片市场中占据主导地位。Silo 致力于开源 AI 模型,可供免费使用,任何人都可以自定义。

此次收购显示了 AMD 试图快速扩大业务规模,并推动客户与其自有的互动。软件已成为半导体公司的新战,它们试图锁定客户,产生更可预测的收入,摆脱芯片销售周期的波动。AMD 是几家参与开发 OpenAI 领导的 Cuda 竞争手 Triton 的公司之一,该平台将使 AI 开发人员更容易地在芯片供应商之间切换。


HN 热度 387 points | 评论 203 comments | 作者:helsinkiandrew | 10 hours ago #

https://news.ycombinator.com/item?id=40926648

  • CUDA 的成功部分归因于 NVIDIA 拥有内部研究团队,用 CUDA 做创新事物,有时会转化为产品(OptiX),其他时候是开发关系以展示硬件能做什么,提供文档。AMD 收购 Silo AI 可能是为了拥有内部 LLM 团队为客户创建模型,进行基准测试,改进产品。
  • Nvidia 花费大量时间和金钱开发软件,促进对其 GPU 的需求。
  • Nvidia 花费大量资金确保教授使用和教授他们的平台。
  • Matlab 的工具被认为很有用,但也有人认为 Matlab 的指导不够实用。
  • Nvidia 花费大量资金确保教授使用和教授他们的平台。

https://www.theregister.com/2024/07/08/github_copilot_dmca/

根据《The Register》的报道,开发者声称 GitHub Copilot 在非法复制他们的代码方面的指控大部分被驳回,目前工程师们的诉讼只剩下两项指控。这起集体诉讼针对 GitHub、微软和 OpenAI,于 2022 年 11 月在美国提起,原告声称 Copilot 编程助手是在 GitHub 托管的开源软件上进行训练,因此会向其他程序员建议这些公共项目的片段,而不考虑许可证,比如提供源代码的适当来源,从而侵犯原创者的知识产权。

微软拥有 GitHub,并使用 OpenAI 的生成式机器学习技术来支持 Copilot,该技术会在工程师输入注释、函数定义和其他提示时自动完成源代码。

原告对他们的版权开源代码的部分可能被 Copilot 提供(复制)给其他程序员使用而未给予应有的信用和原始许可证要求感到不满。起初共有 22 项指控,但随着被告公司要求法院驳回指控,这些指控逐渐减少。法官 Jon Tigar 在 7 月 5 日发布的一项裁决中,大部分支持了 GitHub、微软和 OpenAI 的立场。其中,三项指控被驳回,只有一项被允许继续。根据微软和 GitHub 的律师统计,目前只剩下两项指控。

最近被驳回的指控中,有一项涉及数字千年版权法(DMCA)第 1202(b)条,基本上规定未经许可不得删除关键的“版权管理”信息,例如在这种情况下,写代码的人和使用条款。在集体诉讼中,有人认为 Copilot 在提供代码片段时删除了这些信息,这在他们看来会违反第 1202(b)条。然而,法官认为 Copilot 建议的代码与开发者自己受版权保护的工作不够相似,因此第 1202(b)条不适用。事实上,去年据说 GitHub 调整了其编程助手,以生成训练代码的轻微变体,以防止其输出被指控为许可软件的完全复制。

原告无法提出新的第 1202(b) DMCA 版权主张,因为法官 Tigar 以有偏见的方式驳回了这一指控。匿名程序员一再坚称 Copilot 可以生成与他们自己编写的代码完全相同的代码,这是他们诉讼的关键支柱,因为他们的 DMCA 主张需要相同性。然而,法官 Tigar 较早前裁定,原告实际上没有展示出这种情况发生,这促使他驳回了这一主张,并给予修改的机会。修改后的诉状认为,如果用户关闭 Copilot 的反重复安全开关,非法复制代码是不可避免的,并引用了一项关于 AI 生成代码的研究,试图支持他们的立场,即 Copilot 会抄袭源代码,但法官再次并不认为微软的系统以有意义的方式剽窃他人的工作。

此外,还有两项指控:一项是侵犯开源许可证的指控,另一项是违约投诉,此前被驳回后重新提出。GitHub 在一份声明中表示:“我们坚信人工智能将改变世界构建软件的方式,提高生产力,最重要的是,让开发者更快乐。我们相信 Copilot 遵守适用法律,我们一直致力于从一开始就负责任地创新 Copilot。我们将继续投资并倡导未来的 AI 动力开发者体验。”

双方在发现过程中也发生了争执,其中包括原告指责被告故意拖延,称迄今为止提交的文件已经是公开的或早该披露。原告指出,微软迄今只提交了一份文件,这在原告看来毫无意义。微软和 GitHub 反驳说,原告要求的信息太多,指责他们未能高效和诚信地追求这些主题的相关发现。其中一个主题涉及微软 2018 年收购 GitHub。

OpenAI 表示,原告在要求电子邮件方面没有遵循适当的程序,称在收到正确的请求之前无法(或不会)提供任何电子邮件。三家公司表示,上述 DMCA 版权主张的驳回从根本上改变了案件,并认为发现的范围现在应该被缩小。原告对此提出异议,认为开源许可证违规主张涉及的文件几乎与 DMCA 问题应该提出的文件相同。

原告要求延长发现时间,尽管被告认为这并非必要,但这三家科技巨头表示他们愿意接受“合理的延期”。


HN 热度 345 points | 评论 385 comments | 作者:samspenc | 1 day ago #

https://news.ycombinator.com/item?id=40919253

  • 机器生成的代码是否侵犯版权,取决于是否达到原创作品的标准,细微变化可能不构成侵权。
  • 代码的版权保护涉及表达形式,算法则可申请专利。
  • 美国版权法保护“实质相似性”,但在法庭上对企业利益高度选择性。
  • 法律对 AI 平台的案例可能更有利,但案例细节至关重要。
  • 作者公会诉 Google 案表明大多数案件可能会偏向 AI 平台,但 Warhol 案例可能对艺术 AI 模型更有影响。
  • 版权被滥用,现代版权对大公司有利,与初衷相悖。
  • 版权持续时间应调整,不同行业应有不同规定。
  • 版权应有激励或要求发布功能性部分的规定,以促进创新。
  • 版权当前更多是为了寻租,而非促进创新和创造力。
  • 版权法的实施由富有的人掌握,以进一步丰富持有者。
  • 版权的目的是为了延长持有者的利益,而非促进创新和创造力。
  • 版权制度需要大规模改革,而非微调。
  • 版权的当前形式是为了寻租,而非促进创新和创造力。
  • 版权法是由英国 Stationer’s Company 等贵族集团发明的,目的是保护特权。
  • 版权的实施方式需要更新,以适应现代数字复制的环境。

Europe’s new heavy-lift rocket, Ariane 6, made its inaugural flight #

https://www.esa.int/Enabling_Support/Space_Transportation/Ariane/Europe_s_new_Ariane_6_rocket_powers_into_space

欧洲新一代重型运载火箭“阿丽亚娜 6 号”于 7 月 9 日当地时间 16:00 在法属圭亚那的欧洲航天发射场进行了首次飞行(英国时间 20:00,中欧时间 21:00)。阿丽亚娜 6 号是欧洲阿丽亚娜系列火箭的最新型号,取代了阿丽亚娜 5 号,具有模块化和多功能设计,可将任务从近地轨道发射到更远的深空。欧洲航天局局长约瑟夫·阿什巴赫尔表示,欧洲新一代阿丽亚娜系列火箭的首次飞行是历史性时刻,成功地恢复了欧洲对太空的访问能力。

这次首飞(VA262)是一次演示飞行,旨在展示阿丽亚娜 6 号在逃离地球引力并在太空中运行方面的能力。在飞行后一个小时,首批卫星从阿丽亚娜 6 号的上面级释放,并被放置在地球上方 600 公里的轨道上。这次首飞搭载了来自各个太空机构、公司、研究机构、大学和年轻专业人士的卫星和实验。

除了火箭本身,这次首飞还展示了欧洲航天发射场的发射台功能和地面操作。法国航天局(CNES)建造了新的定制发射区,使阿丽亚娜火箭的发射能够更快速地进行。阿里安航天集团首席执行官马丁·西昂表示,欧洲航天工业已经进入一个新时代,阿丽亚娜 6 号的成功首飞展示了团队和合作伙伴的不懈努力。

阿丽亚娜 6 号成功将卫星送入轨道,但地面控制还有更多任务等待完成。未来,阿丽亚娜 6 号将展示其上面级可以重新启动其 Vinci 引擎的能力,以确保在任务结束时通过地球大气层将自身解体,避免成为太空碎片。下一次阿丽亚娜 6 号的飞行计划在今年进行,将是其首次商业飞行。


HN 热度 309 points | 评论 340 comments | 作者:gostsamo | 15 hours ago #

https://news.ycombinator.com/item?id=40924915

  • 欧洲为 2030 年前获得独立太空访问而存在 Ariane 6,但发射成本几乎是猎鹰 9 的两倍,两者都能将 22 吨送入低地球轨道。
  • Ariane Next/SALTO 将在 6-10 年内复制猎鹰 9 效率和设计,目标是可重复使用、RP-1/LOX、与 Merlin 类似的 Prometheus 发动机。
  • Ariane 6 落后于 SpaceX 一代,但仍居第二,独立于单一个人的意愿,确保国家安全的独立发射能力。
  • 除了廉价的印度火箭外,还有一大批传统 + 私人中国公司,一些积极尝试克隆猎鹰 9 甚至星舰。
  • 欧洲有一个运行良好的火箭计划,但人们似乎忘记了地缘政治。
  • Starship 和 New Glenn 基本上和 Ariane 6 一样梦幻,但 Ariane 6 已成功飞行,New Glenn 失踪,Starship 还有很长的路要走。
  • 欧洲需要自己的发射器,Ariane 6 是一个过渡,但设计目标是“猎鹰 9 竞争对手”,它确实不是。
  • 欧洲应该与两三家私人欧洲火箭初创公司合同,如 RFA,建造可重复使用的发射器,创造价格和发展速度上的竞争。
  • 欧洲需要一个可重复使用的火箭,Ariane 6 是一个死胡同。
  • 欧洲有一个发射车辆,但没有平台,几乎所有 Ariane 6 的东西都必须被抛弃才能在现代可重复使用的设计中有所作为。
  • 欧洲需要一个本土发射选项,Ariane 6 不是,我对 ArianeSpace 能否实现持怀疑态度。

Vision language models are blind #

https://vlmsareblind.github.io/

这个网站名为“VLMs are Blind”,主要展示了关于视觉语言模型(VLMs)在简单视觉任务上的失败研究,这些任务对人类来说很容易。研究发现,VLMs 在一些对人类来说很简单的视觉任务上表现非常糟糕,比如识别两个圆是否重叠、两条线是否相交、一个单词中哪个字母被圈出以及数出奥林匹克标志中的圆圈数量等。

四种最先进的 VLMs 的表现令人震惊,表明它们的视觉能力最好时类似于近视者看到细节模糊,最差时类似于盲人做出有根据的猜测。网站提供了详细的研究内容、任务描述、图片示例、问题设置、结果表格以及定性样本,展示了 VLMs 在不同视觉任务上的表现和失败情况。


HN 热度 253 points | 评论 103 comments | 作者:taesiri | 10 hours ago #

https://news.ycombinator.com/item?id=40926734

  • 这篇论文探讨了当前视觉语言模型的局限性,尽管在许多多模态基准测试中得分很高,但这些模型在非常基本的情况下经常失败。这引发了一个关键问题:我们是否准确评估了这些模型?
  • 大多数数据只是图像的标题描述,您将不得不投入一些时间来构建这个数据集,这是您自己的费用。
  • 当前的多模型方法在嵌入和图像的标记化方面工作,这是基本问题:您正在向模型提供模糊、不精确的数据。是的,它们是盲目的,因为正是由于这个原因。
  • 这是视觉上要求 LLM 计算字母数量的等价物。失败更多与标记方案相关,而不是模型的基本质量。
  • 我试过用 CogVLM 进行线交叉和圈出字母的测试,它正确通过了。我认为作者测试的方式可能有问题。太多的“模型无法做到”声明最终证明了模型确实做到了。
  • 这篇论文的标题和论点应该与特定的工具一代相结合。这在摘要中有提到,但不具体是不好的。在这种情况下,因为当前面向公众的模型是 WIWEB:它将永远是最差的。并且有数万亿美元的奖金在等着,所以改进正在以可能的最快速度进行。
  • 我希望评论中贬低这篇论文的人能够发表一篇论文或者有相关的出版物可以指出。你知道,达成共识的方式。所以我只能用匿名在线评论者和两所著名大学的出版物来评判。我应该相信谁的话?决定,决定。您可以在这种情况下用 LM 替换 Web3,用 NFT 替换加密。

Weird things I learned while writing an x86 emulator #

https://www.timdbg.com/posts/useless-x86-trivia/

这篇文章讨论了作者在编写 x86 和 amd64 模拟器时学到的一些奇怪的事情和随机知识。作者编写的模拟器用于时间旅行调试,其中包含 CPU 模拟器,用于记录进程的整个执行过程。

文章提到 x86 编码方案有时存在多种编码相同指令的方式,例如 int 3 指令可以以 CD 03 编码,也可以用单字节的 CC 编码。此外,文章还介绍了一些有趣的编码细节,如使用前缀字节修改指令行为、段覆盖、奇怪的标志位特性等。作者还分享了关于 CPU 工作原理的见解,以及一些关于指令编码和行为的细微差异。

文章内容涵盖了 x86 架构的编码细节、指令行为、寄存器使用等方面,对于想深入了解 CPU 工作原理的读者具有一定的参考价值。


HN 热度 222 points | 评论 72 comments | 作者:fanf2 | 9 hours ago #

https://news.ycombinator.com/item?id=40927438

  • BSF/BSR 指令在零输入时目的地值未定义,AMD 文档称在这种情况下目的地不会被修改,而 glibc 利用了这个未记录的事实。
  • 编码中人们常抱怨前缀,但实际上不是最糟糕的事情,更糟糕的是一些怪癖,如 REX/VEX/EVEX.RXB 扩展位在某些情况下会被忽略。
  • APX 引入了更多怪癖,例如 REX2 前缀可以编码通用寄存器 r16-r31,但不能编码 xmm16-xmm31。
  • QEMU 的 x86 解码器重写包括 AVX 支持,计划添加 APX 支持,基于手册中的表格,代码大部分可读性良好。
  • AArch64 指令操作更清晰,但操作数和编码方面不如 x86 一致,AArch64 有各种寄存器类型和操作数类型。
  • x86 架构充满历史遗留,使用段寄存器在实模式和保护模式之间切换是为了保持旧软件兼容性。
  • x86 汇编语言编码复杂,但汇编本身并不糟糕,主要问题在于编码方案的复杂性。
  • x86 架构有许多特例,文档中未提供的信息通常需要通过逆向工程获得。
  • x64 汇编在忽略历史遗留的情况下,工作起来相当不错。

How CD pregaps gained their hidden track superpowers #

https://tedium.co/2024/07/06/compact-disc-pregap-history/

这篇文章探讨了紧密盘(Compact Disc)中的“预间隙”(pregap)历史。在 1990 年代,音乐产业通过紧密盘引领了隐藏曲目的潮流。预间隙是指专辑第一首曲目之前的空间,带来了许多创新想法,但也揭示了偏离规范的风险。

文章介绍了预间隙的起源,以及它如何成为音乐产业最奇特的隐藏地点。此外,还提到了一些有趣的细节,比如 Willie Nelson 在专辑《Moonlight Becomes You》中使用预间隙隐藏曲目的专利申请,以及音频 CD 中的其他隐藏技术。

最后,文章还讨论了 Enhanced CD 的兴起以及隐藏预间隙带来的问题,展示了音乐产业在尝试新技术时所面临的挑战。


HN 热度 205 points | 评论 119 comments | 作者:shortformblog | 1 day ago #

https://news.ycombinator.com/item?id=40920122

  • 有人提到在 CD pregaps 中放置隐藏音轨,用于 live recordings 中包含观众的噪音;
  • 有人分享个人的 CD ripping 脚本配置,将 pregaps 留在前一首曲目的末尾;
  • 讨论了希望有一种存储专辑的有效方式,以整体存储而不是单独曲目;
  • 有人提到生成带有嵌入式 cue 的 FLAC 作为原始的大师副本;
  • 讨论了如何在 MKV 中使用单个流来存储不同编解码器的音频;
  • 有人分享了在 CD 上隐藏音轨的创意方法,如在多个曲目之间放置空曲目等;
  • 有人提到了一些专辑中隐藏音轨的例子,以及如何在 CD 播放器中找到隐藏音轨;
  • 讨论了 CD pregaps 的历史和结构,以及如何在 CD 中存储隐藏音轨;
  • 有人分享了在 CD 上发现隐藏音轨的经历,以及对隐藏音轨的看法。

ML Code Exercises #

https://www.deep-ml.com/

网站 https://www.deep-ml.com/ 是一个提供机器学习编程挑战的平台。它包含了各种难度和类别的编程问题,涵盖了线性代数、机器学习和深度学习等领域。用户可以在该平台上找到不同难度的问题,如矩阵乘以向量、计算协方差矩阵、使用雅可比方法解线性方程组、奇异值分解等。

这些问题涵盖了从简单到困难的不同难度级别,涉及到线性代数、机器学习和深度学习的各个方面。用户可以在该平台上挑战这些问题,提升自己的编程技能和理解能力。


HN 热度 201 points | 评论 62 comments | 作者:mchab | 11 hours ago #

https://news.ycombinator.com/item?id=40925896

  • 大多数评论认为在标准科学计算和方法方面,专业人士不会重新发明轮子,因为他们可能提供的解决方案与行业标准软件相比较差。
  • ML 面试更多是关于大局观的白板面试,而特定编程问题的优先级较低。
  • 有人认为 ML 工作面试中不会问这些问题,这些问题看起来像 ChatGPT 或直接来自教科书。
  • 一些人认为 ML 面试问题应该更注重 ML 系统设计、ML 知识问题、概率统计知识和 ML 问题解决。
  • 一些评论指出 Leetcode 类型的问题可能需要专门练习,而大多数问题可以在入门课程中涵盖。

RouteLLM: A framework for serving and evaluating LLM routers #

https://github.com/lm-sys/RouteLLM

这个 GitHub 地址( https://github.com/lm-sys/RouteLLM)包含了一个名为 RouteLLM 的框架,用于提供和评估 LLM 路由器,旨在在不影响质量的情况下节省 LLM 成本。该框架是由 LMSys 和 Anyscale 合作开发的。核心功能包括:

  1. 可以替代 OpenAI 的客户端(或启动与 OpenAI 兼容的服务器),将简单查询路由到更便宜的模型,从而降低成本。
  2. 提供了经过训练的路由器,已经证明在广泛使用的基准测试中(如 MT Bench)将成本降低了高达 85%,同时保持 95% 的 GPT-4 性能。
  3. 可轻松扩展框架以包括新的路由器,并比较不同路由器在多个基准测试中的性能。

安装方法:

  • 从 PyPI 安装:pip install "routellm[serve,eval]"
  • 从源代码安装:git clone https://github.com/lm-sys/RouteLLM.git,然后 cd RouteLLM,最后 pip install -e .[serve,eval]

快速开始:

  • 可以通过初始化 RouteLLM 控制器来替换现有的 OpenAI 客户端,以在 LLMs 之间路由查询。可以根据需要在不同模型之间进行路由,从而节省成本同时保持高质量的响应。

此外,该项目还包括服务器和演示功能,可以启动一个与 OpenAI 兼容的服务器,以及评估框架来衡量不同路由策略在基准测试中的性能。项目提供了详细的配置、贡献和引用信息。


HN 热度 200 points | 评论 32 comments | 作者:djhu9 | 23 hours ago #

https://news.ycombinator.com/item?id=40922739

  • RouteLLM 框架有望提供成本优化,解决多个 LLM 实际挑战,如速率限制、每个令牌成本、选择合适模型等问题。
  • 工具如 KNN-router 允许定义路由查询逻辑,考虑模型准确性、响应时间和成本,帮助构建强大、经济高效的 LLM 管道。
  • 公司关注内容过滤敏感性,重要性在于能够在不同模型间切换。
  • LLM 路由器可记录查询状态,自动切换到另一模型,避免中断工作流程。
  • 路由工具可用于故障转移至另一模型,适用于限制访问 LLM 的情况。
  • 路由工具可优化成本/质量,但有人认为应考虑速度、任务特异性等多方面。
  • 一些工具允许动态切换模型,基于多个约束条件如延迟、复杂性、成本等。
  • 有人认为大多数情况下不需要像 4o 这样强大的 LLM,系统可自动选择适当模型,节约成本。
  • 针对非关键问题的解决方案,存在过早优化现象,应审慎选择。

SimSig: Railway Signalling Simulations #

https://www.simsig.co.uk/

SimSig(Simulator of Railway Signalling Systems)是一个铁路信号模拟器,让您可以在家中的 PC 上体验信号室的工作,感受运行当今(以及一些昨天的)铁路时的乐趣和挑战。SimSig 让您扮演信号员的角色,操作基于英国广泛使用的 IECC 和 Westcad 图形的信号屏幕,控制信号和道岔,确保火车准时到达目的地。SimSig 涵盖了英国的大部分地区、美国的一些模拟以及澳大利亚的几个地区,每个地区都有各自的挑战和技能水平,从简单到复杂不等。

SimSig 模拟了英国 IECCs(综合电子控制中心)的运作,模拟了所有信号设备(轨道电路、道岔、信号等),强调质量和真实性,而非数量。SimSig 被世界各地的信号员、司机和其他专业人士使用。您可以在 Windows 8.1 和 10 上运行 SimSig,也可以在 Linux 的 Wine 和 Mac 的 Crossover 等模拟器上运行。SimSig 提供多个免费模拟器,价格从不到 £10 到更高不等,每个模拟器都有评估期,让您可以在购买前进行试用。

SimSig 支持多人游戏,许多模拟器适合多人游玩,多人游戏可以通过互联网或家庭局域网进行。许多模拟器还支持“链式”连接,即将相邻区域连接在一起形成更大的区域。任何人都可以使用内置的时刻表编辑器编写时刻表,我们也不收取额外费用。SimSig 为用户提供了丰富的时刻表下载区。用户无法自行制作模拟器,但可以贡献时刻表。

SimSig 让您体验铁路信号/调度控制中心的操作,让您可以操作和引导火车到达目的地。您可以通过 SimSig 的模拟器来感受这一过程,体验信号员的工作。


HN 热度 176 points | 评论 75 comments | 作者:untilted | 14 hours ago #

https://news.ycombinator.com/item?id=40925025

  • NXSYS 模拟了 General Railway Signal 的 NX 系统,是 1930 年代的重大突破。
  • Rail Route 是一个轻量级的信号屏幕模拟游戏。
  • Factorio 是一个包含游戏机制的铁路模拟器。
  • OpenTTD 是一个铁路游戏的分支。
  • JGR’s patchpack 是 OpenTTD 的一个分支,具有可编程信号等功能。
  • Sweet Transit 是一个基于 Factorio 火车系统的游戏。
  • Factorio 的开发者制作了一个基于 Factorio 火车系统的火车游戏。
  • NIMBY Rails 是一个建设功能性铁路系统的游戏。
  • SimSig 的首页段落幽默地描述了火车延误的原因和解决方法。
  • 铁路信号是一个可以通过研究大幅提高铁路网络吞吐量的领域。
  • 通信列车控制系统 (CBTC) 可以减少列车之间的间隔。
  • 在铁路系统中,安全距离和列车操作员数量等因素限制了列车之间的间隔。