2024 07 13 HackerNews

2024-07-13 Hacker News Top Stories #

  1. WebVM提供了一个基于WebAssembly的无服务器虚拟Linux环境,能在浏览器中安全运行x86二进制文件,用户可通过Dockerfile创建自定义镜像。
  2. AT&T确认大规模数据泄露,几乎全部客户电话记录被盗,影响约1.1亿用户,正与执法部门合作处理此事。
  3. 《基于物理的深度学习》一书介绍如何结合物理模拟与深度学习,通过示例展示流体流动预测及不确定性估计等应用。
  4. 一篇文章展示了如何利用Amazon S3作为容器注册表,提供更快的上传速度,尤其适用于自定义容器镜像构建。
  5. FlashAttention-3通过异步性和低精度计算优化注意力机制,大幅提高Transformer模型性能,尤其在Hopper GPU上表现突出。
  6. Tau是一个开源的自托管PaaS平台,旨在简化配置、提高可扩展性,为开发者提供类似Vercel/Netlify/Cloudflare的服务。
  7. 项目“Windows NT for Power Macintosh”致力于将PowerPC版Windows NT移植到Power Macintosh,目前支持多种旧款Mac系统。
  8. 一篇分析指出科技行业裁员揭示了员工在高管眼中可替代性的问题,即使公司盈利,裁员仍可能发生。
  9. MIT和哈佛团队开发的CHARMs分子工具通过表观遗传编辑技术沉默致病基因,为治疗朊病毒疾病等遗传病展现潜力。
  10. Karpathy的项目llm.c展示了在单个8XH100节点上低成本复现GPT-2(1.6B参数版)的过程,推动AI模型复现的简化。

WebVM is a server-less virtual Linux environment running client-side #

https://webvm.io/

网站 https://webvm.io 是一个提供 Linux 虚拟化在 WebAssembly 中的服务的网站。它是一个无服务器的虚拟 Linux 环境,完全在客户端运行,使用 HTML5/WebAssembly 技术。

WebVM 使用 CheerpX 虚拟化引擎,可以在任何浏览器上安全地执行 x86 二进制文件。CheerpX 包括 x86 到 WebAssembly 的 JIT 编译器、虚拟基于块的文件系统和 Linux 系统调用模拟器。此外,您可以通过 Dockerfile 创建自己的 WebVM,具有自定义镜像。

欢迎访问 WebVM,您可以尝试一些示例,比如运行 Python3 脚本、编译并运行 C 语言程序、查看程序反汇编等。


HN 热度 585 points | 评论 122 comments | 作者:sebg | 1 day ago #

https://news.ycombinator.com/item?id=40940225

  • 这是一个用户态二进制文件的兼容性层,不涉及完整系统仿真。
  • 系统调用模拟可能不完整,无法通过 Linux 测试套件。
  • WebVM 是基于 CheerpX 构建的,不开源,用户可以部署自己的版本。
  • IRC 对新用户有很高的准入门槛,Discord 更易用,但 Matrix 仍有 UI 问题。
  • IRC 没有聊天记录,Discord 搜索历史更方便。
  • WebVM 用于教育、文档、历史软件保护、虚拟化等多种用途。
  • 文件系统使用本地 IndexedDB 缓存,具有一定的持久性。
  • WebVM 支持 Dockerfile 转换为可启动镜像。
  • WebVM 运行速度较慢,对于 Web IDE 的本地开发环境可能不够快。
  • WebVM 通过 HTTP 逐块传输磁盘映像,不使用冻结内存镜像。
  • 移动端浏览器上无法使用 WebVM,键盘输入存在问题。
  • 浏览器不支持时应显示特定错误信息。

AT&T says criminals stole phone records of ‘nearly all’ customers in data breach #

https://techcrunch.com/2024/07/12/att-phone-records-stolen-data-breach/

根据 TechCrunch 的报道,美国电话巨头 AT&T 证实,他们将开始通知数百万消费者,因一起新的数据泄露事件,导致网络犯罪分子窃取了“几乎所有”客户的电话记录。这起数据泄露事件涉及到 AT&T 的移动和固定电话客户的电话号码,以及在 2022 年 5 月 1 日至 2022 年 10 月 31 日期间的通话和短信记录,包括谁通过电话或短信联系了谁。部分被窃取的数据还包括了 2023 年 1 月 2 日以后的记录,针对数量较少但未指定的客户。

被窃取的数据还包括了使用 AT&T 网络的其他手机服务提供商的客户的通话记录。AT&T 表示,被窃取的数据“不包含通话或短信内容”,但包括了在六个月期间内与 AT&T 电话号码互动的通话和短信记录,以及客户的通话和短信总数、通话持续时间等元数据信息。被窃取的数据不包括通话或短信的时间或日期。

AT&T 表示,他们将通知大约 1.1 亿 AT&T 客户有关此数据泄露事件,并已在周五市场开盘前向监管机构提交了一份文件。AT&T 表示,他们于 4 月 19 日得知了这起数据泄露事件,与他们今年 3 月早些时候的安全事件无关。AT&T 的发言人告诉 TechCrunch,最近一次客户记录的泄露是从云数据巨头 Snowflake 那里窃取的,Snowflake 是最近一系列针对其客户的数据窃取事件的受害者之一。

Snowflake 指责数据泄露事件是由于其客户未使用多重身份验证来保护其 Snowflake 账户,这是一个安全功能,但云数据巨头并未强制要求客户使用。AT&T 表示,他们正在与执法部门合作逮捕涉及此次泄露的网络犯罪分子,并表示“至少有一人被逮捕”。FBI 证实,AT&T、FBI 和司法部同意推迟两次通知公众和客户,理由是“可能存在对国家安全和/或公共安全的潜在风险”。

这是 AT&T 今年披露的第二起安全事件。在此之前,AT&T 不得不重置数百万客户的账户密码,因为一批客户账户信息,包括用于访问 AT&T 客户账户的加密密码,被发布在一个网络犯罪论坛上。安全研究人员称,这些加密密码很容易被解密,促使 AT&T 采取预防措施保护客户账户。


HN 热度 472 points | 评论 465 comments | 作者:impish9208 | 12 hours ago #

https://news.ycombinator.com/item?id=40944505

  • 在欧洲,许多国家都认为保存电话记录超出运营所需的范围是非法的,与欧洲人权和基本自由保护公约不兼容,除了对国家安全构成积极威胁和法院监督的临时措施外,没有理由让任何服务提供商保存这些记录。
  • 没有理由让任何服务提供商保存这些记录,只需通过立法使其保存变得非法。
  • NSA 从数据经纪人那里购买所有可用数据,与电信公司合作,可以通过 NSL 命令他们,这是绕过宪法的一种方式。
  • NSA 不应该需要电信公司保留这些记录,只需将其交给 NSA 保留即可。
  • 数据泄露导致的时间浪费问题,应该有更严厉的数据泄露相关法律,公司只会尽最低限度保护数据安全,需要对那些使此问题可能的疏忽者进行刑事起诉。
  • 应该让软件工程师签署任何数据保存或更改的变更,如果发生数据泄露,应进行调查,如果发现软件工程师疏忽,他们将失去执照。
  • 个人数据无法被安全保护,唯一的方法是不存储它。
  • 需要对那些不重视安全并且丢失客户数据的公司进行惩罚,对出售客户数据的公司进行识别。
  • 如果技术无法保护,就不应该使用该技术。
  • 数据泄露对公司的影响可能被低估,应该对数据泄露进行更严厉的处罚。
  • 数据泄露事件对公司的股价影响可能与数据泄露之前的公司运营状况有关。
  • 数据泄露事件对公司的股价影响可能与数据泄露之前的公司运营状况有关,需要更多的研究来确定因果关系。
  • 没有足够的愤怒,消费者对数据泄露已经麻木,缺乏消费者的愤怒,公司没有动力采取更多措施阻止数据泄露。
  • 数据隐私似乎已经不存在,管理员为大型客户数据库设置密码似乎没有意义。
  • 金融产品应该有一种“黑洞”功能,资金可以进入,但不能在没有重大痛苦的情况下流出。
  • 金融产品应该有一种“黑洞”功能,资金可以进入,但不能在没有重大痛苦的情况下流出,需要引入更多的摩擦以防止欺诈。
  • 金融产品应该有一种“黑洞”功能,资金可以进入,但不能在没有重大痛苦的情况下流出,需要引入更多的摩擦以防止欺诈。
  • 消费者对数据泄露已经麻木,这些事件现在几乎没有引起愤怒。
  • 数据隐私似乎已经不存在,管理员为大型客户数据库设置密码似乎没有意义。
  • 我认为我的社会安全号码和地址已经以几分之一的价格出售,但如果资金被盗,那就是一场麻烦。

Physics-Based Deep Learning Book #

https://physicsbaseddeeplearning.org/intro.html

这个网站是关于《基于物理的深度学习》书籍的介绍页面。该书提供了关于在物理模拟背景下深度学习的实用和全面介绍。除了标准的监督学习外,还涵盖了物理损失约束、与可微分模拟更紧密耦合的学习算法、针对物理问题定制的训练算法,以及强化学习和不确定性建模等内容。

书中展示了如何训练网络以推断围绕形状(如翼型)的流体流动,并估计预测的不确定性,以取代传统的数值模拟。还介绍了如何使用模型方程作为残差来训练代表解决方案的网络,以及如何通过使用可微分模拟改进这些残差约束。此外,还探讨了如何更紧密地与完整模拟器互动以解决反问题,以及如何利用模拟器在训练循环中规避标准强化学习技术的收敛问题。

书中还介绍了将物理模型引入深度学习的不同方法,即基于物理的深度学习(PBDL)方法。这些算法变体将按照集成紧密程度的顺序介绍,并讨论不同方法的优缺点以及各种技术在哪些场景中特别有用。

书中提供了可执行的 Jupyter 笔记本代码示例,可以直接在浏览器中执行,方便修改并立即查看结果。如果您对内容有任何评论或发现错误,可以联系维护该书的团队。


HN 热度 294 points | 评论 22 comments | 作者:sebg | 1 day ago #

https://news.ycombinator.com/item?id=40941056

  • 介绍了物理基础深度学习书籍,涉及多个领域的科学机器学习示例,包括流行病学、引力波、药物动力学、海洋模拟等,介绍了一些 Julia 库。
  • 有人询问“物理模拟机器学习工程师”的就业市场情况。
  • 有人希望这本书很棒,是一个很好的主题。
  • 有人问如何下载整本书的 PDF 版本。
  • 提供了直接下载 arXiv 摘要页面的链接。
  • 提供了其他资源链接,包括数学 + 机器学习的 CRUNCH 组 YouTube 频道、Steve Brunton 的物理信息机器学习播放列表等。
  • 有人问深度学习是否能够使大规模量子物理模拟更易处理,以及等离子体物理用于聚变反应堆的情况。
  • 讨论了深度学习用于物理问题的潜力。
  • 有人提到这本书是关于物理问题的深度学习,而不是物理学家视角下的深度学习。
  • 有人认为标题有误导,书籍实际是如何将深度学习应用于物理模拟。
  • 有人提到书名有误导,实际上是基于深度学习的物理,而不是基于物理的深度学习。
  • 有人提出将这些方法应用于接触动力学的问题的重要性。

Using S3 as a Container Registry #

https://ochagavia.nl/blog/using-s3-as-a-container-registry/

这篇文章介绍了如何将 Amazon S3 作为容器注册表来使用。作者开发了一个自定义容器镜像构建器,并与 Outerbounds1 合作了四个月。他分享了一个惊人的发现:你可以将 S3 用作容器注册表!只需通过 HTTP 公开一个 S3 存储桶,并将镜像文件上传到特定路径即可。

有了这个设置,你实际上可以从中拉取 Docker 镜像。文章详细解释了这一过程,并提供了一个演示,展示了如何从 S3 存储桶的 URL 中拉取并运行容器镜像。作者发现使用 S3 相比传统的容器注册表(如 DockerHub、GitHub Container Registry、ECR 等)具有更快的上传速度,这对于他们开发的自定义镜像构建器非常重要。

文章还解释了为什么 S3 比 ECR 更快,主要是因为 S3 允许并行上传单个层的数据块,而 ECR 必须按顺序上传每个数据块。作者还提到了一些注意事项,指出这种方法仍处于实验阶段,但展示了 S3 作为容器注册表的潜力。


HN 热度 283 points | 评论 128 comments | 作者:jandeboevrie | 18 hours ago #

https://news.ycombinator.com/item?id=40942732

  • S3 上传速度比 ECR 快
  • ECR 在上传时进行安全扫描
  • 使用 Google 的 Artifact Registry 下载速度慢
  • Kubernetes 不会嵌入注册表
  • 使用官方 Docker 注册表
  • AWS ECR 支持自动删除旧标签
  • 使用 GitLab 也支持到期后删除标签
  • Kubernetes 需要一个内嵌注册表
  • 有些注册表云产品操作繁琐
  • 使用生命周期策略自动删除旧标签
  • 有人希望 Cloudflare 创造一个高性能无服务器容器注册表
  • 无服务器容器注册表使用 R2
  • 云产品注册表操作繁琐,自动删除旧标签困难
  • Kubernetes 分布版嵌入注册表
  • 使用 GHCR
  • 有人对使用 S3 作为私有注册表感兴趣
  • 有人对高安全领域的用例感兴趣
  • 有人对使用 S3 作为私有注册表感兴趣

FlashAttention-3: Fast and Accurate Attention with Asynchrony and Low-Precision #

https://www.together.ai/blog/flashattention-3

这篇博文介绍了 FlashAttention-3,它是一种快速而准确的注意力机制,利用异步性和低精度来提高性能。FlashAttention 是 Transformer 架构中的核心层,对于大型语言模型和长文本应用来说是一个瓶颈。

FlashAttention 通过最小化内存读写在 GPU 上加速注意力,现在被大多数库用于加速 Transformer 的训练和推理。在过去两年中,这导致 LLM 上下文长度大幅增加,从 2-4K(GPT-3,OPT)到 128K(GPT-4),甚至 1M(Llama 3)。然而,尽管 FlashAttention 取得了成功,但尚未充分利用现代硬件的新功能,FlashAttention-2 在 H100 GPU 上仅实现了理论最大 FLOP 的 35% 利用率。

博文描述了三种加速 Hopper GPU 上注意力的主要技术:利用 Tensor Cores 和 TMA 的异步性来重叠整体计算和数据移动,通过 warp-specialization 交错块状 matmul 和 softmax 操作,以及利用 FP8 低精度的不一致处理。FlashAttention-3 比 FlashAttention-2 快 1.5-2.0 倍,使用 FP16 时可达到 740 TFLOPS,即 H100 理论最大 FLOPS 的 75% 利用率。使用 FP8,FlashAttention-3 接近 1.2 PFLOPS,比基线 FP8 注意力误差小 2.6 倍。

FlashAttention-3 的改进将带来更高效的 GPU 利用率、更低精度下更好的性能以及 LLM 中更长上下文的使用能力。FlashAttention-3 已在 Github 上发布。


HN 热度 276 points | 评论 57 comments | 作者:jhshah | 1 day ago #

https://news.ycombinator.com/item?id=40938577

  • FlashAttention 算法改进主要集中在拆分/合并注意力机制中的 softmax 部分,本身并不是完全新颖的。最大的贡献在于在 Nvidia 硬件上高效实现这一机制及其繁琐的部分。
  • FlashAttention 算法与硬件关联性较大,特别是针对具有独立 MMA 和“标量”向量执行单元的计算引擎,需要特定硬件支持,不易在其他平台上轻松移植。
  • FlashAttention 对硬件的依赖程度取决于抽象层,ThunderKittens 提供与 FA2 相当的速度提升,但相对通用于各种 GPU,对于新硬件可能有特定功能,但会导致 API/库碎片化。
  • FlashAttention 是一种计算注意力机制中的 Softmax(QK^T)V 部分的方法,与 GQA 等注意力策略不同,但可以在 LLM 中简单替换注意力操作。
  • FlashAttention-3 针对 Hopper GPU 进行了优化,对于消费级 GPU(如 3090 和 4090)可能性能提升有限,尤其在 RTX 5000 系列上。
  • FlashAttention 是 AI 领域中最重要的改进之一,使大多数 AI 用户能够在相同硬件上获得更多、更快的计算,几乎没有任何折衷。

Tau: Open-source PaaS – A self-hosted Vercel / Netlify / Cloudflare alternative #

https://github.com/taubyte/tau

GitHub 上的项目"taubyte/tau"是一个开源的分布式平台即服务(PaaS)。Tau 是一个框架,用于构建低维护成本且高度可扩展的云计算平台,受软件开发人员喜爱!Tau 是一个单一的二进制文件,除了标准系统库外没有外部依赖。它需要最少的配置,主要步骤包括安装 Tau、配置和启动。Tau 的目标是为软件开发人员提供一个云计算平台,使他们能够与那些由成千上万工程师支持的平台一较高下,并摆脱基础设施和运营约束,实现“本地编码等于全球生产”的理念。

Tau 通过内置的自动发现功能实现最小化配置,类似于自动驾驶汽车通过传感器收集信息,Tau 会收集信息并尝试找到最佳的可达性和可用性方式。Tau 构建的云是非常动态的,节点之间会交换资产、路由和服务的信息,并通过分布式服务(如 seer 和 gateway)来实现负载均衡,确保最佳性能和可靠性。

Tau 采用 Git 作为唯一更改基础设施的方式,而不是使用 API 调用。它构建了一个节点之间的覆盖点对点网络,具有自动节点和协议发现、路由、传输独立性和 NAT 穿越等功能。此外,Tau 使用内容寻址来解决存储问题,确保数据的唯一性和可验证性。

目前,Tau 支持 WebAssembly 进行计算,支持端到端测试,并提供了本地云环境的运行方式。此外,Tau 还可以通过插件系统进行扩展,提供了详细的文档和支持。如果您对该项目有任何疑问或需要帮助,可以在 Discord 上联系他们。


HN 热度 259 points | 评论 72 comments | 作者:thunderbong | 8 hours ago #

https://news.ycombinator.com/item?id=40946033

  • 自托管平台服务提供了即服务的好处,同时避免了供应商锁定的威胁,也可在临时或测试环境中运行相同软件。
  • PE/VCs 压力下,公司可能将平台内部化,而不是支付托管版本费用。
  • 使用技术使系统自我修复、自动部署,产品与托管业务的激励不一致,希望找到更好与产品相匹配的商业模式。
  • 开源供应商也可以,迁移成本高,团队可以继续支付人员支持,而不是被告知需要在三个月内重新架构云堆栈。
  • 使用 libp2p 进行网络自动发现,IPFS 进行分布式存储,Webassembly 本地化,如果描述的一样好,底层技术允许自托管同时具有托管平台的一些好处。
  • Kubernetes 有很多优点,但对于某些人来说,理解层次太复杂,可能不需要。
  • Kubernetes 提供了很多功能,但对于某些人来说,理解层次太复杂,可能不需要。
  • 服务器无服务器的吸引力在于简单性,它将服务器抽象化,更专注于独特的业务逻辑。
  • Tau 是否实现了扩展和零扩展?如果没有零扩展,如何宣称是 Vercel 的替代品?
  • 与 Coolify 和 CapRover 相比,Tau 是一个值得欢迎的补充。

Windows NT for Power Macintosh #

https://github.com/Wack0/maciNTosh

本项目是将 PowerPC Windows NT 移植到 Power Macintosh 系统的存储库。目前包含针对新世界 Power Macintosh 系统的 ARC 固件及其加载程序的源代码,使用 Gossamer 架构(即 MPC106 “Grackle” 内存控制器和 PCI 主机,“Heathrow” 或 “Paddington” 超级 I/O 芯片位于 PCI 总线上)。支持以下系统:

  • iMac G3(托盘装载)
  • Power Macintosh G3(蓝白色)“优胜美地”
  • Macintosh PowerBook G3 铜键盘 “龙巴”
  • Power Macintosh G4 PCI“Yikes!”

ARC 固件本身运行在足够低的级别,应与使用相同芯片组的 Old World 系统兼容,但目前没有这些系统的加载程序:

  • Power Macintosh G3(米色)
  • Macintosh PowerBook G3 系列 “Wallstreet”、“PDQ”

ARC 固件中包含的驱动程序:

  • Cuda 和 PMU(尽管 Cuda 在真实硬件上未经测试)
  • ADB 键盘
  • 平面 32bpp 视频帧缓冲区,由加载程序设置。当前加载程序仅支持 ATI 硬件
  • Mac I/O 内部 IDE 控制器
  • USB OHCI(不完整,不可用,初始化代码已注释掉)

目前为 NT 完成的驱动程序:

  • HAL,包括:NT 启动时的帧缓冲区、超级 I/O 中断控制器、Grackle PCI 总线支持、Cuda 和 PMU、用于内核调试的串行端口
  • Mac I/O 内部 IDE 控制器
  • 通用 HID / 存储驱动程序,目前仅实现 ADB 键盘 / 鼠标和作为软驱的内存磁盘
  • 平面 32bpp 视频帧缓冲区 miniport 驱动程序

软件兼容性为 NT4,目前仅支持 NT 3.51 可能会兼容,如果 HAL 和驱动程序得到移植。NT 3.5 将永远不兼容,因为它仅支持 PowerPC 601。

安装过程涉及光盘分区、NT 安装、已知问题、双启动问题等。开发需使用 devkitPPC,构建 ARC 固件的步骤包括构建大端 libc、ARC 固件加载程序、小端 libc 和 ARC 固件本身。

总的来说,这是一个仍在开发中的项目,仅具备最基本的驱动程序来运行和使用 NT。用户应该期待出现 bugchecks 等问题,并注意双启动时的注意事项。感谢使用的开源库和项目,使这一移植项目成为可能。


HN 热度 251 points | 评论 147 comments | 作者:TazeTSchnitzel | 10 hours ago #

https://news.ycombinator.com/item?id=40945076

  • NeXTStep 被认为是一个明智的选择,而 BeOS 虽然优秀,但在当时不太适合苹果。
  • BeOS 缺乏多用户支持等功能,可能需要更多时间和资源来完善。
  • BeOS 会改变苹果的系统语言和发展方向,对 POSIX 等也会产生影响。
  • 关于苹果与 NeXT 的合并,一些评论认为苹果可能会被收购,而手机市场可能会有不同的格局。
  • 取消项目往往让人怀念,因为它们的结构优雅,未实现的愿景会激发人们的遐想。
  • 软件应当像网站一样提供功能接口,提高互联互通的便利性。
  • IBM OS/2 SOM 和 Smalltalk 也曾提供了多语言支持,但未能继续发展。
  • Copland 项目曾让人兴奋,但最终苹果选择了 NeXT,VisionOS 也被认为是技术上的杰作。

As an Employee, You Are Disposable (2023) #

https://nelson.cloud/as-an-employee-you-are-disposable/

这篇文章谈到了最近的科技裁员事件显示了在高管眼中员工是可替代的。即使投资者的期望被超越,裁员仍可能发生。

有些公司即使盈利,也会裁员。许多公司不仅盈利,而且在裁员期间,高管仍然赚取巨额利润。除了裁员,员工的薪水可能被冻结,即使公司的收入有所增加。无论你提供了多少价值,产生了多大影响,或者在公司工作了多长时间,你仍然是可替代的。这篇文章展示了一些非常富有的高管对普通工人/员工的看法。

总的来说,作为员工,你是可替代的。文章还提到了一些相关的文章,建议阅读。


HN 热度 245 points | 评论 358 comments | 作者:nelsonfigueroa | 15 hours ago #

https://news.ycombinator.com/item?id=40943436

  • 公司不是你的家庭,员工应该明白公司与个人之间的关系是交易性的,不应该过分强调忠诚度。
  • 公司决策由董事会或直接所有者做出,即使高管层也受制于董事会/所有者的直接命令来裁员。
  • 雇佣关系是一项商业交易,员工应该意识到这一基本事实,避免过度忠诚导致权力失衡。
  • 雇员应该将雇佣视为合同,而婚姻等个人关系则是契约,避免过度期望对方忠诚而失去自身权力。
  • 大公司过度雇佣为显示成功,但这种行为是不道德的,因为员工最终可能被裁员。
  • 雇员应该推动尽可能多地开源代码,但需谨慎处理,以避免被标签为“想要所有代码开源”而受限制。
  • 雇员应该意识到公司的决策基于盈利,而不是忠诚度,这是市场经济的基本原则。
  • 公司应该在经济系统的限制下运作,但不应该忽视人性和道德,给员工合理的离职程序和尊重。
  • 在裁员时,应该考虑员工的感受和人性,而不仅仅追求盈利。
  • 改变经济系统需要深思熟虑,但应该努力创造更人性化的限制和环境。

Gene-silencing tool shows promise as a future therapy against prion diseases #

https://news.mit.edu/2024/charmed-collaboration-creates-therapy-candidate-fatal-prion-diseases-0627

这篇文章介绍了麻省理工学院和哈佛大学布罗德研究所的研究人员在致命朊蛋白病治疗方面取得的重要进展。研究人员开发了一种名为 CHARMs 的分子工具,可以关闭致病基因,如朊蛋白基因,以及潜在地关闭许多其他与神经退行性疾病和其他疾病有关的蛋白质编码基因。

CHARMs 通过表观遗传编辑来实现这一目标,这种方法通过向 DNA 添加化学标记来关闭或沉默目标基因,而不修改基因本身。研究表明,朊蛋白在健康成年人中并非必需,而在疾病情况下,去除该蛋白可以改善甚至消除疾病症状。这种表观遗传编辑可能是治疗遗传性疾病的有效方法。研究人员通过将 CRISPRoff 工具改进为 CHARMs,设计出了一个小巧而有效的基因沉默工具,可以在动物实验中消除大脑中超过 80%的朊蛋白。

他们还解决了工具的大小和毒性问题,并设计了一种自我关闭机制,以减少副作用。此外,另一个研究小组的工作使得 CHARMs 技术更接近临床试验阶段。总的来说,这项研究为治疗朊蛋白病等疾病提供了新的希望,虽然距离临床应用还有一段路要走,但研究人员对未来充满信心。


HN 热度 213 points | 评论 65 comments | 作者:gmays | 1 day ago #

https://news.ycombinator.com/item?id=40939703

  • Prions 被证明在环境中持久存在,是致命且几乎不可摧毁的,有人认为它们是一种来自地狱编码的全球性生物杀手。
  • Prions 会逐渐剥夺你的睡眠能力,是噩梦的来源。
  • Prions 在体内引起蛋白质错误折叠,最终导致死亡,因为没有免疫机制来清除错误折叠的蛋白质或纠正它们。
  • 新治疗方法通过禁用产生 prions 的基因,但对环境中的 prions 无效。
  • 治疗成功关闭内源 prion 蛋白的产生,疾病理论上不会进展,甚至可能在一定程度上逆转。
  • 个体的 PrP 对特定 prion 菌株的易感性有很大变化,这在感染概率和疾病进展时间上非常重要。
  • 生物学问题没有简单答案,尤其是对于复杂的生物问题,解决方案总是复杂的,即使伴随着简单的叙述。
  • 人们可能发现一些被认为是遗传、细菌或病毒引起的疾病实际上只是 prions 导致的。
  • 治疗降低蛋白质量 80%,这似乎有点低,但效果可能因疾病、细胞类型等而异。
  • Prions 不是高度传染的,研究人员将其视为重要优先事项,因为他们的研究可能有助于治疗类似 prion 的疾病。

Karpathy: Let’s reproduce GPT-2 (1.6B): one 8XH100 node 24h $672 in llm.c #

https://github.com/karpathy/llm.c/discussions/677

在这个 GitHub 链接中,作者介绍了如何在 llm.c 中复现 GPT-2。llm.c 是一个直接使用 C/CUDA 编写的项目,总共约 5000 行代码,没有涉及 Python 解释器或更复杂的深度学习库。作者指出,由于计算能力(H100 GPU)、软件(CUDA、cuBLAS、cuDNN、FlashAttention)和数据(FineWeb-Edu 数据集)的改进,现在可以在单个 8XH100 节点上用 $672 在 24 小时内复现 GPT-2(1.6B 参数版本)。然而,llm.c 仍然存在一些问题,如性能调优、稳定性和评估的不完整性。

作者通过一个有趣的例子展示了模型的生成能力,展示了模型在英语角度的表现。训练 GPT-2 使用 llm.c 相对简单,只需一个 8XH100 GPU 盒子,作者推荐使用 Lambda labs 提供的服务。作者提供了详细的训练步骤,包括安装 CUDA、下载数据集、编译和训练模型等。

此外,作者还介绍了训练过程中的一些参数设置,如学习率、权重衰减、梯度累积步数等。作者还提到了 llm.c 的优势,如快速编译和运行、内存占用稳定、位运算确定性等。

最后,作者展望了 llm.c 未来的发展方向,包括进一步优化 GPT-2 的训练超参数、提高训练和扩展稳定性、混合精度训练等。作者鼓励用户在 GitHub Discussions 或 Discord 上提出问题和讨论。


HN 热度 178 points | 评论 53 comments | 作者:alecco | 1 day ago #

https://news.ycombinator.com/item?id=40939707

  • AI 硬件发展将推动 AI 应用普及,未来可能带来 AI 驱动桌面应用的黄金时代。
  • 游戏空间尝试创建 AI 驱动 NPC、世界生成和叙事,但 AI 生成的内容可能难以满足游戏设计师的需求。
  • 文本生成目前在音频方面已相当成熟,但对话生成仍有局限性。
  • 游戏中 AI 生成的内容可能会破坏沉浸感,对话生成需要更好的工具和平衡。
  • AI 在游戏中生成任务和奖励可能会增加玩家参与度,但目前的成本和技术限制仍需克服。
  • AI 在游戏 NPC 和故事叙事方面仍需突破,现有技术尚不足以支持。
  • AI 在游戏中可能更适合辅助开发过程,但传统方法在任务生成方面仍然有效。
  • AI 在游戏中的应用需要更多创新,当前技术尚不足以满足游戏需求。
  • AI 在游戏中的应用可能需要人类创作的指导,以确保内容质量和连贯性。
  • AI 在游戏 NPC 和世界状态方面仍有不足,需要更多创新和改进。