2024-11-05 Hacker News Top Stories #
- 科学家通过将两种蛋白质粘合在一起,导致癌细胞自毁,开启了新型癌症治疗方法。
- 纽约时报技术工会因合同谈判不顺,宣布罢工,可能影响报道选举结果的能力。
- 一项研究指出,依赖自动化工具评估员工绩效可能导致管理者忽视员工的非量化贡献。
- 项目 Sid 通过多智能体模拟,研究人工智能代理在大规模社会中的表现和进步,展现了代理自主开发专业角色和遵守集体规则的能力。
- Hertz-dev 是第一个开源的对话音频生成模型,具有低延迟和高质量的特点。
- 昆西·琼斯,音乐巨匠,去世于 91 岁,留下了他在音乐上的巨大贡献。
- Gitpod 的团队决定放弃使用 Kubernetes,转而寻找其他解决方案来满足开发环境的需求。
- 研究人员提出了机器学习的概念,即从模型中删除特定的知识而不需要重新训练,发现现有的机器学习方法可能并没有真正地删除知识,而是将其隐藏起来。
- WhatDinner 是一个为情侣设计的 meal planning 工具,旨在帮助他们轻松决定晚餐的菜单。
- pg_flo 是一个用于在 PostgreSQL 数据库之间移动和转换数据的工具,支持实时流式传输、批量复制、强大的转换和灵活的路由。
Scientists glue two proteins together, driving cancer cells to self-destruct #
https://med.stanford.edu/news/all-news/2024/10/protein-cancer.html
斯坦福大学医学院的研究人员开发了一种新方法,利用细胞的自然死亡过程来杀死癌细胞。这种方法通过人工地将两个蛋白质结合在一起,激活细胞死亡基因,导致癌细胞自毁。
研究人员希望这种方法可以用来治疗淋巴瘤等癌症。他们已经开发了一种分子胶水,可以将两个蛋白质粘合在一起。这种胶水可以激活细胞死亡基因,导致癌细胞自毁。
这种方法与传统的癌症治疗方法不同,传统方法通常会杀死大量健康细胞。研究人员希望这种方法可以更准确地杀死癌细胞,而不会伤害健康细胞。
研究人员已经在实验室中测试了这种方法,结果表明它可以有效地杀死淋巴瘤细胞。他们还在健康小鼠中测试了这种方法,没有发现明显的毒副作用。下一步,他们将在患有淋巴瘤的小鼠中测试这种方法,以评估其治疗效果。
HN 热度 604 points | 评论 162 comments | 作者:Jerry2 | 23 hours ago #
https://news.ycombinator.com/item?id=42037386
- 这是一项非常新颖和有趣的研究,利用 BCL6 基因的致癌功能,而不是抑制它,来引导激活机制,逆转细胞死亡的抑制效果。
- 该技术为针对“不可成药”蛋白质靶点开辟了巨大可能性,因为只需要一个能与目标蛋白结合的分子。
- BCL-2 抑制剂如 Venetoclax 已经广泛用于癌症治疗,通过触发细胞凋亡来杀死癌细胞,这种方法已经非常有效。
- 快速诱导癌细胞凋亡可能导致肿瘤溶解综合征(TLS),对患者造成毒性。
- 癌症细胞在个体之间甚至个体内部非常多样化,许多生物治疗需要对患者肿瘤 DNA 进行精确测序才能调整和起效。
- 理想情况下,每种癌症细胞都应进行测序,然后根据细胞类型和 DNA 测序选择合适的“工具”来传递药物,避免影响正常细胞。
- 免疫疗法虽然机制更自然,但上调免疫系统可能会导致严重的副作用,如自身免疫疾病。
- 早期诊断技术的发展,如超极化技术,将有助于提高癌症的早期发现率和治疗效果。
- 女性癌症似乎比男性癌症早 5-10 年出现,尽管男性整体的癌症生存率较低。
New York Times Tech Guild goes on strike #
https://www.washingtonpost.com/style/media/2024/11/04/new-york-times-tech-strike-walkout/
纽约时报技术工会(New York Times Tech Guild)于 11 月 4 日凌晨 12 点 01 分开始罢工,这是该工会几个月来威胁要采取的行动。罢工可能会影响纽约时报报道本周选举结果的能力。纽约时报技术工会与公司管理层的谈判越来越紧张,未能达成合同协议,工会代表告诉华盛顿邮报。
纽约时报技术工会在谈判失败后宣布无限期的不公平劳动惯例罢工。罢工可能会影响纽约时报的选举报道。纽约时报技术工会表示,罢工是对公司管理层不公平劳动行为的回应。
纽约时报技术工会的罢工可能会影响公司的选举报道。罢工开始后,工会成员在纽约时报大楼前举行了抗议活动。罢工可能会持续一段时间,直到工会和公司管理层达成协议。
纽约时报技术工会的罢工是最近几周来美国媒体行业罢工潮的一部分。其他媒体公司的工会也在与公司管理层谈判,要求改善工作条件和工资待遇。
HN 热度 557 points | 评论 1005 comments | 作者:ChrisArchitect | 12 hours ago #
https://news.ycombinator.com/item?id=42040795
- 罢工是因为纽约时报管理层不愿意与新成立的工会签订合同
- 工会的主要诉求包括:正当理由的就业保护、解决性别和种族薪酬差异、远程工作权利
- 管理层拖延谈判可能是为了阻止工会稳定下来
- 薪酬差异的统计数据需要控制其他变量,如职位级别、生产力等
- 数据分析师工会成员具备社会数据分析经验,已控制相关变量
- 性别薪酬差距在控制变量后仍然存在,且在某些职业中尤为明显
- 金融和销售行业存在较大薪酬差距可能与绩效奖金有关
- 女性和非二元性别员工可能在销售中受到更差的对待
- 男性可能在工作表现上更积极争取认可,女性则可能因性别角色内化而表现不同
- 如果员工不主动要求加薪,雇主通常会支付更低的薪酬
A change of heart regarding employee metrics #
http://rachelbythebay.com/w/2024/11/03/metrics/
作者在这篇文章中分享了自己对员工绩效评估工具的看法。作者曾经开发过这样的工具,用于评估员工的工作效率和产出,但现在他认为这种做法是错误的。
作者认为,管理者的职责是了解他们的下属员工的工作情况和绩效,而不是依赖工具来评估员工。管理者应该通过与员工的直接沟通和观察来了解他们的工作情况,而不是通过工具来评估员工。
作者还指出,这种工具实际上并不能准确评估员工的工作效率和产出,而是反映了管理者的无能。管理者应该做好自己的工作,而不是依赖工具来评估员工。
作者最后总结说,不要开发或使用这样的工具,而是应该让管理者做好自己的工作。这种工具不仅不能提高工作效率,反而会使工作环境更加糟糕。
HN 热度 538 points | 评论 335 comments | 作者:zdw | 19 hours ago #
https://news.ycombinator.com/item?id=42038653
- 管理者应该通过个人互动了解员工的工作情况,而不是依赖自动化工具
- 自动化工具可能导致管理者忽视员工的非量化贡献,如帮助同事和发现潜在的安全问题
- 依赖自动化工具的管理方式会逐渐将员工变成只关注指标的“优化者”,损害团队的创新和质量
- 在当前的经济环境下,员工减少对工作的投入可能是合理的,因为公司往往更关心短期利益
- 如果工作不再令人满意,应该寻找新的机会,而不是继续在不关心员工的公司工作
- 有些人认为即使工作不是自己的热情所在,也能保持专业和可靠的态度
- 工作热情对于长期职业发展和健康状态至关重要,缺乏热情的工作不可持续
- 管理者应该关注员工的整体表现,而不仅仅是通过工具看到的量化指标
- 对于一些人来说,工作只是谋生的手段,他们可能更关心家庭或个人爱好
- 管理者和员工之间的信任关系比任何工具都更重要,工具不能替代管理者的职责
Project Sid: Many-agent simulations toward AI civilization #
https://github.com/altera-al/project-sid
项目 Sid:多智能体模拟向人工智能文明迈进
人工智能代理通常被孤立或小规模评估,交互作用的范围和复杂性有限。然而,大规模模拟涉及多个自治代理的研究尚未被探索。我们展示了 10-1000+ 个 AI 代理如何在代理社会中表现和进步。我们首先介绍了 PIANO(并行信息聚合通过神经编排)架构,它使代理能够与人类和其他代理实时交互,同时保持多个输出流的连贯性。
然后,我们使用受人类历史启发的文明基准评估代理在大规模模拟中的性能。这些模拟在 Minecraft 环境中进行,揭示了代理能够实现有意义的进步——自主开发专业角色,遵守和改变集体规则,并参与文化和宗教传播。这些初步结果表明,代理可以实现人工智能文明的重大里程碑,开启了大规模社会模拟、代理组织智能和将人工智能集成到人类文明的新途径。
论文可在以下两个位置获取:
- arXiv:arXiv:2411.00114
- PDF:2024-10-31.pdf(在本仓库中)
HN 热度 386 points | 评论 141 comments | 作者:talms | 1 day ago #
https://news.ycombinator.com/item?id=42035319
- 多代理模拟本质上是另一种形式的提示工程,每个代理实际上是一个 SQL 视图,映射形成提示的字符串模板。
- 当前技术下,基于 LLM 的 NPC 交互会破坏游戏的约束,导致不可预测的游戏体验。
- 大型预算游戏需要真正投入努力来实现具有严肃性的 NPC,才能验证 LLM 在游戏中的实际效果。
- 沙盒游戏可能是 LLM 技术的亮点,玩家可以通过提示生成特定主题的世界,但存在版权问题。
- 自动化环境生成工具需要艺术家的控制才能达到高质量,完全去除人类创意和技术中介目前不可行。
Hertz-dev, the first open-source base model for conversational audio #
Standard Intelligence 公开源代码的对话音频生成模型
Standard Intelligence 研究团队最近几个月致力于可扩展的跨模态学习,现宣布开放源代码的对话音频生成模型 hertz-dev,总参数量达 8.5 亿。
hertz-dev 由三部分组成:hertz-codec、hertz-vae 和 hertz-dev。
- hertz-codec:一个 5 百万参数的编码器和 9500 万参数的解码器,能够将 16kHz 的单声道语音转换为 8Hz 的潜在表示,码率约为 1kbps。
- hertz-vae:一个 18 亿参数的解码器,能够预测下一个编码的音频帧,具有 8192 个采样潜在表示的上下文长度(约 17 分钟)。
- hertz-dev:一个 66 亿参数的 Transformer 栈,部分初始化自预训练的语言模型,训练数据为 2 亿小时的音频,具有 2048 个标记(约 4 分钟)的上下文长度。
hertz-dev 是第一个公开的对话音频生成模型,具有以下特点:
- 低延迟:理论延迟为 65ms,实际延迟约为 120ms(在 RTX 4090 上)。
- 高质量:能够生成高质量的对话音频。
Standard Intelligence 是一个致力于研究通用人工智能的团队,目前共有 4 名成员,位于旧金山。如果你有兴趣加入团队或投资,请联系 join@si.incmailto:join@si.inc 或 invest@si.inc。
HN 热度 270 points | 评论 50 comments | 作者:mnk47 | 1 day ago #
https://news.ycombinator.com/item?id=42036995
- Hertz-dev 是一个开源的语音对话基础模型,与现有的开源 TTS 引擎相比表现更好
- 小团队专注于一个特定领域比尝试做多模态模型更有效,可以更快地发布高质量产品
- Hertz-dev 可以作为研究产品的基础模型,因为它准确地模拟了训练数据的分布,适合多种任务的微调
- Hertz-dev 是一个完全的语音到语音模型,不涉及文本处理,能够保持自然的语音特征
- Hertz-dev 作为基础模型,可以通过微调轻松配置性别、年龄和口音等特征
- 小团队背景为 16-20 岁的天才,已经工作了大约 5 个月,展示了强大的开发能力
- Tesla 的纯视觉自动驾驶技术与语音交互系统类似,都是通过简化模型来加速数据收集和迭代
- 语音到语音的模型可以产生更自然、更人性化的响应,避免传统 TTS 的生硬感
Quincy Jones has died #
https://apnews.com/article/quincy-jones-dead-a9e31c7e39c448d8971519f47a22dd21 Quincy Jones,音乐巨匠,去世于 91 岁。Jones 的音乐生涯跨越了多个领域,从制作 Michael Jackson 的历史性专辑《Thriller》到为电影和电视创作获奖的配乐,他还与 Frank Sinatra、Ray Charles 和其他数百位艺术家合作。
Jones 出生于芝加哥南部,曾与黑帮混混,后来成为好莱坞首位黑人高管。他创作的音乐作品包括一些美国最伟大的节奏和歌曲。他与总统、外国领导人、电影明星、音乐家、慈善家和商业领袖等各界人士交往密切。
Jones 曾与 Count Basie 和 Lionel Hampton 巡演,为 Frank Sinatra 和 Ella Fitzgerald 编排唱片,为《Roots》和《In the Heat of the Night》创作配乐,并组织了比尔·克林顿总统的第一次就职庆祝活动。他还监督了由多位明星参与的慈善活动。
Jones 的家庭表示,他的去世是一个巨大的损失,但他们也为他伟大的生涯感到骄傲。Jones 将在本月晚些时候获得一项荣誉学院奖。
HN 热度 269 points | 评论 65 comments | 作者:gfortaine | 16 hours ago #
https://news.ycombinator.com/item?id=42039569
- 昆西·琼斯在音乐上的贡献巨大,如制作《The Dude》和《Back on the Block》等专辑
- 他曾在 ACM Computers in Entertainment Magazine 的顾问委员会任职,并参与了 Alan Kay 的 Viewpoints Research Institute
- 他为非洲国家的债务减免工作做出了贡献
- 他曾与 Nadia Boulanger 学习音乐作曲,与 Olivier Messiaen 学习和声
- 他为《 Sanford and Son 》等电视剧创作了主题曲
- 他的音乐作品被用于《杀死比尔》中的场景
- 他与 Herbie Hancock 合作,了解合成器和录音计算机的设置
- 他受邀为 Alan Kay 70 岁生日的书籍贡献内容
- 他与 Tom Bähler 合作,有许多美好的故事
- 他曾与 Rod Temperton 合作,创作出高水平的音乐
- 他能够将感受到的情感转化为音乐,这是非常罕见的才能
- 他安排了众多超级巨星参与《We Are The World》的录制,展示了卓越的组织和协调能力
- 他谈论披头士乐队成员的音乐技巧时,表现出幽默和坦率
- 他与 Frank Sinatra 合作,推动了拉斯维加斯赌场对黑人表演者的公平对待
- Buzz Aldrin 在月球上播放了他编排的《Fly Me to the Moon》
We’re Leaving Kubernetes #
https://www.gitpod.io/blog/we-are-leaving-kubernetes
Gitpod 的创始人兼 CTO Christian Weichel 和工程师 Alejandro de Brito Fontes 在这篇文章中分享了他们对 Kubernetes 的看法。他们认为,Kubernetes 不是构建开发环境的最佳选择。他们花了六年时间在 Kubernetes 上开发 Gitpod,拥有 150 万用户,然而他们发现 Kubernetes 并不适合开发环境的需求。
开发环境与生产环境有着根本的区别。开发环境需要高度的互动性和状态性,开发者需要快速的反馈和响应。开发环境的资源使用模式也非常不确定,需要大量的 CPU 和内存资源。同时,开发环境需要广泛的权限和功能,包括 root 访问和网络能力。
Gitpod 的团队尝试了各种方法来解决这些问题,包括使用 SSD、PVC、eBPF、seccomp notify、TC 和 io_uring 等技术。然而,他们发现这些方法都有其局限性,无法完全解决开发环境的需求。
文章的作者认为,Kubernetes 是为生产环境设计的,而不是为开发环境设计的。Kubernetes 的复杂性和限制使得它不适合开发环境的需求。Gitpod 的团队决定放弃使用 Kubernetes,转而寻找其他解决方案来满足开发环境的需求。
HN 热度 259 points | 评论 115 comments | 作者:filiptronicek | 9 hours ago #
https://news.ycombinator.com/item?id=42041917
- 开发者应该拥有自己的开发机器,以确保环境的一致性和提高开发效率
- 远程开发环境通常会因为反馈循环过长而变得低效,尤其是在网络不稳定时
- 开发者需要创建工具来减轻远程开发的痛苦,因为他们本身就是做软件的
- 对于大多数项目,如果开发环境过于复杂以至于无法在本地运行,这本身就是一个问题
- 通过使用 Nix 等工具,可以快速设置开发环境,但团队成员可能不愿意学习新的工具
- 开发者喜欢对自己的机器有控制权,包括项目依赖
- 在初创公司,时间宝贵,学习复杂的工具可能不是优先事项
- Nix 在部署方面也有优势,但缺乏通用的部署方法,通常需要转换为 Docker 镜像
- 远程开发环境可以通过终端工具如 spacemacs、tmux 和 mosh 来实现,但代码同步是一个未解决的问题
- 对于处理敏感数据的项目,从生产环境到开发环境的数据脱敏是一个好实践
An embarrassingly simple approach to recover unlearned knowledge for LLMs #
https://arxiv.org/abs/2410.16454
该网页是一篇关于人工智能的研究论文,标题为《你的语言模型真的忘记了吗?一个令人尴尬的简单方法来恢复未学习的知识》。论文讨论了大型语言模型(LLM)在训练过程中可能会学到一些不想要的行为和知识,例如版权和私人内容。为了解决这个问题,研究人员提出了机器学习的概念,即从模型中删除特定的知识而不需要重新训练。
论文指出,现有的机器学习方法可能并没有真正地删除知识,而是将其隐藏起来。为了验证这一点,研究人员使用了量化技术来恢复已经被删除的知识。实验结果表明,在全精度下,未学习模型保留了平均 21% 的被删除知识,而在 4 位量化下,这个比例增加到了 83%。
研究人员提出了一个理论解释来解释这一现象,并提出了一个量化鲁棒的机器学习策略来解决这个问题。论文共有 21 页,包括 2 个图表,属于计算机科学和人工智能领域。
HN 热度 238 points | 评论 110 comments | 作者:PaulHoule | 21 hours ago #
https://news.ycombinator.com/item?id=42037982
- 量化模型可以逆转特定的“遗忘”方法,使模型恢复之前被遗忘的知识。
- “遗忘”方法旨在删除模型中的特定知识,同时尽可能保留模型的实用性,这可能被用于满足版权要求。
- 事实本身不受版权保护,但事实的表达方式可能受版权保护。
- AI 公司利用互联网上的信息训练模型,然后将其商业化,而无需向信息的原始创建者支付费用,这被视为一种盗窃行为。
- 生成式 AI 的主要价值在于理解世界和语言,这通常被认为是合法的创造性转换。
- 生成式 AI 的不可接受用途包括未经授权使用新闻文章、复制商标角色或特定艺术家的风格,以及制作深度伪造色情内容。
- 通过法律手段而非技术限制来规范 AI 的使用,以防止非法行为,同时保护用户自由。
- 由于国际法律和管辖权的限制,完全阻止非法 AI 内容的传播是困难的,但可以通过现有法律进行一定程度的管控。
Show HN: Tinder, but to decide what to eat #
WhatDinner 是一个为情侣设计的 meal planning 工具,旨在帮助他们轻松决定晚餐的菜单。该工具提供了一个简单的界面,允许用户管理自己的食谱,并根据自己的偏好决定每天的菜单。
功能
- 食谱管理:用户可以管理自己的食谱,并查看自己准备过的菜肴。
- 频率设置:用户可以决定自己想要准备某道菜的频率,WhatDinner 会根据用户的偏好为他们推荐菜单。
使用方法
- 开始决定:用户可以开始使用 WhatDinner 来决定晚餐的菜单。
- 联系我们:用户可以通过联系页面与 WhatDinner 团队取得联系。
- 隐私政策:WhatDinner 提供了详细的隐私政策,保护用户的个人信息。
HN 热度 232 points | 评论 197 comments | 作者:kiru_io | 1 day ago #
https://news.ycombinator.com/item?id=42036041
- 该应用解决了情侣决定晚餐吃什么的问题,但功能较为基础,可增加更多食谱选择和偏好设置
- 应用可以进一步发展为帮助情侣了解彼此偏好、增进关系的工具,不仅限于晚餐选择
- 无需服务器支持,可以考虑一次性收费模式,减少维护成本
- 可以加入购物清单功能,方便用户提前规划购买食材
- 应用可以扩展为社交平台,让用户根据食物偏好和兴趣匹配陌生人一起用餐
- 初始选项过少且未列出食材,导致用户难以做出选择,尤其是对食材有特殊要求的用户
- 该应用可以带来期待晚餐的兴奋感,但需要解决食材与冰箱内容不匹配的问题
- 可以加入排除特定食材的功能,以适应不同用户的饮食需求
- 有些菜品缺少特定食材无法制作,而有些则可以替代或省略,应用需要考虑这种差异性
pg_flo – Stream, transform, and re-route PostgreSQL data in real-time #
pg_flo 是一个用于在 PostgreSQL 数据库之间移动和转换数据的工具。它支持实时流式传输、批量复制、强大的转换和灵活的路由。
功能
- 实时流式传输:使用 PostgreSQL 逻辑复制系统捕获和流式传输数据变化。
- 批量复制:并行化批量复制以实现快速的初始数据同步。
- 强大的转换:应用基于正则表达式的转换、屏蔽敏感数据和基于列值的过滤。
- 灵活的路由:在表之间无缝路由数据,无论是不同名称的表还是具有自定义列映射的相同表。
使用案例
- 安全生产和分段同步:利用强大的转换规则持续同步生产数据到分段,维护数据隐私和安全实践。
- 数据归档和分析:同步和转换数据到单独的数据库进行归档、审计和分析目的。
工作原理
pg_flo 利用 PostgreSQL 的逻辑复制系统捕获和流式传输数据变化。它使用 NATS 作为消息代理来解耦复制器和工作者进程,提供灵活性和可扩展性。转换和过滤在数据到达目标之前应用。
HN 热度 232 points | 评论 49 comments | 作者:shayonj | 1 day ago #
https://news.ycombinator.com/item?id=42034237
- pg_flo 是一个有趣的项目,支持将数据归档到 S3,并且在较小规模的数据处理上表现良好
- Debezium 现在有了独立版本,可以直接发布到 NATS 队列,不再需要 Kafka
- PeerDB 被 ClickHouse 收购,可能减少对非 ClickHouse 目标的支持
- Dozer 项目也值得关注,但似乎正在转向 LLM 集成
- pg_flo 在 worker 或 replicator 节点故障时,数据流会中断,需要引入监控以提高生产就绪性
- PeerDB 依赖于 Temporal,虽然增加了复杂性,但有助于构建复杂的 CDC 状态机,支持大规模工作负载
- NATS 作为依赖项是合理的,特别是 JetStream 版本,可以在较小预算下运行
- Supabase 的实时 CDC 工具也是开源的,可以考虑用于实时数据同步
- PostgreSQL 逻辑复制可以用于数据归档和读取分离,但需要处理不同类型的删除操作以保持数据一致性