2026-07-02 Hacker News Top Stories #
- Anthropic 发布新模型 Claude Sonnet 5,大幅提升推理与工具使用能力,性能接近旗舰但定价更低。
- 美国商务部解除对 Anthropic 旗下 Claude Fable 5 和 Mythos 5 的出口管制,访问权限即将恢复。
- 科学家首次用无生命材料建造出能生长、复制 DNA 并分裂的合成细胞,在合成生命领域实现关键突破。
- 作者反思大多数争论本质是为维护自我而非探讨观点,只有对方主动求助时沟通才能真正有效。
- Claude Science 是为科研设计的 AI 平台,可直接分析蛋白质、基因组等数据并连接科学数据库,加速图表生成。
- 索尼宣布 2028 年 1 月起 PlayStation 所有新游戏不再生产实体光盘,仅提供数字版。
- 开源游戏引擎 Godot 禁止 AI 生成的代码贡献,要求提交者必须是能对代码负责的人类。
- Asahi Linux 7.1 修复了 macOS 开发者测试版导致的问题,并为 M3 系列设备新增音频、Wi-Fi 等关键驱动支持。
- 索尼因授权协议到期将删除用户已购买的 551 部影片且无退款,引发对数字内容所有权的广泛担忧。
- 任天堂将全体员工基本工资上调 10% 并提高新人起薪,以在激烈人才竞争中留住员工。
Claude Sonnet 5 (Claude Sonnet 5) #
https://www.anthropic.com/news/claude-sonnet-5
Claude Sonnet 5 于 2026 年 6 月 30 日发布,是 Anthropic 最新的 Sonnet 系列模型,主打更强的智能体能力。它在推理、工具使用、编程和知识工作方面相比前代 Sonnet 4.6 有显著提升,性能接近 Opus 4.8,但价格更低。
在智能体搜索(BrowseComp)和计算机使用(OSWorld-Verified)测试中,Sonnet 5 在中等努力下成本效率大幅提高,高努力下可匹配 Opus 4.8。定价为每百万输入 token 3 美元、输出 token 15 美元,即日起至 2026 年 8 月 31 日有促销价 2/10 美元。
安全评估显示,Sonnet 5 的不良行为率整体低于 Sonnet 4.6,在智能体安全、拒绝恶意请求、抵抗提示注入方面更好,幻觉和谄媚减少,但在部分测试中略逊于 Opus 4.8 和 Mythos Preview。模型未刻意训练网络安全任务,其网络攻击能力远低于 Opus 系列。
早期合作伙伴反馈积极,认为它能完成多步骤复杂任务、主动检查输出、成本效益优秀,适用于软件工程、自动化、法律研究等场景。
HN 热度 1233 points | 评论 762 comments | 作者:marinesebastian | 1 day ago #
https://news.ycombinator.com/item?id=48736605
- 使用 Sonnet 5 不如直接用较低 effort 的 Opus,因为成本更低。
- Opus 容易过度复杂化简单问题,需要反复引导,浪费 token。
- 模型优化方向可能是从用户和企业提取财富,而非解决问题。
- Anthropic 引入新 tokenizer 增加 token 生成,损害用户利益。
- 市场存在竞争且切换成本低,Anthropic 不会牺牲质量。
- 实际上 LLM 存在锁定性,不同模型有不同怪癖,用户积累经验后难以切换,企业合同也导致锁定。
- 消费者对 LLM 产品的情绪与实际体验存在严重脱节。
- 模型为迎合大众平庸用户而优化,降低高端用户体验。
- 换成开源模型后相同上下文窗口能更高效利用。
- Opus 在读取过多代码后给出错误建议,需要回滚。
- Claude Code 默认行为是忽略读取完整文件就执行修改。
- 用户对 Opus 智能程度感知差异可能与系统负载有关。
2. 美国商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制 (Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5) #
https://twitter.com/AnthropicAI/status/2072106151890809341
Anthropic 官方发布推文称,已接到美国商务部通知,解除对 Claude Fable 5 和 Mythos 5 的出口管制。访问将于明天恢复,团队感谢用户的耐心,并感谢所有参与模型重新部署的相关人员。该推文获得 1310 万阅读量和超过 4000 条回复。
HN 热度 917 points | 评论 633 comments | 作者:Pragmata | 23 hours ago #
https://news.ycombinator.com/item?id=48740771
- 商业 AI 实验室存在数据窃取和竞争风险,应转向私有开源 AI
- 开源 AI 虽性能不及前沿模型,但多数场景足够用,且可控性更高
- 依赖第三方前沿模型有生存风险,政府可随时中断服务,必须自控模型
- 商务部解除出口管制以 Anthropic 同意安全合作和数据共享为条件
- 构建可控 AI 成本高,但可通过联邦/合作模式降低负担
- 前沿模型的经济模式可能不可持续,开源难以长期领先
3. 首次,从零构建的细胞实现生长与分裂 (For first time, a cell built from scratch grows and divides) #
科学家们首次成功构建了一个合成细胞,这个细胞结合了比以往具生命特征的属性,证明了在实验室中从无生命材料创造生命或近似生命的可能性。研究团队在一个细胞膜内逐步装入无生命成分,观察到这些分子开始表现出生命的基本特征。这个合成细胞能够生长、复制 DNA 并分裂,展示了细胞周期的基本功能。
尽管该细胞不符合生命的定义,因为它无法在没有持续供应的情况下存活,也没有防御机制或良好的废物处理系统,但这仍是合成生物学家追求数十年的目标 —— 从无生命生成生命的强有力证明。合成生物学家凯特・阿达马拉领导的团队开发了这个细胞,通过在实验室中创造并组装生物分子,利用脂质体(囊泡)作为细胞的基础结构。
阿达马拉的团队模仿了细胞的基本机制,包括 DNA 复制、蛋白质合成等。他们创建了一个合成基因组,并为其提供了进行这些基本生命活动所需的物质。同时,研究团队设计了一个能够吸引脂质泡的膜蛋白,以便这些泡能够与合成细胞结合并释放所需的供应物质。
虽然细胞可以生长和复制 DNA,但细胞分裂仍然是一个难点。以往的研究人员未能成功实现这一过程,因此阿达马拉决定放弃细胞骨架的构思,采用了一种新的方法,使细胞膜的形状弯曲,从而实现细胞分裂。最终,她成功制造出了一个可以分裂的细胞,这一成就被认为是合成生学的重大突破。
研究团队还尝试让合成细胞朝着进化的方向发展,通过对细胞 DNA 的调整,试图创造出更或更快分裂的细胞,从在细胞群体中实现特征的选择。然而,这种变化并非自然选择,而是通过人为方式创造的遗传变异。为了实现真正的进化,阿达马拉的团队需要找到一种能够引入随机突变的酶,以确保细胞可以在其环境中适应并生存。
尽管合成细胞目前仍需依赖外部供给的原材料且尚未达到现代活细胞的自给自足,但这一成就仍是向生命起源探索的一大步。阿达马拉的团队成立了一个名为 “生物性” 的非营利组织,旨在将他们的合成生物学工具共享给全球的研究人员,以促进进一步的研究和发展。
这项研究不仅有助于理解生命的基本需求,还可能为未来开发可再生材料、生物燃料和药物等提供新的思路。阿达马拉的工作为探索生命的起源和生物的未来铺平了道路,进一步证明了 “要理解生命,首先需要构建生命” 的观点。
HN 热度 659 points | 评论 224 comments | 作者:defrost | 9 hours ago #
https://news.ycombinator.com/item?id=48747304
- 一些科学家对研究者 Adamala 的宣传手法表示不满,认为提前将手稿发送给记者是过度反应。
- 论文被拒绝的原因常常存在争议,有时是因为审稿人的主观判断。
- 许多人认为,当前的同行评审制度是繁琐和腐败的,亟需改革。
- 尽管存在不同的观点,但将手稿上传到预印本服务器或提交到其他期刊是正常的应对方式。
- 研究的重大意义是否被普遍认可仍存在争议,记者的报道并不总能反映研究的真实价值。
- 一些科学家对该研究的成功表示赞赏,认为这是一个重要的里程碑。
- 研究领域中的术语定义常常造成争议,不同科学家对术语的理解可能各不相同。
- 发表的过程可以被视为一种对科学质量的把关,而不仅仅是形式上的 “盖章”。
- 对于新兴的研究领域,传统的期刊可能难以适应,因此需要开放的讨论和更宽松的发表环境。
4. 大多数争论只因为 ego 而非 ideas (Most arguments are about ego, not ideas) #
https://wangcong.org/2026-06-30-why-i-stopped-arguing-with-people.html
作者是一位软件工程师,曾热衷于争论技术正确性,但发现即使赢了道理也往往输了人,甚至让对方更固执。他逐渐放弃争论,并总结出几点认识:正确并不总是有益的(引用老子“有无相生”);大多数争论关乎自我而非观点,与自我驱动的人争论只会制造敌人;人类本质上是情感驱动而非理性,逻辑论证无法打动感觉;纠正他人很少真正帮助对方,人们更愿从自身后果中学习;唯一的例外是当对方主动请求帮助时,此时建议才能被接受。与其争论,不如从差异中获益——如果坚信自己正确,就付诸行动让现实证明,而非说服他人。最终只能改变自己,而改变自己的最佳方式是不断向他人寻求反馈并真诚倾听。
HN 热度 639 points | 评论 508 comments | 作者:backlit4034 | 10 hours ago #
https://news.ycombinator.com/item?id=48746445
- 不能以理性说服非理性立场,因为对方可能并非基于理性;立场可能代表价值观,应讨论价值观而非对错
- 写帖子是为了巩固自己的理解,而非说服他人;写作主要为自己,不必发布所有内容
- 写作可以宣泄情绪、欺骗大脑,或留作证据
- 争论的驱动是试图理解某事,写作澄清观点能带来谦卑,意识到问题复杂
- 日记式思考有助于成长,与 AI 辩论设计也能澄清思路
- 问“你想达成什么?”可以促使深入思考
- 有时只能安静接受对方的发泄
- 理性可以改变非理性立场(如宗教),但理性并非单一,且有深层情感因素
- 声称理性脱离宗教的人常是情绪驱动的叛逆,背后有深层故事
5. Claude Science (Claude Science) #
https://claude.com/product/claude-science
Claude Science 是一个面向科学研究的 AI 辅助工作平台,支持在 macOS 和 Linux 上运行。它能够直接分析蛋白质结构、基因组、化学分子等数据,所有结果均可复现并追溯代码。平台内置科学渲染器,可原生查看蛋白质、序列比对、基因组轨道、化学结构等文件,无需额外安装。系统具备自我校验功能,能自动标记错误引用、不可追溯的数据以及图表与代码不匹配的问题。用户可以用自然语言对图表进行迭代修改,AI 将直接编辑生成图表的代码。平台支持在笔记本电脑、本地集群或 GPU 上按需扩展计算资源,管理 Python 和 R 内核,变量和模型可跨会话保持。它还预配置了基因组学、单细胞、蛋白质组学、化学信息学等多个领域的环境,可连接 60 多个科学数据库,并能将分析流程保存为可复用的技能。使用案例包括单细胞 RNA-seq 分析、系统发育进化分析、蛋白质结构建模和化学信息学分子设计。多位研究人员评价该平台能显著加速从原始数据到可发表图表的流程,并发现之前难以识别的问题。
HN 热度 552 points | 评论 171 comments | 作者:lebovic | 1 day ago #
https://news.ycombinator.com/item?id=48735770
- Claude Science 连接了数据库和计算工具(包括高性能计算集群),不仅能做数据科学图表和论文,还能整合湿实验室等更广泛的科研场景。
- 将 AI 直接接入数据源可能面临机构政策、法律和 NIH 等数据存储要求的复杂合规问题,目前难以实现。
- 如果数据存在 Snowflake 中,可以通过其内置 AI(Claude)访问,从而绕开部分合规障碍。
- 该产品不同于简单配置代理技能,它内置了默认配置、可信技能和针对长时间运行会话的抽象(如 HPC 作业完成后唤醒会话),使用更简洁。
- 通过连接真实数据库(如 Crossref、PubMed)并指示 LLM 验证引用,可以减少引用幻觉率,但无法降至零;需要独立的实时验证引擎才能完全消除。
- 幻觉无法完全避免,因此应将自主工作限制在可验证的问题上,并配合审查代理(reviewer agent)进行人工审核。
- 希望未来 Claude Science 能提供更好的可视化(如 threejs + shaders 场景),而不仅仅是传统图表和分子结构。
- 对整合湿实验室和 CRO(合同研究组织)的模式感兴趣,这能解决罕见病研究中研究者注意力瓶颈的问题。
- 适合采用本地低配 LLM 与主 LLM 协作的框架,以优化延迟并处理遗留/小众场景。
- 实际用例:使用该产品分析全基因组测序数据,通过 read-backed phasing 分析解决了某孩子罕见遗传变异的亲本来源问题,几分钟内完成。
6. 2028 年 1 月起 PlayStation 新游戏停止生产实体光盘 (Physical disc production ending in Jan 2028 for new games on PlayStation) #
由于消费趋势转向数字媒体,索尼互动娱乐宣布,自 2028 年 1 月起,所有 PlayStation 主机新游戏将停止生产实体光盘,仅通过 PlayStation Store 和零售商提供数字版。此前已发行的光盘游戏不受影响。此外,同日还公布了 PS3 和 PS Vita 的 PlayStation Store 重要更新。
HN 热度 537 points | 评论 574 comments | 作者:Tiberium | 11 hours ago #
https://news.ycombinator.com/item?id=48745456
- 索尼上周撤销了数百部已购买的电影,提醒大家数字内容只是租赁,并非拥有。
- 索尼在宣布物理光盘停产的同时,关闭了 PS3 和 Vita 商店,消费者被套牢。
- 索尼将过去签约和授权的成本转嫁给消费者,如电影购买可被撤回、PS3 授权密钥因电池问题失效,且无激励去修复旧问题。
- 游戏是奢侈品,消费者本可以走开,但在封闭平台投入大量金钱后很难轻易放弃。
- 从投入数百上千美元的封闭平台走开并非奢侈,这是反竞争和反消费者的行为。
- 游戏机每几年就需要升级,玩家可以转向竞争对手(如 Steam、Valve)或 PC 平台。
- 即使离开,也无法导出 PS5 存档、转移许可、保留奖杯成就,且在线游戏账户锁定在平台上。
- 索尼在 PlayStation 光盘上拥有垄断地位。
- 消费者仍拥有力量(至少在目前),改变需要消费者觉醒。
- PC 游戏可通过 Linux、Proton 运行,且备份方式更自由;Steam 游戏可能仍依赖远程验证,并非完全离线可用。
- Valve 同样拥有类似统治力,但希望有基于 NFT 的去中心化可转移数字购买方案。
- Proton 是开源且大量改进已上游至 Wine,即使 Valve 变坏也无法撤销已有改进。
- DRM-free 文件比 NFT 更实际,NFT 只是账本记录,不解决托管失效问题。
- 通过备份到 LTO 磁带,PC 用户可脱离 Steam 运行游戏,但需确认游戏是否依赖远程激活。
7. Godot 将不再接受 AI 作者的代码贡献 (Godot will no longer accept AI-authored code contributions) #
开源游戏引擎 Godot 近期宣布,将不再接受 AI 生成的代码贡献。这一决定是由于维护团队面临越来越多由 AI 生成的代码提交,导致审核工作变得繁重和令人沮丧。在经过几个月的讨论后,Godot 基金会决定更新贡献政策,明确禁止 AI 撰写的代码、由 AI 代理提交的拉取请求,以及人际沟通中使用的 AI 生成文本。
基金会表示,尽管 Godot 的拉取请求数量激增显示了对该项目的兴趣在上升,但 AI 生成的贡献消耗了维护者的精力,使他们更难以应对原本就已经繁琐的代码审核工作。维护者指出,如果对拉取请求的反馈只是被机器吸收,而没有帮助潜在的未来维护者成长,那么花费时间进行审核的理由就变得难以成立。
为了解决这一问题,Godot 基金会正在努力更新贡献政策,计划引入更严格的措施来限制低质量的贡献,鼓励维护者进行代码审核,培养新贡献者成为未来的维护者。同时,基金会强调,所有的贡献必须来自可以对其代码负责并在出现问题时进行修复的人类。
具体来说,基金会将明确拒绝 AI 生成的代码,并要求贡献者仅将 AI 工具用于 “琐事”,且必须披露其使用情况。此外,基金会还将拒绝人际沟通中使用的 AI 生成文本,认为这是对他人的基本尊重。尽管如此,机器翻译仍然是可以接受的,前提是原始文本是由人类撰写的。
基金会指出,随着 AI 工具的不断变化,他们将持续采取保守的政策,但会根据情况的演变进行重新评估。
HN 热度 523 points | 评论 373 comments | 作者:pjmlp | 15 hours ago #
https://news.ycombinator.com/item?id=48743472
- AI 生成的冗长文字像对人脑的拒绝服务攻击,难以审查
- 政策可能带来两种结果:提交者伪装成人类,或生成简洁有价值的贡献
- 大多数贡献者根本不读政策,尤其是快速 AI PR 的人
- 有了政策,维护者可无争议地直接关闭这类 PR
- 政策主要用途是关闭巨大文字墙 PR 后,有依据应对抗议
- 不需要政策,PR 本来就没有被合并的权利
- AI 前 PR 需大量人类努力,默认应关注;现在零努力 PR 激增且更大
- 政策不是关闭 PR 的必要条件,但有助于平息后续争论
- 是否应得与人们认为应得是两码事,清晰规则能减少无谓争议
- 抗议者可能也是 LLM
- AI 可能足够智能阅读政策,那时可修改政策让其用特定风格写 PR
- AI 让写简洁摘要更容易,现在正应要求高质量的提交
- 很少有人知道如何让 AI 写简洁准确的摘要,AI 只能编造貌似合理的动机
- AI PR 像 Monty Python 式的冗长可笑
- 多年来与初级员工斗争让他们写简洁文档,大多失败
- “非常简洁”指令能帮助 AI 输出更合理的摘要
- 可允许 AI PR,但用另一个 AI 审查拒绝不符合简洁定义的提交
8. Asahi Linux 7.1 进展报告 (Asahi Linux 7.1 Progress Report) #
https://asahilinux.org/2026/06/progress-report-7-1/
Asahi Linux 发布 Linux 7.1 进展报告:修复了 macOS 27 开发者测试版导致的启动问题(需手动运行安装程序或从 Linux 运行修复工具);SMC 固件变更导致电池驱动触发紧急关机,已在 7.0.12 内核中修复;M3 系列设备新增音频输出、CPU 频率切换、big.LITTLE 调度、PCIe、WiFi、蓝牙、NVMe 等支持;提醒用户不要在生产设备上安装开发者测试版。
HN 热度 519 points | 评论 190 comments | 作者:pantalaimon | 13 hours ago #
https://news.ycombinator.com/item?id=48744518
- 担心苹果未来可能引入硬件签名验证固件,从而破坏第三方操作系统。
- I²S 与 I²C 无关,设计简单只传原始 PCM,与 SPI 更接近,两者命名相同是因为同属飞利浦半导体(NXP)。
- 苹果 Silicon 的 PSCI 电源管理接口是未解问题:Linux 需要 PSCI 但苹果没有实现,目前依赖 hack 防止电池消耗,设备树驱动缺少文档,反向工程进展缓慢。
- 苹果平台比 Intel/FSF 推荐的机器更开放,因为有 IOMMU 沙箱隔离协处理器,而 Intel 和 Android 存在无法移除的管理代码及远程更新风险。
- 苹果没有理由关闭 Asahi 项目,M 系列 Mac 有意支持启动任意 OS(通过安全白皮书中的降级安全模式),且保留延迟确保 macOS 主导地位。
- 苹果的引导工具只承认有效的 macOS 安装,这似乎与“支持任意 OS”相矛盾,但安全白皮书确实描述了运行本地签名 OS 的方式。
- 部分安全白皮书指出苹果 M 系列 Mac 可启动第三方操作系统并非漏洞,而是设计功能,但引导流程仍有限制。
- 其他争议:有人认为苹果可能存在只有自己能用的超级管理员后门,但被反驳为缺乏证据。
9. 索尼删除 PlayStation 用户已付费购买的 551 部影片 (Sony Deletes 551 Movies PlayStation Owners Paid For) #
https://reclaimthenet.org/sony-deletes-551-studiocanal-movies-playstation-owners-paid-for
索尼宣布将于 9 月 1 日删除 PlayStation 用户已购买的 551 部 StudioCanal 电影和电视节目,包括《终结者 2》《全面回忆》等。索尼解释为“内容许可协议”到期所致,但未提供退款或补偿。用户点击“购买”后并未真正拥有内容,所有权实际取决于上游合同。文章进一步指出,游戏行业也在削弱实体所有权,例如即将发售的《GTA 6》实体版仅包含下载码,无光盘,无法转售或离线安装。这反映了数字时代所有权正被集中到少数公司控制的服务器和账户中,商店界面上的“购买”一词已失去传统意义。
HN 热度 494 points | 评论 218 comments | 作者:bilsbie | 9 hours ago #
https://news.ycombinator.com/item?id=48747389
- 需要制定数字媒体消费者权利法,强制公司像对待实体购买一样对待数字文件,不能随意收回或禁止使用,并应提供全额补偿。
- 停止杀戮游戏运动正在与欧盟议员合作,推动涵盖所有数字媒体的跨领域立法。
- 只要在一个主要市场通过这样的立法,就能产生重大影响,例如 Steam 的退款政策就是澳大利亚消费者监管诉讼的结果。
- 欧盟议会无法自行提出立法,只能修改,因此是虚假民主。
- 允许公民通过全民公决绕过议会推动立法才是真正民主,且停止杀戮游戏有望在欧盟成为法律。
- 对游戏开发增加监管会增加成本和复杂性,导致投资减少,降低创造风险。
- 监管应视为权衡:更好的公司行为与更少风险承担,问题是收益是否值得成本。
- 大多数监管的代价大于收益,所有监管本质上都是反竞争的,应证明其充分益处,而不是“先做再说”。
- 与其对游戏打补丁,不如全面改革版权法。
- 监管不一定是反竞争的,比如确保产品安全、可靠,能让消费者做出理性选择,或者促进竞争。
- 停止杀戮游戏的目标是允许运行私有服务器,而不是强制开源游戏引擎代码。
- 要求发行商发布游戏依赖中心服务的本地运行版本,或至少提供开发工具。
- 如果公司使用“购买”一词,则应要求在其移除访问权限时退款,否则应改为“租赁”,让消费者明确理解。
10. 任天堂将员工基本工资提高 10% (Nintendo has raised its employees base salary by 10%) #
https://mynintendonews.com/2026/06/26/nintendo-has-raised-its-employees-base-salary-by-10/
任天堂社长古川俊太郎在股东大会上宣布,公司将员工基本工资提高 10%,以留住人才。他表示维持适当水平的薪酬对留住员工很重要,并举例已采取加薪措施,包括将基本工资提高 10%。相关报道提到,任天堂同时提高了新毕业生的起薪,此举是为了在行业竞争中保持优势。
HN 热度 484 points | 评论 302 comments | 作者:tk | 12 hours ago #
https://news.ycombinator.com/item?id=48745113
- 日本工资长期停滞,但物价和房租相对稳定,日元疲软使出口更有竞争力。
- 日本近年通胀 2-3%,零食涨价道歉只是营销手段,实际涨价并不罕见。
- 东京等大城市房租占收入比例较低,但酒店价格因旅游热潮大幅上涨。
- 日本住房因政府鼓励新建、地震法规和文化视其为消耗品而贬值,二手房有污名。
- 美国快餐 Popeyes 的价格存在争议,有人抱怨家庭餐昂贵,有人用具体菜单价格反驳认为定价合理。
- 与美国/欧洲相比,日本住房更实惠,尤其非中心区月租仅 200-250 美元,但通勤时间可能很长。
- 东京建房数量远超加州和英国,供给充足且保持可负担性。
Hacker News 精彩评论及翻译 #
Department of Commerce has lifted export controls … #
https://news.ycombinator.com/item?id=48741070
The damage is done. You cannot build a business critical function on top of American SOTA frontier model. Especially not with the current crew in charge.
Now whether AI tech is in the same league as say Nuclear tech and therefore by any reasonable standard should be regulated is a different question.
We hit the slippery slope on a random day in June 2026 and there is no putting the genie back in the bottle. Any exec or manager that puts load bearing weight on top of Anthropic/OpenAI/Google/AmericanCorp frontier model deserves the stress.
drevil-v2
损害已经造成。你不能在美式顶尖前沿模型之上搭建业务关键功能,尤其是在当前这批人掌舵的情况下。
至于AI技术是否与核技术属于同一级别、因此按合理标准理应受到监管,那是另一个问题。
我们在2026年6月的某个普通日子滑下了滑坡,再也无法把精灵塞回瓶子里。任何将重要承载压注在Anthropic/OpenAI/Google/美国公司前沿模型之上的高管或经理,活该承受压力。
Most arguments are about ego, not ideas #
https://news.ycombinator.com/item?id=48746587
They never mention they could’ve been wrong. The author assumes they’re always right, but that trying to convince others and argue them to their right side is not valuable.
How about: maybe I’m wrong and I didn’t let their ideas influence me. How about: even when I think I’m right, it will be better to calmly kindly discuss, listening as much as talking, not debating or arguing or speaking over them, but attempting to see new perspectives.
I could well be wrong about this :)
Dumblydorr
他们从不提自己可能错了。作者假设自己永远正确,但认为试图说服他人、争论到对方认同自己并不值得。
不如这样想:也许我错了,我没有让他们的想法影响我。或者这样:即便我认为自己是对的,更好的做法是冷静友善地讨论,倾听与表达并重,而不是争辩、反驳或打断对方,而是尝试看到新的视角。
我对此也可能错了 :)
Godot will no longer accept AI-authored code contr… #
https://news.ycombinator.com/item?id=48743798
It’s a fair policy. Getting those verbose, AI-authored walls of text is very annoying, especially when you’re expected to thoroughly review it. It’s like a denial-of-service attack on the human mind. I can only imagine how frustrating this can get in open projects that get a lot of contributions.
However, I don’t think this will discourage AI-based coding at all. In fact, I see two potential outcomes of these policies:
-
Negative : Submitters just add stylistic markers to make their accounts and output seem human-generated. This is like syntactic sugar: the core content and the size of contributions stay the same, but the style gets quirkier.
-
Positive : Submitters actually provide to-the-point, no-bullshit commits and comments - “here’s the code, here’s why I made that change, here are the effects of that change”. Even if AI-generated, these small contributions may become much easier to verify & validate. We may even see some standardization in terms of what qualifies as an appropriately sized contribution, what requires more thorough review (e.g., adding unverified dependencies), etc.
I personally wouldn’t care if it was AI-generated or not, as long as the content fit the latter category.
TomasBM
这是一项合理的政策。那些冗长、由AI生成的文本墙非常烦人,尤其是当你要仔细审查它们时。这就像是对人类思维的拒绝服务攻击。我无法想象在那些接受大量贡献的开源项目中,这种情况会有多令人沮丧。
不过,我认为这完全不会阻碍基于AI的编程。实际上,我看到这些政策可能产生两种结果:
-
负面:提交者只是添加风格化标记,让他们的账户和输出看起来像是人类生成的。这就像语法糖:核心内容和贡献规模保持不变,但风格变得更古怪。
-
正面:提交者实际上提供直击要点、不废话的提交和评论——“这是代码,这是我做这个改动的原因,这是改动带来的影响”。即使是由AI生成的,这些小贡献也可能变得更容易验证和确认。我们甚至可能看到一些标准化,比如什么才算大小合适的贡献,什么需要更彻底的审查(例如,添加未经验证的依赖项等)。
就我个人而言,只要内容符合后者,我根本不在乎它是不是AI生成的。
Claude Code is steganographically marking requests #
https://news.ycombinator.com/item?id=48735460
Value judgment aside: I am a bit surprised at how sloppily they did this. I think they could’ve achieved the same effect while decreasing the odds of detection via reverse engineering.
(This field is known as “underhanded code”, coined by the Underhanded C contest: https://www.underhanded-c.org. It’s a little-known “art”; little-known for probably self-explanatory reasons. There are much cleverer ways of achieving objectives like this. One obviously being you can move more out of the client and into the server, but the other being you can write plausibly deniable client code in a much more benign-seeming way than this. Some of what they added can only be done on the client, but I think some could’ve been moved, and the client-required parts could’ve been done more subtly and credibly.)
It’s possible they knew the JS bundle gets so heavily scrutinized that it’d eventually get spotted and reported on regardless so they didn’t bother doing something more subtle and duplicitous. But still seems slightly lazy.
meowface
抛开价值判断不谈:我有点惊讶他们做得如此草率。我认为他们本可以在降低被逆向工程检测到的概率的同时达到同样的效果。
(这个领域被称为"隐晦代码"(underhanded code),由Underhanded C竞赛提出:https://www.underhanded-c.org。这是一门鲜为人知的"艺术";之所以鲜为人知,原因大概不言自明。实现这类目标有更巧妙的方法。其中之一显然是将更多内容从客户端转移到服务器端,但另一种方法是编写看似合理、实际上更无害的客户端代码。他们添加的某些功能只能在客户端实现,但我觉得其中一部分本可以转移,而必须在客户端实现的部分也能做得更隐蔽、更可信。)
有可能他们知道JS代码包会受到如此严格的审查,无论如何最终都会被发现并曝光,所以也懒得再搞更隐蔽、更欺骗性的手法了。但即便如此,还是有些敷衍。
Nintendo has raised its employees base salary by 1… #
https://news.ycombinator.com/item?id=48746536
In Japan, there’s a big issue when a snack raises its price 2 cents
No, there really isn’t. You’re looking at one company that “apologized” as a marketing play but outside of that prices have been increasing with no fanfare for years now. The annual inflation rate has been 2-3% for the past 4 years. It’s a lot less interesting to write a news article about that though.
https://www.stat.go.jp/english/data/cpi/158c.html
Anon1096
在日本,零食涨价2分钱可是个大问题
不,真没什么大不了的。你看到的只是一家公司把“道歉”当营销噱头,但除此之外,这些年物价一直在悄然上涨。过去四年里,年通胀率一直是2-3%。不过写这种新闻文章可就没那么有趣了。
https://www.stat.go.jp/english/data/cpi/158c.html
Most arguments are about ego, not ideas #
https://news.ycombinator.com/item?id=48746681
The point being made is to pick your battles.
The author’s point is that, even if you are correct 100% of the time, fighting every battle is toxic to yourself and everyone around you.
They are saying to look past the fact that you might be right and consider that it’s not worth the effort anyway.
Now, I will attempt to put down my phone and not respond to any replies I get to the contrary.
Sweating intensifies…
MichaelApproved
核心观点是要学会选择自己的战场。
作者的意思是,即便你百分之百正确,每一场仗都去争个对错,对自己和身边的人都是一种消耗。
他们想说的是,不要执着于自己可能是对的这一点,而是要考虑到这些事根本不值得费心。
现在,我要试着放下手机,不去回复任何反对我的评论了。
手心开始冒汗……
Claude Code is steganographically marking requests #
https://news.ycombinator.com/item?id=48737018
The conclusion of this blog post is a bit hysterical. The intent of this steg is excruciatingly clear (identifying usage by Chinese firms that may be conducting model distillation). It’s unclear on how this “punishes normal developers” in any shape or form.
mrshadowgoose
这篇博文的结论有点歇斯底里。这种隐写术的意图极其明显(识别可能在进行模型蒸馏的中国公司)。不清楚这如何以任何形式“惩罚正常开发者”。
Physical disc production ending in Jan 2028 for ne… #
https://news.ycombinator.com/item?id=48751390
Great buildup on Sony’s side to gain trust in this move in the gaming community ahead of this announcement when just this week they again pulled hundreds of “purchased” movies from customer’s libraries without refund, reminding everyone that digital content is rented, not owned.
fcsp
索尼在游戏社区中为此次公告建立信任的努力相当不错,然而就在本周,他们再次从用户库中撤回了数百部“已购买”的电影且不予退款,这提醒了所有人:数字内容只是租赁,而非拥有。
Physical disc production ending in Jan 2028 for ne… #
https://news.ycombinator.com/item?id=48746385
To illustrate why this is stupid, I will furnish two links to purchase Dark Souls 3 (PS4, 2016)
Ebay, to buy: $11 + shipping[0]
PS Store, to rent: $60[1]
[0] https://www.ebay.com/itm/298370753624
[1] https://www.playstation.com/en-us/games/dark-souls-iii/
lelandfe
为了说明这有多愚蠢,我将提供两个链接来购买《黑暗之魂3》(PS4,2016)。eBay,购买:11美元+运费[0];PS商店,租用:60美元[1]。[0] https://www.ebay.com/itm/298370753624 [1] https://www.playstation.com/en-us/games/dark-souls-iii/
Claude Code is steganographically marking requests #
https://news.ycombinator.com/item?id=48738864
First its the “Chinese” then it will be people using “cyber” capabilities, or “jailbreaking” or “going against Dario” or any other thing they find “objectionable”.
kiproping
先是“中国人”,然后就会是那些使用“网络”能力、或“越狱”、或“反对达里奥”、或任何他们觉得“有问题”的人。
Sony Deletes 551 Movies PlayStation Owners Paid Fo… #
https://news.ycombinator.com/item?id=48747939
It should be illegal to have others purchase what you as a company only licensed and therefore aren’t legally allowed to sell.
eska
公司只是获得许可而本身无权出售的东西,却让其他人购买,这应该是违法的。
Nano Banana 2 Lite #
https://news.ycombinator.com/item?id=48736246
I think that should be illegal and misrepresenting. Lots of gray area with AI usage.
psygn89
我认为那应该是非法的且具有误导性。人工智能的使用存在很多灰色地带。
Claude Science #
https://news.ycombinator.com/item?id=48736916
I built one of the connected tools included in this launch (the Biomni HPC [1]), and I have spent an inordinate amount of my life working on this problem. (I also worked at Anthropic, but not on this product.)
As other comments have pointed out, this is for data science – but it’s capable of more than making plots and writing papers [2]. It has integrations with many databases and computational tools, including a researcher’s institutional cluster.
That alone is valuable. I founded a startup after struggling with this problem at a bio startup; integrating these tools and databases is hard and time consuming. If the only outcome of this product is that great APIs are built for LLMs, it will be a massive positive impact. Many databases used in computational genomics are still only accessible through FTP!
LLMs are particularly good at navigating these tools and databases. It’s often very specialized, but straightforward, work that benefits from in-context skills. Seeing an early glimpse of my former customers – bioinformaticians – using LLMs to solve this problem is what led me to join Anthropic in 2024.
Also, this pattern isn’t fundamentally constrained to data science: you can also integrate with a wet lab or a CRO for some kinds of science. This is what I’m spending my time on now.
This type of science doesn’t solve everything, but it’s useful in some niches. For example, progress on many rare diseases is bottlenecked by researcher attention rather than a fundamental breakthrough.
[1] https://x.com/phylo_bio/article/2029233694775624096
[2] In comparison, OpenAI’s science product – Prism – was effectively a LaTeX editor they acquired with Crixet.
lebovic
我构建了本次发布中包含的一个连接工具(Biomni HPC [1]),并且我在这个问题上投入了过多的时间。(我也曾在Anthropic工作,但并非参与这个产品。)
正如其他评论所指出的,这适用于数据科学——但它能做到的远不止绘制图表和撰写论文[2]。它集成了许多数据库和计算工具,包括研究人员的机构集群。
仅这一点就很有价值。我在一家生物初创公司苦苦应对这个问题后创立了一家初创公司;集成这些工具和数据库既困难又耗时。如果这个产品唯一的成果是为LLM构建了出色的API,那也将产生巨大的积极影响。计算基因组学中使用的许多数据库仍然只能通过FTP访问!
LLM特别擅长驾驭这些工具和数据库。这通常是高度专业化但直接明了的工作,受益于上下文技能。看到我以前的客户——生物信息学家——使用LLM解决这个问题的早期迹象,正是促使我在2024年加入Anthropic的原因。
此外,这种模式并不局限于数据科学:对于某些类型的科学,你还可以与湿实验室或CRO进行集成。这就是我现在正在投入时间的事情。
这种类型的科学并不能解决所有问题,但在某些细分领域很有用。例如,许多罕见病的进展瓶颈在于研究人员的注意力,而非根本性的突破。
[1] https://x.com/phylo_bio/article/2029233694775624096
[2] 相比之下,OpenAI的科学产品——Prism——实际上是一个他们通过收购Crixet获得的LaTeX编辑器。
Sony Deletes 551 Movies PlayStation Owners Paid Fo… #
https://news.ycombinator.com/item?id=48749022
We need some kind of modern equivalent to the old proposed Digital Media Consumer’s Rights Act but which protects people’s rights to digital media they buy. These should never be sold and then taken away with no compensation like this. We need a law that forces companies to treat digital files the same as a physical purchase. They can’t take it away and have to allow people to resell and loan out as well. And in cases of online games where you can buy something, and then later they can ban you which deprives you of being able to use what you bought, that should come with requirements that the company must provide full compensation of the purchase price. It should also ban EULA’s and TOS from defining these things as only licenses even though they are structured as a purchase in a store.
I know it’ll never happen with the people we have in government these days, and the anti-consumer organizations, like the ESA, that are out there now claiming things like running private servers for Minecraft is illegal and piracy. (Yes, they really said that. Despite the fact that Minecraft has always provided the server and allowed this for 15+ years)
nullsmack
我们需要某种类似于早先提出的《数字媒体消费者权利法案》的现代版本,但该法案应保护人们对自己所购数字媒体的权利。这些数字媒体不应该像这样被出售后又被无偿收回。我们需要一部法律,强制企业将数字文件视为与实体购买相同的对待。企业不能随意收回,还必须允许人们转售和出借。对于在线游戏中的购买行为(例如你购买了某样东西,但后来他们可以封禁你的账号,导致你无法使用所购内容),应要求企业必须全额退还购买价格。此外,法律还应禁止最终用户许可协议和服务条款将这些交易定义为仅限许可,即使它们在商店中是以购买形式呈现的。
我知道以当今的政府人员以及像娱乐软件协会(ESA)这类反消费者组织的存在,这永远无法实现——他们甚至声称运行《我的世界》私服是非法的和盗版行为。(是的,他们确实说过这话。尽管《我的世界》一直提供服务器支持并允许这样做超过15年。)
Most arguments are about ego, not ideas #
https://news.ycombinator.com/item?id=48746919
Here’s a simple idea: You can’t reason someone out of a position they didn’t reason themselves into.
And three interpretations to consider:
0: The default: That person is irrationally attached to being wrong. Best to walk away, argumentation will be futile, and I have a life to lead.
1: Whoa! Sometimes that person is me.
2: If they didn’t reason themselves into it, how did they get into it? What if their position represents their values , not some perfectly architected strategy for maximizing some hypothetical measure of rightness? In that case, if I wish to discuss it with them, I should be talking about their values and my values and where they intersect, rather than arguing right and wrong?
I have personally found all three of the above useful at one point or anther.
a4isms
这是一个简单的想法:你无法用理性说服一个并非通过理性得出其立场的人。
以及三种解读供参考:
0:默认情况——那个人非理性地固执于错误。最好走开,争论毫无意义,而我有自己的生活要过。
1:哇!有时候那个人是我自己。
2:如果他们不是通过理性得出立场,那他们是怎么得出的?如果他们的立场代表的是他们的价值观,而非某种为了最大化某个假想的正确性而精心设计的策略呢?这种情况下,若我想与他们讨论,我是否应该谈谈彼此的价值观及其交集,而不是争论对错?
我个人发现以上三种解读在不同时刻都各有裨益。
Knoppix #
https://news.ycombinator.com/item?id=48736366
Oh man, fond memories.
I remember being very interested in programming in middle/high school, but all the environments in our school computer lab had windows (this was in India), and I think at that time (maybe 2001-2003) I didn’t even know there were other operating systems.
Our school was participating in something called International Cyber Olympiad, and of course I gave the eligibility exam.
They sent all students who passed a Knoppix Live CD to prepare for the actual competition. We did not have a PC at home until a couple of years later, but I used that CD in any PC I could find anywhere - the school computer lab, the school library computers, and my dad’s office computers. It was my first experience with a Linux system (and I found it awesome). Also my first experience with gcc instead of borland c++.
srijan4
哦,满满的回忆。
记得在初中/高中时,我对编程特别感兴趣,但学校机房里所有的电脑装的都是Windows(当时在印度),而且那时(大概是2001-2003年)我甚至不知道还有其他操作系统。
我们学校参加了一个叫“国际网络奥林匹克”的活动,我当然也参加了选拔考试。
所有通过考试的学生都收到了一张Knoppix Live CD,用来准备正式比赛。我家直到几年后才有电脑,但我在任何能找到的电脑上都用过那张CD——学校机房、学校图书馆的电脑,还有我爸办公室的电脑。那是我第一次接触Linux系统(感觉超棒),也是第一次用gcc代替Borland C++。
Leanstral 1.5 #
https://news.ycombinator.com/item?id=48742312
Got curious, sign up, add money to account, try to use. Can’t, it’s a labs model. Fine, let’s enable labs. Can’t, unspecified error. Fine, lets contact customer support as instructed, can’t no customer support, just a half-assed FAQ, that seems vibe-coded and searched poorly, totally irrelevant answers coming up for all queries tried. Then it hit me:
If AI makes good customer support, then why does no AI company use theirs to provide customer support?
Grimblewald
出于好奇,我注册了账号、充值、尝试使用。结果不行,这是个实验室模型。好吧,那我就启用实验室功能。又不行,显示未指明的错误。行吧,按提示联系客服,结果根本联系不上,只有个半吊子的常见问题解答,感觉像是用AI胡乱生成的,搜索效果也很差,所有问题都搜出完全不相关的答案。这时我突然意识到:
既然AI能做好客服,那为什么没有一家AI公司用自家的AI来提供客服呢?
Claude Code is steganographically marking requests #
https://news.ycombinator.com/item?id=48739112
From my understanding, distilling the model with another model is not illegal per se. Also, the output of the LLM is public domain by law, too.
So, why all this “effort” to protect the model? This is a free market, and moving fast and breaking things is the norm.
If they are so adamant on protecting their IP, maybe they can start by respecting others’ IP, so we can start talking about ethics, equality and playing fair.
bayindirh
从我的理解来看,用另一个模型蒸馏模型本身并不违法。而且,LLM的输出在法律上属于公共领域。那么,为什么要这么“努力”保护模型呢?这是一个自由市场,快速行动并打破常规是常态。如果他们如此坚决地保护自己的知识产权,也许他们可以先从尊重他人的知识产权开始,这样我们才能开始谈论道德、平等和公平竞争。