2025-08-25 Hacker News Top Stories #
- 德国ISP Telefonica篡改DNS设置,封锁了作者的网站,降低了透明度,使追踪封锁行为更加困难。
- Claude Code凭借其简洁的架构、高效的用户体验和优化的提示设计,成为了一款备受好评的AI工具。
- Comet AI浏览器因安全漏洞可能导致银行账户被盗,暴露了AI浏览器在跨标签页数据访问和模型对齐方面的安全隐患。
- Geoffrey Huntley分享了如何用300行代码构建编码代理,认为掌握代理创建技能将成为2025年的基本能力。
- 中断工作后需要23分钟15秒才能恢复的说法缺乏确切来源,可能源于Gloria Mark的访谈但无印刷证据。
- Valve的员工手册展示了其独特的扁平化组织文化,但其真实性和非层级结构的潜在问题引发了广泛讨论。
- 美国政府对可再生能源的打压可能导致电力短缺和电价上涨,高管警告这将损害电网稳定性。
- 使用LLMs大幅缩短了游戏开发时间,从3个月到3天,展示了AI在编码中的巨大潜力。
- 通过精心设计的提示和计划文档,Claude Code被成功转变为设计伙伴,提升了开发效率和一致性。
- 投资快CPU值得,因为其长期成本效益高于云服务,能显著提升开发者生产力。
A German ISP changed their DNS to block my website #
https://lina.sh/blog/telefonica-sabotages-me
德国一家大型互联网服务提供商(ISP)篡改了他们的 DNS 设置,特别是在作者揭露了他们所属的一个组织之后。这个组织名为 Clearingstelle Urheberrecht im Internet(CUII),是一个私人组织,负责决定哪些网站应该被封锁,而没有法官和透明度,只有 ISP 和主要版权持有者决定公众能看到什么。
作者创建了一个名为 cuiiliste.de 的网站,用来查找被封锁的域名,因为 CUII 拒绝公开这样的名单。最近,Netzpolitik.org 发表了一篇文章,基于作者收集的信息,揭露了 CUII 的最新失误:他们封锁了一些已经不再存在的域名。过去,通过询问 ISP 的 DNS 服务器(互联网的电话簿)来检查一个网站是否被 CUII 封锁是很容易的。如果返回一个 CNAME 到 notice.cuii.info,就意味着该网站被封锁了。然而,CUII 不喜欢这种容易被检查的方式,他们想要保持名单的秘密。几个月前,Telekom、1&1 和 Vodafone 等 ISP 停止使用这种响应,开始假装被封锁的网站根本不存在。
Telefonica(o2 的母公司,德国第四大 ISP)似乎没有收到这个通知,他们仍然在 DNS 响应中使用 notice.cuii.info。在 cuiiliste.de 上,任何人都可以输入一个域名,查看它是否被 CUII 封锁,以及具体是哪些 ISP 封锁的。Telefonica 修改了他们的 DNS 服务器,特别指出 blau-sicherheit.info 被 CUII 封锁。有趣的是,Telefonica 似乎拥有这个域名,它是他们的一个品牌,而且这个域名并不是一个盗版网站,而是一个测试域名。作者的工具因为它被 Telefonica 的 DNS 服务器标记为封锁而将其标记为封锁。
Telefonica 封锁了自己的域名,然后有人从 Telefonica 的网络访问作者的网站,检查是否检测到这一点。作者确实检测到了这一点。随后,Telefonica 修改了他们的封锁方式,特别是针对作者的网站。在这次可疑的查询后两小时,作者收到了大量的通知,他的程序认为 CUII 突然解封了数百个域名。原因是 Telefonica 改变了他们的 DNS 服务器,停止将被封锁的域名重定向到 notice.cuii.info,现在他们假装域名根本不存在。这导致作者不得不花整个周五下午来修复这个问题,现在一切又恢复正常了。
修复工作虽然完成了,但没有 notice.cuii.info 重定向,确认一个封锁是否真的是 CUII 所为变得更加困难。有时 ISP 会因为其他原因封锁网站,比如恐怖主义内容。作者尝试通过与已知非 CUII 封锁的域名列表进行交叉检查来补偿这一点。这种时机上的巧合非常可疑。在 Netzpolitik 的文章揭露 CUII 封锁不存在的域名之后,他们使得追踪他们的错误变得更加困难。无论意图如何,结果都是一样的:透明度降低,监督变得更加困难。这对 CUII 有利,但对公众不利。
HN 热度 705 points | 评论 356 comments | 作者:shaunpud | 13 hours ago #
https://news.ycombinator.com/item?id=45003033
- CUII(德国版权清除中心)声称他们执行的是法院命令,但有人质疑他们可能也在封锁其他网站。
- CUII 以前会基于“类似先例”封锁网站,即使没有法院命令或待定命令,后来因监管机构批评而改为只执行法院命令的封锁。
- 有人提到 CUII 网站页面已经更新,现在只协调 ISP 之间的封锁行为,且是在法院命令之后。
- 有人怀疑 CUII 是否真的放弃了封锁,还是只是声称放弃了以便在不被人发现的情况下继续封锁。
- 有人认为 CUII 会继续封锁他们一直在封锁的网站类型,并在法院命令下增加新的网站。
- 有人指出,尽管 CUII 被指控过度封锁,但他们只是在封锁已经被其他方式取缔的域名。
- 有人提到西方传统上通过版权权利进行审查,如果是为了金钱和商业目的,则不被视为审查。
- 有人提到现在美国通过强制和拒绝(如果不与政府立场一致,在美国公共部门工作或旅行到美国将遇到困难)推动自我审查,而欧洲则寻找其他审查方式。
What makes Claude Code so damn good #
https://minusx.ai/blog/decoding-claude-code/
Claude Code 是一款令人愉悦的人工智能代理/工作流程,它通过减少对控制的干扰,让用户感到满意。Claude Code 拥有足够的自主性来执行有趣的任务,同时不会像其他工具那样引起控制上的不适。大多数工作都是由新的 Claude 4 模型完成的,特别是交错思考。与 Cursor 或 Github Copilot 代理相比,即使使用相同的底层模型,Claude Code 也更不令人烦恼。
Claude Code 的成功在于它对大型语言模型(LLM)的优势和劣势有着深刻的理解。它的提示和工具弥补了模型的不足,并帮助它在其擅长的领域发光发热。控制循环非常简单,易于跟踪和调试。MinusX 从 Claude Code 推出时就开始使用,并编写了一个记录器来拦截和记录所有网络请求,以便深入分析。
要构建类似 Claude Code 的代理,关键是保持简单。LLM 本身就难以调试和评估,任何额外的复杂性都会使调试变得更加困难。因此,应避免多代理、代理交接或复杂的 RAG 搜索算法等复杂结构,保持一切在一个文件中,避免过多的样板代码,并至少几次彻底清除它们。
Claude Code 的主要特点包括:
- 控制循环:保持一个主循环和一个消息历史。
- 提示:使用 claude.md 模式协作并记住用户偏好,使用特殊的 XML 标签、Markdown 和大量示例。
- 工具:LLM 搜索优于基于 RAG 的搜索,设计高水平和低水平工具,并让代理管理自己的待办事项列表。
- 可操纵性:调整语气和风格,强调重要性,编写算法,并提供启发式和示例。
Claude Code 在每个环节都选择了架构简单性,例如一个主循环、简单的搜索、简单的待办事项列表等。抵制过度工程化的冲动,为模型构建良好的框架,让它发挥作用。这是否与端到端自动驾驶的教训相似?这是一个痛苦的教训。
HN 热度 435 points | 评论 284 comments | 作者:samuelstros | 1 day ago #
https://news.ycombinator.com/item?id=44998295
- Claude Code 文档重复,没有展示其优于其他工具的地方
- 认为文章是针对那些主观上认为 Claude Code 最好的读者
- 作者回应称文章主要面向已经广泛使用并认为 Claude Code 更好的用户
- 用户体验认为 Claude Code 除了在终端运行外,并不比其他工具更好
- Claude Code 允许查看思考过程和规划,用户可以及时纠正错误路径
- Cursor 也显示“思考”过程,但不如 Claude Code 直观
- VScode 现在也支持类似的交互模式
- Opus 在代码生成方面优于其他工具
- Anthropic 的模型在 SQL 方面不如 Gemini 2.5 pro 可靠
- Codex-CLI + gpt-5 的代码质量看起来不错
- 文章讨论的是模型如何被工具使用,而非模型本身
- Gemini 2.5 pro 在解决困难问题上优于 Opus
- 可以使用 Opus 在 Cursor 或其他工具中
- 标题中的“这么棒”暗示了与其他工具的比较
- 有人提到 Claude Code 和 Cursor 的区别在于一个是命令行工具,另一个是 IDE
- 存在 Cursor Agent CLI,类似于 CC 的 TUI
- 所有公司都会在模型上添加自己的提示和提示,体验完全不同
- 有开源工具可以帮助理解 Claude Code 的工作原理
- 推荐查看 Claude Trace 来了解 Claude Code 的工作方式
- 有开源替代品 OpenHands CLI
- Anthropics 的 Claude-code 仓库用于问题跟踪和示例钩子,不包含代码
- 有人提供了一个链接,但该链接已被 DMCA 下架
Comet AI browser can get prompt injected from any site, drain your bank account #
https://twitter.com/zack_overflow/status/1959308058200551721
twitter 网友发帖子,截图展示了 AI 浏览器巨大的安全问题:
这就是我为什么不用 AI 浏览器。
你只要一边刷 Reddit 一边“末日滚动”,就可能被注入提示词,然后眼睁睁看着自己的银行账户被掏空
HN 热度 435 points | 评论 159 comments | 作者:helloplanets | 8 hours ago #
https://news.ycombinator.com/item?id=45004846
- 浏览器中的 LLM 可以查看跨标签页的数据,是极度危险的“致命组合”。
- 依赖模型对齐和内置防护是不够的,因为这些只是统计上的预防措施,不能保证绝对安全。
- 安全性不应基于概率假设,而应假设攻击者输入是最坏的情况。
- 通过减少代理权限来提高安全性,但攻击者仍可能通过控制的图像 URL 泄露数据。
- 安全模型不应假设 AI 模型不会“犯错”,它有随机数生成器,会偶尔做出错误决策。
- 任何安全方法都是统计性的,因为现实世界中总会有编译器错误、运行时错误等风险。
- 尽管存在风险,但通过确定性方法至少尝试将错误概率降至零,而不是依赖模型对齐。
- 每个系统提示都被泄露了,没有“物理”屏障就无法提供安全保证。
- 如果 LLM 有用户控制的输入并访问两个域,它永远不会安全,直到对齐变得完美,这目前看来没有希望实现。
- LLM 的基本设计使其在这方面根本上不安全,就像编程语言故意执行字符串类型中存储的值一样。
- 如果我们用同样的标准考虑“人类使用银行网站”,那么我们根本就不会有在线银行。
- 即使人类也不完美,容易上当受骗,但我们不应该故意构建额外的攻击机制。
- 我们应该继续尝试使用 LLM 和 AI,即使进化过程中充满了失败的实验。
- 应该鼓励不了解风险的人不要使用这样的浏览器,了解风险的人不应该在使用这些浏览器时使用金融工具。
How to build a coding agent #
Geoffrey Huntley 在其个人网站上分享了关于如何构建编码代理(coding agent)的免费工作坊信息。这个工作坊旨在教授参与者如何创建自己的编码代理,类似于 Roo code、Cline、Amp、Cursor、Windsurf 或 OpenCode 等工具。他强调,了解如何构建编码代理对于个人发展至关重要,因为它能帮助人们从 AI 的消费者转变为能够使用 AI 自动化任务的生产者。
Huntley 提到,构建编码代理并不难,仅需 300 行代码循环运行 LLM(大型语言模型)令牌。他将在工作坊中现场演示如何构建一个编码代理,并解释其基本原理。他认为,到了 2025 年,与 AI 协同工作已成为常态,因此,通过让代理在演讲期间构建另一个代理,来展示这一点是非常合适的。
他强调,构建编码代理的知识能够转变人们的角色,从 AI 的消费者变为能够自动化任务的 AI 生产者。在技术行业,不断学习新事物是必要的。他提到,2024 年,了解主键(primary key)是基本要求,而到了 2025 年,了解如何创建代理成为了基本技能,雇主在招聘时会寻找具备这种能力的人。
Huntley 还提到,雇主现在寻求能够自动化组织内部任务的个人。他将在 Web Directions Melbourne 的 AI 闭幕演讲中深入讨论这一点。他指出,任何与 AI 相关的职业中断或失业都不是 AI 本身的问题,而是个人发展和自我投资不足的结果。如果同事们在使用多个代理、在会议期间后台运行,而你却没有参与,那么自然会落后。
他提到,技术行业的传送带不断前进,如果作为 2025 年的 DevOps 工程师没有 AWS 或 GCP 的经验,就业市场将会非常艰难。他强调,构建编码代理非常简单,但其对职业的破坏性影响却被大多数人忽视。
Huntley 介绍了一些构建编码代理的关键概念,包括不是所有的 LLM 都是代理性的,不同的模型有不同的特点,如高安全性、低安全性、预言机或代理性。他将这些行为映射到一个象限中,并解释了不同模型的适用场景。例如,Grok 是一个低安全性模型,适合安全研究;Anthropic 或 OpenAI 是高安全性模型,适合需要伦理对齐的场景;预言机适合总结任务或需要高水平思考的场景;而像 Anthropic 的 Claude Sonnet 这样的模型则更像是一个数字松鼠,偏向于执行工具调用,而不是深入思考。
HN 热度 402 points | 评论 111 comments | 作者:ghuntley | 20 hours ago #
https://news.ycombinator.com/item?id=45001051
- Princeton SWE-bench 团队用约 100 行代码构建了一个在 SWE-bench 上表现不错的代理。
- 整个代理运行依赖于特定的提示。
- 需要大约 120 行的默认提示。
- 理论上不可能的事情如果只基于基础理论则无法完成,但开放思维则一切皆有可能。
- 很多人认为大型语言模型(LLM)“认为”自己不能做某事,但实际上它们选择了一些明显无效的路径。
- 通过不断输入需求,即使没有时间机器,革命也会在所有时间线上发生。
- 一个有用的提示片段可以帮助人们摆脱调试循环。
- 这个代理不仅仅适用于问题修复,功能也可以视为尚未完成的问题。
- 在文件中完全自包含的问题很容易用 LLM 编辑,但在代码库中则不同。
- Lumpers 和 Splitters 的概念被提及。
- 缺乏工具是一个问题,大多数代码是关于代理框架的,而不是特定于 SWE 的。
- 缺乏工具是 mini-swe-agent 的一个特点,可以与任何大小的 LLM 一起运行。
- 正确的工具可以让小型模型比无指向的工具表现得更好。
- mini-swe-agent 作为一个学术工具,可以轻松测试,展示简单想法的力量。
- 作者也在 Amp 工作。
- 这些幻灯片是会议工作坊的幻灯片,文字是演讲的听写。
- 将幻灯片和文字结合的方式通常效果很好,但这次内容太少。
- 文章作者可能从 AI 和代理的成功中获益。
- 工具使用背后的工作方式是一个问题,模型 API 如何将模型响应转化为不同的 API 响应尚不清楚。
The cost of interrupted work (2023) #
https://blog.oberien.de/2023/11/05/23-minutes-15-seconds.html
这篇文章探讨了广为流传的“中断工作后需要 23 分钟 15 秒才能恢复”的说法的来源。作者在尝试向同事引用这一事实时,发现很难找到确切的出处。文章首先提到,大多数提及这一数字的文章都指向了一篇名为《The Cost of Interrupted Work: More Speed and Stress》的论文,该论文研究了中断对长期任务的不同影响。然而,该研究发现,在中断存在的情况下,人们在原始任务上花费的时间实际上更少,尽管压力更大,但论文并未提及恢复时间。作者继续查找其他相关论文,发现有的研究提到了中断解决到恢复原始任务所需的时间是 11 到 16 分钟,但没有进一步研究恢复期。其他论文则关注任务在同一天内恢复的概率,而没有提到具体的恢复时间。
在搜索过程中,作者还查阅了 23 篇博客文章,发现其中 9 篇错误地引用了论文,2 篇正确引用了论文的实际结果,9 篇直接或间接引用了 Gloria Mark(原论文的作者)的三次访谈,她在访谈中提到了 23 分钟 15 秒的恢复时间。还有 2 篇文章引用了《华尔街日报》,该报直接引用了 Gloria Mark 的 23 分钟 15 秒的说法。最终,作者得出结论,23 分钟 15 秒的说法多次出现在 Gloria Mark 的访谈中,但没有找到任何印刷的原始来源。作者呼吁如果有人知道这一数字最初出现在哪个论文或研究中,请告知。文章最后提供了一个参考图和所有提及的文章和论文的链接列表。
HN 热度 260 points | 评论 195 comments | 作者:vaporwave | 1 day ago #
https://news.ycombinator.com/item?id=44999373
- 中断会严重影响某些人的工作,导致他们花费大量时间重新找回思路。
- 有些日子中断对工作影响不大,但难以预测哪些日子会这样。
- 有人发现结对编程可以最小化中断带来的成本。
- 有人非常不喜欢结对编程,宁愿选择其他方式。
- 结对编程时,有人更愿意担任导航而不是驾驶,因为导航负责高层次思考。
- 远程工作时,使用第二键盘和鼠标可以提高效率。
- 有证据显示两个人使用键盘可以提高生产力。
- 有人期待有一个为多人编辑设计的编辑器。
- 使用第二显示器和第二台机器进行结对编程,并通过 git 同步工作。
- 有人怀念实验性的“两个光标、两个高亮、两个剪贴板”的设置。
- 有人提到了 Dynaboard,这是一个类似 Google Docs 但适用于本地多人编辑的工具。
- 有人提到了 Tuple.app,这是一个允许远程结对编程的应用。
- 有人提到了使用 tmux 进行结对编程的可能性。
- 与比自己聪明的人一起工作可以提高效率。
- 在结对编程中,不占主导地位的人可能会停止思考,效率低下。
- 明确调用行号和缩放注释工具有助于结对编程。
- 使用 vim 命令可以提高结对编程的效率。
- 有人觉得如果别人控制鼠标和键盘,他们需要说服对方检查他们认为没问题的地方,这很麻烦。
- 有人提到了不同电脑的键盘布局不同,包括修改键的布局。
- 有人怀疑这种设置几乎不会影响生产力。
- 有人提到了在调试会话中零延迟跳到白板的好处。
Valve Software handbook for new employees [pdf] (2012) #
https://cdn.akamai.steamstatic.com/apps/valve/Valve_NewEmployeeHandbook.pdf
Valve 新员工手册(中文版速览)
欢迎来到 Valve
- 无层级(Flatland) - 没有经理,没有汇报线,人人平等。 - 你的办公桌带轮子——随时搬到最能发挥价值的地方。
- 自筹资 & 自有 IP - 不拿外部投资,不被人指手画脚;所有游戏/平台都是自己的。
- 第一天生存指南 - 没人给你布置任务,你得自己找最有价值的事做。
2️⃣ 安顿下来
- 100% 自选项目 - 没有“分配任务”,你“用脚投票”(或轮子投票)。 - 如何选项目: 1. 哪件事对客户最有价值? 2. 哪件事非做不可而 Valve 还没做? 3. 什么最有趣、最能发挥你特长?
- Cabal(突击小队) - 跨职能、临时、自发组队,目标是把产品做出来。 - 没有固定“项目经理”,只有信息协调人(lead)。
- 工作&生活 - 长期加班=计划失败,会被拉去检讨。 - 办公室福利:水果、咖啡、按摩、健身房、洗衣……随便用。
- 犯错文化 - 从没人因犯错被开;失败=学习机会。 - 千万别重复同样的错,也别无视客户/同事的反馈。
3️⃣ 我干得怎么样?
- 绩效反馈 2.0 1. 年度同伴评审(匿名、建设性、帮你成长) 2. 年度 Stack Ranking(按价值排序,决定薪酬)
- 四大价值维度 1. 技能/技术深度 2. 产出/效率 3. 对团队的贡献(工具、流程、招人) 4. 对产品的大局贡献(优先级、用户体验洞察)
- 薪酬理念 - 让每个人拿到“对的”数字——你创造多少价值就拿多少钱。 - 觉得不对?直接谈,Valve 很乐意重新校正。
4️⃣ 开启你自己的冒险
- 没有头衔,只有角色 - 今天你是工程师,明天可能是产品经理、市场、法务……
- T 型人才最吃香 - 横:广泛技能;竖:某一领域世界级深度。
- 成长加速器 - 没有固定“晋升路径”,成长速度=你能跑多快。 - 多向周围大神学习,把别人的绝活变成你的新工具。
5️⃣ Valve 在成长
- 招聘是头等大事 - 招错一个人对 Valve 的伤害远大于普通公司。 - 面试必问: - 你愿意让他当你老板吗? - 你愿意向他学习吗? - 万一他跳槽去对手公司你怕不怕?
- 只招比我们自己更强的人 - 防止“向下招聘”导致组织崩塌。
- 规模还能再大吗? - 目前 20%/年的增速 OK;只要保持招人标准,越大越高效。
6️⃣ 结语 & 彩蛋
- 我们不太擅长的几件事 - 带新人、做导师、内部信息同步、招聘全新学科的人才、长期预测。
- 术语表(精选) - Gabe Newell:全公司“最不是你老板”的人。 - Fishbowl:带玻璃墙的会议室,偶尔会变成鲨鱼格斗场(非法)。 - WFH:只要飘一片雪花,就可以在家办公。
HN 热度 220 points | 评论 173 comments | 作者:Michelangelo11 | 15 hours ago #
https://news.ycombinator.com/item?id=45002301
- Valve Software 的员工手册并未实际发放给员工,而是作为广告宣传的一部分。
- 非层级结构的公司可能容易受到操纵和抢占资源的问题。
- 至少有一位前员工确认 Valve 存在上述问题。
- Valve 将 CastAR 项目的权利交给了前员工,这在其他公司中不常见。
- CastAR 项目在外部投资者资助下未能成功,但 Tilt Five 接手后仍在运营。
- AR 和 VR 市场规模令人失望,即使是市场领导者 Oculus/Meta 也未能达到预期。
- AR 和 VR 与传统的人类计算机界面相比,在大多数用例中都更差。
- 3D 世界的信息密度并不总是比 2D 屏幕更高。
- 可以想象一种科幻版的 AR 可能很有趣,但 VR 主要服务于高端游戏玩家。
- 许多人放弃了 VR 设备,因为它们未能流行起来。
- VR 体验非常沉浸,但难以融入日常生活,且内容有限。
- VR 设备价格可能还不够低,市场采用率不高。
- VR 设备使用起来比较麻烦,不如 Steam Deck 方便。
- 人们心理上不喜欢穿戴或携带技术产品,除非有充分的理由,而 VR 没有提供这样的理由,还让人感到孤立。
US attack on renewables will lead to power crunch that spikes electricity prices #
美国总统唐纳德·特朗普对太阳能和风能项目的攻击可能会提高消费者的能源价格,并破坏已经紧张的电网,可再生能源高管警告说。特朗普长期以来一直认为风力涡轮机不美观,危及鸟类,太阳能装置占用太多土地。本周,他声称他的政府不会批准太阳能和风能项目,这是总统自上任以来对可再生能源行业发起的最新攻击。
特朗普本周的声明似乎证实了业界的担忧,即内政部将阻止太阳能和风能项目的联邦许可。内政部长道格·伯古姆上个月控制了所有许可审批,美国清洁能源协会批评此举为“阻挠”,称其为“前所未有的政治审查”。
内政部阻止许可将减缓整个太阳能和风能行业的增长,可再生开发商 Arevon、Avantus 和 Engie 北美的高管告诉 CNBC。高管们告诉 CNBC,即使太阳能和风能项目在私有土地上,如果影响到水道或动物物种,也可能需要美国鱼类和野生动物服务的批准。这三家电力公司是美国十大可再生能源开发商之一,根据能源研究公司 Enverus 的数据。
内政部发言人告诉 CNBC,当被问及是否会为太阳能和风能建设发放新许可时,内政部“不会对对美国人民没有意义或可能危害社区或环境的大型、不可靠的项目给予优惠待遇”。
可再生能源高管警告说,扼杀可再生能源将加剧即将到来的电力供应短缺,损害电网,并导致消费者电价上涨。Arevon 首席执行官凯文·史密斯表示,这将使电力供应紧缩更加困难。Arevon 是一家总部位于亚利桑那州斯科茨代尔的太阳能和电池储能开发商,在 17 个州活跃,运营着相当于 100 亿美元资本投资的 5 吉瓦电力。
内政部的繁文缛节和特朗普对铜和钢铁的关税导致市场不稳定,使得规划变得困难,可再生能源高管表示。Avantus 首席执行官克里夫·格雷厄姆表示:“我们不想在知道游戏规则之前签订合同。”Avantus 是一家总部位于圣地亚哥的太阳能和电池储能开发商,在沙漠西南部建造了 3 吉瓦的太阳能和储能。
由于关税和监管不确定性,Engie 北美公司将其在美国的计划投资削减了 50%,该公司首席可再生能源官大卫·卡罗尔表示。Engie 可能会进一步削减其计划。总部位于休斯顿的 Engie 北美子公司将在年底前运营约 11 吉瓦的太阳能、电池储能和风能。
像 Engie 这样的跨国公司长期以来一直将美国视为世界上最稳定的商业环境之一,卡罗尔说。但这种评估正在 Engie 的董事会和整个行业中发生变化。卡罗尔说:“美国商业市场的稳定性不再真的是黄金标准。”
由于金属关税,Arevon 的太阳能和电池储能项目成本增加了高达 30%,首席执行官史密斯表示。许多可再生能源开发商正在与公用事业公司重新谈判电力价格,以覆盖成本的突然飙升,因为项目在财务上不再可行。
特朗普的《一大美丽法案》将在 2027 年底结束太阳能和风能项目的两项关键税收抵免,使条件更加困难。投资税收抵免支持新的可再生能源建设,生产抵免促进了清洁电力的发电。史密斯说,这些税收抵免刚刚被转嫁给消费者。它们的终止和关税导致的成本上升将意味着家庭和企业的公用事业账单增加。
Avantus 对太阳能的收费已从每兆瓦时 60 美元大致翻倍,因为多年来利率和关税的增加,首席执行官格雷厄姆表示。当税收抵免消失时,价格将再次飙升至每兆瓦时约 100 美元,他说。格雷厄姆说:“小制造商、小公司和个体经营者将看到他们的电费上涨,这将开始将小企业家推出行业或市场。”
在《一大美丽法案》成为法律一年后的明年 7 月开始建设的可再生能源项目仍将有资格获得税收抵免。Arevon、Avantus 和 Engie 正在推进目前正在建设的项目,但对本十年后期的项目前景不太确定。Arevon 的负责人史密斯表示,从 2026 年下半年到 2028 年,随着新项目不再符合税收抵免条件,美国将看到新的可再生能源发电大幅下降。
史密斯说:“无法承担财务风险的中小型企业,其中一些将消失。”“你将看到该行业的项目减少。”更少的可再生能源电厂可能会增加停电或断电的风险,史密斯说。随着科技公司建设数据中心以训练人工智能系统,电力需求激增。
HN 热度 216 points | 评论 269 comments | 作者:rntn | 9 hours ago #
https://news.ycombinator.com/item?id=45004466
- 欧洲因意识形态驱动的能源政策导致放弃核能、依赖俄罗斯天然气,结果不佳,需要十年时间恢复能源主权
- 可再生能源成本现在并不合理,存在间歇性问题,但因农业等原因取消可再生能源项目似乎短视
- 可再生能源是历史上最便宜的能源,其快速增长是由经济因素而非感觉良好驱动的
- 储能成本也在大幅下降,许多地区未补贴的可再生能源 + 储能已成为最便宜的能源
- 瑞典和欧盟虽然可再生能源降低了能源价格,但电网费用和能源税的增加超过了节省
- 电网费用现在占账单的大部分,用于支付电网稳定性和传输所需的费用
- 澳大利亚 CSIRO 发现电网费用相对较小,远低于新建大型反应堆所需的补贴
- 瑞典成本上升是由于新市场需要建设,但一两年后成本会降低
- 瑞典人口密度低、电网大、工资高,使得电网等劳动密集型基础设施成本更高
- 瑞典批准了基于天然气的新电网稳定性电厂,这些电厂有投资成本和运营成本,政府希望消费者在未来十年内支付
- 瑞典需要根据欧盟环境标准改造或拆除现有的水电站,以保护濒危物种,这也会增加电网稳定性成本
- 瑞典计划建设新的输电线路以平衡国家南北部分的差异,预计需要十年左右时间建设
- 可再生能源并不便宜,需要考虑储能才能代表完整的画面
- 屋顶太阳能比核能更贵,因为规模经济为零,住宅储能极其昂贵,而大规模太阳能 + 储能直到几年前才比核能便宜
- 太阳能和风能都存在重大的主权问题,整个太阳能供应链在中国,风涡轮中的稀土元素大多来自中国
- 核能之所以昂贵是因为在美国的建设方式,依赖于有限的地点来建造基本上是完全定制的设施
- 如果我们复制粘贴反应堆到适合它们的地点,核能将非常有竞争力
- 核能也是可再生的,因为可以通过海水提取铀,海洋和岩石下的铀几乎是无限的
Making games in Go: 3 months without LLMs vs. 3 days with LLMs #
https://marianogappa.github.io/software/2025/08/24/i-made-two-card-games-in-go/
Mariano Gappa 在他的博客中分享了使用 Go 语言开发游戏的经历。他首先回顾了自己在没有使用大型语言模型(LLMs)的情况下,花费 3 个月时间开发了阿根廷传统纸牌游戏 Truco 的后端和前端。他使用了 React 来构建用户界面,并利用 TinyGo 将后端代码转换为 WASM,以便在 GitHub Pages 上托管静态文件。一年后,他尝试使用 LLMs 来加速开发过程,仅用 3 天就完成了另一款阿根廷纸牌游戏 Escoba 的开发。他克隆了 Truco 的后端代码,并让 LLMs 根据 Escoba 的规则重构代码,结果几乎完美。前端开发则花费了更多时间,主要挑战在于他的 React 技能和 WASM 函数管理游戏状态的不寻常设置。
Mariano 提供了一个极简的井字棋游戏的后端和前端代码仓库,供人们学习如何使用这种技术栈开发游戏。他详细介绍了如何构建一个基于回合制的后端,包括初始化游戏状态、计算可能的行动、执行行动以及编写机器人行动选择函数。前端任务相对简单,包括调用后端创建新游戏状态、在 UI 中渲染它、让玩家从有效选项中选择行动、调用后端应用行动以及在轮到机器人时触发其行动。
他还解释了如何将后端代码编译为 WASM,并提供了前端与后端之间的数据交互示例代码。最后,他提供了一些故障排除建议,比如如何确保 WASM 文件正确加载,并鼓励有兴趣的人尝试自己制作游戏。
HN 热度 216 points | 评论 163 comments | 作者:maloga | 8 hours ago #
https://news.ycombinator.com/item?id=45004728
- 开发者通常忽略游戏开发中编码并非瓶颈,真正的挑战在于平衡游戏循环、调整难度、创造不诡异的资产和构建足够的打磨以吸引玩家。
- 尽管 LLM 降低了编码障碍,但游戏设计中更高的障碍依然存在,技术进步并没有导致优秀游戏的爆发式增长。
- 未来 AI 不仅能实现功能,还能进行游戏测试,运行数千次循环,找出哪些机制能吸引模拟玩家。
- AI 如何模拟玩家以及如何确定真实玩家的兴趣仍然是一个挑战。
- 游戏公司已经收集了大量关于玩家的数据,可以训练模型来评估游戏原型的不同方面。
- 基于数据创造艺术的游戏,如 Concord,是一种成功的创作方法。
- 数据不能替代设计中的愿景,A/B 测试并不总是有效。
- 微软可能正在使用其第一方工作室的聚合数据来训练“好游戏”模型。
- 十年前就有游戏使用基于玩家数据的模拟对手来提高玩家留存和多人游戏兴趣。
- LLM 可能在模拟人类玩家行为、沟通和反应时间方面有所作为,帮助解决玩家活动低谷或毒性问题。
- 尽管降低了 AI 的难度,人类玩家在多人游戏中仍然更喜欢与人类对战。
- 大型游戏公司每年推出的新游戏缺乏新意,只是在现有系列上做微调并提高价格。
- “乐趣”可能不是游戏公司内部使用的词汇,他们可能更关注“参与度”或“上瘾性”。
- 游戏开发者在游戏测试方面尝试了各种方法,除了编写自动化测试。
- 由于需要频繁调整游戏机制,保持测试的实用性是一个巨大的任务。
- 单元测试在游戏开发中并不总是可行,因为许多游戏互动是跨帧发生的,难以单元测试。
- 即使单元测试通过,也无法保证游戏看起来好或好玩,最终需要不断试玩来确保互动的乐趣。
- 可以通过模拟事件循环和依赖注入来编写“模拟”版本的游戏测试。
- 许多游戏在合理的测试覆盖范围内并非确定性的。
Turning Claude Code into my best design partner #
https://betweentheprompts.com/design-partner/
这篇文章讲述了作者如何将 Claude Code 转变为他的最佳设计伙伴。最初,作者直接在提示中描述任务,然后依赖 Claude Code 的执行结果。但随着任务复杂性的增加,这种方法暴露出几个问题:对话成为任务唯一的真实来源,新消息可能会覆盖旧指令,导致代理犯错;代理的上下文大小有限,随着对话的增长,早期的信息可能会被“遗忘”。
为了解决这些问题,作者开始尝试让 Claude Code 先写一个计划文档,这个文档成为任务的真实来源,而不是冗长的对话。当计划文档足够好时,作者会清除对话,以计划文档为上下文重新开始。作者通常会给 Claude Code 一个关于要实现的功能的描述,并提供一些参考文件,但不会给出太多实现指令,以期望它提出建议并参与设计过程。
在合作设计过程中,如果作者对建议的实现不满意,他会告诉 Claude Code 为什么它错了,并期待它改变方法。这个过程比作者自己开始编写代码并在后来意识到自己的方法错误要高效得多。作者还发现,将计划文档视为一个活文档,可以让 Claude Code 在实现功能时更新计划,因为实现过程可能会揭示原始计划的一些部分是不正确的。
作者养成了每次提交代码时都检查计划是否最新的习惯,将计划更新视为运行质量检查的一部分。这种活文档方法解决了 AI 开发中的一个基本问题:上下文限制。有了最新的计划文档,作者可以开始一个新的对话,简单地让 Claude Code 继续实现。这通常效果很好,因为文档通常足以为新会话提供足够的上下文,以便从上一个会话结束的地方继续。
在实现开始时,作者会沿途审查变化以确保一切进展正确。如果对进度满意,他可以减少检查的频率。在审查最终代码时,更新的计划文档为他提供了关于实现过程中做出的技术选择的有用提示。作者认为,仔细规划功能然后再急于实现,这使他成为一个更好的开发者,因为这迫使他记录实现并思考后再开始编码。他也发现自己因为必须为 AI 写下理由而更清晰地解释自己的推理,而与同事则通常会通过面对面或视频通话讨论。
总之,这种工作流程系统地解决了作者遇到的原始方法的基本问题:它创建了一个清晰的真相来源,消除了上下文限制问题,并迫使更好的架构思考。活文档成为了规范和实现日志,不仅记录了构建的内容,还记录了为什么以及如何构建。结果是,开发过程更加周到、更有文档记录、更可靠。AI 不仅仅是实现者,它成为了一个协作设计伙伴。
HN 热度 201 points | 评论 73 comments | 作者:scastiel | 15 hours ago #
https://news.ycombinator.com/item?id=45002315
- 通过精心设计的提示,Claude Code 能够一次性完成项目,显著提高技术写作的效率和确保团队共识。
- AI 驱动开发类似于测试驱动开发(TDD),通过迫使开发者事先设计系统,使编码成为次要任务。
- 在开发过程中,细化测试策略和决策很重要,但在核心功能实现过程中可能会迷失方向。
- 与编码相比,通过 Markdown 文档进行工作更难保持专注。
- 很多人在不清楚自己要构建什么的情况下花费大量时间构建东西,这在作者的经验中是常见的。
- 通过快速原型来理解领域比完美的架构图和测试更重要。
- 有些人在没有计划的情况下构建东西,他们边做边规划。
- 大型语言模型(LLM)不能设计东西,它们只是从训练数据中复制其他设计。
- 如果我们为 LLM 设计好框架,它们在实现细节上非常出色。
- 有人认为测试驱动开发(TDD)不需要事先设计系统,而是让测试驱动开发过程。
- TDD 的一个目标是从外向内思考,先创建最外层 API 的单元测试,然后逐步添加功能。
- TDD 在业界逐渐失去热度,一些倡导者后来承认他们经常先写代码再写测试。
- AI 设计过程依赖于事先设计好的模式,这可能表明这种开发方式的局限性。
- “极限编程”方法论认为,如果你不知道如何实现代码,就不应该做 TDD,而是应该先实验直到你知道如何实现,然后丢弃实验。
It is worth it to buy the fast CPU #
https://blog.howardjohn.info/posts/buy-a-cpu/
近年来,CPU 的速度有了显著提升,但许多人仍在使用上一代的移动芯片,这严重影响了他们的生产力。与此同时,AI 编程订阅服务如 Cursor 变得流行,其团队计划每年 480 美元,其他提供商的价格大致相同,明确了工程生产力至少值每年 500 美元。考虑到资深(美国)软件工程师的典型薪资,只需提高 1% 的效率,这项投资就能得到回报。
相比之下,顶级 CPU AMD Ryzen 9 9950X 的价格仅为 500 美元,实际上使用寿命更长,但公司通常会在 3 年内摊销开发机器的成本,每年仅为 170 美元,与 AI 相比非常划算。文章建议购买快速 CPU,因为它非常值得。
文章还提供了三台机器的基准测试结果:2024 年最快的笔记本电脑(i7-1165G7,发布于 2020 年)、2024 年能买到的最快的 ThinkPad(AMD Ryzen 7840U)和 2025 年能买到的最快的桌面 CPU(AMD Ryzen 9950x)。在 Linux 内核编译时间和 TLS 操作基准测试中,性能差距惊人,许多情况下超过 10 倍。
文章总结说,桌面 CPU 大约是笔记本电脑 CPU 的 3 倍快,顶级 CPU 大约是 3 年前同类顶级型号的 3 倍快,这也适用于云虚拟机,新一代产品在许多工作负载上快 2-3 倍,通常价格相同。如果你能证明 AI 编码订阅的合理性,你也能证明购买最佳工具的合理性。
HN 热度 190 points | 评论 373 comments | 作者:ingve | 17 hours ago #
https://news.ycombinator.com/item?id=45001778
- 为软件工程师提供硬件时,购买最高配置的 Macbook Pro 并每 2-3 年更新一次是合理的。
- 开发者生产力不易量化,人的注意力和认知能力有限,等待电脑完成工作可以视为休息和恢复精力的时间。
- 长时间的等待会打断思路,影响工作效率。
- 简单的估算对于许多事情来说效果出奇地好,因为被忽略的复杂性往往表现为噪声,多种因素平均后结果相对准确。
- 等待电脑完成工作的时间是不可恢复的,快速的机器可以更快地进入生产工作状态。
- 许多 FAANG 公司的员工都在服务器上远程工作,本地机器的速度对他们的工作影响不大。
- 通过限制操作系统内存使用并跟踪相关指标,可以验证是否值得升级硬件。
- 快速的电脑并不总是能节省时间,有时只是能否运行某项任务或者是否会影响开发者的情绪。
- 旧的 CPU 可以继续使用,直到主板损坏为止。
- 尽管技术不断进步,但新一代的电脑可能没有上一代耐用,因为晶体管尺寸减小导致更脆弱。
- 优化硬件寿命而非性能可能会导致硬件更新周期变长。
- 根据个人工作负载的不同,旧电脑可能仍然能够满足需求。
Hacker News 精彩评论及翻译 #
Why was Apache Kafka created? #
https://news.ycombinator.com/item?id=44998863
Kafka isn’t a queue, it’s a distributed log. A partitioned topic can take very large volumes of message writes, persist them indefinitely, deliver them to any subscriber in-order and at-least-once (even for subscribers added after the message was published), and do all of that distributed and HA.
If you need all those things, there just are not a lot of options.
Joeri
Kafka 不是一个队列,它是一个分布式日志。一个分区主题可以处理海量的消息写入,将它们无限期地持久化,有序且至少一次地递送给任何订阅者(即便是订阅者在消息发布后加入的),并以分布式和高可用的方式完成所有这一切。如果您需要所有这些功能,可用的选择其实非常有限。
The ROI of Exercise #
https://news.ycombinator.com/item?id=44995011
We know from one study that people who played tennis a few times per week lived roughly 10 years longer than average. So we’ll use that value going forward.
There has to be some incredible correlation between having the time and money to play tennis “a few times per week” and being significantly wealthier than the average person. And being wealthy is clearly the healthiest thing you can do.
koolba
据一项研究表明,每周打几次网球的人比普通人寿命长约10年。因此,我们将在下文采用这个数据。
拥有每周打几次网球的时间和金钱,与远超普通人的财富水平之间,肯定存在着某种惊人的关联。而且,财富显然是你能做的最健康的事。