2026-02-17 Hacker News Top Stories #
- 多款大模型对“洗车店仅 50 米应步行还是开车”的不同回答暴露出其常识推理与隐含前提识别的明显缺陷。
- Peter Steinberger 宣布加入 OpenAI 并将其开源项目 OpenClaw 转型为独立基金会以保持开放与继续发展。
- 欧盟通过法规禁止销毁未售出服装、鞋类及配饰并要求分阶段信息披露以推动循环经济。
- 现代 CSS 指南主张用原生浏览器特性替代旧式写法以提高可维护性与性能。
- 英国司法部下令删除媒体常用的法院报道数据库 Courtsdesk,激起新闻自由与透明度争议。
- 若半导体技术自 80 年代停滞,计算仍可通过软件与架构优化发展,但大型模型与当代计算密集型应用将不可行。
- Qwen 发布 Qwen3.5-397B-A17B,宣称通过新的注意力与稀疏专家架构显著提升原生多模态智能体能力。
- 马格努斯·卡尔森在首届 FIDE 认证的自由式(Chess960)世锦赛夺冠,成为囊括多项世界冠军的顶尖棋手。
- Anthropic 在 Claude 中默认压缩文件操作细节引发开发者对透明度、安全与可审计性的强烈不满。
- 受大型 AI 客户囊括产能影响,西部数据称 2026 年硬盘产能已被提前售罄,消费级市场受挤压。
洗车店仅 50 米远,该步行还是开车去? (I want to wash my car. The car wash is 50 meters away. Should I walk or drive?) #
https://mastodon.world/@knowmadd/116072773118828295
这是一个关于大型语言模型(LLM)在面对一个看似简单实则具有陷阱的提问时,表现如何的讨论帖。用户 Kévin 提出一个问题:想洗车,但车洗店距离家 50 米,是该步行去还是开车去?
帖子中展示了多个主流大模型(如 Deepseek、Qwen、Gemini、ChatGPT 等)对此问题的不同回应,揭示了它们在逻辑推理、常识判断和自我一致性方面的差异。部分模型被指出存在明显矛盾:例如建议“步行去”,却未考虑步行后如何将车带回洗车店;或声称步行有“最小环境效益”,但实际路径设计反而更耗能。
评论区讨论热烈,用户们分析各模型的表现:
- 有些模型虽识别出“车必须被运到洗车店”这一关键点,但仍推荐不合理的行走方案。
- 也有模型直接指出“车就是重物,不能徒手搬运”,从而得出应开车前往的合理结论。
- 部分人调侃某些模型像“技术宅”一样过度解读,甚至建议带“泳衣”“香蕉”等荒谬物品。
- 还有人质疑 AI 回答背后是否存在人工干预,比如低薪外包人员参与生成答案,或受特定利益方影响。
整体来看,该话题反映了当前大模型在处理现实情境中的局限性——尽管具备强大语言能力,但在常识推理与行为合理性判断上仍常出现“一本正经地胡说八道”的现象。
HN 热度 1391 points | 评论 869 comments | 作者:novemp | 19 hours ago #
https://news.ycombinator.com/item?id=47031580
- 使用大语言模型时,需要明确说明常识性信息,否则模型可能因理解偏差而给出错误答案。
- 当前大模型在处理自然语言时仍需用户补充大量隐含前提,这暴露了其与人类交流方式的本质差异。
- 未来可能需要发展一种结构化语言来消除歧义,尽管这种方式可能不自然且学习成本高。
- 人类沟通依赖于不断澄清模糊之处,这是有效协作的基础,而非依赖 AI 自动补全逻辑。
- 将人类思维模式强行适配 AI 需求是不现实的,AI 应适应人类的表达习惯而非反之。
- 未来的 AI 系统可能通过与物理设备(如汽车)直接交互来获取实时信息,从而减少对模糊指令的依赖。
- 用自然语言编程并非解决方案,历史经验表明,计算机的精确性恰恰是其优势,而非缺陷。
我加入 OpenAI (I’m joining OpenAI) #
https://steipete.me/posts/2026/openclaw
作者 Peter Steinberger 宣布加入 OpenAI,致力于将人工智能代理(agents)普及到每个人。他此前创建的开源项目 OpenClaw 将转型为独立基金会,继续保持开源与开放性。
OpenClaw 从一个个人兴趣项目发展为全球关注的焦点,引发大量社区讨论和合作意向。尽管有众多机会和建议,作者表示自己更倾向于做“建造者”而非创办大型公司。他希望打造一个连普通用户如母亲也能轻松使用的智能代理系统,这需要更广泛的技术革新与安全考量。
在与多家顶尖实验室交流后,作者认为 OpenAI 是实现其愿景的最佳平台。双方在理念上高度契合,OpenAI 已承诺支持 OpenClaw 项目,并为其提供资源保障。
未来,OpenClaw 基金会将继续作为开发者、研究者和数据自主者的自由空间,支持更多模型与生态发展。作者本人将投身于 OpenAI 的前沿 AI 研发,与全球社区共同推进技术进步。
“爪子就是法律。”——这是对 OpenClaw 精神的总结,也象征着技术民主化与用户赋权的信念。
HN 热度 1385 points | 评论 1071 comments | 作者:mfiguiere | 1 day ago #
https://news.ycombinator.com/item?id=47028013
- 成功往往不取决于技术能力,而在于能否展示出创造性和愿景,代码质量并非决定性因素。
- 有些人通过社交能力和形象包装获得职位,而非实际技术实力,这种现象在职场中普遍存在。
- “Julius”式人物指的是那些擅长表达但缺乏真正技术理解力的人,他们可能在短期内获得成功,但长期难以应对实际挑战。
- 真正的技术能力与职场晋升之间存在脱节,许多成功者并非最优秀的程序员,而是最善于自我推销的人。
- 社交能力在职场中比技术能力更能决定职业发展,这导致了“Julius”类人物的大量涌现。
- 一些人认为,如果自己没有遇到“Julius”,可能恰恰说明自己就是那个“Julius”。
- 企业招聘更看重的是“感知到的能力”而非真实能力,这使得缺乏技术深度的人也能获得高职位。
- “Julius”类人物在面临真正技术难题时往往暴露短板,最终难逃被替换或公司衰败的命运。
- 有些公司因由“Julius”主导而走向衰落,其团队规模大幅缩减,最终导致组织崩溃。
欧盟禁止销毁未售出服装、鞋类及配饰 (EU bans the destruction of unsold apparel, clothing, accessories and footwear) #
欧盟委员会于 2026 年 2 月 9 日通过新措施,依据《可持续产品生态设计法规》(ESPR),禁止销毁未售出的服装、鞋类及配饰。此举旨在减少浪费、降低环境影响,并推动企业向循环经济转型。
每年欧洲有 4% 至 9% 的未售出纺织品被销毁,造成约 560 万吨二氧化碳排放,相当于瑞典 2021 年的全部净排放量。新规要求企业披露其废弃的未售商品数量,并全面禁止对未售出服装、鞋类和配饰进行销毁。
为帮助企业合规,欧盟同时发布了两项执行文件:
- 授权法案 明确了允许销毁的例外情况,如安全风险或产品损坏,由各国主管部门监督执行。
- 实施法案 设定了统一的信息披露格式,企业需从 2027 年 2 月起按标准报告库存废弃量,为适应留出充足时间。
企业被鼓励通过更有效的库存管理、退货处理,以及转售、再制造、捐赠或重复使用等方式替代销毁。
该禁令将分阶段实施:大型企业自 2026 年 7 月 19 日起适用;中型企业则在 2030 年跟进。信息披露要求目前适用于大型企业,也将于 2030 年扩展至中型企业。
欧盟环境委员杰西卡·罗斯瓦尔表示,纺织业是可持续转型的先锋,但仍有挑战。新措施将助力行业实现绿色转型,提升竞争力并减少对外依赖。
背景显示,法国每年有约 6.3 亿欧元的未售商品被销毁,德国每年近 2000 万件网购退货被丢弃。纺织品是重点问题,欧盟正通过 ESPR 推动产品更耐用、可回收、可重复使用,提升整体循环效率。
HN 热度 1180 points | 评论 800 comments | 作者:giuliomagnifico | 1 day ago #
https://news.ycombinator.com/item?id=47025378
- 欧盟禁止销毁未售出服装的政策旨在减少浪费和环境污染,尽管短期内可能增加生产复杂性,但现代小批量生产和需求预测技术已使适应这一政策成为可能。
- 该政策可能被企业规避,通过将未售出服装出口至监管较弱的国家,由当地公司名义上“销售”后实际销毁,从而增加碳排放和供应链成本。
- 现代时尚产业过度追求快速更替,导致消费者在购买后不久即认为衣物过时,造成大量本可继续使用的衣物被浪费。
- 服装浪费不仅是经济上的损失,也反映出社会价值观的扭曲,过去人们因衣物昂贵而精心修补,如今却轻易丢弃,反映出对资源的不尊重。
- 企业缺乏自愿环保的动力,因为道德行为在竞争中会削弱自身优势,只有通过强制性法规才能打破“劣币驱逐良币”的困境。
- 有效的环境治理需要系统性、前瞻性的经济政策,而非针对单一问题的零散应对,应将外部性纳入经济决策的核心考量。
- 真正的变革需要将关键利益相关方(如大型企业、能源公司、保险公司等)纳入政策设计,通过使其在环保中获得实际利益,实现从对抗到合作的转变。
- 政策实施应平稳推进,通过可信的激励与约束机制引导企业长期投资绿色转型,避免因政策突变引发经济动荡。
现代 CSS 代码片段:停止像 2015 年那样写 CSS (Modern CSS Code Snippets: Stop writing CSS like it’s 2015) #
这是一个关于现代 CSS 技术的对比指南,旨在帮助开发者摆脱过时的 CSS 写法,采用更简洁、高效的现代原生方案。
页面展示了 20 个常见的旧式 CSS 写法及其对应的现代替代方案。每个对比项都包含“旧”与“现代”两种写法,并附有浏览器兼容性百分比和简要说明。
核心内容涵盖多个方面:
- 颜色:使用 oklch 和 display-p3 等新颜色空间,实现更精准、感知一致的颜色控制。
- 布局:通过 grid、place-items、stretch、inset 等新属性简化定位与弹性布局。
- 响应式设计:利用 object-fit、clip-path shape()等实现图片自适应与复杂形状。
- 交互与动画:无需 JavaScript 即可实现自动增长 textarea、平滑高度过渡、滚动吸附效果。
- 表单与用户交互:支持原生表单验证样式、hover 提示、对话框控制,减少对 JS 的依赖。
- 可维护性与逻辑复用:引入 @function、if 条件表达式、attr 类型推断等,提升代码可读性和可重用性。
整体强调“不再需要为简单任务编写冗长的脚本”,推荐使用现代浏览器原生支持的新特性,提升开发效率与用户体验。
HN 热度 665 points | 评论 280 comments | 作者:eustoria | 1 day ago #
https://news.ycombinator.com/item?id=47025851
- Tailwind 的使用导致了大量非语义化的 div 和哈希类名,增加了代码可读性和维护难度。
- 尽管 Tailwind 本身不强制使用非语义标签,但其流行促使开发者更倾向于使用非语义的 div 和无意义的类名。
- 语义化标签(如 article、section)在实际开发中被过度使用或滥用,导致其意义模糊,失去了原本的语义价值。
- HTML5 之后 W3C 未新增更多语义化标签,使得开发者难以用语义标签表达复杂结构,加剧了 div soup 的问题。
- 使用 Tailwind 并不直接影响可访问性,只要正确添加 ARIA 属性,即可保障无障碍体验。
- 语义化标签的缺失并非 Tailwind 的问题,而是开发者自身设计习惯和对语义理解不足所致。
- 生成的 HTML 代码虽然结构混乱,但原始源码仍可保持良好结构,维护者仍能通过源码理解逻辑。
- 企业级 CMS(如 Adobe AEM)常生成大量嵌套 div 和无意义类名,这是导致 div soup 的主要原因之一。
- 使用非语义标签和哈希类名会增加网页爬虫、用户脚本和样式自定义的难度。
- 未来网页可能转向 canvas 渲染,届时 HTML 的语义性将更加不重要,但当前仍需重视可访问性。
- 语义化并非唯一保障可访问性的手段,合理使用 ARIA 属性和语义属性同样有效。
- 语义化标签与样式框架(如 Tailwind)并不冲突,开发者完全可以结合使用,关键在于设计习惯。
- 语义化标签的引入应基于实际内容结构,而非为了“看起来更规范”而强行使用。
- 语义化的核心是“思考内容的意义”,而非仅仅使用特定标签,过度追求标签语义可能适得其反。
英国司法部下令删除国内最大法院报道数据库 Courtsdesk,平台将在数日内彻底清除 (Ministry of Justice orders deletion of the UK’s largest court reporting database) #
英国最大法院报道数据库 Courtsdesk 被司法部下令删除,该平台将在数日内被彻底清除。Courtsdesk 自 2020 年上线以来,被 39 家媒体的 1500 多名记者用于查询地方法院案件信息,是记者追踪刑事法庭审理情况的重要工具。
据平台创始人 Enda Leahy 透露,该平台多次因法院未提前通知媒体案件审理而发现问题,约三分之二的法院存在未通知记者的情况。平台曾获时任司法大臣克里斯·菲尔普的批准,但 HM 法院与法庭服务局(HMCTS)于 2025 年 11 月发出终止通知,理由是“未经授权共享法院信息”。
Courtsdesk 曾 16 次致信政府机构寻求解决方案,甚至请求将问题提交信息专员办公室,但未获回应。前司法大臣菲尔普也曾向现任法院事务大臣莎拉·萨克曼求助,但遭拒绝。 Leahy 表示,HMCTS 自身记录准确率仅为 4.2%,且 160 万起刑事案件在未通知媒体的情况下开庭,她强调 Courtsdesk 是唯一能真实反映刑事法庭运作的系统。
对此,HMCTS 回应称,媒体仍可正常获取法院信息,且此次行动是为了保护敏感数据,因 Courtsdesk 曾将信息提供给第三方 AI 公司。司法部在推特上表示,记者对法院信息的访问权未受影响,相关记录依然公开。
该决定引发广泛争议。部分评论者批评政府削弱新闻自由,称其为“黑暗时代”;也有观点认为此举合理,称司法系统应更高效、减少对媒体的依赖。但也有声音指出,真正的问题在于政府对信息透明度的控制,而非媒体本身。
HN 热度 482 points | 评论 330 comments | 作者:harel | 12 hours ago #
https://news.ycombinator.com/item?id=47034713
- 公共记录应免费开放于政府网站,AI 公司应被允许自由抓取,不应设置访问壁垒或限制数据复制与批量抓取。
- AI 公司不应将个人犯罪记录永久纳入数据集,尤其对于已过追诉期或已改过自新的案件,应避免造成“终身定罪”的不公平后果。
- 应设立基于犯罪严重程度的时效性规则,如谋杀、强奸等重罪记录永久保留,而轻微犯罪在一定年限后应从决策系统中移除。
- 法律记录中包含被撤销指控或证据不足的案件,但人工智能系统难以区分,容易导致误判和错误归因。
- 企业或个人不应拥有无限获取他人完整生活信息的权利,雇主在雇佣时应有合理限度地了解背景信息。
- 可借鉴加拿大“脆弱部门检查”机制,对特定岗位(如儿童看护、教育、医疗)进行更严格的背景审查,平衡公共安全与再融入社会的需求。
- 英国的“警方披露与禁止服务”(DBS)检查制度提供多层级背景审查,可作为参考范例。
- 某些国家通过法律保障前科人员获得就业、住房等基本资源的权利,有助于降低再犯率。
- 政府应重新评估数据公开与隐私保护之间的平衡,当第三方轻易获取信息时,政府可能选择删除数据以维护公共利益。
- 虽然雇主有权自行决定是否雇佣有前科者,但不能随意主张全面了解对方全部生活细节,这种权利应受到限制。
LT6502:基于 6502 的自制笔记本电脑 (LT6502: A 6502-based homebrew laptop) #
https://github.com/TechPaula/LT6502
这是一个基于 6502 处理器的笔记本电脑设计项目,名为 LT6502。项目由开发者 TechPaula 发起,旨在打造一台复古风格但功能完整的便携式计算机。
项目核心配置包括:
- 65C02 处理器,运行频率 8MHz
- 46KB RAM
- BASIC 语言固化在 ROM 中
- 集成 65C22 VIA 芯片,用于定时和 I/O 控制
- 9 英寸内置显示屏幕,支持简单图形和字体
- 内置键盘
- Compact Flash 存储扩展
- 10000mAh 内置电池,支持 USB 供电与充电
- 串行控制台接口
- 一个内部扩展插槽
项目进展记录显示,从 2025 年 11 月开始,陆续完成了 PCB 设计、元件采购、初步上电测试,并逐步实现各模块功能:
- 2026 年 1 月完成基本电源、RAM、ROM 和串口通信功能
- VIA 和 ACIA 芯片正常工作,键盘输入已集成至固件
- Compact Flash 接口成功运行,蜂鸣器也已可用
- 2026 年 1 月 16 日成功驱动 4.3 英寸 RA8875 显示屏,后续尝试 10.1 英寸 RA8889 屏幕
- 2 月完成外壳组装,固件持续优化
内存映射清晰,分为 RAM、ROM 和外设区域。ROM 中包含 EhBASIC 2.22p5、eWozMon 增强版监控程序、启动代码及 6502 向量表。RAM 用于程序运行和 CF 读写缓冲。
EhBASIC 已扩展多项图形与文件操作命令,如:
- BEEP:控制蜂鸣器音调与时长
- CIRCLE、ELIPSE、LINE、SQUARE:绘制图形
- PLOT:绘制像素点
- MODE:切换文本/图形显示模式
- DIR、LOAD、SAVE:管理 CF 卡文件
- COLOUR、CURSOR:设置颜色与光标位置
- OUTK:在键盘背光屏显示信息
当前开发重点包括:
- 更大尺寸显示屏的适配(10.1 英寸 RA8889 或 9 英寸 RA8875)
- 修复 MEGA644P 芯片的键盘扫描代码
- 完善 BIOS 功能,如启动提示音、文件加载/保存流程
该项目展现了极强的硬件与软件协同开发能力,融合了复古计算情怀与现代嵌入式技术,是硬核爱好者极具参考价值的开源项目。
HN 热度 405 points | 评论 213 comments | 作者:classichasclass | 1 day ago #
https://news.ycombinator.com/item?id=47025399
- 如果半导体技术在 80 年代停滞,人类可能只能使用几兆内存和约 30MHz 的高效 ARM 核心,但网页浏览器和数字转型仍有可能实现,而大型语言模型则完全不可能。
- 1990 年实际上就是半导体发展停滞的现实版本,万维网于 1989-1990 年在一台 25MHz 的 68040 NextCube 上诞生,其本质类似于带网络功能的 HyperCard。
- 若 CPU 频率被限制在 200-400MHz 但效率持续提升,将催生出类似 System 7.6 或 Windows 2000 的精炼桌面操作系统,界面简洁且用户可高度定制,令人向往。
- 经典 Mac OS 在用户控制力和自定义能力方面堪称巅峰,通过扩展和控制面板系统,任何技术用户都能组合出高度个性化的环境,无需编写代码或打开终端。
- 尽管经典 Mac OS 存在协作式调度、冲突捕获器和崩溃重启等缺陷,但其扩展机制允许对系统进行深度改造,如添加硬件支持、重写文本渲染甚至引入桌面图标物理效果。
- 现代 Linux 虽技术强大,但修改系统需从桌面环境到内核层层调整,远不如经典 Mac OS 中扩展机制那样对普通用户友好。
- Smalltalk-80 等系统在动态更新和集成开发环境方面更优,支持无缝版本切换,但未能吸收现代分布式版本控制思想。
- 即使在经典 Mac OS 中编写扩展也非易事,调试困难,但大量开发者已为各种小众需求提供了现成扩展,形成丰富生态。
- 在无法提升主频的情况下,多核设计可能更早进入消费市场,平行处理成为主要性能提升方式,这或许会带来一个不同的计算世界。
- 可以设想用 RISC-V RV32E 核心在小型 FPGA 上构建可插拔的微型计算机,搭配简单外设如 RAM、UART 和图形板,打造类似 Ben Eater 风格的极简电脑。
Qwen3.5:迈向原生多模态智能体 (Qwen3.5: Towards Native Multimodal Agents) #
https://qwen.ai/blog?id=qwen3.5
Qwen 团队高兴地宣布推出 Qwen3.5 系列的首个开放权重模型 ——Qwen3.5-397B-A17B。作为一种原生的视觉语言模型,Qwen3.5-397B-A17B 在推理、编码、智能体能力和多模态理解等各类基准评估中表现出色,从而帮助开发者和企业大幅提升生产力。
模型架构与效率 #
Qwen3.5-397B-A17B 采用创新的混合架构,将线性注意力(通过 Gated Delta Networks 实现)与稀疏专家混合(Mixture of Experts)结合在一起,显著提高了推理效率。尽管模型的总参数量达到 3970 亿,但每次前向传递仅激活 170 亿个参数,从而在不牺牲能力的情况下优化了速度和成本。
语言支持 #
该模型的语言和方言支持从 119 种扩展到 201 种,增强了全球用户的可访问性和支持。
Qwen3.5-Plus #
此外,Qwen3.5-Plus 作为托管模型通过阿里云模型工作室提供,具有默认的 1M 上下文窗口、官方内置工具和自适应工具使用。
性能评估 #
Qwen3.5 在一系列评估任务中与前沿模型进行比较,涵盖了多种任务和模态。具体表现如下:
- 在知识与多语言能力的评估中,Qwen3.5 在多个基准(如 MMLU、SuperGPQA 等)中表现优异,得分与其他领先模型相比并不逊色。
- 在推理与 STEM 领域,Qwen3.5 在多项测试中也取得了良好成绩,例如在数学与编码任务中表现突出。
预训练与扩展 #
Qwen3.5 在预训练方面进行了三方面的提升:
- ** 力量 **:与 Qwen3 相比,Qwen3.5 使用更大规模的视觉 - 文本标记进行训练,并且在严格筛选下增强了中文 / 英文、多语言、STEM 和推理数据的质量。
- ** 效率 **:在 Qwen3-Next 架构上构建,采用了更高稀疏性的 Mixture of Experts 架构,提升了稳定性优化和多标记预测能力,使得在 32k 和 256k 上下文长度下,Qwen3.5 的解码吞吐量分别是 Qwen3-Max 的 8.6 倍和 19 倍。
- ** 多样性 **:通过早期的文本 - 视觉融合以及扩展的视觉 / STEM / 视频数据,使得 Qwen3.5 在相似规模下超越了 Qwen3-VL。同时,词汇量从 150k 增加到 250k,提升了大多数语言的编码和解码效率。
总体来看,Qwen3.5 的表现相比于 Qwen3 系列有了显著提升,这得益于对几乎所有 RL(强化学习)任务和环境的规模化增强,同时强调了 RL 环境的难度和通用性,而不是优化特定指标或狭窄的查询类别。未来,我们将通过技术报告详细介绍这一过程中的更多成果。
HN 热度 372 points | 评论 179 comments | 作者:danielhanchen | 16 hours ago #
https://news.ycombinator.com/item?id=47032876
- Qwen3.5 在后训练阶段的性能提升主要得益于对几乎所有可设想的强化学习任务和环境的大规模扩展。
- 有评论指出,尽管“下一个词预测”仍是 LLM 的训练目标,但实际表现已远超这一简单定义,反映出模型能力的复杂性。
- “平均排名与环境扩展”图表存在误导性,初期靠近 Y 轴的 Qwen 点实为 Qwen 3 而非 Qwen 3.5,容易引起误解。
- 某些大型语言模型在面对“开车去洗车”这类常识性问题时仍会给出荒谬答案,如建议步行前往,暴露了其推理缺陷。
- 有人用幽默方式回应该类问题,称自己的 AI 因规模过大而感到“职业倦怠”,讽刺模型虽强大却无法理解基本常识。
- 针对模型在类似问题上的错误,有人建议通过“权重消融”来测试模型对核心概念的理解程度,强调实际物理约束的重要性。
- 有观点认为,当前主流大模型在处理此类“陷阱题”时,更多是因推理路径选择不当(如未触发高级推理模式)所致,而非能力不足。
- 当前 SOTA 模型在强制启用深度推理模式(如 MoE 结构)后,可能能正确应对问题变体,说明其具备解决能力但受限于优化策略。
- 不同模型对同一问题反应差异显著,例如 GLM 建议步行,而 Gemini 则明确支持驾驶,表明模型行为受架构与设计影响。
- 有用户指出,某些模型(如 4.7 Flash 版本)因参数量小、硬件要求低,仅适合轻量级任务,不具备主干模型的综合能力。
- 将编程生成与自然语言转换结合,可用于构建“加密式”语言谜题,使每次提问对模型而言都是全新内容,避免重复训练数据的影响。
- 借鉴密码学中的“一次性密钥”思想,可通过生成具有唯一性的自然语言问题,防止模型“重放攻击”或依赖已有知识。
- 该类问题本质上是测试模型是否真正理解语境,而非记忆或复现训练数据,属于“信息战”范畴,需更严谨评估方法。
- 有人将这类问题戏称为“新草莓测试”或“新鹈鹕测试”,意指它们已成为衡量模型常识推理能力的新基准。
- 有评论调侃称,当模型开始“嘲笑”人类的问题时,或许已达到某种形式的“通用人工智能”(AGI),尽管该术语尚无明确定义。
- 对于“是否达到通用人工智能”的讨论,有人质疑该词已被滥用,成为一种模糊的营销术语,缺乏实质标准。
马格努斯·卡尔森夺得首届 FIDE 自由式国际象棋世界冠军 (Magnus Carlsen Wins the Freestyle (Chess960) World Championship) #
https://www.fide.com/magnus-carlsen-wins-2026-fide-freestyle-world-championship/
2026 年 FIDE 自由式国际象棋世界冠军赛于德国魏森豪斯举行,比赛日期为 2026 年 2 月 13 日至 15 日。挪威棋手马格努斯·卡尔森在决赛中以 2.5 比 1.5 战胜美国棋手法比安诺·卡鲁阿纳,首次夺得官方认可的 FIDE 自由式国际象棋世界冠军头衔。
比赛中最具决定性的时刻出现在第三局,卡尔森从看似必败的局面中逆转取胜,成功扭转战局。第四局双方战成和棋,卡尔森凭借此役确保胜局,最终捧杯。这场胜利也使他成为历史上首位获得 21 个世界冠军头衔(涵盖不同比赛形式)的棋手。
卡鲁阿纳与卡尔森均获得参加 2027 年该赛事的资格。在季军争夺战中,乌兹别克斯坦棋手诺迪尔贝克·阿卜杜萨托罗夫击败德国棋手文森特·基默,同样锁定 2027 年参赛资格。他在最后一局中虽处于优势局面,但成功将胜势转化为平局,实现夺冠。
其他名次方面,美国棋手汉斯·尼曼以 2 比 0 击败印度棋手阿琼·埃里加伊西,获得第五名;亚美尼亚籍美国棋手列冯·阿罗尼扬在快棋加赛中击败乌兹别克斯坦棋手雅沃赫尔·辛达罗夫,位列第七。
此外,一场女子表演赛中,哈萨克斯坦选手比比萨拉·阿苏巴耶娃战胜瑞士选手亚历山德拉·科斯滕纽克,赢得胜利。
本次赛事总奖金为 30 万美元,冠军奖金达 10 万美元。这是首届由 FIDE 正式认证的自由式国际象棋世界锦标赛,标志着这一新兴赛制的重要里程碑。
HN 热度 358 points | 评论 250 comments | 作者:prophylaxis | 1 day ago #
https://news.ycombinator.com/item?id=47028227
- 马格努斯·卡尔森在 35 岁时仍能赢得国际象棋 960 快棋世界冠军,展现了其卓越的竞技状态,这在顶尖棋手普遍于三十五岁后开始下滑的背景下尤为突出。
- 尽管身体和智力能力可能依然在线,但长期高强度的训练与比赛带来的心理压力,以及缺乏新挑战,可能导致顶尖棋手逐渐失去动力。
- 顶级棋手如卡斯帕罗夫即使年过六旬,仍具备极强实力,说明年龄并非决定性因素,更多取决于持续投入与兴趣。
- 棋手巅峰期通常在中晚期三十岁左右开始衰退,但并不意味着无法继续高水平竞技,关键在于保持专注与热情。
- 频繁的开局研究和准备是维持顶尖水平的关键,而这一过程对许多棋手而言会随着时间推移变得枯燥且难以持续。
- 自由式国际象棋(Freestyle Chess)的发展为棋手延长职业生涯提供了可能,因其规则限制了深度开局准备,使经验与策略更具优势。
- 马格努斯·卡尔森放弃卫冕传统世界冠军头衔的主要原因是他对赛事组织形式不满,而非竞技状态下降或技术性失利。
- 卡尔森曾在 2011 年就曾拒绝参加世界冠军赛,显示出他对现行赛制长期存在的不满情绪。
- 2018 年与卡鲁阿纳的世界冠军对抗赛虽有激烈对局,但因双方过度保守、频繁和棋,最终以快速加赛收场,被部分人认为缺乏观赏性。
- 一些评论者认为,该届世冠赛的乏味源于双方都进行了大量预研,导致对局趋于防守化,类似“引擎对弈”的感觉。
- 纪律争议(如穿牛仔裤事件)发生在卡尔森退役多年之后,与他放弃卫冕并无直接关联,不应混淆。
- 卡尔森本人曾表示,在对阵涅波姆尼亚奇时已感到自己达到巅峰,因此对再次投入漫长备战缺乏信心,担心失败会影响其“棋坛之王”的历史地位。
- 他若再赢一局即可追平历史上最长卫冕纪录,但因不愿承受潜在声誉风险而选择退出,反映出其对荣誉与自我评价的高度敏感。
Anthropic 试图隐藏 Claude 的 AI 操作行为,开发者对此深感不满 (Anthropic tries to hide Claude’s AI actions. Devs hate it) #
https://www.theregister.com/2026/02/16/anthropic_claude_ai_edits/
Anthropic 更新了其 AI 编程工具 Claude Code,版本 2.1.20 将文件操作的详细信息隐藏,仅显示“读取了 3 个文件(按 Ctrl+O 展开)”等简化提示。此举引发开发者强烈不满,认为该变更削弱了透明度,影响安全审计、错误排查和成本控制。
开发者指出,查看具体文件名有助于判断 Claude 是否从错误文件中获取上下文,及时干预以避免浪费计算资源(如令牌消耗)。尽管可通过快捷键展开详情,但频繁操作不切实际。
虽然 Anthropic 声称这是为了减少界面干扰,提升用户体验,并建议使用“详细模式”获取信息,但用户反馈该模式仍存在过多噪音,无法满足需求。创始人兼 Claude Code 负责人鲍里斯·切尔尼(Boris Cherny)回应称,已将原“详细模式”重新定义为显示文件路径,但不再包含完整推理过程或子代理输出。
有开发者表示,当前的不透明性已导致其无法信任 Claude 的行为,必须持续监督和纠正,否则极易造成资源浪费。尽管部分用户支持简化界面,但主流声音仍呼吁恢复原有透明机制。
目前,Claude Code 仍默认采用压缩输出,未来可能继续调整,但尚未有恢复旧模式的迹象。
HN 热度 352 points | 评论 217 comments | 作者:beardyw | 14 hours ago #
https://news.ycombinator.com/item?id=47033622
- 隐藏 Claude 的操作细节会增加风险,因为开发者需要实时监控 AI 是否误读指令或错误修改文件,透明度是防止“失控”的关键。
- 当前 AI 代理的开发趋势更偏向于自动化运行和批量输出,而非人类实时监督,这导致了对中间步骤透明度的需求被忽视。
- 在真实、长期维护的复杂代码库中,AI 生成的代码往往冗长且难以维护,远未达到生产环境的要求。
- 很多客户在使用 AI 编码时遇到可维护性和可扩展性问题,根源在于缺乏有效的架构约束和流程管控,而非模型本身能力不足。
- 代码质量本质上依赖于上下文,即使训练数据中包含优质代码,若在错误场景下使用,结果依然可能失败。
- 有经验的开发者通过将 AI 用于重复性低价值任务(如重构测试、更新文档、生成日志分析工具等),并辅以人工审查,能显著提升代码质量和效率。
- 将大量任务完全委托给 AI 并不经过严格审查,属于“情绪化编程”(vibe coding),本质上是不负责任的投机行为。
- 虽然某些人用“灵魂耗竭”来形容使用 AI 完成琐碎工作,但这种做法仍能帮助他们节省精力、减少职业伤害,具有实际价值。
- 现阶段的 LLM 更像是统计平均水平的实现者,无法提供真正卓越的代码,其上限受制于训练数据的整体质量。
AI 需求狂飙致硬盘售罄,西部数据称 2026 年产能已提前卖光 (Thanks a lot, AI: Hard drives are sold out for the year, says WD) #
https://mashable.com/article/ai-hard-drive-hdd-shortages-western-digital-sold-out
AI 公司对存储硬件的疯狂需求已导致全球硬盘供应严重短缺。根据西部数据(Western Digital)最新财报电话会议信息,该公司已提前售罄 2026 年全年硬盘产能,距离 2026 年结束还剩 10 个多月。
西部数据 CEO Irving Tan 透露,其“前七名大客户”几乎包揽了全部产能,其中三家客户已与公司签订 2027 年甚至 2028 年的供货协议。这些客户主要为大型人工智能企业,正大规模采购存储设备以支撑 AI 模型训练和数据处理需求。
这一现象反映出 AI 产业对硬件资源的持续挤压。消费级市场在西部数据整体收入中的占比已降至仅 5%,企业客户成为绝对主力。随着 AI 公司持续抢占内存、处理器和存储设备供应链,PC 制造商被迫频繁上调内存价格,游戏主机厂商如索尼也考虑推迟下一代 PlayStation 的发布计划。
目前来看,AI 对硬件的高需求短期内难以缓解。除非资本市场对 AI 前景失去信心,否则消费者将面临更长的等待周期和更高的购买成本。
HN 热度 338 points | 评论 283 comments | 作者:dClauzel | 13 hours ago #
https://news.ycombinator.com/item?id=47034192
- 当前人工智能相关投资热潮导致硬件市场供需失衡,价格飙升,反映出非理性资金的干扰。
- 硬件产能扩张需要时间,生产者在面对可能短暂的繁荣时,对新建工厂持谨慎态度。
- 2022 年芯片和存储行业曾因疫情后需求激增而出现泡沫,随后崩溃,导致企业减少资本支出,为当前短缺埋下伏笔。
- 当前科技行业的估值已远超其实际盈利能力,形成明显资产泡沫,尤其以“七巨头”巨额资本开支为标志。
- 将软件行业整体市值与少数头部 AI 公司对比存在误导,应结合盈利能力和市盈率等指标综合评估。
- 微软等传统科技巨头的股价上涨主要源于长期业务增长,而非单纯由人工智能驱动。
- 若当前趋势持续,全球计算资源将严重不足,企业甚至面临无法采购必要硬件的困境。
- 市场的非理性状态可能持续较长时间,直到资金流动停止或外部冲击发生。
- 政府干预和金融体系的脆弱性使泡沫破裂后的后果极为严重,可能引发系统性危机。
- 当前高投入并非缺乏合理性,而是因为市场需求增长速度远超供给能力,投资不足才是问题核心。
Hacker News 精彩评论及翻译 #
I’m joining OpenAI #
https://news.ycombinator.com/item?id=47031422
I’m happy for the guy, but am I jealous as well? Well yes, and that’s perfectly human.
We have someone who vibe coded software with major security vulnerabilities. This is reported by many folks
We also have someone who vibecoded without reading any of the code. This is self admitted by this person.
We don’t know how much of the github stars are bought. We don’t know how many twitter followings/tweets are bought.
Then after a bunch of podcasts and interviews, this person gets hired by a big tech company. Would you hire someone who never read any if the code that they’ve developed? Well, this is what happened here.
In this timeline, I’m not sure I find anything inspiring here. It’s telling me that I should rather focus on getting viral/lucky to get a shot at “success”. Maybe I should network better to get “successful”. I shouldn’t be focusing on writing good code or good enough agents. I shouldn’t write secure software, instead I should write softwares that can go viral instead. Are companies hiring for vitality or merit these days? What is even happening here?
So am I jealous, yes because this timeline makes no sense as a software engineer. But am I happy for the guy, yeah I also want to make lots of money someday.
tabs_or_spaces
我为这个人感到高兴,但我是否也嫉妒呢?嗯,是的,这完全是人之常情。
有人用“感觉编码法”开发出了带有重大安全漏洞的软件,这是许多人报告的。 还有一个人承认,他“感觉编码”时根本没有阅读任何代码。 我们不知道GitHub上有多少星标是买来的,也不知道Twitter上有多少关注和推文是买来的。
然后,在参加了一堆播客和采访之后,这个人被一家大科技公司雇佣了。你会雇佣一个从未阅读过自己所开发代码的人吗?嗯,这里发生的就是这种情况。
在这个时间线里,我不确定这里有什么能激励我的东西。它告诉我,我应该更专注于制造病毒式传播的运气,才能获得“成功”的机会。也许我应该更好地拓展人脉来变得“成功”。我不应该专注于编写好代码或者够用的智能体。我不应该编写安全的软件,而应该编写能迅速传播的软件。如今,公司是在招聘有活力的人,还是凭实力招聘?这到底是怎么回事?
所以,我嫉妒吗?是的,因为作为一名软件工程师,这个时间线完全说不通。但我为这个人感到高兴吗?是啊,我也想有一天赚很多钱。
I’m joining OpenAI #
https://news.ycombinator.com/item?id=47032435
you get hired for your proven ability to (…)
No, you get hired for your perceived ability to (…)
The world is full of Juliuses, which is a big reason everything sucks.
https://ploum.net/2024-12-23-julius-en.html
latexr
你被雇佣是基于你已有的能力(…) 不,你被雇佣是基于你被认为所具备的能力(…) 这个世界到处都是尤利乌斯式的人物,而这正是一切都糟糕透顶的一个重要原因。
I’m joining OpenAI #
https://news.ycombinator.com/item?id=47031587
It’s funny to me how still so many don’t realize you don’t get hired for the best positions for being a 10x programmer who excels at hackerrank, you get hired for your proven ability to deliver useful products. Creativity, drive, vision, whatever. Code is a means to an end. If you’re the type of programmer who thinks of yourself as just a programmer, and take pride in your secure code, ability to optimize functions and algorithms, you’re exactly the kind of programmer AI will replace.
Quality of code has never had anything to do with which products are successful. I bet both youtube and facebook’s codebase is a tangled mess.
erikbye
在我看来很有趣,为什么还有那么多人不明白,你并不是因为是个在 HackerRank 上表现出色的 10x 程序员就能获得最好的职位,你能被录用是因为你交付有用产品的 proven 能力。创造力、驱动力、愿景,诸如此类。代码是达成目的的手段。如果你是那种只把自己看作程序员,并以代码安全、优化函数和算法为荣的程序员,那你正是会被 AI 取代的程序员类型。代码质量从来与产品是否成功无关。我敢说 YouTube 和 Facebook 的代码库都是一团糟。
I want to wash my car. The car wash is 50 meters a… #
https://news.ycombinator.com/item?id=47032253
so you need to tell them the specifics
That is the entire point, right? Us having to specify things that we would never specify when talking to a human. You would not start with “The car is functional. The tank is filled with gas. I have my keys.” As soon as we are required to do that for the model to any extend that is a problem and not a detail (regardless that those of us, who are familiar with the matter, do build separate mental models of the llm and are able to work around it).
This is a neatly isolated toy-case, which is interesting, because we can assume similar issues arise in more complex cases, only then it’s much harder to reason about why something fails when it does.
jstummbillig
所以你需要告诉它们具体细节。
这才是关键所在,对吧?我们被迫去说明那些在与人类交谈时永远不会提及的细节。你不会一上来就说“车能开。油箱加满了。我带着钥匙。”一旦我们被迫为模型做到这种程度,这就是个问题,而无关紧要的细节(尽管我们这些熟悉情况的人,确实会为大型语言模型构建独立的认知模型,并能够绕开它)。
这是一个非常巧妙的、孤立的玩具案例,这很有趣,因为我们可以想象在更复杂的情况下也会出现类似的问题,只不过那时,当事情出错时,要推理出原因就难得多了。
I want to wash my car. The car wash is 50 meters a… #
https://news.ycombinator.com/item?id=47031882
I’ve used LLMs enough that I have a good sense of their edges of intelligence. I had assumed that reasoning models should easily be able to answer this correctly.
And indeed, Sonnet and Opus 4.5 (medium reasoning) say the following:
Sonnet: Drive - you need to bring your car to the car wash to get it washed!
Opus: You’ll need to drive — you have to bring the car to the car wash to get it washed!
Gemini 3 Pro (medium): You should drive.
–
But OpenAI 5.2 reasoning, even at high, told me to walk. My first instinct was, I had underspecified the location of the car. The model seems to assume the car is already at the car wash from the wording. GPT 5.x series models behave a bit more on the spectrum so you need to tell them the specifics. So I asked:
“I want to wash my car. My car is currently at home. The car wash is 50 meters away. Should I walk or drive?”
GPT 5.2 Reasoning (medium):
“Drive—your goal is to get the car to the car wash, and it’s only 50 meters, so a slow, careful drive is simplest.
One small optimization: if you’re worried about starting the car for such a short trip or you want to avoid idling in a line, you can walk over first to check if there’s a queue / if it’s open, then come back and drive the car over when it’s your turn.”
Which seems to turn out as I expected.
prasoonds
我用过足够的LLM,对它们智能的边界有很好的把握。我曾以为,推理模型应该能轻松正确地回答这个问题。
确实,Sonnet和Opus 4.5(中等推理)给出了如下回答:
Sonnet:开车——你需要把车开到洗车店去洗车!
Opus:你需要开车——你必须把车带到洗车店才能洗车!
Gemini 3 Pro(中等):你应该开车。
–
但OpenAI 5.2的推理模型,即使设置为高级,却告诉我应该走路。我的第一反应是,我没有具体说明车的位置。该模型似乎从措辞上假设车已经在洗车店了。GPT 5.x系列的模型行为上更“谱”一些,所以你需要告诉它们具体细节。于是我问道:
“我想洗车。我的车现在在家。洗车店距离50米。我应该走路还是开车?”
GPT 5.2 推理(中等):
“开车——你的目标是把车弄到洗车店,而且只有50米远,所以慢慢开、小心点是最简单的。
一个小优化:如果你担心为这么短的距离启动汽车,或者想避免排队怠速,你可以先走过去看看有没有排队/是否营业,然后再回来在你轮到的时候把车开过去。”
这结果正如我所料。
EU bans the destruction of unsold apparel, clothin… #
https://news.ycombinator.com/item?id=47027510
Here’s how this law is actually going to work.
Instead of destroying the unsold clothes in Europe, manufacturers are going to sell them to “resale” companies in countries with little respect for the rule of law, mostly in Africa or Asia. Those companies will then destroy those clothes, reporting them as sold to consumers.
So instead of destroying those clothes in Europe, we’ll just add an unnecessary shipping step to the process, producing tons of unnecessary CO2.
The disclosure paperwork and the s/contracts/bribes/ needed to do this will also serve as a nice deterrent for anybody trying to compete with H&M.
miki123211
这项法律的实际情况是这样的。
制造商将不再在欧洲销毁未售出的衣物,而是将其卖给那些法治观念淡薄国家的“二手”公司,这些国家主要位于非洲或亚洲。这些公司随后会销毁这些衣物,并向有关部门谎称已售给消费者。
所以,我们并没有在欧洲销毁这些衣物,只是在过程中增加了一个不必要的运输环节,从而产生了大量不必要的二氧化碳。
完成这一切所需的披露文件和所谓的“合同”(贿赂),也会成为任何试图与H&M竞争的人的强大阻力。
Ministry of Justice orders deletion of the UK’s la… #
https://news.ycombinator.com/item?id=47035168
Something is either public record - in which case it should be on a government website for free, and the AI companies should be free to scrape to their hearts desire…
Or it should be sealed for X years and then public record. Where X might be 1 in cases where you don’t want to hurt an ongoing investigation, or 100 if it’s someone’s private affairs.
Nothing that goes through the courts should be sealed forever.
We should give up with the idea of databases which are ‘open’ to the public, but you have to pay to access, reproduction isn’t allowed, records cost pounds per page, and bulk scraping is denied. That isn’t open.
londons_explore
某些内容要么属于公开记录——在这种情况下,它理应免费出现在政府网站上,人工智能公司也应该可以随心所欲地去抓取……
要么就应该被密封X年,之后转为公开记录。这里的X可能是1年,例如在你不想妨碍正在进行的调查时;也可能是100年,如果内容涉及某人的私事。
任何经法庭审理的内容,都不应被永久密封。
我们应该摒弃那种“对公众开放”的数据库理念——在这种数据库里,访问需要付费,禁止复制,每页记录价格不菲,并且批量抓取也被禁止。那根本不叫开放。
Modern CSS Code Snippets: Stop writing CSS like it… #
https://news.ycombinator.com/item?id=47027324
CSS in 2025: Let’s write html inlined styles as if it was 2005 and separation of formatting/representation was never invented. I talk of tailwind, of course.
ktpsns
2025年的CSS:让我们像2005年那样直接在HTML里写内联样式,就好像从未有过样式与内容分离这回事。我说的当然是Tailwind。
Ministry of Justice orders deletion of the UK’s la… #
https://news.ycombinator.com/item?id=47035360
Open to research yes.
Free to ingest and make someones crimes a permanent part of AI datasets resulting in forever-convictions? No thanks.
AI firms have shown themselves to be playing fast and loose with copyrighted works, a teenager shouldn’t have their permanent AI profile become “shoplifter” because they did a crime at 15 yo that would otherwise have been expunged after a few years.
whizzter
开放研究,没问题。
但可以自由地将他人的犯罪行为纳入人工智能数据集,并以此形成永久的“定罪”?那就免了。
人工智能公司对待受版权保护的作品向来草率随意,一个青少年绝不应该因为在15岁时犯下的、按理说几年后就会被抹除的罪行,就给自己留下一个永久的“小偷”AI档案。
Amazon’s Ring and Google’s Nest reveal the severit… #
https://news.ycombinator.com/item?id=47025565
" Those who would give up essential Liberty, to purchase a little temporary Safety, deserve neither Liberty nor Safety " – Benjamin Franklin
The key phrase is “a little temporary safety”. 250 years ago people understood that the “security” gains were small and fleeting, but the loss of liberty was massive and permanent.
zugi
那些为了获得一点点暂时的安全而放弃根本自由的人,既不配拥有自由,也不配拥有安全”——本杰明·富兰克林。关键短语是“一点点暂时的安全”。250年前,人们明白所谓的“安全”收益微小且短暂,而自由的丧失却是巨大且永久性的。
Anthropic tries to hide Claude’s AI actions. Devs … #
https://news.ycombinator.com/item?id=47034401
the hiding stuff is weird because the whole reason you’d want to see what Claude is doing isn’t just curiosity - it’s about catching when it goes off the rails before it makes a mess. like when it starts reading through your entire codebase because it misunderstood what you asked for, or when it’s about to modify files you didn’t want touched. the verbose mode fix is good but honestly this should’ve been obvious from the start - if you’re letting an AI touch your files, you want to know exactly which files. not because you don’t trust the tool in theory but because you need to verify it’s doing what you actually meant, not what it thinks you meant. abstractions are great until they hide the thing that’s about to break your build
the_harpia_io
它隐藏操作内容这点很奇怪,因为你想知道 Claude 在做什么,并不仅仅是出于好奇,更重要的是要在它捅娄子之前就抓住问题所在。比如,因为它误解了你的要求而开始遍历你的整个代码库,或者它正要去修改那些你根本不希望它碰的文件。详细模式(verbose mode)的修复很好,但说实话,这从一开始就应该很明显——如果你要让 AI 操作你的文件,你就想知道具体是哪些文件。这并非因为你不信任这个工具的理论价值,而是因为你需要验证它做的是你真正想要的,而不是它以为你想要的。抽象层固然很棒,但前提是它们不能隐藏那些即将搞砸你构建流程的关键信息。
Thanks a lot, AI: Hard drives are sold out for the… #
https://news.ycombinator.com/item?id=47034440
There’s clearly easy/irrational money distorting the markets here. Normally this wouldn’t be a problem: prices would go up, supply would eventually increase and everybody would be okay. But with AI being massively subsidized by nation-states and investors, there’s no price that is too high for these supplies.
Eventually the music will stop when the easy money runs out and we’ll see how much people are truly willing to pay for AI.
glimshe
这里显然有热钱在扭曲市场。通常,这不会是个问题:价格会上涨,供给最终也会增加,大家最终都会好起来。但人工智能得到了国家和投资者的大力补贴,对于这些供应品来说,价格再高也无所谓。最终,当热钱耗尽,泡沫破裂时,我们才能看清人们到底愿意为人工智能付多少钱。
14-year-old Miles Wu folded origami pattern that h… #
https://news.ycombinator.com/item?id=47040156
Don’t get hung up on “14 year old”. Pay attention to “took up origami 6 years ago”. That’s 6 years of passionate learning, experimenting and improvement.
givemeethekeys
别纠结于“14岁”,请关注“6年前开始学习折纸”。这是6年来充满激情的学习、探索和进步。
I gave Claude access to my pen plotter #
https://news.ycombinator.com/item?id=47028360
The images are neat, but I would rather throw my laptop in the ocean than read chat transcripts between a human and an AI.
(Science fiction novels excluded, of course.)
pavel_lishin
图片倒是挺整洁的,但我宁愿把笔记本扔进大海,也不想看人类和AI之间的聊天记录。
(科幻小说除外,当然。)
UK Discord users were part of a Peter Thiel-linked… #
https://news.ycombinator.com/item?id=47036949
I think it’s prudent to assume that these companies are selling your information to anyone with two nickels to rub together, regardless of which tech celebrities they are linked to.
SoftTalker
我觉得,最稳妥的做法是,就当这些公司会把你的信息卖给任何人,不管它们背后有没有科技名人撑腰。
I’m joining OpenAI #
https://news.ycombinator.com/item?id=47029078
While following OpenClaw, I noticed an unexpected resentment in myself. After some introspection, I realized it’s tied to seeing a project achieve huge success while ignoring security norms many of us struggled to learn the hard way. On one level, it’s selfish discomfort at the feeling of being left behind (“I still can’t bring myself to vibe code. I have to at least skim every diff. Meanwhile this guy is joining OpenAI”). On another level, it feels genuinely sad that the culture of enforcing security norms - work that has no direct personal reward and that end users will never consciously appreciate, but that only builders can uphold - seems to be on it’s way out
maxaw
在关注OpenClaw项目时,我发现自己内心涌起一种未曾预料到的怨怼。经过一番内省,我意识到这与看到一个项目取得巨大成功却忽视了我们许多人曾付出惨痛代价才学会的安全规范有关。一方面,这是一种因被抛下而产生的、略带私心的不适(“我还是无法说服自己随性写代码,至少得大致看一下每一个代码差异。与此同时,这家伙却加入了OpenAI”)。另一方面,强制执行安全规范的文化——那种没有直接个人回报、终端用户永远不会意识到其价值、却只能由建设者来维护的工作——似乎正在逐渐消失,这确实令人感到悲伤。
I guess I kinda get why people hate AI #
https://news.ycombinator.com/item?id=47038199
Microsoft’s AI CEO is saying AI is going to take everybody’s job. And Sam Altman is saying that AI will wipe out entire categories of jobs. ANd Matt Shumer is saying that AI is currently like Covid in January 2020—as in, “kind of under the radar, but about to kill millions of people”.
I legitimately feel like I am going insane when I hear AI technologists talk about the technology. They’re supposed to market it. But they’re instead saying that it is going to leave me a poor, jobless wretch, a member of the “permanent underclass,” as the meme on Twitter goes.
They are marketing it. The target customer isn’t the user paying $20 for ChatGPT Pro, though; the customers are investors and CEOs, and their marketing is “AI is so powerful and destructive that if you don’t invest in AI, you will be left behind.” FOMO at its finest.
mjr00
微软的AI首席执行官说,AI将取代所有人的工作。而山姆·奥特曼(Sam Altman)则表示,AI将淘汰整个行业的职位。还有马特·舒默(Matt Shumer)说,AI目前的状况就像2020年1月的新冠疫情一样——也就是说,“它还处在人们的雷达之下,但却即将夺走数百万人的生命”。
当听到AI技术专家谈论这项技术时,我真的感觉自己快要疯了。他们本该为这项技术做市场推广,但他们却告诉我,它会让我变得贫穷、失业,沦为一个“永久底层阶级”——正如推特上那个梗所说的那样。
他们确实在为它做营销。但目标客户并非那些花20美元订阅ChatGPT Pro的普通用户;真正的客户是投资者和首席执行官,他们的营销口号是:“AI是如此强大和具有破坏性,如果你不投资AI,你就会被时代淘汰。”这简直是把错失恐惧症(FOMO)发挥到了极致。
The Sideprocalypse #
https://news.ycombinator.com/item?id=47036392
I wish i could take back the view i gave to this article, it says nothing. Is there such a thing as an inverse hype machine? Where people take the opposite side of a hyped product and then hype that view just as much but for the same purpose? His footer even admits he’s basically just trolling for views so he can reach the status of “thought leader”.
btw, someone else having the same idea you have for a saas company has always been the case forever. Individuals taking shortcuts in quality to get to market faster has also been the case forever. There’s nothing new about either of those two things.
chasd00
我真希望我能撤回我给这篇文章的赞,因为它说了等于没说。有没有“反向炒作机”这种东西?就是人们针对一个被炒作的产品,采取完全相反的立场,然后用同样的方式去炒作这个观点,但目的却是一样?他的页脚甚至承认了自己基本上就是靠钓鱼引战来获取流量,好让自己成为“意见领袖”。
顺便一提,永远都会有其他人跟你有同样的SaaS公司创业想法,这向来如此。为了更快上市而牺牲产品质量,这也向来如此。这两件事哪一件都不新鲜。
Modern CSS Code Snippets: Stop writing CSS like it… #
https://news.ycombinator.com/item?id=47028316
The deadest horse in web development is the myth of “separation of concerns”
namuol
Web开发里最该被枪毙的迷思就是“关注点分离”。
Editor’s Note: Retraction of article containing fa… #
https://news.ycombinator.com/item?id=47029193
Former technology journalist here.
If you want to experiment with reported news using untested tools that have known quality problems, do it in a strictly controlled environment where the output can be carefully vetted. Senior editor(s) need to be in the loop. Start with something easier, not controversial or high-profile articles.
One other thing. If the author cut corners because he’s too sick to write, but did so anyway because he thought his job would be in jeopardy if he didn’t publish, maybe it’s time for some self-reflection at Ars regarding the work culture and sick leave/time-off policies.
ilamont
我以前是科技记者。
如果你想用存在已知质量问题的未经测试的工具来实验性报道新闻,请在严格受控的环境中进行,以确保输出内容能够得到仔细审核。高级编辑必须参与其中。先从一些简单、不具争议性或低关注度的文章开始。
还有一点。如果作者因为生病无法写作而偷工减料,但仍认为不发表工作就会不保,那么Ars或许该反思一下其工作文化和病假/休假政策了。
I fixed Windows native development #
https://news.ycombinator.com/item?id=47024407
The build.bat above isn’t just a helper script; it’s a declaration of independence from the Visual Studio Installer.
I am so fed up with this! Please if you’re writing an article using LLMs stop writing like this!
dimgl
上面的 build.bat 不仅仅是一个辅助脚本;它宣告了我们不再依赖 Visual Studio 安装程序。
我真是受够了!如果你正在用大语言模型写文章,就别再这样写了!