2026-03-17 Hacker News Top Stories #
- 预测市场Polymarket的赌徒为操纵赌局结果,威胁记者篡改关于伊朗导弹袭击的报道,暴露了金融投机与虚假信息合流对新闻独立性的新型威胁。
- 加拿大《合法获取法案》在取消部分无证索取权的同时,要求电子服务提供商保留元数据并协助执法测试数据访问,仍存在"后门"监控和重大隐私安全隐患。
- 现代新闻网站因广告驱动的商业模式导致单页面数据量高达49MB,大量跟踪脚本和"敌对设计"严重违反可用性原则,将用户注意力作为数据收割原料。
- 基于62国数据的研究表明,腐败在民主国家对社会信任的侵蚀显著强于专制国家,因民主制度强调公平契约,腐败被视为对价值观的背叛而产生"规范放大效应"。
- 文章呼吁停止未经审阅直接复制粘贴AI生成内容的"Sloppypasta"行为,强调应主动验证和个性化处理AI输出,避免将验证负担转嫁给接收者并维护专业信任。
- 英国国防部内部专家警告,美国AI公司Palantir深度整合政府多部门数据,即使不直接接触机密也能通过分析推断国家机密,构成"国家级安全威胁"。
- Chrome DevTools MCP服务器新功能支持编码代理直接连接运行中的浏览器会话,复用登录状态并访问调试面板,实现更高效的自动化调试体验。
- 作者分享借助LLM开发软件的新范式,认为开发者应从关注编码细节转向系统架构设计,利用AI工具即使不逐行审阅代码也能构建可维护的复杂应用。
- 纳斯达克为迎合SpaceX上市提议修改指数规则,允许新公司快速入指并对低流通股给予高权重乘数,这将迫使被动基金以虚高价格买入,损害普通投资者利益。
- 基于美国劳工统计局数据的交互式可视化工具显示,尽管软件开发岗位市场增长,但面临签证移民和本土毕业生的双重供给压力,长期增长可持续性存疑。
1. Polymarket 赌徒因伊朗导弹事件威胁要杀我 (Polymarket gamblers threaten to kill me over Iran missile story) #
2026 年 3 月 10 日,伊朗向以色列发射一枚导弹,击中耶路撒冷以南的贝特谢梅什附近一片林地,未造成人员伤亡。以色列《国土报》军事记者埃马努埃尔·法比安(Emanuel Fabian)在报道中援引救援部门和现场视频,确认该事件为一枚未被拦截的导弹直接命中。
然而,此后法比安接连收到多名匿名人士的邮件与消息,要求他修改报道,声称该地点实际是拦截导弹的碎片坠落,而非完整导弹击中。发件人 Aviv 和 Daniel 均以“为国家利益”“帮助很多人”为由,要求他当晚更新文章,甚至暗示若不配合将带来严重后果。
其中一名发件人 Daniel 更明确表示:“如果你今晚不改,你正在让很多人失望。”他还附上一份误标为《经济学人》的印度媒体截图,声称法比安的报道已被引用,造成连锁错误。
法比安发现,这些联系人活跃于 X(原推特)和 Discord 平台,且与名为 Polymarket 的预测市场网站有关。该平台允许用户对事件结果下注,包括“伊朗导弹是否击中以色列”等议题。
经调查,这些匿名人士的真实目的,是通过施压记者,确认导弹是否真正击中以色列,以影响 Polymarket 上相关赌局的赔率。一旦确认导弹未被拦截,下注“伊朗成功打击以色列”的用户将获利。
法比安指出,这些行为已构成严重威胁,甚至涉及人身安全。他强调,自己作为记者,必须基于事实报道,不受外部压力影响。目前,他仍坚持原报道内容,即导弹确为未被拦截的完整弹头击中。
该事件揭示了现代信息战中,虚假信息与金融投机的结合,以及媒体独立性面临的新型威胁。
HN 热度 1277 points | 评论 854 comments | 作者:defly | 12 hours ago #
https://news.ycombinator.com/item?id=47397822
- Polymarket 的出现反映了亚当·斯密“自由市场”思想的极端化,这种思想被批评为放纵甚至带有“撒旦”色彩,可能导致对名人、政客甚至普通人的死亡进行赌博。
- 亚当·斯密实际上是一位道德哲学家,他批评赌博和国家主导的赌博,认为人类对自身能力的过度自信是一种道德缺陷,因此对他的思想被曲解为支持无限制市场自由是一种误解。
- 将亚当·斯密的名字用于为商业不当行为辩护,是对其思想的误读,他本人对商人过度逐利的行为持批判态度,其核心关注点是社会整体福祉而非市场效率。
- 左翼思想家并非一味批评亚当·斯密,而是将其视为政治经济学的重要奠基人,尽管认为其理论存在局限,但其关于阶级意识与共同利益的讨论仍具启发性。
- 亚当·斯密的著作中明确指出了“看不见的手”带来的问题,强调市场机制可能引发社会异化与劳动剥削,这些警示对现代政策制定具有现实意义。
- 尽管亚当·斯密的思想被广泛误用,但真正的问题在于社会对市场机制的盲目崇拜,而非其本人的原意,应更关注其对市场失灵的深刻洞察。
- 与其过度依赖古典思想家的权威,不如让当代思想家在现实语境中反思技术与资本的结合,如 Polymarket 所体现的“私有化国家情报”趋势。
- 亚当·斯密与马克思的思想都被后人简化和工具化,其复杂理论被简化为意识形态标签,导致对真实问题的讨论被遮蔽。
- 试图通过回归古典思想来解决现代问题是一种无效的循环,真正的挑战在于面对技术与资本结合所催生的新形式的权力集中。
- 任何社会都难以完全脱离市场机制,但自由市场并非唯一选择,非自由市场社会如北朝鲜或亚马逊部落社区也存在,只是其发展水平与生活质量难以与现代自由社会相比。
2. 《合法获取法案》(Bill C-22):危险的后门监控风险依然存在 (Bill C-22, the Lawful Access Act: Dangerous backdoor surveillance risks remain) #
文章讨论了加拿大新推出的《合法获取法案》(Bill C-22),该法案标志着政府在“合法获取”议题上的新一轮立法尝试。与去年因过度扩大权力而受挫的 Bill C-2 相比,Bill C-22 在部分条款上有所调整,但仍存在严重隐私与安全风险。
法案分为两大部分:第一部分涉及“及时获取数据与信息”,已作出重要改进。政府取消了原法案中针对所有服务提供者的广泛、无需法院授权的信息索取权,转而设立“服务确认请求权”,仅允许执法机构向电信运营商询问某人是否为其客户。更敏感的个人数据获取则需通过法官批准的生产令,这符合加拿大最高法院近期关于隐私权的判例精神,是重大进步。
然而,法案的第二部分——《支持授权获取信息法案》(SAAIA)则保留了极具争议的监控机制。它要求所有“电子服务提供者”(ESP)——包括谷歌、Meta 等国际平台——必须为执法机构提供“合理协助”,以测试其数据访问和拦截能力。ESP 的定义极为宽泛,涵盖任何在加拿大提供电子服务的实体,无论其是否在本地运营。
核心提供商(core providers)将面临更严格义务,包括:开发和维护执法可访问的技术能力、安装相关设备、提交通知,并保留特定元数据(如通信传输数据)长达一年。尽管法案明确禁止保留内容信息、网页浏览历史和社会媒体活动记录,但元数据的强制保留仍引发隐私担忧。
此外,法案允许政府在特定情况下引入系统性安全漏洞,这可能严重威胁网络整体安全。虽然新增了情报专员对部长命令的审批机制,但整体仍缺乏透明度,且对跨境数据共享未设有效限制。
总体来看,尽管法案在部分程序上有所收敛,但其对网络基础设施的强制监控要求、对国际平台的广泛管辖以及对安全漏洞的容忍,仍构成对公民隐私和网络安全的重大挑战。作者警告,这些条款可能带来长期的“后门”风险,值得高度警惕。
HN 热度 975 points | 评论 316 comments | 作者:opengrass | 1 day ago #
https://news.ycombinator.com/item?id=47392084
- 该法案允许在特定情况下不向被调查者提供搜查令副本,存在滥用权力的主观漏洞,可能损害公民权利。
- 在调查犯罪组织时,不通知嫌疑人可避免其中断非法活动,有利于获取完整证据链。
- 犯罪分子停止犯罪行为本身是一种积极结果,不应一味追求“大抓捕”和长期监控。
- 传统上警察通过公开存在感进行威慑,如今数字监控使执法方式变得隐蔽且缺乏透明度。
- 执法人员若缺乏信任,过度依赖隐蔽监控可能演变为对普通公民的骚扰。
- 警察应通过公开巡查和询问等方式开展调查,而非依赖长期隐蔽监控。
- 隐蔽监控的正当性应有时间限制,若无法在合理期限内证明犯罪,应终止调查并告知当事人。
- 任何个人或组织都可能被随意定义为“犯罪组织”,从而成为长期监控对象,存在政治滥用风险。
- 民主社会中,公民不应被无故调查而不知情,这是基本权利保障。
- 该法案并未免除搜查令要求,只是允许在特定情况下不向相关方出示,本质上仍受法律约束。
- 与美国相比,加拿大在数据监控方面限制更严格,当前措施并非前所未有。
- 互联网服务提供商作为技术执行方,无需知晓搜查令内容,因其已掌握用户身份信息。
- 搜查令一旦签发,应有明确有效期,且执法机构需在一定期限后通知被监控者。
- 监控行为的合法性应参照传统电话监听的法律框架,已有成熟判例支持。
3. 49MB 的网页页面 (The 49MB web page) #
https://thatshubham.com/blog/news-audit
现代新闻网站的页面加载体验已严重恶化,一篇简单的文章加载可能消耗高达 49MB 的数据,涉及 422 个网络请求,耗时数分钟。这一体积甚至超过 Windows 95 操作系统(28 张软盘)的总和,相当于下载 10 至 12 首高质量 MP3 歌曲。尽管硬件性能大幅提升,但前端框架与广告技术堆栈的臃肿反而抵消了进步。
页面加载过程中,浏览器需处理大量跟踪脚本和程序化广告竞价,这些操作在后台悄然进行,占用 CPU 资源,导致设备发热、风扇运转、电池快速消耗。广告系统通过频繁的 POST 请求、像素追踪和跨站身份关联,构建用户画像,形成一场“高频率数字交易市场”般的监控行为。
更讽刺的是,这些行为往往打着“合规”旗号,如使用名为“purr.nytimes.com”的 TCF(透明与同意框架)接口,实则在用户不知情下持续采集数据。用户被迫点击 cookie 同意弹窗,却仍被后台持续追踪,形成“法律盾牌”与“数据掠夺”并存的悖论。
根本原因在于经济驱动:出版商为追求短期广告收益(CPM),牺牲用户体验,采用“敌对设计”策略。页面停留时间、广告可见性等指标成为核心 KPI,导致设计不断强化干扰——如强制弹窗、多重登录提示、广告占据 95% 屏幕空间等。用户必须完成一系列“数字家务”才能阅读内容,交互成本极高。
典型案例包括《经济时报》页面:用户刚进入即遭遇“Z 轴战争”——底部 cookie 横幅、中间订阅弹窗、右上角通知请求同时弹出,且关闭按钮设计低对比度,难以发现。这种多重干扰严重违反可用性原则,违背“内容优先”设计逻辑。
最终,现代新闻网站已演变为以用户注意力为原料的“数据收割场”。读者的耐心与认知负荷被系统性榨取,而内容本身却被边缘化。这不仅是技术问题,更是商业模式与伦理失衡的体现。
HN 热度 774 points | 评论 346 comments | 作者:kermatt | 1 day ago #
https://news.ycombinator.com/item?id=47390945
- 开发者在高速网络下开发时容易忽视性能问题,导致网站在低速网络下表现极差。
- 使用浏览器开发者工具中的网络和 CPU throttling 功能,可以有效模拟慢速网络环境,帮助优化网站性能。
- 有开发者曾因忘记关闭模拟慢速网络设置,导致误判性能问题,浪费大量时间优化。
- 旧设备或低带宽环境下,现代网页加载缓慢甚至崩溃,凸显优化必要性。
- 使用轻量级浏览器如 Lynx 或 Links,能在资源有限的设备上更高效地浏览网页。
- 一些开发者故意在前端代码中加入延迟,以展示加载动画,这种做法缺乏对用户体验的基本尊重。
- 管理层和产品负责人也应体验慢速网络环境,才能真正理解性能优化的重要性。
- macOS 用户可通过 Network Link Conditioner 工具全局模拟不同网络条件,便于测试。
- 某些网站故意在 JavaScript 中加入人为延迟,以展示 UI 动画,这种行为令人难以理解。
- 有开发者曾因未关闭系统级网络限速工具(如 tc netem),导致测试环境异常,影响开发效率。
- 网络限速功能在测试后容易被遗忘,导致误判性能问题,需养成良好习惯。
- 未来或许可以出现“浏览器即服务”模式,由服务器端快速加载页面并传输给用户。
4. 腐败对社会信任的侵蚀在民主国家比在专制国家更为严重 (Corruption erodes social trust more in democracies than in autocracies) #
https://www.frontiersin.org/journals/political-science/articles/10.3389/fpos.2026.1779810/full
本文发表于《Frontiers in Political Science》2026 年 3 月 2 日,属于“和平与民主”栏目,探讨了腐败对社会信任的影响在不同政体中的差异。研究聚焦于一个核心问题:为何在民主国家中,腐败对社会信任的破坏作用比在专制国家更为显著。
研究提出两个理论机制:一是“规范放大效应”,即民主制度强调平等与公正,腐败被视为对社会契约的背叛,从而严重削弱公众对社会整体的信任;二是“代表传染效应”,在民主制度下,腐败官员由民众选举产生,公众可能将腐败行为与自身联系起来,产生自我归因的负罪感,进而降低信任。而在专制国家,腐败被视为精英阶层的常态,与普通民众隔离,因此对社会信任的冲击较小。
研究基于 62 个国家的个体调查数据与国家层面的民主质量指标,采用多层次分析方法,验证了上述理论。结果显示,感知腐败确实普遍降低个体的普遍信任水平,但这一心理机制在民主国家中显著更强,即使控制了不平等和国家层面腐败程度等变量后依然成立。
研究结论指出,民主制度所依赖的问责机制,也使其社会资本更加脆弱。腐败不仅损害制度信誉,更通过心理机制侵蚀民主社会的团结基础。这一发现对理解民主韧性具有重要意义:民主国家在应对腐败时面临独特挑战,必须加强制度透明与公众信任重建。
文章数据来自全球范围,涵盖从俄罗斯、伊朗等国家到新西兰、荷兰等稳定民主国家,具有较强的代表性。研究为民主治理中的信任危机提供了深层解释,并呼吁政策制定者关注腐败对社会心理的长期影响。
HN 热度 631 points | 评论 326 comments | 作者:PaulHoule | 13 hours ago #
https://news.ycombinator.com/item?id=47397593
- 在威权体制中,腐败被视为维持社会运转的必要手段,官员通过索要贿赂来推动事务进展,普通民众为获取服务也需参与其中,形成一种依赖关系。
- 在低信任社会中,遵守规则无法获得结果,拒绝腐败反而会遭遇更多障碍,因此不参与腐败几乎等同于自我边缘化。
- 腐败在威权社会中是系统性存在,已成为经济运行的一部分,拒绝参与会带来生活上的巨大困难,类似在现代西方社会“离网生活”。
- 腐败并非普遍可及,其本质是一种隐性社会资源分配机制,通过关系网络(如 blat)实现资源交换,而非简单的金钱交易。
- blat 是一种基于个人信任的关系网络,通过长期互惠的非正式交换(如物资、服务、信息)来达成目标,其核心是信任而非金钱。
- 腐败行为常表现为公职人员利用职权为私人关系提供便利,如免费维修、优先购票、子女入学等,这些行为本质上是滥用公共权力。
- 在威权体制下,腐败是获取稀缺资源的必要途径,而拒绝参与将导致个人在社会中处于不利地位。
- 腐败在西方更多体现为权贵阶层通过金钱和关系绕过规则,实现利益输送,而非普通民众的日常行为。
- 腐败的隐蔽性使其难以被制度化,但其存在被广泛知晓,尤其在资源分配不公的环境中,普通人无法通过正常渠道获得服务。
- 腐败本质上是一种社会筛选机制,使有能力者通过非正式渠道获得优势,而守法者因不符合“潜规则”而被排除在外。
- 腐败的长期存在会削弱社会对规则的信任,形成恶性循环,使制度性治理更加困难。
5. 杜绝随意粘贴 (Stop Sloppypasta) #
本文探讨了“Sloppypasta”这一现象,即未经审阅、未加修改、直接复制粘贴的 AI 生成内容被随意发送给他人,尤其在工作沟通中表现明显。这种行为虽看似高效,实则对收件人造成额外负担,因对方需自行验证内容真实性、相关性与准确性。
文章指出,Sloppypasta 的常见形式包括:将 AI 生成的通用策略建议、邮件打开率下降分析或竞争对手报告直接转发,而未结合具体情境或团队讨论背景。这些内容往往缺乏具体数据、来源或时效性,却以“我让 AI 分析了”为由被当作个人见解呈现。
作者强调,这种行为本质上是责任转嫁:发送者省去了思考与验证的步骤,却要求接收者承担认知成本。这打破了过去“写”与“读”之间相对平衡的努力关系,造成“努力不对等”,引发接收者的挫败感。
此外,Sloppypasta 损害信任。现代大模型虽能生成流畅文本,但存在“幻觉”(hallucination)风险,即编造事实。若发送者未核实内容,接收者无法判断信息真伪,长期下来会削弱对发送者专业性的信任。
文章引用多位专家观点,指出写作是思考的过程,通过写作能加深理解与记忆。若过度依赖 AI 生成内容,反而会降低自身认知能力,形成“认知债务”。
最后,作者呼吁:在沟通中应避免直接转发 AI 输出,而应主动提炼、验证、个性化内容,体现个人判断与专业价值。真正的协作不是复制粘贴,而是共同思考与创造。
HN 热度 610 points | 评论 241 comments | 作者:namnnumbr | 1 day ago #
https://news.ycombinator.com/item?id=47389570
- AI 生成的 Jira 工单内容冗长且不切实际,常包含无关功能,导致开发团队难以理解,甚至需要重新编写。
- 一些团队成员将 AI 生成的工单视为“手写”内容,拒绝承认其来源,导致沟通障碍和误解。
- AI 生成的工单缺乏上下文和逻辑一致性,尤其在缺乏熟悉旧代码库的人员时,问题更加严重。
- 工程师过度依赖 AI 生成代码或文档,导致自身对系统理解不足,职业成长受限。
- 有人利用 AI 生成的模糊工单作为招聘要求,制造“无法理解”的岗位,实为讽刺性现象。
- 生成的 PR 描述冗长且空洞,充斥“更好的架构”“更干净的代码”等无意义术语,实际信息量低。
- 有人在使用 AI 生成内容时仍需手动精简和审查,反而增加了工作量,效率并未提升。
- 用 AI 生成支持工单或邮件,导致信息被淹没在无用文本中,增加了运维人员的排查成本。
- AI 生成内容的泛滥使团队信任度下降,甚至被视为对同事的不尊重,影响团队协作氛围。
- 有人建议在使用 AI 时明确限制输出长度和受众,以提升内容质量,但仍需人工审核。
6. 英国国防部警告:帕兰提尔深度介入政府核心构成国家安全威胁 (MoD sources warn Palantir role at heart of government is threat to UK security) #
英国国防部(MoD)内部两名高级技术专家匿名透露,美国人工智能与监控公司帕兰提尔(Palantir)在英国政府中的深度介入已构成“国家级安全威胁”。尽管政府声称所有数据仍归英国所有,但这些技术人员指出,这种说法忽视了帕兰提尔通过数据聚合与分析能力,能够构建出关于英国社会的全面画像,甚至推导出国家机密信息。
帕兰提尔已获得超过 6.7 亿英镑的英国政府合同,包括 1.5 亿英镑的国防投资协议及 1500 万英镑与英国核武器机构的合作。专家强调,即便原始数据由政府掌控,但帕兰提尔通过整合不同部门的非机密信息,可生成高度敏感的结论。例如,仅凭一个北约零件编号、送达地址和日期,就能推断出核潜艇在特定时间抵达迪戈加西亚港的位置。
这些技术专家警告,帕兰提尔已能将国防、医疗、交通、能源及工业基础设施等多领域数据整合,形成对英国国家运行的全景式掌握。这种能力不仅对外国势力构成风险,也使英国在与美国等盟友的互动中处于被动地位。若美国掌握这些信息,可能在外交或军事决策上对英国施加隐性压力。
英国开放权利集团执行董事吉姆·基洛克指出,帕兰提尔的全面数据洞察力,使美国在必要时拥有“巨大杠杆”。他批评英国政府对帕兰提尔的依赖,是与一个“妄自尊大、无视自身局限”的外国权力绑定。
与此同时,帕兰提尔在美国内政中也引发争议,其技术被用于移民驱逐和建立全美可搜索公民数据库。美国军方也在多个地区使用其 AI 系统。相比之下,瑞士军队已拒绝该技术,担忧其带来的主权与安全风险。
目前,英国国防部未对相关指控作出回应,但此前表示已通过合同条款确保数据主权。然而,技术专家认为,这种“数据所有权”说法在实际操作中毫无意义,如同读完一封机密情书后声称内容安全,实则已掌握全部信息。
HN 热度 578 points | 评论 234 comments | 作者:vrganj | 12 hours ago #
https://news.ycombinator.com/item?id=47397797
- Palantir 因瑞士媒体揭露其被多个政府机构拒绝合作而提起诉讼,但实际可能是行使法律赋予的回应权利,而非压制言论。
- 有观点认为 Palantir 的商业模式本质是为股东利益服务,通过权力关系将资金输送给特定关系网,缺乏真实业务价值。
- Palantir 与全球规模的情报、监视与侦察系统整合多年,其技术已超越国家层面,构成全球性安全威胁。
- 该公司被指与“黄金穹顶”导弹防御系统有关联,进一步强化其作为全球安全威胁的形象。
- Palantir 的崛起与彼得·蒂尔的愿景密切相关,其目标是通过技术手段削弱民主制度,实现精英统治。
- 蒂尔将 Palantir 命名源自《指环王》中邪恶势力使用的邪恶之眼,这一命名选择被批评为具有象征意义的讽刺。
- 蒂尔公开谈论“反基督”并认为其可能存在于当代,这种言论被批评为极端且脱离现实,与基督教教义相悖。
- 蒂尔支持特朗普、推动“项目 2025”等行动,其政治立场与通过制造“替罪羊”来维持社会秩序的理论一致。
- 蒂尔的宗教观点受勒内·吉拉尔影响,认为社会需要通过牺牲特定群体来避免崩溃,这种思想被批评为危险且非主流基督教信仰。
7. Chrome DevTools MCP 服务器现已支持编码代理直接连接运行中的浏览器会话,实现更高效的调试体验 (Chrome DevTools MCP (2025)) #
https://developer.chrome.com/blog/chrome-devtools-mcp-debug-your-browser-session
Chrome DevTools MCP 服务器现已支持让编码代理直接连接到正在运行的浏览器会话,带来更高效的调试体验。该功能允许编码代理复用现有登录状态,无需重复登录,特别适用于需要身份验证的场景。同时,代理可直接访问 DevTools 中的活动调试会话,例如在“网络”或“元素”面板中选中问题请求或元素后,交由编码代理分析并修复。
此功能基于 Chrome M144(Beta 版)的新特性,通过启用远程调试并配置 MCP 服务器使用 –autoConnect 参数实现。用户需在 chrome://inspect#remote-debugging 页面开启远程调试,并在每次连接请求时手动授权。连接成功后,Chrome 顶部将显示“Chrome 正由自动化测试软件控制”的提示,确保安全性。
使用步骤包括:1)在 Chrome 中开启远程调试;2)配置 MCP 服务器启动时自动连接;3)通过命令行工具(如 gemini-cli)发起调试任务,系统将自动打开页面并执行性能分析等操作。
未来,Chrome 计划进一步开放更多 DevTools 面板数据给编码代理,实现更深度的 AI 协同调试。该功能让用户在手动调试与 AI 辅助之间无缝切换,提升开发效率。
HN 热度 577 points | 评论 230 comments | 作者:xnx | 1 day ago #
https://news.ycombinator.com/item?id=47390817
- 使用 Playwright 拦截请求和响应,通过 Claude Code 自动化交互网站并生成强类型 API,以高效访问网站功能而不加载广告和冗余内容。
- 利用 Playwright 调整页面宽度,自动捕获 DOM 树在不同状态下的样式变化,生成结构化数据和截图,用于还原页面布局与响应式行为。
- 认为 MCP(Model Control Protocol)虽有使用门槛,但能标准化处理认证等复杂逻辑,提供比基础 HTTP 接口更安全的框架。
- 指出 MCP 的设计初衷是为 AI 提供统一的工具访问接口,而 CLI 虽高效但无法在所有 Claude 表面(如 Cowork)中使用。
- 认为当前对 MCP 的追捧是过度炒作,直接构建自定义 CLI 工具更高效,且能绕过不必要的抽象层。
- 强调 MCP 与手动工具的本质区别:前者面向自动化 AI 操作,后者面向人类交互,前者效率远高于后者。
- 认为 MCP 与 AI 模型的直接集成(如 Claude Code)结合,可实现“AI 速度”下的设计还原,如通过 SnipCSS 插件快速生成 Tailwind/CSS 代码。
- 指出 MCP 的使用存在“摩擦”,但这种摩擦可能被部分用户视为“安全”或“可控”的体现。
- 认为大公司(如 Meta)大规模爬取网页用于训练模型,与个人用户为提升效率而抓取数据,在目的和规模上完全不同,不应一概而论。
- 认为广告和追踪器本质上是监控行为,用户有权拒绝,大公司推广此类行为反而应自食其果。
- 强调用户对广告追踪的抵制是正当权利,而大公司利用用户数据牟利才是真正的“罪恶”。
- 指出对爬虫行为的道德评判应区分“训练”与“推理”:前者涉及大规模、无差别数据采集,后者是精准、目标明确的信息获取,后者更可接受。
- 认为用户通过自动化工具获取网页数据用于个人效率提升,与企业用于训练 AI 的行为在动机和影响上存在本质差异。
- 使用 BrowserOS 搭建内置 MCP 服务器,结合 Claude Code 实现网页自动化与 API 生成,体验良好。
- 通过 rtrvr.ai 扩展,仅通过提示即可让 AI 代理自动操作网页、记录网络请求,并生成带认证头的直接调用脚本,实现“一键自动化”。
- 借助 WebMCP 框架实现类似功能,可将网页交互转化为可复用的强类型 API,具备良好扩展性。
- 认为 Claude 本身已具备代理浏览器能力,无需依赖 Playwright,可直接生成确定性代码,实现更高效的自动化。
- 指出 Agent-Browser 项目虽新,但功能完整,具备替代 Playwright 的潜力,值得尝试。
8. 如何用大语言模型编写软件 (How I write software with LLMs) #
https://www.stavros.io/posts/how-i-write-software-with-llms/
本文作者 Stavros 分享了自己使用大型语言模型(LLM)进行软件开发的全新工作流程和心得体会。他坦言,自己真正热爱的并非编程本身,而是创造事物的过程。随着 LLM 技术的进步,尤其是 Codex 5.2 和 Opus 4.6 等模型的发布,他发现可以高效、低错误率地构建复杂软件系统,且代码可维护性远超以往。
作者指出,LLM 的进化改变了开发者的核心能力需求:不再需要精通编码细节,而是更强调系统架构设计与技术选型能力。在熟悉技术栈的项目中(如后端开发),即使代码量达到数万行,系统依然保持清晰与稳定;而在陌生领域(如移动端),则容易因架构不当导致代码混乱。
他列举了几个实际项目来证明 LLM 开发的实用性:
- Stavrobot:一个安全优先的个人智能助手,能管理日程、自主研究、生成代码、提醒任务,是真正日常使用的工具。
- Middle:一个可随身携带的语音记录设备,自动转录并发送至指定接口,实现“零摩擦”记录想法。
- Sleight of Hand:一件艺术装置钟,通过不规则的滴答声制造心理错觉,探讨时间感知。
- Pine Town:一个无限多人协作的数字画布,用户可在虚拟草地上自由绘画,充满趣味与社区互动。
作者强调,尽管他从未完整阅读过这些项目中的大部分代码,却仍对整体架构了如指掌。这得益于他使用 OpenCode 作为开发“引擎”,并建立了一套高度结构化的交互方式。
文章最后附有真实编码会话记录,详细展示如何与 LLM 协作完成任务,包括需求描述、代码生成、调试与优化全过程。作者认为,当前阶段仍需人类开发者进行架构把控与质量审查,但未来可能只需关注更高层次的设计。他相信,这标志着软件开发进入一个全新的、充满可能性的阶段。
HN 热度 469 points | 评论 462 comments | 作者:indigodaddy | 23 hours ago #
https://news.ycombinator.com/item?id=47394022
- 使用多角色代理协作的开发流程虽然看似有条理,但实际成本高昂,且在多数情况下无法超越单次高质量提示下的单一模型表现。
- 单一模型在良好提示和上下文支持下,能够高效完成复杂任务,其输出质量与多角色协作相当,但成本和耗时显著更低。
- 多角色代理协作的高成本主要源于角色间沟通与协调的开销,这种开销在人类组织中也普遍存在,但在模型间并不必要。
- 尽管人类通过分工实现专业化,但大型语言模型具备跨领域知识整合能力,无需通过角色分离来提升表现。
- 多代理系统在调试和追踪问题时存在严重困难,一旦出错难以定位,导致维护成本过高。
- 不同模型之间虽有差异,但顶级模型训练数据高度重叠,其认知差异远小于人类专家之间的差异,难以真正实现多样视角。
- 利用上下文差异或不同模型组合可部分模拟多视角,但效果仍不及真实人类多样性。
- 某些早期流行的多步骤代理工作流如今已过时,因模型自身已能自动完成类似任务,手动干预反而可能降低效率。
- 自动化上下文控制等技术虽潜力大,但目前提升有限,需更长时间打磨,短期内难以成为核心优势。
- 任务文件结合可验证节点的流程设计,具备意图表达、过程记录与自我反思能力,是未来有潜力的开发范式。
- 当前许多多角色协作模式属于“技术幻觉”或“临时性工具”,在模型能力快速进化背景下很快会被淘汰。
9. 纳斯达克的耻辱 (Nasdaq’s Shame) #
https://keubiko.substack.com/p/nasdaqs-shame
这篇文章名为《纳斯达克的羞耻》,作者 Keubiko 对纳斯达克最近对纳斯达克 100 指数方法的提案进行了深入分析和批评。作者表示,尽管他通常支持指数投资,但当前的市场情况让人感到不安,尤其是被动投资的资金涌入已经扭曲了市场的价格发现过程。
文章指出,纳斯达克最近发起了一项 “咨询”,旨在征求投资者对其指数方法更新的意见,但实际上这更像是一个强迫接受的通知,目的是为了迎合即将上市的 X 公司。据悉,SpaceX 希望能够快速进入纳斯达克 100 指数,以优于纽约证券交易所的方式进行 IPO。
文章详细介绍了两个主要的提案:
- ** 快速入场豁免(Fast Entry Exemption)**:新上市的大型公司可以在 15 个交易日后被添加到纳斯达克 100 指数,而无需遵循标准的流动性要求。
- ** 低流通股的 5 倍乘数(5x Multiplier for Low-Float Stocks)**:对于流通股少于 20% 的公司,纳斯达克提议将其在指数中的权重调整为其流通股比例的 5 倍。这意味着即使公司只有 5% 的流通股,按照这个方法计算,其在指数中的权重可以达到 25%。
作者认为,这样的做法会导致巨大的市场扭曲,尤其是被动投资基金在公司 IPO 后,必须以高于实际市场价格的水平购买这些股票,造成价格泡沫。此外,流动性的操控也会影响到公司的股价,并在锁仓期结束时,迫使被动投资者以不合理的高价购买更多股票最后,作者质疑纳斯达克和 SpaceX 之间的互动,并认为这种变更对普通投资者不利,可能会导致他们在高点买入股票,而真正的获益者则是内部人士和早期投资者。他还指出,尽管纳斯达克可能会在评论后修改提案,但这种情况可能很难被逆转。
文章以一种幽默讽刺的语气结尾,提醒读者对市场的复杂性和潜在的操控保持警惕,强调个人观点仅供娱乐,不应被视为投资建议。
HN 热度 398 points | 评论 154 comments | 作者:imichael | 1 day ago #
https://news.ycombinator.com/item?id=47392550
- 索引基金因合同义务需购买新纳入公司的 20% 股份,但若该公司公开流通股仅占 5%,则基金无法通过市场购买足额股份,导致创始人可借此操纵股价,形成类似“逼空”的金融困境。
- 评论者指出原例中计算错误,认为 20% 被动持有应对应 25% 的权重,且基金只需购买公开流通股的 25%,无需购买全部股份,因此不存在“除以零”的问题。
- 原作者回应称,其简化模型中已考虑 20% 被动持有与 5% 流通股的匹配,使基金必须购买全部公开流通股,从而引发价格飙升,其模型逻辑成立。
- 基金管理人可通过衍生品等方式跟踪指数,无需直接购买股票,因此不一定面临被迫高价购股的问题。
- 索引基金的跟踪误差是正常现象,但故意不履行合同义务以规避高价购股并非合理解释,应追究操纵行为的责任。
- 由于创始人通常有锁定期,基金在短期内无法从其他内部股东处购股,进一步加剧了对公开市场的依赖。
- 纳斯达克新提案允许低流通股公司按 5 倍流通股比例加权,这可能放大指数对新公司的价格影响。
- 指数基金的目标是跟踪指数,而非击败指数,即使因纳入导致股价虚高,基金仍会按规则执行,不关心后续价格回落。
- 有观点认为,指数纳入本身是股价上涨的主因,而创始人或早期投资者可借此提前布局获利。
- 若 SpaceX 被提前纳入指数,其股价将因基金被迫买入而暴涨,但若延迟纳入,可避免被市场“抢跑”。
- 有人质疑该“逼空”机制是否真实存在,认为其更像是炒作概念,缺乏实际操作基础。
10. 美国就业市场可视化工具 (US Job Market Visualizer) #
这是一个基于美国劳工统计局(BLS)数据的交互式可视化工具,名为“US Job Market Visualizer”。该工具展示了 342 个职业的就业情况,覆盖全美约 1.43 亿个工作岗位。每个职业以矩形表示,面积大小与该职业的总就业人数成正比。
用户可通过切换不同图层,查看各职业在多个维度上的分布情况:包括 BLS 预测的职业增长前景、中位数薪资、教育要求以及“数字 AI 暴露度”。其中,“数字 AI 暴露度”是通过大语言模型(LLM)评估得出的,衡量 AI 对某一职业的潜在影响程度,评分范围为 0 到 10。
该工具的核心功能之一是支持自定义 LLM 提示词,用户可编写新的评估问题(如对人形机器人、外包风险或气候变化的敏感度),由 LLM 为每个职业打分并重新着色,实现灵活的数据探索。
数据显示,当前有约 3410 万岗位面临负增长,占总数的 24%;而 9720 万岗位处于增长状态,占比达 68%。从薪资角度看,高薪职业(10 万美元以上)的平均增长前景最好,达到 8.7%。教育要求越高,职业增长预期也越强,拥有研究生及以上学历的职业平均增长达 11.3%。
值得注意的是,该工具并非正式报告或学术论文,而是一个用于探索和分析 BLS 数据的开发工具。其“数字 AI 暴露度”评分仅为粗略估算,不代表职业将被取代,而是反映 AI 可能带来的工作方式重塑。例如,软件开发等高度数字化的职业得分高达 9,但并不意味着岗位消失,反而可能因效率提升而需求增加。
HN 热度 390 points | 评论 306 comments | 作者:andygcook | 9 hours ago #
https://news.ycombinator.com/item?id=47400060
- 美国软件开发岗位市场增长速度远超平均水平,导致求职者难以在一年内找到新工作。
- 每年超过 12 万持 H1B、L1 和 OPT 签证的新移民进入美国,需每年 5% 以上的市场增长才能维持就业平衡,加上本土毕业生,年增长需求可能高达 10%,长期不可持续。
- 建议暂停 H1B 签证发放或大幅提高费用至 20 万至 50 万美元,仅允许真正顶尖人才进入,以防止企业滥用签证进行低成本替代性雇佣。
- 当前观点忽略了 H1B、L1 和 OPT 签证持有者中相当一部分人会离开美国,且并非全部从事软件开发工作,存在过度简化问题。
- 将移民视为“抢走工作”的逻辑属于“劳动总量谬误”(lump of labour fallacy),即错误地认为工作岗位是固定数量的。
- H1B 签证不应统一归为技术类,应像早期 H-1A(护士)和 H-1C(注册护士)那样按职业领域细分,以实现更精准管理。
- 应加强美国劳工部(DOL)的监管能力,对依赖 H1B 的雇主进行更严格审计,打击签证欺诈行为,但当前司法体系因“切诺基裁决”限制了行政效率。
- 提高 H1B 申请费用虽能增加成本,但对大型企业而言仍可承受,且 H1B 员工因签证绑定难以跳槽,企业可借此压低薪资,降低整体用工成本。
- H1B 签证持有者并非“廉价劳动力”,其实际成本通常高于本地员工,包括申请流程时间、法律费用、审批风险等,总成本远超薪资差异。
- H1B 员工并非完全“被绑定”于雇主,可自由申请工作转移,企业无法长期强制控制其职业去向。
- 持有 H1B 签证的外国人往往愿意接受较低薪酬,以换取在美国合法居留的权利,这种权利本身具有极高价值。
- 企业为规避高额 H1B 费用,正转向 L1、O1 等其他签证类型,或通过美国高校毕业生身份直接申请调整身份,绕过费用限制。
- 尽管 H1B 费用提高至 10 万美元,但实际支付者极少,多数企业通过其他路径规避,且大型科技公司仍持续大规模申请 H1B。
Hacker News 精彩评论及翻译 #
The 49MB web page #
https://news.ycombinator.com/item?id=47391711
Our developers managed to run around 750MB per website open once.
They have put in ticket with ops that the server is slow and could we look at it. So we looked. Every single video on a page with long video list pre-loaded a part of it. The single reason the site didn’t ran like shit for them is coz office had direct fiber to out datacenter few blocks away.
We really shouldn’t allow web developers more than 128kbit of connection speed, anything more and they just make nonsense out of it.
PunchyHamster
我们的开发者单次打开网站,竟占用 750MB 左右的内存。 他们给运维提交了工单,抱怨服务器太慢,请求我们查看一下。 于是我们就去查了查。在一个视频列表很长的页面上,每个视频都预加载了部分内容。 那个网站对他们的表现还算凑合,唯一的解释就是办公室和我们数据中心之间相隔几条街,且拥有直连光纤。 我们真不该给 web 开发人员超过 128kbit 的带宽,再多一点的话,他们只会搞出一堆乱七八糟的东西。
Polymarket gamblers threaten to kill me over Iran … #
https://news.ycombinator.com/item?id=47397972
Man the moral degradation is off the charts. Prediction markets are easily the worst things to grace the internet by far and its not even close.
fzil
天哪,道德沦丧简直爆表。预测市场绝对是迄今为止给互联网留下的最烂东西,差远了去了。
The 49MB web page #
https://news.ycombinator.com/item?id=47392296
PSA for those who aren’t aware: Chromium/Firefox-based browsers have a Network tab in the developer tools where you can dial down your bandwidth to simulate a slower 3G or 4G connection.
Combined with CPU throttling, it’s a decent sanity check to see how well your site will perform on more modest setups.
vunderba
给那些不知道的科普一下:基于 Chromium 或 Firefox 的浏览器在开发者工具中都有一个“网络”选项卡,你可以通过调低带宽来模拟较慢的 3G 或 4G 连接。配合 CPU 降频,这是一个很好的测试手段,可以用来检查你的网站在配置一般的设备上表现如何。
Ask HN: How is AI-assisted coding going for you pr… #
https://news.ycombinator.com/item?id=47392707
Haven’t seen this mentioned yet, but the worst part for me is that a lot of management LOVES to use Claude to generate 50 page design documents, PRDs, etc., and send them to us to “please review as soon as you can”. Nobody reads it, not even the people making it. I’m watching some employees just generate endless slide decks of nonsense and then waffle when asked any specific questions. If any of that is read, it is by other peoples’ Claude.
It has also enabled a few people to write code or plan out implementation details who haven’t done so in a long (sometimes decade or more) time, and so I’m getting some bizarre suggestions.
Otherwise, it really does depend on what kind of code. I hand write prod code, and the only thing that AI can do is review it and point out bugs to me. But for other things, like a throwaway script to generate a bunch of data for load testing? Sure, why not.
viccis
我没看到有人提到这点,但对我来说最糟糕的是,很多管理层非常喜欢用Claude生成50页的设计文档、PRDs之类的,然后发给我们让我们“尽快审阅”。没人会看,甚至连做的人自己都不看。我看到有些员工只是生成一堆没完没了的废话幻灯片,然后一旦被问到具体问题就开始支支吾吾/胡扯。如果真有人看,那大概也是别人的Claude在看。
这也让一些许久未写代码或规划实现细节的人(有时甚至十年以上)开始动笔,所以我收到了一些非常离谱的建议。
话说回来,这确实取决于是什么类型的代码。我手工编写生产代码,AI唯一能做的就是帮我审核代码并指出bug。但对于其他事情,比如一个一次性脚本用于生成大量数据进行负载测试?当然可以,没问题。
Chrome DevTools MCP (2025) #
https://news.ycombinator.com/item?id=47392034
I use Playwright to intercept all requests and responses and have Claude Code navigate to a website like YouTube and click and interact with all the elements and inputs while recording all the requests and responses associated with each interaction. Then it creates a detailed strongly typed API to interact with any website using the underlying API.
Yes, I know it likely breaks everybody’s terms of service but at the same time I’m not loading gigabytes of ads, images, markup, to accomplish things.
If anyone is interested I can take some time and publish it this week.
dataviz1000
我使用 Playwright 拦截所有的请求和响应,并指示 Claude Code 访问像 YouTube 这样的网站,点击并与所有元素及输入框进行交互,同时记录与每一次交互相关的所有请求和响应。随后,它会创建一个详细的强类型 API,通过底层 API 与任何网站进行交互。
是的,我知道这可能违反所有人的服务条款,但另一方面,为了达成目的,我并不需要加载巨量的广告、图片和网页标记。
如果大家感兴趣,我可以花点时间,本周将其发布出来。
Palestinian boy, 12, describes how Israeli forces … #
https://news.ycombinator.com/item?id=47403607
For those wondering, it is verifiable story, it is covered as fact in Israeli newspapers:
https://www.ynetnews.com/article/p7mq5k5bs
The main justification floated is that the car was “going fast” and thus made the undercover Israeli soldiers feel unsafe.
The New York Times describes it as such:
“Ali Bani Odeh’s wife and four young boys hadn’t seen him in a month and a half when he came home to Tammun, in the West Bank, from his construction job in Israel late on Friday to spend the last few days of Ramadan with his family.
On Saturday night, the boys persuaded him to take them out for a drive. Eid al-Fitr, the end of Ramadan, was coming, so there were new clothes to buy. The day’s fast had been broken, so there were sweets to be had, too.
They picked up fried doughnut holes in Tubas, saving them for later, but the clothing shop they went to in Nablus was closed. It was already past midnight, so they headed back to Tammun: Khaled, 11, the oldest, in the back with Mustafa, 8, and Muhammad, 5. Othman, 6, blind and incapable of walking or feeding himself, was in his mother’s lap in front.
As they rounded a corner slowly, a few minutes from home, young Khaled and Mustafa recounted on Sunday, their mother, Waad, 35, asked her husband to pull over and take Othman from her so she could get something from her bag on the floor. Suddenly, the boys said, they saw laser pointers shining on their family from every direction, heard their mother scream, heard their father say “God is great” — and then heard a deafening fusillade of gunfire.”
https://www.nytimes.com/2026/03/15/world/middleeast/palestinian-family-killed-west-bank.html
bhouston
对于那些好奇的人,这是一件可验证的事情,以色列报纸将其作为事实进行了报道:
https://www.ynetnews.com/article/p7mq5k5bs
主要提出的理由是车辆“速度过快”,这使负责秘密行动的以色列士兵感到自身安全受到了威胁。
《纽约时报》是这样描述的:
“当艾哈迈德·巴尼·乌德(Ali Bani Odeh)周五深夜从以色列的建筑工作归来,返回约旦河西岸的塔蒙与家人共度最后几天斋月时,他的妻子和四个年幼的男孩已经一个半月没有见过他了。
周六晚上,孩子们说服他开车带他们出去兜风。开斋节(斋月结束)即将来临,所以需要买新衣服。一天的斋戒已经结束,所以也有甜点要吃。
他们在图巴斯买了炸面球留着以后吃,但随后在纳布卢斯的那家服装店却已经关门。当时已经过了午夜,所以他们驾车返回塔蒙:11岁的哈立德是最大的,坐在后排,和8岁的穆斯塔法及5岁的穆罕默德在一起。6岁的奥斯曼(Othman)双目失明,无法行走或自行进食,坐在前排母亲怀里的膝盖上。
当他们快到家、刚绕过一个拐角时,周日哈立德和穆斯塔法回忆道,35岁的母亲瓦阿德让丈夫停车,想从他腿上抱下奥斯曼,以便从地板上的包里拿点东西。突然,孩子们说,他们看到激光笔从四面八方照向他们的家人,听到母亲尖叫,听到父亲喊‘真主至大’,随后便听到了震耳欲聋的连珠枪声。”
https://www.nytimes.com/2026/03/15/world/middleeast/palestinian-family-killed-west-bank.html
Bill C-22, the Lawful Access Act: Dangerous backdo… #
https://news.ycombinator.com/item?id=47393177
Regarding warrantless searches and access … reading the text of the bill (OP link) warrants seem to be required. Simple, right?
Well, no, this is a recently inserted block of text in the bill (confirm at the link above):
Exception (2. 7)(b) However, a copy of the warrant is not required to be given to a person under subsection (2. 6) if the judge or justice who issues the warrant sets aside the requirement in respect of the person, on being satisfied that doing so is justified in the circumstances. That’s a pretty big, subjective loophole to bypass civil liberties IMO.
emptybits
关于无证搜查和访问……阅读法案文本(OP链接),搜查令似乎是必需的。很简单,对吧?
然而,并非如此。这是最近在法案中增加的一段文本(请在上方链接确认):
例外 (2.7)(b) 然而,如果签发搜查令的法官或司法官确信这样做在当前情况下是正当的,并决定豁免对某人出示副本的要求,则无需根据第(2.6)款的规定向该人出示搜查令副本。
依我看,这是一个相当大且主观的漏洞,用于规避公民自由。
Corruption erodes social trust more in democracies… #
https://news.ycombinator.com/item?id=47399999
It’s well known that in authoritarian regimes (which autocracies generally are) corruption is, rather than a problem, a necessary element of society to keep things going.
Anyone with the slightest amount of official power, like a government officer, has the ability to prevent things going forward on his part. In this kind of society, most people are poor and it would be considered stupid to not demand a small (or large) bribe from the citizen in order to unlock the process. Everyone does it, more with outsiders and to a lesser extent with one’s circle of acquaintances (because the social fabric between known parties is the other way to unlock things). Corruption surely is one thing that really trickles down from the top.
So, things like like obediently waiting in the queue for your turn or complaining about the officer won’t help unlike in high-trust societies. If you try that in a low-trust society there will be additional documents, stamps, acknowledges, or signatures you need, and keep needing, in order to complete your request until you get the drift and bring a little something. Corruption gets things going and in a society that has no trust it is a positive trait.
In Western democracies this sounds unimaginable because there’s a stronger sense that right things will work out right just because of the rules. Western corruption happens on a different level: a regular western citizen has no benefit from giving bribes and he would object to the police or government officials from demanding one. Western corruption mostly concerns about the powerful and rich making friendly mutual agreements to bend the governing bodies and law to enable themselves become more powerful and richer.
yason
人们心知肚明,在威权政体(专制政权大多如此)中,腐败与其说是一个问题,不如说是维持社会运转的一个必要元素。
任何拥有微薄官方权力的人,比如政府官员,都有能力在流程上卡你一下。在这样的社会里,大多数人都很穷,如果官员不向公民索要一点小贿赂(或大贿赂)来打通办事流程,反而会被认为是愚蠢之举。人人都这么做,对外人索取得更甚,对熟人圈子则相对少一些(因为在熟人之间,人情往来是另一种疏通途径)。腐败的确是真正自上而下传导而来的一种现象。
因此,像乖乖排队等候轮到你的时机,或者投诉办事员,都是没用的,这与高信任社会的情况截然不同。在低信任社会里,如果你这么做,你就会被告知需要额外的文件、印章、回执或签字,而且是一个接一个,永远需要,直到你悟出其中的门道,拿出点“东西”来。腐败让事情得以运转,而在一个缺乏信任的社会里,这反倒成了一种积极特质。
在西方民主国家,这听起来难以置信,因为人们有着更强的信念,即规则本身就能确保一切按规矩顺利办成。西方的腐败发生在不同的层面:普通西方公民行贿不仅没好处,反而会反对警察或政府官员索贿。西方的腐败主要涉及权贵达成友好的私下协定,通过操纵监管机构和法律来让自己变得更加强大和富有。
Ask HN: How is AI-assisted coding going for you pr… #
https://news.ycombinator.com/item?id=47391792
It makes my work suck, sadly. Team dynamics also contributes to that, admittedly.
Last year I was working on implementing a pretty big feature in our codebase, it required a lot of focus to get the business logic right and at the same time you had be very creative to make this feasible to run without hogging to much resources.
When I was nearly done and worked on catching bugs, team members grew tired of waiting and starting taking my code from x weeks ago (I have no idea why), feeding it to Claude or whatever and then came back with a solution. So instead of me finishing my code I had to go through their version of my code.
Each one of the proposals had one or more business requirements wrong and several huge bugs. Not one was any closer to a solution than mine was.
I had appreciated any contribution to my code, but thinking that it would be so easy to just take my code and finishing it by asking Claude was rather insulting.
fastasucan
难过的是,这让我工作起来很糟心。不得不承认,团队互动也难辞其咎。
去年我在给我们的代码库实现一个相当大的功能时,既需要高度专注以确保业务逻辑正确,又要极具巧思,确保运行时不会占用过多资源。当我快完成并正在修复bug时,团队成员失去了耐心,开始拿我几周前的代码(我都不知道为什么),投喂给Claude或其他什么AI,然后声称有了解决方案。结果导致我没法完成自己的代码,反而不得不去审查他们改写的代码。
每一个提案都在业务需求上出错,还包含好几个严重的bug。没有一个比我的方案更接近正确答案。我本很感激任何人对我的代码提出帮助,但觉得他们觉得仅仅拿我的代码问Claude就能轻松搞定,这简直是在侮辱人。
Stop Sloppypasta #
https://news.ycombinator.com/item?id=47395063
I’ve encountered an even more nightmarish version of this recently: ai generated tickets. Basically dumping the output of “write a detailed product spec for a clinical trial data collection pipeline” into a jira ticket and handing it off.
Doesn’t match any of our internal product design, adds tons of extraneous features. When I brought this up with said PM they basically responded that these inaccuracies should just be brought up in the sprint review and “partnering” with the engineering team. AI etiquette is something we’ll all have to learn in the coming years.
czhu12
我最近碰到了比这更糟糕的情况:AI 生成的工单。基本上就是把“为临床试验数据收集流程写一份详细产品规格说明书”的输出结果一股脑塞进一个 Jira 工单里,然后直接扔给工程团队处理。这跟我们内部的产品设计完全不搭,还增加了很多无关紧要的功能。当我向那位产品经理指出这个问题时,他基本上是说这些错误在冲刺评审里提出来就行,并且要“与工程团队合作”。人工智能礼仪是我们未来几年所有人都必须学的东西。
How I write software with LLMs #
https://news.ycombinator.com/item?id=47397037
One thing I’ve noticed is that different people get wildly different results with LLMs, so I suspect there’s some element of how you’re talking to them that affects the results.
It’s always easier to blame the prompt and convince yourself that you have some sort of talent in how you talk to LLMs that other’s don’t.
In my experience the differences are mostly in how the code produced by the LLM is reviewed. Developers who have experience reviewing code are more likely to find problems immediately and complain they aren’t getting great results without a lot of hand holding. And those who rarely or never reviewed code from other developers are invariably going to miss stuff and rate the output they get higher.
miguelgrinberg
我注意到一件事,就是不同的人使用 LLM 得到的结果差异巨大,所以我怀疑这其中有一个因素是你与它们“沟通”的方式影响了最终结果。
人们总是更容易责怪提示词,然后说服自己认为自己拥有其他人所不具备的某种与 LLM 沟通的天赋。
以我的经验来看,差异主要出在人类如何评审 LLM 生成的代码上。有代码审查经验的开发者往往能一眼看出问题,并抱怨如果不手把手教就得不到高质量的结果。而那些很少或从未审查过其他开发者代码的人,往往会忽略问题,从而给出更高的评价。
Corruption erodes social trust more in democracies… #
https://news.ycombinator.com/item?id=47398352
You have to understand how gears shift from there. Trust is essential for business transactions and specifically for long term investments. You can’t make massive leaps in technology or medicine or many other areas without trust (a lot of money on a leap means if you don’t trust the other side or the government to keep conditions stable, you won’t see a return).
Now if you are in a high trust society, you may have a lot of leveraged businesses or governments who have gotten loans or permission to do something based on past trust history. If the trust degrades systematically Investors may want returns faster, or interest rates go up, or partnerships don’t happen. That’s why low trust places don’t grow as fast - trust is the oil for growth engines and lack of it is sand for the same.
Corruption also does a lot of small-profit-for-the-corrupt that leads to massive damage to the overall society via second and third order effects. (example: someone stealing copper cables that stop electricity to entire cities for a while).
dzink
必须理解那里的齿轮是如何换挡的。信任对于商业交易至关重要,特别是对于长期投资。没有信任,你无法在技术、医学或许多其他领域取得重大突破(在一个飞跃中投入大量资金意味着,如果你不信任另一方或政府能保持环境稳定,你就无法看到回报)。
如果你处于一个高信任社会,你可能会拥有许多高杠杆企业,或者政府基于过去的信用记录获得了贷款或进行某项活动的许可。如果信任系统性地下降,投资者可能会要求更快回本,或者利率上升,亦或合作难以达成。这就是为什么低信任度地区的增长速度较慢——信任是增长引擎的“油”,而缺乏它则是阻碍这一引擎运转的“沙子”。
腐败也会导致腐败者获得微小利益,但这通过二阶和三阶效应给整个社会造成了巨大损失。(例如:有人偷盗铜缆导致整个城市一度停电)。
Polymarket gamblers threaten to kill me over Iran … #
https://news.ycombinator.com/item?id=47398102
I don’t understand how this isn’t an immediate open and shut case for the police, assuming certain facts are verified independently. At the point that you’re making death threats to strangers you should be removed from civil society.
bitmasher9
假设某些事实经独立核实,我不明白为什么这不是警方立即就能处理的铁案。当你开始向陌生人发出死亡威胁时,你就应该被逐出文明社会。
Ask HN: How is AI-assisted coding going for you pr… #
https://news.ycombinator.com/item?id=47390383
It has made my job an awful slog, and my personal projects move faster.
At work, the devs up the chain now do everything with AI – not just coding – then task me with cleaning it up. It is painful and time consuming, the code base is a mess. In one case I had to merge a feature from one team into the main code base, but the feature was AI coded so it did not obey the API design of the main project. It also included a ton of stuff you don’t need in the first pass - a ton of error checking and hand-rolled parsing, etc, that I had to spend over a week unrolling so that I could trim it down and redesign it to work in the main codebase. It was a slog, and it also made me look bad because it took me forever compared to the team who originally churned it out almost instantly. AI tools are not good at this kind of design deconflicting task, so while it’s easy to get the initial concept out the gate almost instantly, you can’t just magically fit it into the bigger codebase without facing the technical debt you’ve generated.
In my personal projects, I get to experience a bit of the fun I think others are having. You can very quickly build out new features, explore new ideas, etc. You have to be thoughtful about the design because the codebase can get messy and hard to build on. Often I design the APIs and then have Claude critique them and implement them.
I think the future is bleak for people in my spot professionally – not junior, but also not leading the team. I think the middle will be hollowed out and replaced with principals who set direction, coordinate, and execute. A privileged few will be hired and developed to become leaders eventually (or strike gold with their own projects), but everyone in between is in trouble.
hdhdhsjsbdh
工作变得像艰难的苦役一样,而个人项目的进展却更快了。 在工作中,上级的开发人员现在全用AI做所有事情——不仅是写代码——然后派我去清理和完善。这既痛苦又耗时,代码库乱得一塌糊涂。有一次,我不得不把一个团队的功能合并到主代码库,但那个功能是AI写的,所以它不遵守主项目的API设计。它还包含了大量一开始就不需要的东西——大量的错误检查和手写的解析逻辑等——我不得不花了一周多的时间进行拆解和整理,才能把它删减并重新设计,使其能适配主代码库。这是一场苦役,而且让我看起来很糟糕,因为相比于原本几乎瞬间就搞定代码的团队,我花了太长的时间。AI工具不擅长这种解决设计冲突的任务,所以虽然很容易瞬间拿出一堆概念,但如果不面对由此产生的技术债,就无法神奇地把它塞进更大的代码库中。 在个人项目中,我可以体验到别人似乎正在享受的那种乐趣。你可以非常快速地构建新功能,探索新想法等。你必须在设计上多加斟酌,因为代码库可能会变得混乱且难以在此基础上继续开发。通常是我先设计API,然后让Claude进行评审并实现它们。 我认为对于像我这样处于这个职位的专业人士来说,未来是黯淡的——既不是初级人员,也不是团队领导。我认为中间层会被掏空,取而代之的是负责设定方向、协调和执行的高级人员。只有极少数有特权的人会被招聘并培养成领导者(或者在个人项目上大获成功),但夹在中间的人都很麻烦。
Corruption erodes social trust more in democracies… #
https://news.ycombinator.com/item?id=47398033
It looks like a tautology to me. Like: “Corruption erodes social trust in places where social trust exist and is key for the political system.”
retep_kram
我看这就像是同义反复。比如:“腐败在存在社会信任的地方侵蚀社会信任,且是政治系统的关键。”
Stop Sloppypasta #
https://news.ycombinator.com/item?id=47392855
I do find it interesting that people don’t mind AI content, as long it’s “their AI.” The moment someone thinks it’s someone else’s AI output, the reaction is visceral.
Isn’t it obvious? If I’d wanted to see AI response to my question, I’d ask it myself (maybe I already did). If I’m asking humans, I want to see human responses. I eat fast-food sometimes, but if I was served a Big Mac at a sit down restaurant I’d be properly upset.
valicord
确实觉得挺有意思,只要那是“他们自己的AI”,人们对AI生成的内容并不反感。一旦有人以为是别人的AI输出,反应就会变得本能且强烈。
这不是很明显吗?如果我想看AI对我问题的回答,我自己就会去问(也许我之前已经问过了)。我既然是问人类,那我就想要看到人类的回答。我有时候也会吃快餐,但如果我在正式餐厅里吃到了巨无霸,我会真的非常生气。
$96 3D-printed rocket that recalculates its mid-ai… #
https://news.ycombinator.com/item?id=47389285
I remember an anecdote our robotics lecturer told our university class in 1995, which was about how in the west we try to make expensive things that are the absolute best of technology and how the other side didn’t have that luxury and relied on ingenuity.
He described a cold war Russian missile they had somehow obtained and were tasked with trying to reverse engineer. Ostensibly, it was thought to be a heat seeking missile, but there seemed to be no control or guidance circuitry at all. There was a single LDR (light dependent resistor) attached to a coil which moved a fin. That was it. Total cost for the guidance system maybe a couple of dollars, compared to hundreds of thousands for the cheapest guidance systems we had at the time.
The key insight was that if you shined a light at it, the fin moved one way and if there was no light the fin moved the opposite way. That still didn’t explain how this was able to guide a missile, but the next realisation was that the other fins were angled so when this was flying (propelled by burning rocket fuel), the missile was inherently unstable - rotating around the axis of thrust and wobbling slightly. With the moveable fin in place, it was enough to straighten it up when it was facing a bright light, and wobble more when there was no bright light. Because it was constantly rotating, you could think of it as defaulting to exploring a cone around its current direction, and when it could see a light it aimed towards the centre of that cone. It was then able to “explore the sky” and latch on to the brightest thing it could see, which would hopefully be the exhaust from a plane, and so it would be able to lock on, and adjust course on a moving target with no “brain” at all.
ralferoo
我记得1995年我们的机器人讲师在大学课堂上讲过一个轶事,内容是关于我们在西方如何试图制造昂贵且顶尖的技术产品,以及另一边并没有这种奢侈的条件,而是依赖独创性。
他描述了一枚冷战时期苏联的导弹,他们不知怎么搞到的,并被要求进行逆向工程。表面上,它原本被认为是一枚热寻的导弹,但似乎完全没有控制或制导电路。上面只有一个连接在某个线圈上的LDR(光敏电阻),用来操纵一个舵面。就是这样。整个制导系统的成本可能只有几美元,而我们当时最便宜的制导系统却要花几十万美元。
关键的认识在于,如果你朝它照光,舵面就会向一个方向移动;如果没有光,舵面则向相反方向移动。这虽然还不能完全解释它如何引导导弹,但另一个认知是,其他的舵面都是倾斜安装的,因此当它飞行(靠燃烧火箭燃料推进)时,导弹本身就存在固有不稳定性——它会绕着推力轴线旋转并轻微晃动。有了这个可移动的舵面,当它面对亮光时,这就足以让导弹恢复平衡;而当没有亮光时,导弹晃动得会更剧烈。
因为导弹在不停地旋转,可以把它想象成默认探索以当前方向为中心的一个圆锥体区域,当它看到光线时,就会瞄准该圆锥体的中心。于是,导弹就能通过“探索天空”来锁定它所能看到的最亮物体(希望能是飞机的喷气流),从而在没有“大脑”的情况下,成功锁定目标并调整航向。
LLMs can be exhausting #
https://news.ycombinator.com/item?id=47393253
I find LLMs so much more exhausting than manual coding. It’s interesting. I think you quickly bump into how much a single human can feasibly keep track of pretty fast with modern LLMs.
I assume until LLMs are 100% better than humans in all cases, as long as I have to be in the loop there will be a pretty hard upper bound on what I can do and it seems like we’ve roughly hit that limit.
Funny enough, I get this feeling with a lot of modern technology. iPhones, all the modern messaging apps, etc make it much too easy to fragment your attention across a million different things. It’s draining. Much more draining than the old days
cglan
我发现 LLM 比手动编码要累人得多。这很有意思。我认为你会很快意识到,利用现代 LLM,一个人类实际上能管理/跟进的事情是多么有限。
我假设,在 LLM 能在所有情况下都全面超越人类之前,只要我还需要参与其中,我的工作能力就会有一个很硬的上限,感觉我们已经差不多触及到了这个极限。
说来有趣,我很多现代科技产品都有这种感觉。iPhone、所有的现代即时通讯应用等,让人太容易将注意力分散在百万件不同的事情上。这很消耗精力。比过去累多了。
Polymarket gamblers threaten to kill me over Iran … #
https://news.ycombinator.com/item?id=47403104
I sense a large number of Polymarket apologists in the comments. Polymarket’s existence is a symptom of the ubiquity of Adam Smith’s libertine, some would even label satanic (“Do what you wilt”), “free” market thinking. We ought to take it to its natural extreme – where Polymarket encourages gambling on when specific celebrities, politicians, or even random individuals might die (there is already a name for this: “death pools”). I am sure if they followed through on this openly there would still be advocates and defenders of the practice and counter-claims “there wasn’t unequivocal evidence that Polymarket influenced their murder” etc.
waffletower
我在评论区察觉到大量 Polymarket 的辩护者。Polymarket 的存在正是亚当·斯密那种自由放任思想无处不在的症状,有些人甚至将其斥为“撒旦式”的(“随心所欲”)的所谓“自由”市场思维。我们应该将其推向其自然的极端——即 Polymarket 鼓励人们赌博具体的名人、政客,甚至是随机个体何时会死(这种现象已经有一个名字,叫做“死亡池”)。我确信如果他们公然这么做,仍然会有对此做法的拥护者和辩护者,并反驳称“并没有确凿证据表明 Polymarket 煽动了他们的谋杀”等等。
Meta’s renewed commitment to jemalloc #
https://news.ycombinator.com/item?id=47404107
We plan to deliver improvements to [..] purging mechanisms
During my time at Facebook, I maintained a bunch of kernel patches to improve jemalloc purging mechanisms. It wasn’t popular in the kernel or the security community, but it was more efficient on benchmarks for sure.
Many programs run multiple threads, allocate in one and free in the other. Jemalloc’s primary mechanism used to be: madvise the page back to the kernel and then have it allocate it in another thread’s pool.
One problem: this involves zero’ing memory, which has an impact on cache locality and over all app performance. It’s completely unnecessary if the page is being recirculated within the same security domain.
The problem was getting everyone to agree on what that security domain is, even if the mechanism was opt-in.
https://marc.info/?l=linux-kernel&m=132691299630179&w=2
adsharma
我们计划对 [..] 的回收机制进行改进。
在 Facebook 工作期间,我维护了一系列改进 jemalloc 回收机制的内核补丁。虽然在内核和安全社区里并不受欢迎,但在基准测试中肯定更高效。
许多程序会运行多个线程,在一个线程中分配,在另一个线程中释放。Jemalloc 以前的主要机制是:使用 madvise 将页面归还给内核,然后让内核在另一个线程的内存池中进行分配。
一个问题是:这涉及到将内存清零,这会影响缓存局部性以及整体应用性能。如果页面在同一安全域内被重新利用,这就完全没有必要。
问题是让大家都同意那个安全域的定义是什么,即使该机制是可选的。
https://marc.info/?l=linux-kernel&m=132691299630179&w=2
Polymarket gamblers threaten to kill me over Iran … #
https://news.ycombinator.com/item?id=47404106
Wild misunderstanding of Smith. He considered it a moral defect, wrote several pieces criticizing gambling, and criticized state run gambling.
“The over-weening conceit which the greater part of men have of their own abilities, is an ancient evil… their absurd presumption in their own good fortune, is even more universal.”
WillPostForFood
对斯密的误读极其严重。他认为这是一种道德缺陷,曾写文章批评赌博,并批评国家经营的赌博。 “大多数人对自身能力的过度自负,是一种古老的恶习……他们对自身好运的荒谬自信,则更为普遍。”