2025 07 03 HackerNews

2025-07-03 Hacker News Top Stories #

  1. Figma 向 SEC 提交 S-1 文件,计划 IPO 并在纽约证券交易所上市,股票代码为“FIG”,以其协作设计工具和 AI 驱动的平台闻名。
  2. 安卓系统的 IKKO Activebuds 耳机被发现存在多个安全漏洞,包括 API 端点、加密密钥和隐私数据处理问题。
  3. W3C 建议避免使用“点击这里”作为链接文本,强调链接应具备描述性以提高可访问性和用户体验。
  4. 假评论检测工具 Fakespot 结束九年服务,转型为新工具 TrueStar,继续打击虚假评论。
  5. 在美国官员谴责后,ICEBlock 应用飙升至 App Store 榜首,允许用户标记 ICE 特工位置并提醒附近用户。
    6.资深软件工程师 Alberto Fortin 反思大型语言模型的实际应用挑战,建议开发者谨慎使用并结合自身技能。
  6. Cloudflare 推出默认阻止 AI 数据抓取功能,保护原创内容,引发关于互联网自由与创作者权益的讨论。
  7. 美国私营部门就业数据低于预期,失去 3.3 万个就业岗位,反映经济复杂状况,需综合多指标评估。
  8. OpenAI 首席执行官 Sam Altman 批评 Meta 抢夺 AI 人才,强调 OpenAI 的使命感和文化优势。
  9. 华为发布开源权重模型 Pangu Pro MoE,基于 Ascend GPU 训练,性能优于多款开源模型,展现了强大的成本效益。

Figma files for proposed IPO #

https://www.figma.com/blog/s1-public/

Figma 公司宣布拟首次公开募股(IPO) Figma 公司在其发展道路上迈出了重要一步,即向成为一家上市公司迈进。在 4 月份向美国证券交易委员会(SEC)提交了 S-1 文件的保密草案后,该文件现已对公众开放。

Figma 提交 IPO 注册声明 Figma 公司今日宣布,已向美国证券交易委员会(SEC)提交了一份关于其 A 类普通股拟议首次公开发行的 Form S-1 注册声明。Figma 已申请在纽约证券交易所上市,股票代码为“FIG”。此次发行的股份数量和价格范围尚未确定,发行将受市场条件影响,无法保证发行何时完成或实际规模和条款。

承销商信息 摩根士丹利、高盛集团、Allen & Company LLC 和摩根大通将担任此次发行的联合主承销商。美国银行证券、富国证券和 RBC 资本市场将担任此次发行的主承销商。William Blair 和 Wolfe | Nomura Alliance 将担任此次发行的联席副承销商。

发行细节 拟议的发行将仅通过招股说明书提供。初步招股说明书的副本,一旦可用,可以从上述承销商处获得。关于这些证券的 Form S-1 注册声明已向 SEC 提交,但尚未生效。在注册声明生效之前,不得出售这些证券,也不得接受购买要约。本新闻稿不构成出售要约或购买要约的邀请,也不构成任何州或司法管辖区的证券出售,如果该州或司法管辖区的证券法规定在注册或资格认定之前进行此类要约、邀请或出售是非法的,则不得在该州或司法管辖区进行证券出售。

关于 Figma Figma 是团队合作将想法转化为世界上最好的数字产品和体验的地方。自 2012 年成立以来,Figma 从一个设计工具发展成为一个连接的、由人工智能驱动的平台,帮助团队从想法到产品发货。无论您是在构思、设计、构建还是发货,Figma 都使整个设计和产品开发过程更加协作、高效和有趣——同时确保每个人都在同一页面上。


HN 热度 493 points | 评论 224 comments | 作者:kualto | 1 day ago #

https://news.ycombinator.com/item?id=44437316

  • Figma 的成功归功于其前端工程,特别是由联合创始人 Evan Wallace 领导的混合 C++/JavaScript 架构,优化了文档表示以减少内存使用并提高编辑速度。
  • Figma 通过 WebGL 进行文档渲染,绕过大部分浏览器的 HTML 渲染流程,以实现跨浏览器的一致性和性能。
  • Figma 的多人同步协议和实时协作服务由 Evan Wallace 开发,最初用 TypeScript 编写,后来为提高性能和稳定性改用 Rust。
  • Figma 的实时协作功能极大地简化了设计流程,提高了版本控制的便捷性,改善了用户体验。
  • 尽管 Sketch 在使用 Mac OS 的原生形状渲染方面更加流畅,但 Figma 的跨平台兼容性和易用性使其吸引了更多用户。
  • Sketch 尽管仍然存在并且可能运营良好,但在市场占有率上已经大幅下降,从 60% 以上降至低于 20%,这被视为一种失败。
  • 有些人认为 Sketch 因为只能在 macOS 上使用而失败,但实际上 Sketch 仍然被广泛使用,包括苹果公司在内。

Exploiting the IKKO Activebuds “AI powered” earbuds #

https://blog.mgdproductions.com/ikko-activebuds/

这篇文章讲述了作者 Marcel 对 IKKO Activebuds“人工智能”耳机的探索经历。他最初是在 Mrwhosetheboss 的视频和 TikTok 上看到这款耳机的。购买后,他发现耳机运行的是安卓系统,于是决定对其进行一番研究。

首先,作者提到了耳机的包装和外观,包括 USB-C 线缆的放置位置和 OpenAI 标志的使用问题。耳机开机后,显示时间和 ChatGPT 界面,还有其他 AI 功能如翻译。作者指出,耳机的音质在默认 EQ 配置下很差,但可以通过调整 EQ 曲线来改善。

IKKO 耳机有自己的应用商店,没有 Google Play 商店,因为这些应用是为耳机屏幕特别修改的。商店里有音乐应用如 Spotify,也有游戏应用,如《地铁跑酷》。由于屏幕小,这些应用操作起来非常不便,但可以确认耳机运行的是安卓系统。

作者尝试对耳机进行黑客攻击,发现耳机没有浏览器,不能直接下载应用,而且尝试开启开发者模式失败。但他发现耳机的 ADB(Android Debug Bridge)功能是开启的,这使得他能够更容易地进行后续操作。他通过 ADB 安装了 DOOM 游戏,并开始研究 ChatGPT 集成在后端的工作方式。

作者发现耳机直接与 OpenAI 通信,这意味着耳机上必须有 ChatGPT 的密钥。他尝试通过 root 耳机来安装正确的证书,但由于耳机没有音量上键,无法确认解锁。于是他转而使用 APK 提取工具将耳机上的所有应用导出,并在 JADX 中分析启动器应用,发现耳机可以与多个域名通信,包括 OpenAI API 和其他一些可能与设备功能相关的 API。

在寻找 API 端点和密钥的过程中,作者发现了一个名为 SecurityStringsAPI 的文件,其中包含了加密的端点和认证密钥。他没有尝试去解密这些密钥,而是将应用侧载到一个已 root 的设备上,发现 OpenAI 的密钥确实存在。

作者还发现耳机有其他模式,如愤怒的 Dan 和恋爱中的 Dan,这些模式的系统提示相对无聊。他还注意到耳机会将聊天记录日志发送到 chat1 域名下的另一个端点,可能是为了保存聊天记录,因为 ChatGPT API 不允许这样做。

在等待 IKKO 耳机安全部门回复的同时,作者开始研究耳机的配套应用。这个应用可以直接与 ChatGPT 交互,并查看设备上的聊天记录。作者通过 HTTP 检查这个应用,发现它使用账户令牌和设备 ID 查询 API,并返回所有与设备有过的聊天记录。但是,即使移除账户令牌,请求仍然有效,这意味着 API 除了设备 ID 之外没有其他认证。

作者在教程视频中发现了一个未完全模糊处理的设备 ID,并将其输入 API,发现可以查看他们的整个演示设备的聊天记录。由于 IMEI 有一定的范围,理论上可以找出所有客户的聊天记录,这可能包括敏感信息。

作者还将这一新发现添加到了电子邮件链中。在等待回复的同时,他检查了是否可以使用已知的 IMEI 制造一个链接 QR 码来绑定设备。他发现 API 端点比最初想象的要安全,因为变量名直接暴露了加密的 API 端点。通过 Postman,他可以制造一个包含任何 IMEI 的 Base64 图像的 QR 码。但是,使用这个 QR 码尝试绑定设备到应用时,出现了错误,提示设备已经被其他人绑定。这是目前为止唯一的良好安全实现。

然而,作者指出这仍然是一个安全/隐私问题。为什么?因为这暴露了创建账户时设置的用户名。但是,在创建账户时并没有用户名字段,只有名字和姓氏。作者用“Cheese2”作为名字和“Delight2”作为姓氏创建了一个账户,结果用户名等于名字 + 姓氏。当尝试将设备绑定到一个应用时,如果设备已经被绑定到另一个应用,响应会包含“Cheese2Delight2”这个名字。这就意味着用户的个人信息被泄露了。

最后,作者提到,现在可以通过猜测 IMEI 来获取用户的个人信息。


HN 热度 397 points | 评论 138 comments | 作者:ajdude | 9 hours ago #

https://news.ycombinator.com/item?id=44443919

  • 系统提示中提到的“人们会死”的说法被用来限制和破解模型,引发了关于在训练中减少这一向量的后果的讨论。
  • 有人提到,不应该使用提示来添加像这样的护栏,而应该实施真正的限制。
  • 有人联想到阿西莫夫的机器人三定律,认为这是一个从科幻小说中借鉴的难以实现的概念。
  • 有人认为,随着 AI 对齐变得重要,我们仍然没有比这些定律更好的东西。
  • 有人提到,这些系统提示听起来像是科幻小说中的情节,但实际上它们是 AI 从训练数据中提取的文本。
  • 有人认为,AI 作为公共安全工具的可行性是值得怀疑的,因为它们可能会被敌对国家和非国家行为者操纵。
  • 有人指出,AI 已经在公共安全领域得到应用,例如 Axon 的 Draft One 报告撰写器。
  • 有人提到,错误的 AI 逮捕案例已经发生,表明 AI 在公共安全领域的应用已经存在问题。

https://www.w3.org/QA/Tips/noClickHere

这篇文章是由 W3C 质量保证团队撰写的,主要探讨如何为网页中的链接选择合适的文本。文章强调在设计链接文本时,应该避免使用 “点击这里” 等模糊的表达,而是选择更具描述性和信息量的文本。

** 链接文本的含义 **

在引导用户采取行动时,链接文本应具备以下几个特征:

  1. ** 提供上下文信息 **:当链接文本独立于周围内容被阅读时,仍然能够传达相关信息。
  2. ** 清晰说明链接内容 **:链接的文本应能明确解释链接所提供的内容或服务。
  3. ** 避免谈论操作机制 **:链接文本不应涉及用户如何使用链接的具体操作方式。
  4. ** 不使用动词短语 **:避免将动词放入链接文本中。

** 示例 **

文章提供了两个不佳示例,以说明不应该如何编写链接文本:

  • “要下载 W3C 的编辑器 / 浏览器 Amaya,请点击这里。”
  • “要下载 Amaya,请访问 Amaya 网站并获取所需软件。”

这些示例中,链接文本过于依赖于操作步骤,而没有直接说明链接的内容。相反,文章建议使用更直接且富有信息的表达,例如:

  • “获取 Amaya!”

在这个例子中,“获取” 并不包含在链接文本中,因为不建议在链接文本中使用动词短语。相应地,文章还提供了另一个更好的链接文本示例:

  • “了解更多关于 Amaya 的信息:W3C 的免费编辑器 / 浏览器,允许您创建 HTML、SVG 和 MathML 文档。”

** 进一步阅读 **

文章中还提到了一些可以参考的资源:

  • W3C HTML 技术规范中关于链接文本的部分(1990 年)
  • Tim Berners-Lee 的在线超文本风格指南,讨论了如何使超文本更具可读性
  • Jutta Degener 的文章,探讨良好的超文本写作

** 关于 “QA Tips”**

W3C QA Tips 是由 W3C 质量保证兴趣小组创建和维护的短文档,旨在为网页开发者或设计者提供实用的知识。这些小贴士经过小组成员的仔细审查,但并不应被视为 W3C 的技术规范。文章还鼓励读者了解更多关于这些小贴士的信息,以及如何提交自己的建议。

总的来说,这篇文章强调了在网页设计中链接文本的重要性,并提供了有效的写作指导,以提高链接的可用性和信息传达的有效性。


HN 热度 387 points | 评论 302 comments | 作者:theandrewbailey | 11 hours ago #

https://news.ycombinator.com/item?id=44442473

  • 从无障碍性角度考虑,如果所有链接都标记为“点击这里”,对于使用屏幕阅读器的用户来说,实际上是剥夺了他们非线性访问页面的能力。
  • 链接文本应包含足够的信息,以便用户无需阅读上下文就能理解链接的目的。
  • 避免使用“点击这里”作为链接文本,因为它需要用户阅读上下文才能理解“这里”指的是什么。
  • 有些人认为“点击这里”是不好的,因为它需要阅读上下文才能知道“这里”是什么,这对无障碍性来说是个问题。
  • 有些人认为,如果每个链接都只是“Amaya”而没有动词,用户就无法区分它们。
  • 有些人认为,W3C 并不是推荐链接文本只包含“Amaya”而不加动词,而是建议根据链接的内容适当修改链接文本。
  • 有些人认为,如果生态系统不能在不捆绑恶意软件(广告软件)的情况下维持,那么这样的生态系统就不应该存在。
  • 有些人认为,将捆绑的广告软件描述为“促进可持续生态系统”而将 Chrome 描述为“强制恶意软件”是一种极端的观点。
  • 有些人认为,如果一个生态系统不能在不捆绑恶意软件(广告软件)的情况下维持,那么这样的生态系统就不应该存在。
  • 有些人认为,负面意见是事实。
  • 有些人认为,无障碍性问题比文章中关注的动作呼吁更有说服力,后者主要是营销/参与度问题。
  • 有些人认为,使用 CSS 来截断 git 哈希值是一种好方法,这样搜索功能仍然可以工作。
  • 有些人认为,这些方法比简单地使用清晰的链接文本更脆弱,尤其是随着网站的维护时间的推移。

Fakespot shuts down today after 9 years of detecting fake product reviews #

https://blog.truestar.pro/fakespot-shuts-down/

Fakespot 在 2025 年 7 月 1 日正式关闭,结束了其九年的假评论检测服务。这个服务曾帮助数百万购物者辨别在线评论的真伪。Fakespot 由 Saoud Khalifah 在 2016 年创立,最初是因为他本人在亚马逊上购买了一个产品,信任了虚假的好评,后来他决定创建一个工具来分析亚马逊及其他主要零售商如 eBay 和沃尔玛上的数百万条评论。Fakespot 使用人工智能技术来识别人类购物者可能忽略的模式,例如可疑的相似语言或不可靠的评论者档案。

Fakespot 的技术揭示了一些令人震惊的统计数据:大约 43% 的亚马逊畅销产品拥有不可靠或伪造的评论。在某些类别中,问题更为严重,服装和珠宝类别的不可靠评论高达 88%。这些数字描绘了一个令人清醒的在线购物景象,大多数人在决定购买什么时依赖产品评论,但你所读的反馈中几乎有一半可能不是真实的。

随着 Fakespot 的知名度上升,投资者也开始关注。2020 年 11 月,公司在 A 轮融资中筹集了 400 万美元,使他们的总资金达到 700 万美元,显示出对他们打击假评论任务的强烈信心。三年后,Mozilla 收购了 Fakespot,将这个初创公司的 13 人团队纳入 Firefox 家族。Mozilla 将 Fakespot 的技术直接集成到 Firefox 中,作为“Mozilla Review Checker”功能,使用户能够更容易地验证产品评论,而无需安装单独的扩展。

然而,Mozilla 在 5 月宣布,并非所有收购都能适应可持续的长期模式。公司做出了艰难的决定,停止了 Pocket 和 Fakespot 的服务,作为对 Firefox 核心功能和 AI 驱动创新的战略重新聚焦的一部分。原因是实际的,尽管对用户来说是毁灭性的。Fakespot 的 Chrome Web Store 扩展页面上出现了大量评论,哀叹其关闭。

随着 Fakespot 的关闭,我们告别了一个在日益欺骗性的市场中捍卫消费者权益的工具。它给了购物者一个对抗促销评论者和破坏在线购物信任的机器人农场的机会。对于那些依赖 Fakespot 评论分析来做出购买决策的人来说,它的缺失让我们在购买决策时信心减少。对值得信赖的评论分析的需求并没有消失,甚至比以往任何时候都更加关键。

作者提到,他已经开始构建一个旨在成为 Fakespot 精神继承者的工具,名为 TrueStar。TrueStar 将使用现代 AI、简化的分析技术和可持续的经济模式来保持成本可控,同时保持购物者所需的准确性。TrueStar 正在被构建为一个持久的工具,作者邀请感兴趣的人在他的工具启动时获得通知。

最后,作者对 Fakespot 的关闭表示了哀悼,并感谢 Saoud Khalifah 和他的团队展示了当技术服务于真理而非利润时的可能性。Fakespot 为在线购物提供了近十年的信任度,现在它已经停止服务,让我们为这个工具干杯。


HN 热度 384 points | 评论 256 comments | 作者:doppio19 | 1 day ago #

https://news.ycombinator.com/item?id=44437712

  • Fakespot 在打击虚假产品评论方面落后,无法跟上欺诈商店的新手段
  • 一些商店通过提供优惠券或礼品卡来换取正面评价,使得 Fakespot 难以识别
  • 存在利用大型语言模型(LLMs)生成虚假评论的现象
  • 有公司通过退款方式诱导消费者留下正面评价,Fakespot 难以应对
  • 亚马逊在处理指控性评论方面表现不佳,经常删除揭露假冒产品的评论
  • 亚马逊对于使用“假冒”一词的评论处理过于严格,导致真实反馈被删除
  • 亚马逊上的丝绸产品经常被错误标记为缎子,而亚马逊会删除指出这一点的评论
  • 亚马逊对于虚假评论和不良竞争评论的处理存在问题,难以区分真实性
  • 亚马逊拥有大量数据和 AI 技术,理论上可以更有效地打击欺诈行为
  • 亚马逊可能容忍一定程度的欺诈行为,只要不影响到客户留存和避免监管问题
  • 亚马逊的客户服务流程存在问题,有时会导致错误的电话号码提供给用户
  • 亚马逊内部可能对 LLMs 的“黑洞”效果感到自豪,即忽略客户反馈
  • 亚马逊的 AI 服务并没有改变其忽略客户的行为,市场竞争缺失导致问题无法解决
  • 亚马逊可能在某种程度上与欺诈行为共谋,因为它难以完全区分和处理各种欺诈行为

ICEBlock climbs to the top of the App Store charts after officials slam it #

https://www.engadget.com/social-media/iceblock-climbs-to-the-top-of-the-app-store-charts-after-officials-slam-it-004319963.html

美国政府官员对 ICEBlock 应用及其在 CNN 的报道进行了谴责,这导致更多人了解到该应用的存在,并从 App Store 下载。这款应用允许用户在地图上标记最近发现的 ICE(美国移民和海关执法局)特工的位置,目前已攀升至苹果 App Store 排行榜的首位。它现在是美国 iOS 设备上下载量最高的免费社交网络应用,以及总体上下载量第三高的免费应用。

CNN 的报道提到,该应用的开发者 Joshua Aaron 在看到特朗普政府加强对移民的打击后,于 4 月初推出了这款应用。报道发布时,Aaron 表示该应用已有 2 万名用户,其中许多人居住在洛杉矶,那里的 ICE 一直在突袭社区。除了让用户在地图上标记 ICE 特工的位置外,该应用还允许他们添加注释,比如特工们穿着什么或驾驶什么车辆。任何在目击地点五英里范围内的用户都会收到提醒。

白宫新闻秘书 Karoline Leavitt 在被要求回应这一报道时表示,CNN 的报道是“煽动对…ICE 官员的进一步暴力”。她提到,针对 ICE 特工的攻击增加了 500%,而这些特工只是在“努力完成他们的工作,从…社区中移除公共安全威胁”。ICE 代理主任 Todd M. Lyons 也发表声明,称这款应用在联邦执法人员的背上画了靶子。他继续说:“CNN 正在故意危及那些每天冒着生命危险的官员的生命,并帮助危险的犯罪外国人逃避美国法律。”他质疑这是“简单的鲁莽‘新闻’还是公开的激进主义?”

与此同时,美国国土安全部长 Kristi Noem 和美国司法部长 Pam Bondi 都表示,政府正在追查 Aaron。Bondi 说:“他向罪犯透露了我们联邦官员的位置。”她补充说:“我们正在关注这个问题,我们正在关注他,他最好小心点,因为那不是受保护的言论。那是在威胁我们国家执法官员的生命。”

Aaron 告诉 CNN,ICEBlock 不收集个人数据,如设备 ID 和 IP 地址,TechCrunch 在测试中已确认这一点。该应用仅在 iOS 上可用,因为如果它在 Android 上收集信息,可能会让人们面临风险。如果您通过本文中的链接购买商品,我们可能会获得佣金。


HN 热度 339 points | 评论 309 comments | 作者:doener | 7 hours ago #

https://news.ycombinator.com/item?id=44445180

  • 避免警察活动区域是合理的,与是否违法无关,只是想避免在酒驾检查站被骚扰或因警察占用车道而堵车。
  • 该应用的存在显示了对政府建立警察国家的抵抗,他们反对的是应用本身,而不是其功能。
  • 分享警察位置或信息是否违法取决于是否涉及军事位置,对于普通警察位置则不违法。
  • 如果因为安全许可而提前知道警察行动,泄露信息可能违法,但若无保密义务则不违法。
  • 故意激怒警察国家,即使合法也会被找麻烦,包括逮捕、丢工作、监视等。
  • 特朗普曾提出将“本土人士”送往海外集中营的想法,未来可能会无需做错事就成为目标。
  • Waze 的测速陷阱报告功能仍然存在,说明分享警察位置是合法的。
  • 在新西兰,Waze 因警察威胁而移除了这一功能。
  • 在社交媒体上发布关于酒驾检查点或移动测速相机的信息,约 30% 的人会谴责。
  • 增加 ICE 预算 13 倍可能意味着加强对警察国家的支持。
  • 即使 ICE 官员被视为种族主义暴徒,报复性暴力也是不道德和自败的。
  • 仅报告 ICE 官员的位置就被特朗普政府视为对他们的暴力行为。
  • 暴力抵抗不现实,只会加剧他们的野蛮行为。
  • 50% 的边境巡逻人员是拉丁裔,认为他们是种族主义白人红脖子是宣传的错觉。

I’m dialing back my LLM usage #

https://zed.dev/blog/dialing-back-my-llm-usage-with-alberto-fortin

网页标题为“Why I’m Dialing Back My LLM Usage”,由 Alberto Fortin 撰写,他是拥有 15 年经验的资深软件工程师。Alberto 最初对大型语言模型(LLMs)充满热情,希望它们能彻底改变他的开发工作流程。但在使用 Go 和 ClickHouse 重建基础设施时遇到了重大挑战,他写了一篇深思熟虑的博客文章,反思了人工智能炒作与现实之间的差距。

在这次对话中,Alberto 还准备了一份详细的后续分析,测试了像 Claude Opus 4 这样的新模型,以检查最近的改进是否解决了他遇到的核心问题。他的经历为工程师在生产环境中评估 LLMs 提供了实用的教训——平衡现实的期望与理解这些工具真正增加价值的地方以及它们仍然不足的地方。

以下是一些精选的引用:

现实检查:当 AI 炒作遇到生产代码时 “我对某些事情的质量之差感到非常震惊,这不仅仅是关于错误和功能不工作。我认为作为一个想要在未来几年维护这个代码库的开发人员,我也关心它是否足够整洁。”

“我觉得我离修复这个问题只有一周的时间,但实际上一个小错误会出现,然后那将需要另外两周的时间来修复。”

“我会把错误输出给 LLM,然后它会吐出一些新的东西,这可能会在某种程度上修复问题,但也会弄得更糟——并在过程中破坏其他东西。”

生产力幻觉 “我认为每个人都对此有点过于兴奋,因为第一迭代,第一个小功能,第一个自动完成就像是,‘哦,我的天,这太神奇了。这就像读懂了我的心思。’所以你有点被它愚弄了。”

“我认为我们已经达到了一个水平,我们可以做大约 10 倍的编码工作。所以我们期望这种情况发生,并从 LLMs 那里要求,但我认为每个人都对此有点过于兴奋。”

掌控:心理转变 “我认为这是最大的区别,像是一个心理转变…我是软件工程师,高级软件工程师,我是架构师。LLM 是助手。助手对我做出回应;我制定计划。”

“我对 LLMs 失去了所有的信任,所以我不会再给它们一个大功能。我会做很小的事情,比如重构或非常小范围的功能。”

“我开始自己修复错误。因为一旦你理解了这一点——你对你的代码库和每件事都在做什么有百分之百的理解——对于你来说,进入并修复一些东西要容易和快速得多。”

实用智慧 “如果你对自己的技能足够自信——你知道,一个高级开发人员——如果这对你不奏效,你没有什么不对。只是尝试做你一直做的事情,并使用 AI 来稍微提升你的知识。”

“我们已经上了一个台阶,这很好。但同时,让我们注意我们还没有达到下一个水平…我们正在卸载一些编程工作,但我们仍然需要进行架构抽象并为产品做出决策。”

“让我们尝试冷静下来,对 AI 采取平衡的方法。使用它,因为我认为这是技术领域如此惊人的革命,但我们还没有完全到达那里。”


HN 热度 337 points | 评论 203 comments | 作者:sagacity | 10 hours ago #

https://news.ycombinator.com/item?id=44443109

  • LLMs 令人兴奋,但生成的代码混乱,开发者对代码没有所有权感。
  • 管理由 LLM 编写的代码库困难,因为无法像自己编写的代码那样完全理解。
  • LLM 适合一次性脚本或不打算维护的项目。
  • 一些人已经掌握了 LLM 的使用,可以高效地在项目中规划和执行变更。
  • LLM 开发速度快于建立心理模型的速度,容易导致不了解代码情况和难以修复的 bug。
  • 频繁提交代码并让 LLM 解释代码有助于理解。
  • LLM 主要用于小型、专注的数据任务,可以快速移动并保持对事情的合理掌控。
  • 使用 LLM 需要开发提示、管理上下文、控制节奏、保持组织和有效审查 LLM 的工作。
  • 经过 20 多年编程,对繁琐工作没有耐心,LLM 可以帮助完成。
  • 知道概念上想要实现什么,但不知道如何实现时,LLM 非常有用。
  • 不能让 LLM 做思考部分,它只能快速写出可接受的代码。
  • LLM 可以快速启动新项目,然后自己接手。
  • LLM 主要用于生成示例,知道自己要做什么,但没时间构建模型。
  • LLM 可以快速生成代码,然后自己接手并进行改进。
  • 使用 LLM 需要有效的个人贡献和知识工作技能。
  • 如果之前不是高效的 IC/经理/领导者,LLM 会加速他们失败的速度。
  • LLM 可以大幅提高速度/质量/产出,但需要投入努力。
  • 编程可以看作是理论构建,需要对代码或结果负责。
  • 将工作外包给 LLM 会导致沟通和协调的负担,影响效率。

Cloudflare Introduces Default Blocking of A.I. Data Scrapers #

https://www.nytimes.com/2025/07/01/technology/cloudflare-ai-data.html

Cloudflare 是一家帮助网站安全和管理互联网流量的科技公司,最近推出了一项新功能,允许客户默认自动阻止人工智能(A.I.)公司从其网站收集数据。这一举措旨在保护网络上的原创内容,防止内容创作者因数据被随意使用而受到损害。

Cloudflare 的首席执行官 Matthew Prince 表示,他们非常担心内容创作的激励机制正在消亡。他指出,如果 A.I. 公司可以在没有许可或支付的情况下自由使用各类网站的数据,那么人们将不再愿意创造新的数字内容。

通过这一新设置,网站可以默认阻止在线爬虫(bots)抓取其数据,爬虫需要得到网站所有者的授权才能访问内容。这一改变标志着 Cloudflare 希望改变互联网的运作规则,以保护内容创造者的权益。

随着 A.I. 数据爬虫数量的激增,数据成为一个日益紧张的问题。大型 A.I. 公司,如 OpenAI、Anthropic 和谷歌等,已经从互联网上收集了大量数据,以训练其 A.I. 模型。这些公司尤其重视高质量的数据,因为它能够提升 A.I. 模型在生成准确答案、视频和图像方面的能力。然而,网站出版商、作者和新闻机构等内容创造者指责 A.I. 公司在未获授权的情况下使用他们的材料。

例如,最近 Reddit 起诉了 Anthropic,声称该公司未经许可使用了其超过 1 亿日活跃用户的数据来训练其 A.I. 系统。而《纽约时报》也在 2023 年起诉 OpenAI 及其合作伙伴微软,指控他们侵犯了与 A.I. 系统相关的新闻内容的版权,OpenAI 和微软对此否认了相关指控。

总体来说,Cloudflare 的这一新举措可能会在保护原创内容的同时,对 A.I. 行业的数据获取和使用方式产生深远影响。


HN 热度 336 points | 评论 206 comments | 作者:stephendause | 10 hours ago #

https://news.ycombinator.com/item?id=44443480

  • Cloudflare 的默认阻止 AI 数据抓取器是正确的方向,尽管可能为时已晚
  • Cloudflare 和类似的公司可能会使互联网变得不自由,正在破坏互联网体验
  • Cloudflare 被质疑为寄生虫,因为它作为中介机构从中获利
  • 有人免费使用 Cloudflare 的 AI 保护,认为它提供了有价值的服务
  • 用户因为使用非主流操作系统和浏览器而花费时间解决验证码问题
  • 有人表示 Cloudflare 已经移除了验证码
  • 有人因为使用 Firefox 而非 Chrome 而频繁遇到验证码
  • 有人表示他们使用 Firefox 和广告拦截器,但 Cloudflare 工作正常
  • Cloudflare 作为互联网的中间人,收集大量数据并阻止非主流工具用户
  • 有人担心 Cloudflare 的行为会阻碍新搜索引擎与谷歌竞争
  • 有人认为客户愿意为 Cloudflare 提供的服务付费,因为替代方案更糟
  • 有人寻求一个不受单一实体控制的替代方案
  • 有人质疑是否应该免费提供隐私和缓存服务
  • 有人认为如果你不付费,你就是产品,应该为所使用的服务付费
  • 有人表示即使付费,仍然可能成为产品
  • 有人提到 Cloudflare 解决了服务器的问题,而不是造成问题
  • 有人提到 Reddit AI 交易的收入,暗示 Cloudflare 的利润巨大
  • 有人提到使用 Firefox、广告拦截和指纹测量反制措施,很少遇到 Cloudflare 的挑战
  • 有人提到 Cloudflare 提供了一个插件帮助用户匿名绕过挑战,但感觉安装这个插件很奇怪
  • 有人提到使用 VPN 时更频繁地遇到 Cloudflare 的挑战
  • 有人提到如果不限制 LLM 抓取器,它们会显著增加小型网站的托管成本
  • 有人认为问题在于一些抓取器不尊重规则,不断重复抓取,导致网站压力巨大
  • 有人强调抓取器应该明确标识自己,提供文档 URL 并遵守 robots.txt

Private sector lost 33k jobs, badly missing expectations of 100k increase #


HN 热度 334 points | 评论 210 comments | 作者:ceejayoz | 9 hours ago #

https://news.ycombinator.com/item?id=44443622

  • 需要更好的方法来衡量经济健康,仅看失业率不能全面反映实际情况。
  • 媒体常只关注单一指标,而应综合多个指标来获得更完整的经济画面。
  • GDP 人均并不能反映工人的实际收入情况,因为企业收入增加而工资不变时,人均 GDP 上升,工人并未受益。
  • 单一指标总是有缺陷,需要考虑多个指标。
  • 经济状况可以通过观察社会底层人群来评估。
  • 美国社会似乎不关心最贫困人群。
  • 家庭收入相同,但工作小时数增加和家庭债务增加,实际生活水平下降。
  • U-5 和 U-6 统计可以捕捉到就业不足的情况。
  • 经济学家也会犯错,政策和政治仍受不准确指标驱动。
  • 即使经济学家会犯错,也不意味着他们可以被对经济学只有肤浅理解的计算机程序员纠正。
  • 政治家不需要被非政治家纠正,不懂编程的人也可以批评技术行业。
  • 家庭债务不是一个很好的指标,因为拥有抵押贷款的人债务多但不需要支付租金。
  • 家庭债务可以看作是另一种形式的租金,即从富人那里“租用”资本。
  • 抵押贷款持有者拥有资产升值(或贬值)的权益。
  • 债务在合理范围内是一种工具,可以提供杠杆和购买力。
  • 拥有房屋净值的人在经济衰退中相对安全。
  • 债务对大多数中产阶级家庭是有益的,可以增加现金流、储蓄和退休安全性。
  • 货币供应量和流通速度(M2)也是一个重要的衡量指标。

Sam Altman Slams Meta’s AI Talent Poaching: ‘Missionaries Will Beat Mercenaries’ #

https://www.wired.com/story/sam-altman-meta-ai-talent-poaching-spree-leaked-messages/

这篇文章讨论了 OpenAI 首席执行官 Sam Altman 对 Meta 公司近期的人工智能人才抢夺行为的回应。在一封泄露给 WIRED 的邮件中,Altman 向 OpenAI 的研究人员强调了留在 OpenAI 是构建通用人工智能的正确选择,并暗示公司正在评估整个研究组织的薪酬。

文章提到,Meta 公司 CEO 马克·扎克伯格(Mark Zuckerberg)最近宣布成立了一个新的超级智能团队,由前 Scale AI 的 Alexandr Wang 和前 GitHub 负责人 Nat Friedman 领导,新团队中包括了一些来自 OpenAI 的成员,如 Shengjia Zhao、Shuchao Bi、Jiahui Yu 和 Hongyu Ren。对此,OpenAI 的首席研究官 Mark Chen 表示,这感觉就像是“有人闯入我们的家,偷走了东西”。

Altman 在他的邮件中对这些离职采取了不同的态度,他认为 Meta 确实得到了一些优秀的人才,但总体上,Meta 并没有得到他们最顶尖的人才,而是在他们的名单上排得很靠后。他提到 Meta 已经尝试招募很长时间,并且他已经记不清 Meta 尝试过多少次从 OpenAI 挖走首席科学家。Altman 表示,他为整个行业的使命感感到自豪,当然总会有一些雇佣兵。他补充说,“传教士会打败雇佣兵”,并指出 OpenAI 正在评估整个研究组织的薪酬。他相信 OpenAI 的股票比 Meta 的股票有更多的上升空间,但他认为巨大的上升空间应该在巨大的成功之后到来。他认为 Meta 的做法将导致深刻的文化问题。

最后,Altman 强调他对 OpenAI 的研究路线图从未如此有信心。他表示,公司正在对计算能力做出前所未有的投资,他喜欢公司这样做,并相信会很好地利用这些投资。最重要的是,他认为 OpenAI 拥有世界上最特别的团队和文化。他们有工作要做,并且正在朝着正确的方向前进。


HN 热度 324 points | 评论 669 comments | 作者:spenvo | 1 day ago #

https://news.ycombinator.com/item?id=44436579

  • 许多雇主希望员工表现得像狂热信徒,但在困难时期,这些员工往往是第一批被解雇的,且准备不足。
  • 员工不应被愚弄,认为公司会因为忠诚而保护他们。
  • 公司在某种程度上确实重视员工的忠诚,但作为个人策略,忠诚并不是一个好的选择。
  • 公司只有在不花费任何成本的情况下才会欣赏忠诚,一旦需要裁员或减少成本,忠诚就不再重要。
  • 员工对公司的忠诚没有理由,因为公司不像人类那样忠诚,它们是大型组织,决策可能不公平、不合理。
  • 一些科技公司领导层将 AGI(人工通用智能)视为救世主,是推动他们前进的动力。
  • 内部来看,这些公司并不像公开宣传的那样重视 AGI,更多的是市场营销手段。
  • AGI 是资本主义的救星,用来拯救一个失败的系统,使其不必支付烦人的工人工资。
  • 技术创始人认为技术是阻碍他们赚钱和炒作的障碍。
  • 公司忠诚只有在与高层管理者有直接关系时才可能得到回报。
  • 新的 C 级高管上任后,跟随的新员工往往是他们的亲信。
  • 公司裁员的方式可以反映公司对员工的态度,是否先削减利润和管理薪资,是否为被裁员工提供慷慨的补偿。
  • 员工应该感觉自己是优秀团队的一部分,做有意义的工作,但这并不能保证任何东西。
  • 除了传教士或在慈善/非政府组织工作的人之外,其他人都是雇佣兵。
  • 如果你是公司的所有者,那么你可能是传教士。
  • 公司不是家庭,而是团队,裁员时他们会这么说。
  • 公司应该像对待家庭成员一样对待欠他们人情的人,利用他们。
  • 员工是成功阶梯上的台阶,不要犹豫踩在他们上面。
  • 你的老板的价值取决于他付给你的薪水。
  • 公司在裁员时会说“我们是团队,不是家庭”。
  • 公司会说“你需要花更多时间与家人在一起”,实际上是在裁员。
  • 有些组织,如 OpenAI,完全扭曲了它们最初的信息,以迎合商业化。
  • 忠诚是试图让人们出于某种感觉而留下的废话,应该对那些表现出同样忠诚的人和组织保持忠诚。
  • 管理层变动频繁,不要被措手不及。
  • 在当前的技术开发/技术工作市场中,工资被压低到 2010 年的水平,许多人不得不做两份工作来维持开支。

Huawei releases an open weight model trained on Huawei Ascend GPUs #

https://arxiv.org/abs/2505.21411

随着大型语言模型中专家混合模型(Mixture of Experts, MoE)的出现,我们可以在执行成本相对较低的情况下,拥有更多的模型参数和学习能力。这是因为对于每个输入标记,只有一小部分参数被激活。然而,通常观察到一些专家被激活的频率远高于其他专家,这导致了在不同设备上并行运行专家时的系统效率低下。

因此,我们引入了分组专家混合模型(Mixture of Grouped Experts, MoGE),它在专家选择过程中对专家进行分组,并自然地比 MoE 更好地平衡专家工作负载。它限制了标记在每个预定义的专家组内激活相等数量的专家。当模型执行分布在多个设备上时,这种架构设计确保了设备间的计算负载平衡,显著提高了吞吐量,特别是在推理阶段。

此外,我们在 Ascend NPUs 上构建了基于 MoGE 的稀疏模型 Pangu Pro MoE,该模型总共有 720 亿个参数,每个标记激活 160 亿个参数。通过广泛的系统模拟研究,Pangu Pro MoE 的配置针对 Ascend 300I Duo 和 800I A2 进行了优化。我们的实验表明,MoGE 确实在 Ascend NPUs 上为模型训练和推理带来了更好的专家负载平衡和更高效的执行。Pangu Pro MoE 的推理性能每张卡达到 1148 个标记/秒,并且可以通过推测加速进一步提高到 1528 个标记/秒,超过了可比的 32B 和 72B 密集模型。

此外,我们在 Ascend 300I Duo 上实现了模型推理的优秀成本-性能比。我们的研究表明,Ascend NPUs 能够通过大规模并行化训练 Pangu Pro MoE,使其成为子 100B 总参数类别中的领先模型,超过了像 GLM-Z1-32B 和 Qwen3-32B 这样的著名开源模型。


HN 热度 299 points | 评论 289 comments | 作者:buyucu | 15 hours ago #

https://news.ycombinator.com/item?id=44441089

  • Huawei 发布的开放权重模型可能意味着即使是拥有廉价 GPU 的小玩家也能与大公司竞争。
  • 美国制裁实际上可能会在多个方面改善世界,比如增加计算的多样性和迫使制造业去中心化。
  • 美国制裁可能会增加走私、盗窃、间谍活动、犯罪和破坏行为。
  • 中国自我毁灭对西方来说听起来像是恶意的谩骂。
  • 中国变得更友好对西方和世界其他地区都有帮助,这并非是沙文主义。
  • 中国在基础设施建设上的预算实际上与美国的国防预算相当,而基础设施预算改善了当地人的生活。
  • 制裁可能会对世界造成巨大伤害,因为 Nvidia 可能不再拥有免费的钱作弊代码。
  • Deepseek-R1 在许多基准测试中与 GPT 4.1 一样强大,它是开放权重、开源的,并且他们甚至开源了他们的推理代码。
  • 从编码角度来看,Deepseek-R1 的体验至少是令人失望的,与 GPT 4.1 相比体验更好。
  • Deepseek-R1 在许多基准测试中与 GPT 4.1 一样强大,你可以深入了解并改进它以适应你的用例。
  • Gemini 2.5 模型在许多方面甚至无法击败 Deepseek V3。
  • Gemini 在代码和科学方面输出过于冗长,导致自身混乱,影响长窗口的质量。
  • R1 和 Gemini Pro/Flash 在创造性任务上表现平庸。
  • 在写作比赛中,V3 将击败 Gemini、Deepseek R1 和 Deepseek V3。
  • V3 在叙事写作方面非常出色。
  • R1 几乎和它得出正确答案一样频繁地说服自己放弃正确答案。
  • 2.5 Pro 是一个非常强大的模型,可能在某些方面不如 o3-pro,但 o3-pro 速度慢得多,其实用性往往受到我自己的注意力跨度的限制。