2025-07-30 Hacker News Top Stories #
- 美国退役军官指控以色列军队在加沙犯下战争罪行,引发国际社会强烈反应及政治压力。
- 一个网站通过展示英国议员驾照样本,抗议《在线安全法案》,引发透明度与隐私讨论。
- 玩家因游戏平台限制成人内容,向Visa和Mastercard施压,抗议支付审查行为。
- 谷歌在Chrome中偏袒“一键登录”功能,引发对隐私侵犯和浏览器偏见的争议。
- 开源模型GLM-4.5 Air在普通设备上运行表现出色,展示了其在编码任务上的巨大进步。
- 作者设计了一款名为PyroWave的快速游戏流媒体编解码器,专注于低延迟和高效传输。
- 维基媒体基金会就英国《在线安全法案》提起法律挑战,认为其对维基百科构成威胁。
- AI公司以“无限”服务吸引用户,后续限制使用引发争议,反映了诱饵式定价策略。
- 研究发现,添加无关信息(如猫相关事实)会使大型语言模型在数学问题上的错误率增加300%。
- Pony是一种新型编程语言,基于actor模型和能力安全,旨在高性能环境中构建并发程序。
‘I witnessed war crimes’ in Gaza – former worker at GHF aid site [video] #
https://www.bbc.com/news/videos/cy8k8045nx9o
美国特种部队退役军官安东尼·阿吉拉尔(Anthony Aguilar)向 BBC 透露了他为何辞去在得到美国和以色列支持的加沙人道主义基金会(GHF)援助分发中心的工作。阿吉拉尔表示:“我亲眼目睹了以色列国防军向巴勒斯坦人群开枪。”他补充说,在他的整个职业生涯中,从未见过如此程度的“对平民、手无寸铁、饥饿的平民使用不分青红皂白和不必要的武力”。
英国首相基尔·斯塔默(Keir Starmer)表示,除非以色列政府采取“实质性步骤结束加沙的可怕局势”,否则英国将承认巴勒斯坦国。BBC 的莱塞·杜塞特(Lyse Doucet)在伊朗街头报道,称局势开始恢复正常。
美国总统特朗普对以色列和伊朗的行为表示愤怒。以色列部长告诉 BBC,他的总理和美国总统自“第一天起”就在合作。以色列官员称,至少有四人在伊朗导弹击中住宅楼时丧生。BBC 的乔·因伍德(Joe Inwood)回答了美国在伊朗空袭后可能发生的事情的三个关键问题。
BBC 的露西·威廉姆森(Lucy Williamson)在以色列南部城市贝尔谢巴的索罗卡医院外,紧急工作人员正在评估现场。以色列总理长期以来一直警告说,伊朗接近发展核武器。BBC 验证的罗斯·阿特金斯(Ros Atkins)解释了我们对其计划的了解。伊朗的福特核设施是防御最严密的设施之一。只有一个常规武器可以摧毁它——而只有美国已知拥有这种武器。
社交媒体上发布的视频显示,人们在逃离德黑兰时,燃料队列和交通拥堵。BBC 的中东记者雨果·巴切加(Hugo Bachega)在伊朗导弹一夜之间袭击的佩塔提克瓦。伊朗对以色列发动了新的空袭,造成五人死亡,数十人受伤。救援行动在伊朗对巴特亚姆的致命袭击后展开。紧急服务部门在以色列的巴特亚姆启动救援工作,此前伊朗发动了袭击。
HN 热度 932 points | 评论 1127 comments | 作者:nathanyz | 1 day ago #
https://news.ycombinator.com/item?id=44714221
- 有政治家最初支持以色列政府的行动,但随着局势恶化,对大规模平民伤亡表示强烈反对。
- 认为应该欢迎那些改变立场的人,因为他们在情况变化时获得了新的数据或视角。
- 有人对政治家的态度转变感到不满,认为他们之前忽视了以色列的非法占领和战争罪行。
- 有人质疑局势从一开始就很清晰,认为西方媒体忽视了以色列的行为。
- 有人坚持认为情况并非非黑即白,以色列对巴勒斯坦的行动并非正当。
- 有人指出,尽管巴勒斯坦存在问题,但以色列的行为同样有问题。
- 有人强调以色列非法占领、种族清洗和实施种族隔离的事实。
- 有人提到以色列提供了两国解决方案,而巴勒斯坦拒绝了。
- 有人反驳说,以色列从未真诚地提供两国解决方案,而哈马斯自 2017 年以来就提出了这一方案。
- 有人批评以色列的过度行为,如拆除房屋和非法定居点。
- 有人质疑以色列存在的权利,认为以色列本身就是需要纠正的过度行为。
Show HN: Use Their ID – Use your local UK MP’s ID for the Online Safety Act #
这个网页是一个查询界面,用于查看英国当地议员的驾照可能是什么样子。页面上有一个表单,要求用户输入他们的英国邮政编码,以便提交查询。
-
网页标题:查看您的当地议员的驾照可能是什么样子。
-
表单输入:页面上有一个表单,要求用户输入他们的英国邮政编码。表单中有一个输入框和一个提交按钮。
- 输入框:请输入您的英国邮政编码。
- 提交按钮:提交。
-
提交后的操作:用户输入邮政编码并点击提交按钮后,网页将根据提供的邮政编码查询并显示当地议员的驾照信息。
HN 热度 814 points | 评论 259 comments | 作者:timje1 | 1 day ago #
https://news.ycombinator.com/item?id=44716106
- 有人赞扬该网站是对《在线安全法案》愚蠢之处的抗议
- 有人提到这是对独立英国政府监督网站的第三人称 URL 格式的延伸
- 有人对“他们为你工作”网站表示赞赏
- 有人指出保守党在 2023 年引入并通过了《在线安全法案》,但现在却投票反对它
- 有人提到保守党在 2022 年 3 月首次提出该法案,当时他们并未崩溃,也没有失去选举的迹象
- 有人认为这是一个善意但计划和撰写不当的法案
- 有人质疑如果法案是“定时炸弹”,为什么保守党没有去解除它
- 有人指出工党认为保守党的版本不够远大
- 有人提到工党似乎想要废除《在线安全法案》
- 有人指出英国在这个问题上“双方都有责任”
- 有人提到政府党派会受鞭策,有趣的是那些投票“是”的非工党/前工党人士
- 有人批评工党投票支持保守党的政策,而保守党投票反对它
- 有人指出这种政府不按选民意愿行事的情况很有趣,就像对民主的中指
- 有人提到在美国,中产阶级的投票偏好与他们选出的官员的投票之间没有相关性
- 有人指出英国现在比以往任何时候都更像是一个君主制国家
- 有人提到在 1800 年代英国并非如此
- 有人认为许多英国人会同意即将到来的规则,无论它们是否有效
Visa and Mastercard are getting overwhelmed by gamer fury over censorship #
https://www.polygon.com/news/616835/visa-mastercard-steam-itchio-campaign-adult-games
Visa 和 Mastercard 因游戏审查问题受到玩家愤怒的冲击
在 Steam 和 itch.io 等游戏商店限制成人游戏销售后,愤怒的玩家开始组织起来,针对他们认为负责打击行动的支付处理商发起抗议活动。这场运动虽然还处于初期阶段,但人们正在动员起来,目的是通过大量电子邮件和电话联系 Visa 和 Mastercard,使这些公司无法忽视这一问题。
在 Reddit 和 Bluesky 等社交媒体网站上,人们互相鼓励通过电子邮件和电话联系 Visa 和 Mastercard。Visa 和 Mastercard 成为关注目标,因为受影响的游戏商店都表示,他们对成人游戏的决定是出于失去使用主要支付处理商能力的危险。这些支付处理商有自己的使用规则,但定义模糊。Valve 和 itch.io 的发言人表示,失去这样的基础设施可能会影响到不仅仅是关心色情游戏的受众。
在 Steam subreddit 上一个已被删除的帖子中,有超过 17,000 个点赞,评论者表示,两家支付处理商的客户服务代表似乎已经意识到这个问题。有时,代表们会说他们已经接到了多个关于成人游戏审查的电话,但他们无法对此采取任何行动。
施加压力的人们知道,呼叫中心的人在这种情况下权力有限;通常,代理人员只能处理标准的客户问题,如支付欺诈或信用卡丢失。但目的不是通过特定的电话通话来实现变革:而是要造成足够的混乱,理论上开始让支付处理商损失金钱。
Reddit 帖子上的一条顶级评论写道:“电子邮件可以被忽略,但是一个非常非常长的队列使得其他客户几乎无法接入也会有很大帮助。”在同一帖子中,人们表示他们即使在接线员说他们会因为类似电话堵塞线路而经历数小时等待时间的情况下,也会坚持通话。除了顽固因素外,这种策略的动机是知道大多数客户服务系统会将选择回拨的人放在较低的优先级队列中,因为任何选择加入的人可能都没有紧急情况。
人们还通过电子邮件直接向 Visa 和 Mastercard 的高管表达他们的担忧,这两个支付处理商被活动组织 Collective Shout 在他们的公开信中点名,要求撤下成人游戏。电子邮件也被发送到客户服务。在协调努力的背景下,许多人收到了预先写好的回复,内容如下:
感谢您联系并分享您的观点。作为一家全球公司,我们遵守我们在任何地方开展业务的法律和法规。虽然我们明确禁止在我们的网络上进行非法活动,但我们同样致力于保护合法商业。如果交易是合法的,我们的政策是处理交易。我们不对消费者进行的合法购买做出道德判断。Visa 不调节商家销售的内容,也不在我们处理交易时了解具体销售的商品或服务。当一个合法经营的商家面临非法活动的风险增加时,我们要求为支持这些商家的银行提供增强的保障措施。有关 Visa 政策的更多信息,请访问 Visa.com 上我们的网络完整性页面。感谢您的来信。
在 Bluesky 等平台上,人们分享资源,帮助人们知道如何联系谁,包括可能的脚本,用于与代表交谈或发送电子邮件。一个网站已经建立,其明确目的是为关心的旁观者提供工具和知识,以便他们在运动中发挥作用。
在这一切中,玩家互相告诉对方在与支付处理商的任何互动中保持礼貌,特别是当处理只是试图完成工作的低级工作人员时。对于高管来说,保持体贴的语气的目的是帮助掌权的人认真对待这个问题。
这种策略在执行的深度和广度上令人印象深刻。一些人以活动家的倾向冲锋陷阵,而另一些人则表示他们假装是困惑的客户,想知道为什么他们不能使用 Visa 或 Mastercard 购买他们最喜欢的游戏。
与此同时,最初向 Steam、Visa 和 Mastercard 投诉成人游戏的组织 Collective Shout 也发表了自己的声明和事件时间线。“我们对 Steam 上的强奸和乱伦游戏提出了几个月的反对,他们忽视了我们几个月,”Collective Shout 的博客文章中写道。“我们因为 Steam 没有回应我们而接近支付处理商。”
Collective Shout 声称,它只请愿 itch.io 撤下涉及对女性性暴力或酷刑的游戏,但据称,商店自行决定对整个 NSFW 内容进行审查。目前,itch.io 已经对成人主题游戏进行了去索引,这意味着这些游戏在他们的搜索页面上不再可见。这家独立商店仍在制定和概述其网站上成人内容的规则,但网已经撒得如此之广,以至于一些涉及 LGBT 主题的游戏也受到了影响。
在另一个流行的 Reddit 帖子中,用户表示客户服务代表从困惑转变为重申他们的担忧正在被“听到”。“我将在几天后再次给他们打电话,看看是否有任何改变这种情况的进展,”原始发帖者说。
也许那个帖子中的另一个评论最能总结这一事件:“真正能团结玩家的只有两件事:仇恨运动和愚蠢行为。”
HN 热度 579 points | 评论 562 comments | 作者:mrzool | 1 day ago #
https://news.ycombinator.com/item?id=44713414
- 一些人的奇怪观点导致支付处理器施压商店下架游戏,这是对个人不喜欢的内容的审查。
- 必须对支付处理器施加压力以改变现状,同时也要反对那些认为可以决定其他成年人私人时间活动的人。
- 一个外国女权组织在当前政治环境下决定美国人能看什么不能看是荒谬的。
- 美国的经济和军事影响力使其对贸易伙伴和军事盟友有影响力,这并不罕见。
- 美国福音派人士影响乌干达重新将同性恋定为犯罪行为。
- 澳大利亚基于本国法律对非法色情内容采取行动。
- Visa 和 Mastercard 可能因为集体抗议而改变政策,但也可能是他们自己的决定。
- Visa 和 Mastercard 对色情内容的禁令是长期且持续的政策。
- 澳大利亚无法处理电视上的男性生殖器,却能处理带毛的手铐、女学生制服或剃过的解剖结构。
Sign in with Google in Chrome #
https://underpassapp.com/news/2025/7/5.html
这篇文章由 Underpass App Company 的 Jeff Johnson 于 2025 年 7 月 28 日发布,主要讨论了 Google 的“一键登录”(One Tap)用户体验问题。文章指出,许多网站如 Yelp 在访问时会显示烦人的“使用 Google 登录”横幅。幸运的是,作者开发的浏览器扩展程序 StopTheMadness Pro 可以隐藏这些横幅。
文章进一步解释说,如果你使用的是 Safari 或 Firefox 浏览器,可能没有意识到这些横幅在 Google Chrome 浏览器中从未显示过。作者指导读者如何在 macOS Safari 中通过伪装 Chrome 的用户代理(User-Agent)头来验证这一点。在 Safari 的高级设置中启用“为网络开发者显示功能”,这会在 Safari 的主菜单栏添加一个开发菜单。开发菜单中有一个用户代理子菜单,列出了多个网络浏览器。当你从列表中选择 Google Chrome 并加载 Yelp 网站时,“使用 Google 登录”的横幅就不再出现。
尽管 Chrome 避免了“使用 Google 登录”的横幅,但 Google 的浏览器仍有其自身的自定义烦恼。如果你在访问如 Yelp 这样的参与网站时已经登录了你的 Google 账户,Chrome 会显示一个 One Tap 对话框。这个对话框与在 Safari 和 Firefox 中看到的“使用 Google 登录”横幅有两个重要的不同点。首先,Chrome 对话框不是网页的一个元素,而是 Chrome 原生应用程序用户界面的一部分。因此,StopTheMadness Pro 无法隐藏这个对话框。实际上,当 Chrome 显示对话框时,它会阻止所有 Chrome 扩展弹出窗口的出现。其次,Chrome 对话框可以在 Chrome 的设置中被禁用。在地址栏输入 chrome://settings/content/federatedIdentityApi 可以直接访问该设置。
文章最后,作者呼吁法院和反垄断监管机构关注这一问题,认为这是 Google 偏袒自家浏览器 Chrome 的又一例证,尽管他承认他们可能不会阅读他的博客。
HN 热度 527 points | 评论 271 comments | 作者:frizlab | 1 day ago #
https://news.ycombinator.com/item?id=44715166
- Google 一键登录功能侵犯用户隐私,收集个人信息。
- Google One Tap 能显著增加用户注册量,对产品推广有益。
- 用户往往只是为了关闭对话框而点击“继续”,并非真的想注册。
- 用户并不在乎是否注册,但讨厌繁琐的注册流程和电子邮件验证。
- 用户为了减少垃圾邮件,使用 Apple 的“隐藏我的电子邮件”功能注册。
- 一些网站会阻止临时电子邮件,如 10minutemail 等。
- Apple 邮箱中继尚未被阻止,因为苹果设备用户是高价值客户。
- 通过 Google、Facebook 等第三方登录的同时,也必须允许使用 Apple 登录。
- 一些网站从未表示他们认为用户注册是有意为之。
- 一键登录可以增加收入,无需额外成本。
- 一些网站在用户开始输入查询时弹出 Google 登录窗口,影响用户体验。
- 用户因为 Google 的反用户、反隐私行为而转向 Firefox 浏览器。
- 用户对弹出式登录窗口的延迟焦点捕获感到恼火。
- 用户不认为通过电子邮件发送的垃圾信息是“沟通”。
- 用户可能会失去对 Google 账户的访问权限,导致无法通过电子邮件验证。
- 用户使用 Gmail 地址登录网站,如果忘记密码则无法重置。
- 用户不应该使用 Gmail 地址,而应该拥有自己的域名邮箱。
My 2.5 year old laptop can write Space Invaders in JavaScript now (GLM-4.5 Air) #
https://simonwillison.net/2025/Jul/29/space-invaders/
Simon Willison 在他的博客中分享了一项令人印象深刻的技术进展。他提到了 GLM-4.5 模型家族,这是由中国的 Z.ai 公司发布的一组新的开源模型,这些模型在编码任务上的得分非常高,甚至能够与 Claude Sonnet 4 等模型相媲美。这些模型的规模相当庞大,即使是较小的 GLM-4.5 Air 模型也拥有 1060 亿个参数,占用了 205.78GB 的存储空间。
为了使 64GB 内存的机器能够运行这些模型,Ivan Fioravanti 创建了一个 44GB 的 3bit 量化版本,专门针对 MLX 平台进行了优化。Simon Willison 尝试了这个版本,并发现它运行得非常好。他给模型提供了一个提示:“编写一个 HTML 和 JavaScript 页面,实现太空侵略者游戏”,模型经过一段时间的处理后,成功生成了代码。虽然这不是一个特别新颖的例子,但 Simon Willison 认为,一个在他的 2.5 岁笔记本电脑(64GB MacBook Pro M2)上运行的模型能够产生这样的代码,尤其是第一次就无需进一步编辑即可工作的代码,这是非常值得注意的。
Simon Willison 详细描述了他是如何运行这个模型的。他使用了 mlx-lm 库的当前主分支,以确保他有添加了 glm4_moe 支持的提交。他使用 uv 运行库,并在 Python 解释器中使用标准的 MLX 模型运行方法。他下载了 44GB 的模型权重到他的缓存文件夹中,然后使用 tokenizer 和 generate 函数来生成响应。
模型的响应开始于一个思考过程,模型意识到用户想要创建一个使用 HTML、CSS 和 JavaScript 的太空侵略者游戏,并需要具备以下功能:可以左右移动并射击的玩家太空船、以编队移动并反击的敌人入侵者、得分跟踪、生命/健康系统以及游戏结束条件等。随后,模型生成了 HTML 代码和调试输出,显示了提示、生成和峰值内存使用情况。
此外,Simon Willison 还提到了他使用 pelican 基准测试对全尺寸模型进行测试的情况,并忍不住尝试了这个较小的 3bit 模型。他得到了一个“生成一个骑着自行车的鹈鹕的 SVG”的结果,并分享了相应的记录。
Simon Willison 指出,2025 年几乎每个发布的模型都特别针对编码任务,这种专注显然已经取得了成效:这些编码模型现在真的变得非常好。他回忆起两年前当他第一次尝试 LLaMA 时,从未梦想过他当时使用的同一台笔记本电脑有一天能够运行具有 GLM 4.5 Air 这样强大能力的模型,以及其他如 Mistral 3.2 Small、Gemma 3、Qwen 3 等高质量模型,这些都是在过去六个月中出现的。
最后,Simon Willison 提到了他的博客系列“个人设备上的 LLMs”,并链接到了他的其他相关文章。
HN 热度 431 points | 评论 313 comments | 作者:simonw | 10 hours ago #
https://news.ycombinator.com/item?id=44723316
- 开源模型在质量和发布速度上超出了预期,与两年前相比有了巨大的进步。
- LLama 模型的泄露可能是有意为之,带来了模型优化和微调的快速发展。
- 开源模型与最先进的实验室模型相比大约落后六个月,但这个差距已经非常小。
- 通过微调,即使是小型模型也能在特定任务上大幅超越大型 SOTA 模型,并且运行成本更低。
- 对于自托管,有公司提供基于令牌定价的 LoRA 微调服务。
- 微调可能破坏模型的能力,需要非常小心。
- 可以通过向模型提出一系列相同的问题来衡量微调后模型能力是否被破坏。
- 有资源和特定用例的情况下,使用小型模型进行微调可能更有意义。
- 微调对于大多数企业来说并不常见,也不太有意义。
- 使用 Axolotl 和 Unsloth 进行模型微调,Axolotl 文档提供了学习资源。
- 有公司在欧盟提供模型托管服务,如 DeepSeek、Qwen3、Kimi。
- 对于苹果硬件,MLX 是微调的合适选择。
- Hugging Face transformers 库中,peft 是用于微调的库。
- Unsloth 由于内存需求较低,是微调的简单方式。
- 有用户提到 Brev.dev 曾提供易于跟随的指南,但后来被 Nvidia 下架。
I designed my own fast game streaming video codec – PyroWave #
这篇文章讨论了作者设计的一个名为 PyroWave 的快速游戏流媒体视频编解码器。文章首先指出,将游戏画面从一个机器流式传输到另一个机器是一个日益流行的用例,这要求极低的延迟。作者详细描述了流媒体过程中的各个步骤,包括发送控制器输入、渲染帧、编码帧、通过网络发送、解码和显示图像,并强调每一步都会增加延迟,因此需要最小化这些延迟。
文章提到,为了实现低延迟,需要对视频编解码器进行严格的控制,放弃现代视频编解码器常用的一些技巧,如灵活的速率控制和 B 帧。作者提到,由于编解码器不能增加延迟,且在固定的比特率预算下工作,因此需要采用硬性限制的恒定比特率和无限 GOP P 帧或内刷新。
作者回顾了自己学生时代设计的简单低复杂度视频编解码器,并在处理 Vulkan 视频和 PyroFling 后,再次激发了设计编解码器的兴趣。他想要测试如果设计一个专注于本地流媒体且具有最低可能延迟的编解码器,会出现什么情况。
文章接着讨论了作者放弃运动预测,只使用内帧(intra-only)的方法。虽然这会导致比特率激增,但可以获得更好的错误恢复能力、简单性和一致的质量。作者提到,内帧在数字电影(如运动 JPEG2000)和更专业的应用中有其用例,这些应用更重视这些因素而非压缩带宽。
作者还放弃了熵编码,因为熵编码对于并行化是一个噩梦,这意味着在 GPU 上使用计算着色器进行编码变得非常痛苦。作者选择了不使用熵编码,以提高速度。
文章提到了离散小波变换(DWT),这是一种在 90 年代试图取代 DCT 的替代方法,但最终失败了。DWT 在今天的某些领域仍然有一席之地,尤其是在内视频压缩中。作者解释了 DWT 的工作原理,即通过下采样图像并计算高分辨率图像与低分辨率图像之间的“误差”。作者选择了 5 级分解,并讨论了量化小波的复杂性,以及如何利用人类视觉感知效果进行速率控制。
文章最后讨论了将系数打包成块的过程,这是编解码器设计中最耗时的部分。基本块是 32×32 系数,形成一个独立的比特流单元,可以独立解码。如果发生数据包丢失,可以通过假设所有系数为零来进行错误校正,这可能导致帧中的某个随机位置出现轻微模糊,但可能不会被察觉。32×32 块进一步细分为 8×8 块,然后细分为 4×2 块,这种设计针对 GPU 线程层次结构进行了优化。
HN 热度 415 points | 评论 127 comments | 作者:Bogdanp | 1 day ago #
https://news.ycombinator.com/item?id=44714914
- BBC 开发的 VC-2 是一个基于小波的超低延迟编解码器,目前只有 ffmpeg 和 BBC 官方仓库中的 CPU 版本实现,有人计划为其开发 CUDA 加速版本。
- Vulkan 实现的编解码器性能不佳,GPU 使用率达到 95% 但速度仅为参考 SIMD 编解码器/解码器的两倍。
- 存在能够绕过“加载到 CPU RAM”部分的 API,如 Windows 的 Desktop Duplication API 和 Windows.Graphics.Capture,Linux 的 GStreamer 和 dmabuf。
- JPEG-XS 是 VC-2 的几乎直接后继者,使用了相同的技术,但专利限制了其使用。
- 视频编解码器中的运动向量是 3D 运动向量的 2D 投影等效物,可以用于指导视频的运动补偿。
- 神经网络与视频编解码器的运动向量无关,生成新帧是 2D 的光流,没有 3D 参与。
- 视频编解码器中的 P 帧生成不一定要编码一个实际的 2D 向量来“移动像素”,已有更复杂的实现方式。
Wikimedia Foundation Challenges UK Online Safety Act Regulations #
2025 年 7 月 17 日,维基媒体基金会宣布将对英国《在线安全法案》(OSA)的分类规定提出法律挑战。这场法律挑战将在 2025 年 7 月 22 日和 23 日由伦敦高等法院审理。维基媒体基金会是一家非营利组织,负责运营维基百科和其他维基媒体项目。该基金会早些时候宣布了这一法律挑战,认为这些规定危及维基百科以及全球志愿者社区,他们为网站创造信息。
维基媒体基金会的总法律顾问斯蒂芬·拉波特表示:“法院有机会在本案中为保护在线公共利益项目树立全球先例。维基百科是互联网知识的基础。它是唯一一个由非营利组织运营的前十网站之一,也是用于训练大型语言模型(LLMs)的最高质量数据集之一。我们相信法院将保护维基百科——一个至关重要的百科全书资源——免受为互联网风险最高的商业网站制定的规则的影响,从而为每个人保护开放的互联网。”
维基百科的信息由近 260,000 名全球志愿者贡献者编写和策划。这些志愿者制定并执行政策,确保平台上的信息基于事实、中立,并归因于可靠的来源。在过去的 25 年里,这种以人为中心的内容审核模式使维基百科成为超过 300 种语言中可靠信息的无与伦比的资源;其 6500 万篇文章每月全球浏览量超过 150 亿次。
维基媒体基金会与英国政府一样,致力于促进每个人都能安全参与的在线环境。该组织并不是对整个 OSA 或类别 1 职责的存在提出一般性挑战。相反,法律挑战仅针对可能对维基百科施加类别 1 职责(OSA 最严格的义务)的新分类规定。
如果对维基百科执行类别 1 要求,将破坏维基百科志愿者的隐私和安全,使百科全书面临操纵和破坏的风险,并转移保护人们和改善维基百科这一世界上最受信任和广泛使用的数字公共产品的基本资源。
例如,基金会将被要求验证许多维基百科贡献者的身份,这破坏了对保持维基百科志愿者安全至关重要的隐私。除了异常繁重之外,这一要求——只是类别 1 要求中的一个——可能会使贡献者面临数据泄露、跟踪、诉讼甚至被威权政权监禁的风险。关于类别 1 职责对维基百科的令人担忧的影响的更多细节可以在这篇博客文章中找到。
维基媒体基金会将由长期在英国的维基百科志愿者用户 Zzuuzz 作为共同原告参与此案。他们的自愿参与突出了此案对每天阅读和贡献维基媒体项目的普通人的利益。它展示了维基百科志愿者的观点,即 OSA 分类规定如何直接威胁贡献者在维基百科上参与知识共享的能力,以及破坏他们对隐私、安全、言论自由和结社的权利。
这场法律挑战是针对 OSA 分类规定发出的第一个,也是第一个有维基百科编辑作为共同原告参与的。它遵循了多年与监管机构和政策制定者的对话,在此期间,基金会表达了其关切,以及来自英国议会和民间社会的警告。
维基媒体基金会的首席律师菲尔·布拉德利-施密格表示:“我们对维基百科及其贡献者面临的迫在眉睫的威胁的担忧仍未得到解决。我们现在正在采取行动保护维基百科的志愿者,以及自由知识的全球可访问性和完整性。我们呼吁法院保护维基百科志愿者免受有缺陷的立法的影响。”
维基百科和其他维基媒体项目是安全且重要的资源,人们通过这些资源在英国乃至更广泛的世界学习、分享知识、合作和提高媒体素养。成千上万的维基百科志愿者在英国,维基百科托管了来自文化机构如大英图书馆和惠康收藏的内容。维基百科和其他维基媒体项目的内容仅在英国上个月就被浏览了 7.76 亿次。此外,维基百科用于保护和促进英国的文化遗产,包括威尔士语等土著和少数民族语言。维基百科的威尔士语版本是世界上最受欢迎的威尔士语网站,也是威尔士课程的官方组成部分。
在伦敦皇家法院的听证会(国王诉讼庭的行政法院)预计将对公众开放。案件参考号为 AC-2025-LON-001365,法庭位置将在听证会前不久在此宣布。法院将在听证会后发布其决定,尽管公告的确切时间未知。
参与挑战的志愿者 User:Zzuuzz 的个人身份将保持机密,并受到法律和基金会的保护。
如需媒体咨询,请联系 press@wikimedia.org。
订阅我们的全球倡导通讯,了解本案和其他维基媒体基金会的全球倡导更新。
HN 热度 348 points | 评论 169 comments | 作者:Nurw | 14 hours ago #
https://news.ycombinator.com/item?id=44721403
- 英国在线安全法规定让人联想到特里萨·梅试图禁止个人加密的时期,反映出对复杂问题的无知。
- 法国在 90 年代中期也曾禁止低级加密,违反者会面临罚款和监禁。
- 90 年代美国对加密软件的出口控制导致了许多荒谬现象,例如“这件 T 恤是军火”。
- 尽管出口控制仍然存在,但使用“标准加密”或开源实现可以获得豁免。
- 没有真正的法律或法院裁决保护加密技术,商务部的规则随时可能改变。
- 法律可能是为了对付偷窃军事装备的人,作为额外的指控手段。
- 加密设备出口控制是遗留自二战时期,当时加密需要专用的密码设备。
- 苹果曾因加密出口控制而将 PowerMac G4 宣传为“超级计算机”。
- 现代的“超级计算机”性能与过去相比已不再那么令人印象深刻。
- 法国的加密禁令是一个短暂的愚蠢行为,希望英国的规定也会如此。
- 这些措施可以通过家长控制来处理,而不是依赖大科技公司。
- 现代父母应该负起责任,使用现有的家长控制工具来保护孩子。
- 线上环境对父母来说充满敌意,很难做出合理选择,需要国家行动来帮助父母。
- 许多父母支持小政府和个人责任,却同时反对内容控制,存在认知失调。
- 单独的家长行动不起作用,因为只要有一个孩子没有家长控制,全班都会受到影响。
Stop selling “unlimited”, when you mean “until we change our minds” #
https://blog.kilocode.ai/p/ai-pricing-playbook-strikes-again
这篇文章来自 Kilo Code Blog,主题是关于 AI 定价策略的讨论,特别是针对那些以“无限”为卖点,但实际上会改变主意的公司。文章由 Brendan O’Leary 在 2025 年 7 月 29 日发表。
文章的核心观点是,Anthropic 公司最近为 Claude Pro(每月 20 美元)和 Claude Max(每月 200 美元)服务增加了每周使用限制,影响了最重度的 Claude Code 用户。作者认为这是一种常见的 AI 公司的策略:先用“无限”访问吸引用户,然后对最重要的重度用户进行限制。
文章中提到,这种策略的步骤包括:以慷慨或无限的限制启动,建立用户依赖性,然后针对“不到 5%”的用户添加限制,并将其描述为“可持续性”或“公平性”。作者指出,这种策略对开发者社区造成了损害,因为它破坏了那些推动增长和采用的人的信任。
文章还提到,开发者在遇到“速率限制超出”的问题时,不会考虑基础设施成本,而是会寻找替代方案。作者强调,AI 推理确实需要成本,开发者理解资源限制,但他们不接受的是被告知“无限”,然后在围绕工具构建工作流程后发现隐藏的限制。
Kilo Code 提出了不同的方法:没有隐藏限制的“无限”承诺,从一开始就透明的按使用付费,用户可以控制支出和使用,积分永不过期。文章还提到了一个特别优惠:在本周内,每笔存款都能获得 300% 的额外积分。这意味着,当 Claude 限制每月 200 美元的用户时,用户只需支付 50 美元就能获得价值 200 美元的 AI 编码帮助,唯一的限制是必须在 30 天内使用额外积分。
最后,作者认为 AI 不会取代开发者,但使用 AI 的开发者将取代不使用 AI 的开发者。他呼吁 AI 领域成熟起来,用户对定价游戏越来越聪明。对于公司来说,应该诚实地说明成本,让用户控制限制,并使定价可预测。对于开发者来说,应该停止接受这种“正常”的诱饵和开关,寻找透明的替代方案。文章鼓励读者尝试 Kilo Code,并在本周内获得 300% 的额外积分。
HN 热度 343 points | 评论 315 comments | 作者:heymax054 | 15 hours ago #
https://news.ycombinator.com/item?id=44721003
- 订阅服务时,用户面临提供商切换成本,这成为现有提供商的小型护城河。
- 通过提供“无限”服务吸引用户,然后改变服务条款,是一种现代诱饵和转换策略。
- 用户被迫根据实际提供的价值评估服务,这可能是件好事。
- 如果出现真正的护城河,用户可能会更深入地陷入单一提供商的生态系统,这将非常糟糕。
- 提供商可能会利用记忆功能作为护城河,不让用户迁移记忆,因为记忆可能是不可读的向量。
- 对于 LLMs 来说,记忆可能并不那么有用,因为它们主要用于离散任务。
- 难以将加密的“思想”从一个模型转移到另一个模型,因此人类可读的单词可能仍然是这个领域的一个狭窄瓶颈。
- 改变产品可能会被视为虚假广告,接近非法,但法律可能会站在消费者一边。
- 如果产品发生实质性变化,导致用户不再认为它与订阅时相同,可能构成诱饵和转换,用户应停止支付。
- 除了切换成本外,目前还缺乏与 Claude Code 同样好的替代品。
Irrelevant facts about cats added to math problems increase LLM errors by 300% #
https://www.science.org/content/article/scienceadviser-cats-confuse-ai
这篇文章主要探讨了科学领域的一些最新发现和新闻,包括物理学、政策和生物学的最新进展,以及人工智能在处理信息时的局限性。
在物理学方面,文章报道了一项关于孔雀羽毛的发现。研究人员发现孔雀的彩色尾羽中隐藏着微小的反射结构,这些结构能够将光线放大成激光束。这一发现是动物界中首次发现激光腔体的例子。孔雀羽毛中的有序微观结构能够反射特定频率的光线,产生鲜艳的蓝色和绿色,以及彩虹般的光泽。研究者通过实验室仪器检测到羽毛眼斑处发出的两个不同波长的激光束,尽管这些激光束太微弱,肉眼无法看到。研究者尚未确定具体负责激光放大的微观结构,但他们推测可能是羽毛中的蛋白质颗粒。这一发现并不意味着鸟类能够利用这种能力,但它展示了生物材料未来可能被用来制造可以安全植入人体并用于生物传感、医学成像和治疗的激光器。
在政策方面,文章讨论了美国国家科学基金会(NSF)计划终止对美国唯一的南极科考破冰船 RV Nathaniel B. Palmer 的支持。这将导致美国自 20 世纪 60 年代以来首次在该地区没有专门的研究船只。超过 175 名科学家联名致信 NSF 领导和国会,要求重新考虑这一决定。Palmer 号对于该地区的研究至关重要,包括为西南极的“末日”冰川提供通道。该船可能还能再运行十年或更长时间,直到新的南极船只准备就绪。但这些计划也处于不确定状态,因为特朗普政府也提出了削减开发 Palmer 号继任者的资金。
在生物学方面,文章介绍了一项关于蛋白质的研究。人类基因组中有近 20000 个基因编码蛋白质,这些分子支持身体几乎所有的功能。研究人员通过研究人类、大麦和大肠杆菌中的三种不同蛋白质,发现当他们随机交换蛋白质表面或核心部分的遗传代码时,超过 93% 的样本中蛋白质的丰度下降了一半。然而,在分析那些繁盛的蛋白质时,研究人员注意到蛋白质的基本遗传构成是简单的,并且容易移植。通过跟踪类似于自然界可能发生的突变的小随机交换,他们能够使用模型预测这些突变蛋白质可能在数百万年中如何进化。后来,当他们交换了在数亿年中“进化”的蛋白质核心和表面的遗传代码时,许多蛋白质存活了下来。然而,研究人员发现许多交换导致蛋白质在与其他分子结合时表现更差。这导致研究人员得出结论,蛋白质核心的序列变化可能在进化过程中被选择性地反对,不是因为它们使蛋白质不稳定,而是因为它们使蛋白质在生物体中的工作表现更差。作者希望他们的工作可以用来预测人工设计蛋白质的稳定性和成功。他们写道,他们的研究增加了“越来越多的近期工作表明,蛋白质比广泛认为的要简单和不那么复杂。”
最后,文章探讨了人工智能在处理信息时的局限性。研究人员通过添加“查询不可知的对抗性触发器”——短的、无关的文本,当附加到数学问题上时,会系统地误导模型输出错误答案,而不会改变问题的含义——来测试大型语言模型的数学能力。这种策略被称为 CatAttack。研究人员表示,“触发器不是上下文相关的,因此人类在被指示解决问题时会忽略它们”——但人工智能不会。尽管他们没有提供直接的数据来证明这一点,但这一发现表明,即使是大型语言模型也可能被简单的无关信息所迷惑,导致它们在解决问题时出错。
HN 热度 272 points | 评论 130 comments | 作者:sxv | 9 hours ago #
https://news.ycombinator.com/item?id=44724238
- 该研究强调了对抗性扰动对 LLMs 的影响,特别是在金融、法律和医疗等关键应用领域需要更强大的防御机制。
- 人们应该停止人类与 AI 的比较,关注 LLMs 当前的问题和未来研究。
- LLMs 在面对无关信息时容易受到操纵,这是一个需要解决的问题。
- 过多的 MCP 工具定义可能会破坏 LLMs 设计和编写正确代码的能力。
- 人们在使用 LLMs 时经常忽略无关数据,但这项研究的结果与个人经验不符。
- 在 AI 部署时,人们往往过于关注“理想情况”,而忽视了可能出现的问题。
- 人们在使用这些工具时并非都旨在替代“普通人类”,因此“人类也会犯这种错误”的说法并不总是有帮助。
- 自主系统的优势在于可以大规模扩展,但必须确保它们不会犯人类的错误。
- 将 LLM/LRMs 映射到基于模型的反射代理,这种预期行为是可以理解的。
- 人类在被指示解决问题时,并不总是能忽略无关信息。
- 人类在面对无关信息时的表现可能并不比 LLMs 好。
- 人类在解决某些问题时可能不如表面上看起来的 LLMs 那样聪明。
- 人类大脑可能也只是从高维统计拟合函数中检索概念,额外信息可能会干扰计算。
- 人类会立即识别出这是一个陷阱。
- 即使模型“忽略”了无关信息,这些信息的存在可能会以某种方式改变输出概率。
- 应该提示模型忽略无关信息,并测试模型是否能够更好地执行并忽略这些陈述。
- 人们应该对 LLMs 有更高的标准,而不是仅仅与“具有非凡智力和百科全书知识的人类”相比较。
Pony: An actor-model, capabilities-secure, high-performance programming language #
欢迎来到 Pony 编程语言的官方网站。Pony 是一种开源、面向对象、基于 actor 模型、能力安全的高性能编程语言。
快速链接 #
- Pony 是什么?
- 常见问题解答
- 在浏览器中尝试 Pony
- 示例 Pony 应用程序
- 安装
- 开始学习 Pony
- 教程
- 标准库文档
- 获取帮助
- 现有用户参考
- 社区资源
- 社区规范
- 如何贡献
- 发布信息
Pony 是什么? #
Pony 是一种高性能的编程语言,它结合了面向对象和基于 actor 模型的特性,同时具备能力安全性。这种语言旨在提供一种安全、高效的方式来构建并发程序。
为什么选择 Pony? #
Pony 哲学的核心是指导原则,这些原则包括:
- 能力安全:Pony 通过能力系统来确保内存安全和并发安全。
- 高性能:Pony 旨在提供高性能的并发执行,无需垃圾回收。
- 简洁性:Pony 的设计注重简洁,易于学习和使用。
为什么不选择 Pony? #
尽管 Pony 有许多优点,但也存在一些可能不适合所有项目的情况,例如:
- 生态系统:与其他成熟的编程语言相比,Pony 的生态系统可能不够丰富。
- 学习曲线:对于习惯于其他编程范式的开发者来说,Pony 可能需要一定的学习时间。
学习 Pony #
- 安装 Pony:提供了安装指南,帮助用户开始使用 Pony。
- 入门:为初学者提供了起步指南和参考能力。
- 论文:提供了关于 Pony 的学术论文,深入探讨其设计理念和实现。
使用 Pony #
- 调试:提供了调试 Pony 程序的工具和技巧。
- 依赖管理:介绍了 Pony 的依赖管理工具和实践。
- 性能:提供了性能优化的技巧和测试方法。
贡献 Pony #
- 问题分类:如何对 Pony 的问题进行分类和处理。
- 项目文档:提供了 Pony 项目文档的编写和维护指南。
- CI:介绍了 Pony 的持续集成流程和工具。
社区 #
- Zulip:Pony 社区的即时通讯平台。
- 办公时间:定期的社区办公时间,供开发者交流和解决问题。
- 新闻:Pony 的最新动态和新闻。
- 虚拟用户组:一个虚拟的社区用户组,供用户讨论和分享 Pony 的使用经验。
博客 #
- 存档:Pony 博客的存档,包括历史文章和更新。
- 分类:博客文章的不同分类,如历史、Pony 初体验、稳定状态等。
常见问题解答(FAQ) #
- 关于 Pony:提供了关于 Pony 的基本信息和常见问题。
- 代码:与其他语言的比较、编译、生态系统、链接和运行时等信息。
赞助商 #
Pony 的发展得到了一些赞助商的支持,这些赞助商为 Pony 社区提供了资金和资源。
以上摘要提供了 Pony 编程语言的基本信息、学习资源、使用指南、社区互动和贡献方式,以及常见问题的解答。通过这些信息,用户可以对 Pony 有一个全面的了解,并决定是否将其应用于自己的项目中。
HN 热度 267 points | 评论 223 comments | 作者:RossBencina | 19 hours ago #
https://news.ycombinator.com/item?id=44719413
- Pony 语言是一个基于 actor 模型、能力安全、高性能的编程语言。
- Sylvan Clebsch,Pony 的原始设计者,目前在微软研究 Verona 项目,该项目与 Guido 合作,旨在为动态语言添加区域功能。
- 微软有两个基于 actor 模型的框架:Orleans(用于.NET)和 Dapr Actors(用于容器化工作负载)。
- Akka.NET 是.NET 生态系统中另一个成熟的基于 actor 的框架,与 Erlang/Elixir 的监管风格最为接近。
- Akka(.NET)是一个功能完备、可扩展性高的框架。
- Pony 语言的文档需要更多的示例来说明其关键特性。
- Pony 语言的 actor 模型类似于线程,但与数据结构相关联,并且每个 actor 只有一个执行线程。
- Pony 语言通过不同的引用类型和能力,提供了类似于 Rust 的安全保证,而无需运行借用检查器。
- Pony 语言的 iso 引用避免了可变数据的共享,这是其创新点之一。
- Pony 语言的垃圾收集器表现良好,这得益于其 actor 和引用的工作方式。
- Pony 语言的文档和示例有待进一步完善,以便更好地展示其实际应用模式。
- Pony 语言的语法对于检查数学运算来说非常简洁,提供了不同的运算符来处理溢出和性能问题。
- Pony 语言与 Rust 在默认的加法行为上有所不同。
- Pony 语言允许容易的引用循环,这是其 iso 引用的一个特点。
- Pony 语言的 iso 引用意味着对象图只能通过 iso 引用访问,这有助于避免共享可变数据。
- Pony 语言的文档和示例需要更多实际应用模式的展示,如简单的顺序程序分解为多个 actor,或简单的 web 服务器实现等。