2026-04-12 Hacker News Top Stories #
- 作者用锉刀与砂纸打磨 MacBook 底部锋利边角,做好遮蔽与固定以防铝屑和滑动,显著改善手腕触感并提倡按需个性化改造工具。
- NASA 的 Artemis II 载人绕月任务于 2026-04-10 在圣地亚哥近海成功溅落,四名宇航员完成 9 天飞行并创人类距地最远纪录,海军快速回收后标志深空探索进入新阶段。
- 评估表明廉价开源小模型配合高效流程也能复现 Mythos 的部分零日挖掘与利用链能力,优势在系统化架构与专家整合而非单纯模型规模,但大规模落地仍需完善与信任。
- 作者通过改进抓取与分段并行策略绕过官方限制,收集约 8.4 万个 Firefox 扩展(≈49.3GB)并公开数据集,同时实测大量安装会导致浏览器不稳定。
- Linux 内核明确允许使用 AI 辅助但要求人类审阅并对 GPL-2.0-only 许可与编码规范负责,AI 不得签署 Signed-off-by,提交者需签署 DCO,必要时以 Assisted-by 标注所用工具。
- 乌干达恩戈戈黑猩猩群体在八年间因资源与繁殖竞争、关键个体死亡与疾病等因素分裂并爆发致命冲突(至少24起、含17幼崽),为理解早期人类群体暴力提供线索。
- 法国政府以数字主权为由要求各部委减少对欧盟外专有技术的依赖、优先以 Linux 取代 Windows 并扩大开源采用,试图降低被美国规则与定价锁定的战略风险。
- Sam Altman 回应家遭燃烧瓶袭击,反思言论与叙事的影响、承认早期处理冲突的失误并致歉,重申以安全普惠方式推进 AI 和改进 OpenAI 治理、倡导在民主与法律框架下广泛分享技术。
- 韩国推出“全民基础移动数据接入”,在用户流量用尽后仍提供 400 kbps 无限速率并配套低价 5G 套餐、老年人配额与公共网络改善,旨在重建信任并保障基本通信权利。
- JSON Formatter Chrome 扩展转为闭源并被曝注入广告软件,引发对扩展自动更新和商店审核的不信任与安全担忧,促使用户考虑自编译安装等防范措施。
1. 打磨我的 MacBook 笔记本电脑的边角 (Filing the corners off my MacBooks) #
https://kentwalters.com/posts/corners/
这篇文章讲述了作者对 MacBook 笔记本电脑边角进行打磨处理的经历。作者觉得 MacBook 底部边缘非常锋利,尤其是在凹槽处的角落,使用时对手腕造成不适。为了改善使用体验,作者选择用锉刀和砂纸对这些尖锐的边角进行打磨,逐步调整形状,使小半径曲线与较大半径的凹槽曲线自然融合。
在操作过程中,作者特别注意保护机器,使用胶带覆盖扬声器和键盘,防止铝屑进入机器内部,同时用夹具固定 MacBook 以保证安全。打磨先用较粗的锉刀,然后依次用 150 和 400 号砂纸打磨,最终获得了满意的表面效果。文章中的照片是在打磨几个月后拍摄的,显示了正常使用中产生的划痕和磨损。
作者鼓励读者大胆尝试个性化改造自己的工具,表示未来也会对工作用电脑进行类似的修改,并愿意帮助有需要的人进行打磨,不必害怕尝试。
HN 热度 1296 points | 评论 609 comments | 作者:normanvalentine | 1 day ago #
https://news.ycombinator.com/item?id=47724352
- 应该根据个人需求对工具进行修改,即使是非传统或有争议的方式也值得尝试。
- 设计工具时应考虑人体工程学,类似于工人对工具的自定义改造,苹果未来或许可以回归更流畅的设计以保护手腕。
- 如果打字时手腕接触笔记本边缘,可能是打字姿势不正确,应调整打字方式而非仅改工具设计。
- 理想的打字姿势应支持从肘部到手腕的整个手臂,良好的桌椅设计对手腕保护很重要。
- 手腕保持直线很重要,但长时间悬空打字也不适合,应找到平衡。
- 有些人习惯将手腕放在支撑物上打字多年且无不适,但这并不代表适合所有人。
- 使用人体工学键盘的人往往是因为已有手腕问题才选择,不能简单认为键盘导致问题。
- 苹果硬件的耐用性因人而异,有人认为苹果设备寿命较长,也有人指出部分部件质量有待提升。
- 对工具的过度保护可能限制使用体验,真正的高手会根据需求合理使用并改造工具。
- 大多数人习惯适应工具,而很少考虑主动修改工具以更好地满足自身需求。
- 开源和可修改的系统(如 Linux)更受欢迎,因为用户可以自由调整以符合个人需求。
2. 阿耳忒弥斯二号安全溅落 (Artemis II safely splashes down) #
https://www.cbsnews.com/live-updates/artemis-ii-splashdown-return/
NASA 的 Artemis II 任务于 2026 年 4 月 10 日成功完成,四名宇航员乘坐猎户座飞船在太平洋圣地亚哥海岸附近成功溅落,结束了为期九天的历史性绕月飞行。这次任务创造了人类飞行距离地球最远的纪录。宇航员包括指令长里德·怀斯曼、飞行员维克多·格洛弗、任务专家克里斯蒂娜·科赫以及加拿大宇航员杰里米·汉森。
溅落后,海军救援队迅速将宇航员转移至约翰·P·默萨号军舰进行医疗检查,随后他们将乘坐直升机返回陆地。NASA 官员在新闻发布会上对任务的成功表示欣喜,称这是探索新纪元的开始。NASA 副管理员 Amit Kshatriya 特别赞扬了宇航员家属在飞船重返大气层期间表现出的勇气。
宇航员们在溅落后约 90 分钟陆续从飞船中出来,登上充气救生筏以适应海上环境。救援过程中,海军潜水员进入飞船进行医疗评估,尽管海流强劲,救援工作顺利完成。NASA 管理员 Jared Isaacman 亲自登上军舰与宇航员会面并赠送纪念帽子。
此外,美国前总统特朗普也通过社交媒体祝贺 Artemis II 团队,称此次任务“壮观完美”,并期待未来的火星探索任务。此次任务不仅标志着人类重返月球的成功,也为未来更远的深空探索奠定了基础。
HN 热度 1235 points | 评论 402 comments | 作者:areoform | 1 day ago #
https://news.ycombinator.com/item?id=47725583
- Artemis 任务被认为是 NASA 50 年来首次公开承认高风险的载人航天任务,NASA 接受的乘员死亡率为 1/30,远高于航天飞机的风险水平。
- 当前技术水平下,由于距离和能量的限制,使得载人航天任务无法做到更安全,NASA 在商业货运和载人计划中设定的可接受死亡率也较高。
- 阿波罗任务的风险被美化了,实际上包括训练和事故中也有多名宇航员和地面人员死亡。
- 航天飞机虽然设计复杂且经济上不合理,但在其时代是技术进步,具备独特的卫星回收和维修能力。
- 航天飞机的设计初衷是为了执行特定的军事任务,如捕获苏联卫星,这一任务因政治原因未能实现。
- 阿波罗 13 号任务显示了航天任务中极高的风险,如果事故发生在月球表面,宇航员可能无法返回地球。
- 苏联的 Buran 航天飞机项目部分源于对美国航天飞机军事能力的担忧,尤其是对轨道轰炸系统的防范。
- 关于苏联试图捕获 Salyut-7 空间站的说法缺乏确凿证据,更多是阴谋论和猜测。
- 苏联对美国航天飞机的军事潜力存在高度猜疑,这种猜疑推动了 Buran 项目的发展。
3. 小型模型同样发现了 Mythos 发现的漏洞 (Small models also found the vulnerabilities that Mythos found) #
https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier
这篇文章由 Stanislav Fort 于 2026 年 4 月 7 日发布,主题是关于人工智能在网络安全领域的应用,特别是围绕 Anthropic 公司推出的 AI 模型 Mythos 及其在漏洞发现和利用方面的表现。
文章首先介绍了 Anthropic 发布 Mythos Preview 和 Project Glasswing 的背景,该项目旨在利用 Mythos 模型发现并修补关键软件中的安全漏洞,Anthropic 投入了大量资金支持开源安全组织。官方宣称 Mythos 能够自动发现数千个零日漏洞,并成功构造复杂的漏洞利用链,展现了极高的技术水平。
然而,作者通过实际测试发现,许多 Mythos 展示的漏洞分析可以被较小、成本更低的开源模型复现,且这些小模型在某些安全推理任务上甚至优于大型模型。不同模型在不同任务中的表现差异很大,说明 AI 网络安全能力并非随着模型规模线性提升,而是呈现出“参差不齐”的特点。
文章强调,AI 网络安全实际上是一个由多个不同任务组成的模块化流程,包括代码扫描、漏洞检测、漏洞验证、补丁生成以及漏洞利用构造等。每个环节对模型的需求不同,且不仅仅依赖模型本身,更依赖于系统架构和安全专业知识的整合。
作者指出,真正的竞争优势在于整体系统设计和专家经验,而非单一模型。小型、廉价的模型足以覆盖大量代码,结合有效的系统和流程,能够实现高效的漏洞发现和修复,改变了网络安全防御的经济模式。
总结来看,Anthropic 的 Mythos 验证了 AI 在网络安全中的潜力,但要实现大规模、可信赖的生产应用,还需依赖完善的系统和维护者的信任。文章呼吁关注 AI 安全技术的整体生态,而非单纯追求模型规模和智能水平。
HN 热度 771 points | 评论 211 comments | 作者:dominicq | 8 hours ago #
https://news.ycombinator.com/item?id=47732020
- Mythos 模型通过大量运行找到了 OpenBSD 中的关键漏洞,成本约 2 万美元,显示了自动化漏洞检测的潜力,但具体哪次运行成功无法预知。
- 小模型的漏洞检测类似于自动化地逐文件扫描,存在大量误报问题,且未明确公布误报率。
- 小模型相比大型模型成本更低,可能更适合多次运行以达成共识,但精确度和误报率仍需进一步分析。
- 自动化漏洞检测的价值在于节省人力成本,2 万美元的检测费用远低于人工安全研究员的费用。
- 当前尚未见到 AI 大规模提升软件开发质量或效率的明显证据,技术和管理层面仍有挑战。
- LLM 在模糊任务(如写规格和文档)表现优于代码编写,未来可能出现由 AI 领导的开发团队超越人类管理的情况。
- 对小模型和大模型检测能力的差异存在质疑,部分观点认为小模型可能在大规模代码库中表现不佳。
- 误报问题类似于儿童猜测问题,部分检测结果可能是随机猜测的产物。
- 代码中某些用法(如 eval)可能被模型误判为漏洞,需结合上下文判断其合理性。
4. 安装所有* Firefox 扩展 (Installing every* Firefox extension) #
https://jack.cab/blog/every-firefox-extension
这篇文章记录了作者尝试安装和分析所有 Firefox 浏览器扩展的过程。作者首先通过 Firefox 官方的公共 API 抓取扩展数据,发现 API 默认只能访问约 3 万条扩展记录,远低于实际数量。为此,作者尝试改变排序方式(如按创建时间、评分、热度、更新时间等)和使用排除参数,逐步获取更多扩展数据,最终通过按分类并行抓取,成功获得约 8.4 万个唯一扩展,接近 Firefox 官网公布的数量。
文章详细介绍了作者如何利用 API 分页、排序和过滤功能,克服 API 限制,分批抓取所有扩展数据,并将数据保存为 JSON 文件。作者还提到,整个扩展集合大小约为 49.3GB,平均每个扩展约 585KB。文章中还列举了体积最大的十个扩展,最大扩展达 196MB,包含大量音频文件,还有基于 Unity 的应用、包含大量图片的扩展以及集成 AI 模型的扩展。
此外,作者分享了更新的抓取方法,利用日期过滤和分段策略,提升抓取效率和准确性。最后,作者将完整数据集上传至 Hugging Face,方便他人使用,并提供了在线下载链接。整体来看,文章不仅展示了技术细节,也反映了 Firefox 扩展生态的规模和多样性。
HN 热度 629 points | 评论 76 comments | 作者:RohanAdwankar | 1 day ago #
https://news.ycombinator.com/item?id=47724118
- 作者安装了大量 Firefox 扩展,导致浏览器崩溃和异常表现,过程充满幽默和戏剧性。
- 有人指出部分扩展持续膨胀,数量越来越多,影响浏览器性能。
- 有评论提到作者自己也有开发扩展,但因更新不及时而未继续使用。
- Firefox 的崩溃报告是公开的,但未能找到相关崩溃记录。
- 大量扩展可能导致崩溃报告程序本身也崩溃。
- 有人觉得视频内容很搞笑,类似老年人不熟悉电脑时的浏览体验。
- 有评论提到扩展按钮被假扩展替代,导致误操作。
- 浏览器表现从正常逐渐变得混乱,扩展启动顺序形成了戏剧化过程。
- 有网友对视频中的金属管声音效果感兴趣,猜测是某个特定扩展发出的。
- 有建议将此类扩展作为恶作剧工具,用于办公室恶搞。
- 有人回忆过去 IE 浏览器被大量工具栏占满屏幕,影响正常浏览。
- 现代操作系统界面缩放和任务栏设计也会减少网页可视区域。
- 有人提到手机上安装大量无用应用,类似过去的浏览器工具栏问题。
- Firefox 扩展的配置文件写入机制可能存在性能瓶颈,频繁写入导致效率低下。
- Firefox 写入扩展配置文件是浏览器行为,不是扩展主动写入。
- 有评论提到类似的 Chrome 和 Edge 扩展商店也有网站地图功能。
- 文章让人联想到 NPM 包依赖所有其他包的荒诞情况。
- 过去网吧和 IE 时代,安装多个工具栏是常见现象,影响使用体验。
5. 在为 Linux 内核贡献代码时使用 AI 辅助工具 (AI assistance when contributing to the Linux kernel) #
https://github.com/torvalds/linux/blob/master/Documentation/process/coding-assistants.rst
该网页内容是一篇关于 Linux 内核开发中使用 AI 编码助手的指导文档。文档强调,AI 工具在协助 Linux 内核开发时,必须遵循标准的内核开发流程,包括开发过程、编码风格和补丁提交等规范。
在许可和法律要求方面,所有贡献的代码必须符合 GPL-2.0-only 许可证,并使用适当的 SPDX 许可证标识。AI 生成的代码必须由人工审核,且 AI 代理不能添加 Signed-off-by 标签,只有人类开发者才能合法认证开发者证书(DCO)。人工提交者需对 AI 生成的代码负责,确保其合规并添加自己的 Signed-off-by 标签。
此外,文档建议对 AI 工具的贡献进行适当归属,使用 Assisted-by 标签注明 AI 工具名称、模型版本及所用的专业分析工具(如 coccinelle、sparse 等),以便跟踪 AI 在开发过程中的作用。普通开发工具如 git、gcc 等不需列出。
整体来看,该文档为 Linux 内核开发者提供了使用 AI 辅助工具时的规范和法律合规指导,确保 AI 辅助开发的代码质量和法律责任明确。
HN 热度 490 points | 评论 371 comments | 作者:hmokiguess | 1 day ago #
https://news.ycombinator.com/item?id=47721953
- 可以使用 AI 辅助编程,但提交者需对代码负责并确保符合许可证要求。
- 许多人用 AI 生成代码却不理解其内容,只为简历上有贡献,导致维护者对 AI 代码持怀疑态度。
- 明确简单的政策也意味着不采纳更严格的限制,避免过度限制 AI 使用。
- AI 已成为编码的常态,繁琐的编码工作多由 AI 完成,禁止 AI 辅助几乎不可能。
- 责任归属应由具体的开发者承担,维护项目的质量和责任感。
- 个人可以选择不使用 AI,但利用 AI 可以提高效率,特别是对非专业人士帮助很大。
- 有人只对 AI 不知道的新内容感兴趣,认为重复已有内容帮助有限。
- 应尊重每个人选择使用或不使用 AI 的自由。
- 维护者对认真学习和修改大代码库的贡献不够重视,导致贡献者动力下降。
- AI 使理解和修改复杂代码库变得更容易,使用 AI 是合理的选择。
- 对 AI 辅助的归属和披露存在分歧,明确规则有助于统一认知。
- 有些贡献者为满足自身需求做出修改,虽然不完全理解底层原理,但仍有价值。
6. 乌干达黑猩猩陷入八年“内战”,研究人员称 (Chimpanzees in Uganda locked in eight-year ‘civil war’, say researchers) #
https://www.bbc.com/news/articles/cr71lkzv49po
乌干达基巴莱国家公园的世界上已知最大的野生黑猩猩群体——恩戈戈黑猩猩群,过去八年间发生了激烈的“内战”。研究人员记录了自 2018 年以来至少 24 起杀戮事件,其中包括 17 名幼崽。曾经和睦相处的两个子群——西部组和中部组,逐渐分裂并相互敌对,导致成员之间的攻击和杀戮。
研究指出,导致分裂和冲突的可能原因包括群体规模扩大导致资源竞争、雄性之间的繁殖竞争,以及 2014 年五名成年雄性和一名成年雌性的死亡打破了原有的社会网络。2015 年领导雄性更替和 2017 年呼吸道流行病导致 25 只黑猩猩死亡,也被认为是加剧分裂的关键因素。
研究者认为,这种持续的暴力和群体分裂现象为理解早期人类冲突的起源提供了重要线索。黑猩猩作为与人类基因最接近的物种之一,其群体内部的敌对行为表明,人类冲突可能更多源于关系动态,而非宗教、种族或政治信仰等社会构建因素。
该研究发表在《科学》杂志上,提醒人类社会应从其他物种的群体行为中汲取教训,理解群体分裂带来的危险,同时认识到进化历史并不决定未来。
HN 热度 418 points | 评论 255 comments | 作者:neversaydie | 1 day ago #
https://news.ycombinator.com/item?id=47722333
- 猩猩部落间的暴力行为可能是进化选择的结果,杀戮行为在祖先环境中可能提升了基因的传播优势。
- 猩猩不仅有暴力行为,也有和解、安慰和维护联盟的行为,具体表现受环境和群体条件影响。
- 猩猩对群体内成员和外部成员的态度截然不同,外部成员常遭受有组织的攻击,攻击行为具有明确目标和策略。
- 资源和领地压力是促使猩猩群体间暴力升级的重要环境因素。
- 团队合作和资源竞争的结合是战争产生的根本原因。
- 大多数动物避免同种个体间的暴力,因为受伤风险大且不划算,只有社会性昆虫等少数物种会为群体牺牲生命。
- 统治性物种如人类,因其对其他物种的支配,可能减少了内部杀戮的利益。
- 基因层面解释了群体间的暴力行为,低地位个体的基因可能通过激进行为获得传播机会。
- 昆虫社会中大多数个体无法繁殖,服务于少数繁殖个体,是极端的群体合作和牺牲例子。
- 人类为吸引配偶而冒生命危险的行为较少见,且多发生在男性群体内部的竞争中。
- 其他物种的配偶竞争通常通过仪式化行为避免严重伤害,只有人类表现出较多的致命竞争行为。
- 仪式化竞争背后往往隐含实际暴力的威胁,偶尔需要通过暴力来维持仪式的效力。
- 进化目标是基因传播而非延长个体寿命,许多物种中死亡甚至是繁殖过程的一部分。
- 过去对黑猩猩和倭黑猩猩的和平形象存在误解,实际观察显示它们也有复杂的暴力行为。
- 青少年冒险行为可能是筛选心理异常者的一种社会机制,通过表现正常的情绪反应促进群体凝聚。
7. 法国政府放弃 Windows,转向 Linux,称美国技术存在战略风险 (France’s government is ditching Windows for Linux, says US tech a strategic risk) #
https://www.xda-developers.com/frances-government-ditching-windows-for-linux/
法国政府决定减少对欧盟以外专有技术的依赖,转而支持开源技术和数字主权。法国数字事务总局(DINUM)要求各部委在秋季前绘制依赖图谱,并制定退出欧盟以外技术的计划,重点是用 Linux 替代 Windows 操作系统。政府认为,依赖美国技术存在战略风险,数据和基础设施受制于外部规则和定价,必须实现数字主权。
DINUM 强调,国家不能继续依赖外部技术,必须掌控自己的数字命运。此举不仅限于操作系统,还将扩展到所有技术领域。法国政府倾向于采用开源软件,且欧盟内部也有如 openSUSE 和 LibreOffice 等开源项目可供选择,避免被专有商业模式锁定。
文章还提到,随着开源工具逐渐赶上专有软件,越来越多用户意识到使用专有软件意味着将控制权交给企业,而开源软件则提供了更高的自主权和透明度。法国政府的这一举措被视为数字主权和安全自主的重要一步,旨在减少对美国技术的依赖,增强国家对关键 IT 系统的控制能力。
HN 热度 403 points | 评论 228 comments | 作者:pabs3 | 16 hours ago #
https://news.ycombinator.com/item?id=47728653
- 法国政府宣布减少对美国技术的依赖,计划年底前制定减少对欧洲外依赖的方案,但目前更多是承诺和规划,具体行动和时间表尚不明确。
- 欧洲多国曾尝试过从 Windows 迁移到 Linux,但多数项目最终因各种原因回归 Windows,如德国外交部和慕尼黑市的案例。
- 慕尼黑的 LiMux 项目在一定程度上成功,但遭遇微软高层亲自干预和巨大压力,最终未能持续。
- 当前美国被视为对欧盟和英国的安全及战略风险,推动欧洲国家更坚定地减少对美国技术的依赖。
- 法国宪兵队已经使用 Linux 超过十年,相关基础工作已进行多月,具备一定的技术积累和实践基础。
- 法国情报部门使用 Palantir 等美国技术引发争议,反映出技术依赖的复杂性和矛盾。
- 技术决策背后常受金钱和权力影响,微软等大公司会积极干预政府的开源技术推广计划。
- 法国及欧洲整体缺乏强大的软件和技术产业生态,经济政策和商业环境对技术转型不利。
- 欧洲部分文化中存在表面上的反美情绪,但这更多是对美国当前国际地位和行为的反应。
- 美国当前政府破坏了传统盟友关系,导致盟友对美国的信任度下降,尤其是在技术和安全领域。
- 欧洲与美国科技企业的矛盾由来已久,不仅仅是当前美国政府的行为导致,欧洲整体难以与美国科技竞争。
- 中国通过部分隔离美国大科技公司,成功培育了本土科技企业,欧洲若完全开放美国公司则难以复制这一成功。
8. 萨姆·奥特曼对燃烧瓶事件的回应 (Sam Altman’s response to Molotov cocktail incident) #
https://blog.samaltman.com/2279512
这是一篇由 Sam Altman 发布的博客文章,内容主要围绕他个人的反思、对人工智能(AI)发展的看法以及对当前行业局势的思考。
文章开头,Sam Altman 分享了自己家庭的照片,表达了对家人的深厚感情,并提到最近有人向他家投掷燃烧瓶的事件,强调言语和图像的力量。他反思了近期针对他的煽动性文章,承认自己低估了言论和叙事的影响力。
接着,他阐述了自己的信念:推动普惠繁荣、赋能所有人、促进科学技术发展是他的道德责任;AI 将成为人类能力扩展的最强大工具,需求巨大;AI 发展过程中存在合理的恐惧和焦虑,必须确保安全,社会需要整体应对新威胁,包括政策支持经济转型;AI 应实现民主化,避免权力过度集中,未来应由全社会共同决策;适应性至关重要,技术和社会都在快速变化,没人能完全预见超级智能的影响。
在个人反思部分,Altman 坦承自己在 OpenAI 早期工作中既有自豪也有错误,特别是在与 Elon Musk 的合作和内部冲突中经历了挑战。他承认自己有时回避冲突,导致公司和个人痛苦,并对因此受伤的人表示歉意。同时,他强调 OpenAI 已从初创公司成长为重要平台,需要更稳定的运营方式。他为 OpenAI 在实现使命方面取得的成就感到自豪,认为公司真正改变了世界。
最后,他谈及行业现状,认为围绕 AGI(通用人工智能)的竞争和冲突源于对“控制 AGI”的权力渴望。他提出解决方案是广泛分享技术,避免任何一方独占权力,强调民主制度应高于企业权力,呼吁在法律和规范框架内合作。他欢迎建设性批评,理解对科技的担忧,但坚信技术进步能带来美好未来。文章结尾呼吁降低言辞和行为的激烈程度,避免现实和比喻意义上的爆炸事件。
HN 热度 343 points | 评论 873 comments | 作者:jack_hanford | 1 day ago #
https://news.ycombinator.com/item?id=47724921
- 对 Sam Altman 及其他科技领袖在 AI 问题上的批评是合理的,但暴力或威胁暴力是不可接受的。
- Altman 宣称 AI 技术将使大量经济部门失业,这被部分人视为对数百万人的威胁,虽然不支持暴力,但这种言论引发了激烈反应。
- Altman 及其公关团队未能预见到公众对其言论的强烈反应,显得非常不明智。
- 有观点指出 Altman 正在游说法律以免除 AI 公司因技术使用带来的责任,这种行为被认为是在伤害大众。
- 反对暴力,但也理解部分人因生活压力和社会不公而产生激烈情绪。
- 有人认为任何创造物都会带来伤害,但不应因此对创造者及其家人施加暴力。
- 批评暴力行为,强调应通过法律和和平方式解决问题。
- 政治体制功能失调可能导致国家垄断暴力的破裂。
- 有人质疑 Altman 与 AI 研究者 Suchir Balaji 之死的关联,并指出 Altman 在采访中表现出防御和紧张。
- 公开 AI 技术被用于战争,引发了对 Altman 安全的担忧,但暴力仍不可接受。
- 反对战争是合理的,但针对企业领导人的暴力行为不可取,抗议和抵制是合法途径。
- 许多美国人对政治体系失去信心,导致极端情绪和行为的出现。
- 社会不平衡和权威主义加剧,类似事件可能会增多。
- 权威主义定义为牺牲个人自由以强制服从权威,当前两党都存在这种倾向。
9. 韩国推出全民基础移动数据接入服务 (South Korea introduces universal basic mobile data access) #
https://www.theregister.com/2026/04/10/south_korea_data_access_universal/
韩国政府于 2026 年 4 月推出了“全民基础移动数据接入”计划,旨在为超过七百万用户提供在数据流量用尽后仍能以 400 kbps 速度无限制下载的服务。该计划得到了韩国三大电信运营商 SK Telecom、KT 和 LG Uplus 的支持。
副总理兼科学与信息通信技术部长裴庆勋表示,该计划的实施是因为现代公民无法离开在线服务,同时也是为了修复电信运营商因近期多起安全漏洞事件而失去的社会信任。这些安全事件包括 SK Telecom 的重大数据泄露、LG Uplus 的 3TB 暗网数据泄露事件以及 KT 的 FemtoCell 安全漏洞和可能传播恶意软件的问题。
韩国电信运营商还承诺推出价格低于 2 万韩元(约合 13.5 美元)的 5G 套餐,增加老年用户的数据和通话额度,并提升地铁和长途列车上的 Wi-Fi 服务质量。政府方面则承诺支持 AI 应用相关网络的研究,鼓励电信企业加大对网络基础设施的投资,以推动 AI 驱动的社会发展。
此次举措不仅是对过去安全问题的回应,更体现了韩国政府和电信行业在保障全民基本通信权利、推动技术创新和公共福利方面的努力。
HN 热度 304 points | 评论 84 comments | 作者:saikatsg | 11 hours ago #
https://news.ycombinator.com/item?id=47730407
- 保障全民基本移动数据接入类似于过去美国邮政服务的公共服务理念,应该成为现代社会的基础设施。
- 疫情期间英国实行了对政府和公益网站的零费率数据政策,保障了关键服务的访问。
- 一些国家如捷克和新加坡在疫情期间采取了限制公共场所免费 Wi-Fi 和音乐播放等措施,目的是减少人群聚集。
- 韩国数据价格近年来大幅下降,普及率高,年轻人和老年人均广泛使用互联网和视频服务。
- 网络中立性在不同国家有不同定义和执行力度,英国有严格监管但允许某些零费率服务,存在分级访问现象。
- 网络中立性并非理论概念,而是默认状态,任何对流量差异化处理都不符合严格的网络中立性。
- 韩国推行全民基本移动数据接入计划在全球范围内较为罕见,但考虑到互联网的重要性,这一举措合理且有益。
- 科幻作品中对信息接入权的设定反映了现代社会对普遍信息获取的重视。
10. JSON Formatter Chrome 插件现已关闭并注入广告软件 (JSON formatter Chrome plugin now closed and injecting adware) #
https://github.com/callumlocke/json-formatter
该网页是 GitHub 上名为“json-formatter”的开源项目的主页,项目由用户 callumlocke 维护。json-formatter 是一个 Chrome 浏览器扩展,旨在帮助用户更方便地查看和浏览 JSON 格式的 API 响应数据。
该扩展具有以下主要功能:
- 速度快,即使处理非常长的 JSON 页面也能流畅运行;
- 支持暗黑模式;
- 语法高亮显示;
- 支持折叠树状结构和缩进引导,方便阅读;
- 支持点击 URL 链接;
- 对非 JSON 页面几乎没有性能影响;
- 可在任何有效的 JSON 页面使用,网址无关;
- 提供按钮切换查看原始 JSON 和解析后的 JSON;
- 解析后的 JSON 数据作为全局变量 json 导出,方便在浏览器控制台中检查。
项目现已停止作为开源项目开发,作者计划转为闭源商业模式,开发更全面的 API 浏览工具和高级功能。为满足仍偏好开源工具的用户,作者发布了最终的开源版本“JSON Formatter Classic”,提供简单、本地化的 JSON 格式化功能但不再更新。
网页还介绍了安装方式,包括从 Chrome 商店安装经典版本或从源码安装。开发者可通过克隆仓库并使用 bun 工具进行构建和调试。
常见问题部分解释了扩展如何检测 JSON 内容、JavaScript 对大数字的限制导致显示不准确的原因、对象键顺序的由来以及如何查看服务器原始输出等技术细节。
总体而言,该网页详细介绍了 json-formatter 扩展的功能、安装和开发信息,以及使用中可能遇到的技术限制和解决方案,适合需要处理和调试 JSON 数据的开发者参考。
HN 热度 277 points | 评论 132 comments | 作者:jkl5xx | 1 day ago #
https://news.ycombinator.com/item?id=47721946
- 作者曾承诺不会加入发送用户数据的代码,也不会让扩展落入不良人员手中,但现在扩展被注入广告软件,可能是被黑或转变了商业模式。
- 关闭开源转向闭源商业模式是作者的选择,但这种转变引发了用户信任危机。
- 现代开发工具成本低,用户完全可以自己开发,没必要信任第三方。
- 开源项目缺乏合理的资金支持,导致开发者不得不考虑商业化变现。
- 开发者很难通过开源项目获得足够的捐赠支持,尤其是开发工具类项目。
- 小额捐赠是对开发者工作的认可和动力,但难以成为主要收入来源。
- 该扩展的变现方式被部分用户认为不够透明甚至“狡猾”。
- 浏览器扩展商店缺乏对发布版本和公开源码的一致性验证,存在安全隐患。
- 自动更新机制存在风险,开发者可能利用更新推送广告或恶意代码,用户应谨慎安装扩展。
- Firefox 扩展市场相对更严格,但仍有不足,用户最好自行编译源码安装扩展以保证安全。
Hacker News 精彩评论及翻译 #
AI assistance when contributing to the Linux kerne… #
https://news.ycombinator.com/item?id=47722942
Basically the rules are that you can use AI, but you take full responsibility for your commits and code must satisfy the license.
That’s… refreshingly normal? Surely something most people acting in good faith can get behind.
qsort
基本规则是你可以使用AI,但你要对你的提交负全部责任,代码必须符合许可证要求。
这……反而让人觉得很正常?这肯定是大多数诚信行事的人都能支持的事情。
Small models also found the vulnerabilities that M… #
https://news.ycombinator.com/item?id=47732337
The Anthropic writeup addresses this explicitly:
This was the most critical vulnerability we discovered in OpenBSD with Mythos Preview after a thousand runs through our scaffold. Across a thousand runs through our scaffold, the total cost was under $20,000 and found several dozen more findings. While the specific run that found the bug above cost under $50, that number only makes sense with full hindsight. Like any search process, we can’t know in advance which run will succeed.
Mythos scoured the entire continent for gold and found some. For these small models, the authors pointed at a particular acre of land and said “any gold there? eh? eh?” while waggling their eyebrows suggestively.
For a true apples-to-apples comparison, let’s see it sweep the entire FreeBSD codebase. I hypothesize it will find the exploit, but it will also turn up so much irrelevant nonsense that it won’t matter.
johnfn
Anthropic 的报告明确提到了这一点:
这是我们在 Mythos Preview 中针对 OpenBSD 发现的最关键漏洞,经过我们脚手架上的一千次运行。经过一千次运行,总成本不足 2 万美元,发现了数十个其他漏洞。虽然发现上述漏洞的那次运行成本不足 50 美元,但这个数字只有在事后才有意义。像任何搜索过程一样,我们无法提前知道哪次运行会成功。
Mythos 在整个大陆范围内寻找黄金并且确实找到了。对于这些小模型,作者们指向了一块特定的土地,说“那儿有黄金吗?哎?哎?”并意味深长地挑了挑眉毛。
要进行真正的苹果对苹果比较,不妨让它扫遍整个 FreeBSD 代码库。我猜测它会找到漏洞,但也会带来大量无关紧要的垃圾信息,结果无关紧要。
Artemis II safely splashes down #
https://news.ycombinator.com/item?id=47725663
Glad that they’re safe and sound.
It’s worth pointing out that this is the first extremely public, widely acknowledged high risk mission NASA has done in over 50 years. The Shuttle was risky, but it wasn’t thought of or acknowledged by NASA as being risky until very late in its lifecycle.
According to NASA’s OIG, Artemis acceptable crew mortality rate is 1 in 30. Roughly 3x riskier than the shuttle. There genuinely is a world where they don’t make it back home.
I am grateful that they did. And I’m grateful that we’re going to go even further. I can’t wait to see what Jared’s cooking up (for those who don’t know, he made his own version of the Gemini program in Polaris and funded it out of pocket).
areoform
很高兴他们平安无事。
值得指出的是,这是NASA五十多年来首次进行如此公开、广泛承认的高风险任务。航天飞机虽然有风险,但NASA直到其生命周期后期才认为它是有风险的。
根据NASA监察长办公室的数据,阿尔忒弥斯任务的可接受乘员死亡率是1/30,风险大约是航天飞机的三倍。实际上存在他们回不来的可能。
我很感激他们成功返回,也很感激我们将走得更远。我迫不及待想看看贾里德在筹划什么(对不知道的人来说,他在Polaris项目中打造了一个自己的双子座计划,并自掏腰包资助了这个项目)。
Filing the corners off my MacBooks #
https://news.ycombinator.com/item?id=47725701
The takeaway from this article should be to consider modifying your tools to your needs even in unconventional and controversial ways. I love it.
The flame war on whether the original chassis design sucks or rocks is not that interesting.
yreg
这篇文章的主要启示应该是考虑根据自己的需求改造工具,即使是非传统甚至有争议的方式。我很喜欢这个观点。
关于原始底盘设计到底糟糕还是很棒的激烈争论并不那么有趣。
Artemis II safely splashes down #
https://news.ycombinator.com/item?id=47726133
Yes, and the memories of Apollo are made rosy by hagiography. I even wrote an entire thing to explain why, https://1517.substack.com/p/1-in-30-artemis-greatness-and-risk (yeah, shameless plug, sorry - it’s more for the citations than not. You can read the standards and reports I’ve linked to)
But if I’m allowed to repeat myself from elsewhere in the thread and the meat of the above thing,
It’s physically not possible at our current level of technology to make this “safer” due to the distances and energies involved. Even with the Commercial Cargo and Crew Program (C3P), NASA has set the acceptable mortality threshold at 1 in 270 over the entire mission and 1 in 1000 on ascent / descent. If they could set it higher by gaming the math, they would. They can’t.
We’re a very primitive species, and the forces involved here are genuinely new. And no, Apollo wasn’t much better either, at least 10 astronauts were killed in training or burned alive, as well as (far worse, because astronauts sign up for the risk) one member of ground staff.
People love to hate the Shuttle, and it ended up being subpar / fail expectations due to the political constraints NASA was under, but the Shuttle was a genuine advance for its time – a nonsensical, economically insane advance, but still an advance. If you look at the Shuttle alternative proposals / initial proposals as well as stuff like Dynasoar and Star Raker, you’ll see NASA iterating through Starship style ideas. But those were rejected due to higher up front capital investment at the time.
The Shuttle is an odd franken-turduckling, because it was designed for one mission and one mission only. And that mission never happened. That cargo bay existed to capture certain Soviet assets and deploy + task certain American space assets and then bring them back to Earth.
And that’s the bit that’s hard to emphasize. The fact that the Shuttle could put a satellite up there, watch it fail, then go back up, grab it, bring it back, repair it, then launch again was an insane capability.
Was the program a giant fuck up at the end? Yes. But does that mean Artemis will be safer than the Shuttle? No. That’s not how the energetics, time from civilization, acceptable risk profiles etc. work out.
areoform
是的,人们对阿波罗的美好回忆往往被美化了。我甚至写了一整篇文章来解释原因,https://1517.substack.com/p/1-in-30-artemis-greatness-and-risk(是的,无耻地打个广告,抱歉——更多是为了引用资料。你可以看我链接的标准和报告)。
但如果允许我重复一下我在别处和上文中主要观点:
以我们目前的技术水平,不可能让这个(计划)“更安全”,因为涉及的距离和能量实在太大了。即使是商业货运和载人项目(C3P),NASA也把整个任务的可接受死亡率设定为1/270,上升/下降阶段设定为1/1000。如果他们能用数学手段把风险标准设高,他们肯定会这么做,但他们做不到。
我们是一个非常原始的物种,而这里涉及的力量确实是全新的。而且阿波罗其实也没好到哪里去,至少有10位宇航员死于训练事故或者活活烧死,还有一名地面工作人员(更糟,因为宇航员是自愿承担风险的)。
人们喜欢吐槽航天飞机,由于当时NASA所受的政治限制,航天飞机最终表现平平、未达预期,但它在当时确实是一次真正的进步——虽然是无意义且经济上疯狂的进步,但仍然是进步。如果你看看航天飞机的替代方案/最初提案,以及像Dynasoar和Star Raker这样的项目,你会看到NASA在尝试类似星际飞船的想法,但因当时需要更高的前期资本投入而被否决了。
航天飞机是一个奇怪的“混合怪胎”,因为它是为一个且仅一个任务而设计的,而那个任务从未发生过。它有个货舱,本来是用来捕捉某些苏联资产,然后部署和指挥某些美国的太空资产,之后再带回地球。
这点很难强调清楚。航天飞机能够将卫星送入轨道,看到它失败后再去回收,带回地球修复,然后再次发射,这种能力简直疯狂。
这个项目最后是彻底失败了吗?是的。但这是否意味着阿尔忒弥斯会比航天飞机更安全?不会。能量学、与文明的距离、可接受风险的设定等等因素根本不是这么运作的。
Molotov cocktail is hurled at home of Sam Altman #
https://news.ycombinator.com/item?id=47724144
Well, dropping bombs and threatening to end a civilization certainly made me think the temperature had gone up. I’m not sure I think a single attempted act against some guy is worth being worried by against that backdrop.
lazyasciiart
嗯,投放炸弹和威胁要结束一个文明,确实让我觉得气氛变得紧张了。在这样的背景下,我不确定针对某个人的单次袭击是否值得我们担忧。
Sam Altman’s response to Molotov cocktail incident #
https://news.ycombinator.com/item?id=47725784
Can someone help me to understand why OpenAI and Anthropic talks as if the future of humanity controlled by them? We have very strong open (weight) Chinese models possibly only 6 months behind of them, gene is out of the bottle, is 6 months of difference really that important? And they don’t have good reasons for that 6 months to stay that way.
Am I missing something or are these just their usual marketing? I’m not arguing about importance of AI but trying to understand why OpenAI and Anthropic are so important?
BloondAndDoom
有人能帮我理解一下为什么OpenAI和Anthropic说话的语气好像未来的人类都由他们掌控一样?我们有非常强大的开源(权重)中文模型,可能只比他们落后大约6个月,技术已经释放出来了,这6个月的差距真的那么重要吗?而且他们也没有充分的理由说明这6个月的差距会一直保持。
难道是我遗漏了什么,还是这只是他们一贯的营销手段?我不是在争论人工智能的重要性,只是想弄明白为什么OpenAI和Anthropic如此重要?
Sam Altman’s response to Molotov cocktail incident #
https://news.ycombinator.com/item?id=47725131
It’s never OK to physically attack someone like this. Full stop.
Separately; Sam’s belief that “AI has to be democratized; power cannot be too concentrated.” rings incredibly hollow. OpenAI has abandoned its open source roots. It is concentrating wealth - and thus power - into fewer hands. Not more.
mattsoldo
像这样对别人动手绝对不对。句号。
另外,Sam认为“人工智能必须实现民主化,权力不能过于集中”的说法听起来非常空洞。OpenAI已经放弃了开源的初衷。它正在将财富——也就是权力——集中到更少的人手中,而不是更多。
Bitcoin miners are losing on every coin produced a… #
https://news.ycombinator.com/item?id=47730472
The headline is dramatic but this is literally how bitcoin is designed to work. Miners leave, difficulty drops, costs go down, mining becomes profitable again. The interesting part isn’t the loss per coin, it’s how long the lag between unprofitable mining and difficulty adjustment keeps forced selling pressure on the market.
dmk
标题很夸张,但这正是比特币设计的运作方式。矿工退出了,难度下降,成本降低,挖矿再次变得有利可图。有趣的不是每枚币的亏损,而是在无利可图的挖矿和难度调整之间的时间差有多长,这段时间会持续对市场施加强制卖压。
A compelling title that is cryptic enough to get y… #
https://news.ycombinator.com/item?id=47721563
A comment complaining this was obviously written by an AI, and the standard template is a tell. A philosophical observation about what that says about the state on online discourse. Link to the Dead Internet Wikipedia page.
ninjaranter
一条评论抱怨这显然是由人工智能写的,标准模板就是一个显而易见的标志。评论中还有一段关于这反映了当前网络讨论状况的哲学性观察。并附上了《死网》(Dead Internet)维基百科页面的链接。
We’ve raised $17M to build what comes after Git #
https://news.ycombinator.com/item?id=47721066
The problem is how to make money from something that is more or less solved.
MidnightRider39
问题是如何从一个或多或少已经解决的问题中赚钱。
Sam Altman’s response to Molotov cocktail incident #
https://news.ycombinator.com/item?id=47725232
If only that sentiment was reciprocal!
When the job losses hit in earnest and the vague handwaving about making it right all inevitably turns out to be hollow, those on top will be exceedingly comfortable using violence to keep the underclass in line. It has happened before and it will happen again.
smallmancontrov
要是这种情绪是相互的就好了!
当大量失业真正来临,那些关于“会弥补”的模糊承诺最终被证明都是空话时,处于上层的人将极其轻松地使用暴力来维持下层阶级的秩序。这种事情以前发生过,以后还会再发生。
Small models also found the vulnerabilities that M… #
https://news.ycombinator.com/item?id=47732838
Wasn’t the scaffolding for the Mythos run basically a line of bash that loops through every file of the codebase and prompts the model to find vulnerabilities in it? That sounds pretty close to “any gold there?” to me, only automated.
Have Anthropic actually said anything about the amount of false positives Mythos turned up?
FWIW, I saw some talk on Xitter (so grain of salt) about people replicating their result with other (public) SotA models, but each turned up only a subset of the ones Mythos found. I’d say that sounds plausible from the perspective of Mythos being an incremental (though an unusually large increment perhaps) improvement over previous models, but one that also brings with it a correspondingly significant increase in complexity.
So the angle they choose to use for presenting it and the subsequent buzz is at least part hype – saying “it’s too powerful to release publicly” sounds a lot cooler than “it costs $20000 to run over your codebase, so we’re going to offer this directly to enterprise customers (and a few token open source projects for marketing)”. Keep in mind that the examples in Nicholas Carlini’s presentation were using Opus, so security is clearly something they’ve been working on for a while (as they should, because it’s a huge risk). They didn’t just suddenly find themselves having accidentally created a super hacker.
kilpikaarna
Mythos运行的脚手架不就是一条bash命令,循环遍历代码库中的每个文件,然后让模型去寻找其中的漏洞吗?这听起来就像“这里面有黄金吗?”的自动化版本。
Anthropic有没有真正说过Mythos发现了多少误报?
仅供参考,我在Xitter上看到一些讨论(所以还是要打个折扣)说有人用其他公开的最先进模型复现了他们的结果,但每个模型只找到了Mythos发现的漏洞子集。从Mythos相较于之前模型的增量提升(尽管这个增量可能异常巨大)角度来看,这听起来很合理,但这也带来了相应显著的复杂度提升。
所以他们选择用的宣传角度和随之而来的热度至少有部分是炒作——说“它太强大了,不能公开发布”听起来比“运行你的代码库成本两万美元,所以我们打算直接提供给企业客户(还有几个用作市场营销的开源项目)”要酷多了。别忘了,Nicholas Carlini的演示中的例子是用Opus运行的,所以安全显然是他们一直在努力的方向(应该如此,因为这是巨大的风险)。他们并不是突然发现自己意外地造出了一个超级黑客。
Filing the corners off my MacBooks #
https://news.ycombinator.com/item?id=47726595
Thanks for this interesting post - I’ve been showing it to co-workers to get their reactions, which was incredibly entertaining for me!
Co-worker 1: Interesting. I wonder if that voids the warranty. It’s Apple you know.
Co-worker 2: May Jobs have mercy on their soul…
Co-worker 3: Not a bad idea. But not sure if that would cause problems with structural integrity of the laptop, like if you drop it or something.
Co-worker 4: The only downside I see is that you can no longer say “Hey, that’s a sharp-looking laptop!”
jasoneckert
感谢这篇有趣的帖子——我一直拿去给同事们看,听他们的反应,对我来说非常有趣!
同事1:有意思。不知道这样会不会导致保修失效。毕竟是苹果嘛。
同事2:愿乔布斯保佑他们的灵魂……
同事3:主意不错。但不确定这样会不会影响笔记本的结构强度,比如摔到什么的。
同事4:我唯一觉得不好的是,你不能再说“嘿,那台笔记本看起来真锋利!”了。
France to ditch Windows for Linux to reduce relian… #
https://news.ycombinator.com/item?id=47717066
All the comments about Linux gaming make me want to give my $0.02. I’ve been gaming on Linux, with no Windows installed anywhere, for around 6 years. In the first 3 years, it was a massive pain. Games like S.T.A.L.K.E.R. would consistently have issues with mouse input, weird acceleration, a lot of games wouldn’t run at all. This is NO LONGER the case at all. Things run very well out of the box.
All games I want to play run very well and mostly the process is just “install -> play”.
If a game has an aggressive anticheat, like Battlefield 6 or Valorant, it will not work and you can forget about it.
Controllers work fine, so do some wheels and other peripherals, but a good number of wheels, pedals, joysticks, VR headsets, and other wild and wacky input devices might not work that well or not at all. It mostly depends on whether the software for them runs on Linux, runs in Wine, or is needed at all. Not sure about VR, but I know it was a bit dire 1-2 years ago.
If you don’t play hardcore simulator games, and don’t play one of the competitive shooters with aggressive anticheat (e.g. CS2 and other competitive shooters run perfectly well), you can just install Linux, install Steam or one of the other launchers, and just hit play.
If you’re not sure, you can check the status on https://protondb.com.
lionkor
关于Linux游戏的所有评论让我想说说我的看法。我已经在Linux上玩游戏大约6年了,期间完全没有安装过Windows。在最初的3年里,这非常痛苦。像S.T.A.L.K.E.R.这样的游戏常常会出现鼠标输入问题,奇怪的加速现象,很多游戏根本运行不了。但现在情况完全不同了。游戏开箱即用,运行非常顺畅。
我想玩的所有游戏都能很好地运行,过程大多数时候就是“安装 -> 玩”。
如果游戏有严格的反作弊机制,比如《战地6》或《无畏契约》,那是不可能运行的,可以直接放弃。
手柄能正常使用,方向盘和其他外设大多也行,但有不少方向盘、踏板、摇杆、VR头盔以及其他奇怪的输入设备可能表现不好,甚至完全用不了。这主要取决于它们的软件是否支持Linux,能否在Wine中运行,或者是否根本就需要驱动程序。VR方面我不太确定,但我知道一两年前情况相当糟糕。
如果你不玩硬核模拟游戏,也不玩那些带有严格反作弊的竞技射击游戏(例如CS2和其他竞技射击游戏运行得非常好),你完全可以安装Linux,安装Steam或其他启动器,然后直接开玩。
如果不确定,可以到https://protondb.com查看游戏兼容情况。
Sam Altman’s response to Molotov cocktail incident #
https://news.ycombinator.com/item?id=47725216
Sam eagerly pursued DoD contracts to weaponize AI. And then lobbied for legislation to ensure OpenAI cannot be held accountable if people are killed due to their systems.
tailscaler2026
山姆急切地追求国防部的合同,以实现人工智能的军事化。随后,他游说立法,确保如果有人因他们的系统而丧生,OpenAI 不会被追究责任。
I still prefer MCP over skills #
https://news.ycombinator.com/item?id=47715000
Don’t focus on what you prefer: it does not matter. Focus on what tool the LLM requires to do its work in the best way. MCP adds friction, imagine doing yourself the work using the average MCP server. However, skills alone are not sufficient if you want, for instance, creating the ability for LLMs to instrument a complicated system. Work in two steps:
-
Ask the LLM to build a tool, under your guide and specification, in order do a specific task. For instance, if you are working with embedded systems, build some monitoring interface that allows, with a simple CLI, to do the debugging of the app as it is working, breakpoints, to spawn the emulator, to restart the program from scratch in a second by re-uploading the live image and resetting the microcontroller. This is just an example, I bet you got what I mean.
-
Then write a skill file where the usage of the tool at “1” is explained.
Of course, for simple tasks, you don’t need the first step at all. For instance it does not make sense to have an MCP to use git. The agent knows how to use git: git is comfortable for you, to use manually. It is, likewise, good for the LLM. Similarly if you always estimante the price of running something with AWS, instead of an MCP with services discovery and pricing that needs to be queried in JSON (would you ever use something like that?) write a simple .md file (using the LLM itself) with the prices of the things you use most commonly. This is what you would love to have. And, this is what the LLM wants. For complicated problems, instead, build the dream tool you would build for yourself, then document it in a .md file.
antirez
不要纠结于你个人的偏好:那并不重要。关键是要关注大型语言模型(LLM)完成工作所需的最佳工具。MCP(多功能控制平台)会增加操作难度,想象一下如果你用普通的MCP服务器自己来做这些工作会多麻烦。然而,仅有技能是不够的,比如你想让LLM能够操作一个复杂系统时,需要分两步走:
-
在你的指导和规范下,先让LLM创建一个工具,用来执行某个特定任务。例如,如果你在做嵌入式系统,可以构建一个监控接口,允许通过简单的命令行界面(CLI)进行应用调试,比如设置断点、启动模拟器、在一秒钟内通过重新上传实时映像和重置微控制器来重启程序。这只是个例子,相信你能理解我的意思。
-
然后编写一个技能文件,解释如何使用第一步中的工具。
当然,对于简单的任务,根本不需要第一步。比如使用git时没必要弄个MCP,代理已经知道如何使用git:git对你来说操作方便,也适合LLM使用。同样,如果你经常估算在AWS上运行某个服务的费用,而不是用一个需要通过JSON查询服务发现和价格的MCP(你会真的用那种东西吗?),你完全可以用LLM写一个简单的.md文件,列出你常用服务的价格。这才是你想要的,也是LLM想要的。对于复杂问题,则构建你心中理想的工具,然后用.md文件做文档说明。