2025-01-30 Hacker News Top Stories #
OpenAI和微软正在调查DeepSeek是否未经授权使用其数据训练人工智能模型,双方指控引发了关于知识产权和数据使用的争议。 研究人员发现了两种新的针对Apple M2/A15和M3/A17处理器的推测执行攻击,称为SLAP和FLOP,可能影响多款Apple设备的安全性。 作者从2010年起使用Sublime Text,认为其速度快、资源占用少、功能灵活,尽管已有多年历史但仍是其首选工具。 YouTuber Dianna Cowern在患病两年后首次站立,呼吁支持其频道,同时视频引发了关于长期新冠和医疗系统的讨论。 DeepSeek开源其大语言模型R1,以降低训练成本并进入西方市场,但其开源方式引发了关于“真正开源”定义的争议。 文章介绍了如何在Python脚本中使用uv作为shebang行,简化了脚本的执行流程,尤其适用于处理依赖关系。 作者对AI在写作中的过度“打磨”表达不满,认为AI的自动修改功能破坏了写作的个性和初衷。 OpenAI指控DeepSeek可能使用其模型训练竞争对手,双方在知识产权和数据使用上的争议引发了广泛讨论。 研究表明,肠道微生物摩根氏菌可能通过代谢产物引发炎症反应,与抑郁症相关联。
OpenAI Furious DeepSeek Might Have Stolen All the Data OpenAI Stole from Us #
https://www.404media.co/openai-furious-deepseek-might-have-stolen-all-the-data-openai-stole-from-us/
OpenAI 公司对 DeepSeek 的指控
OpenAI 公司和微软公司正在调查 DeepSeek 是否未经授权使用 OpenAI 的数据来训练其人工智能模型。据报道,DeepSeek 的 R1 模型在人工智能领域引起了轰动,但其训练数据的来源却存在疑问。OpenAI 公司和微软公司认为,DeepSeek 可能违反了 OpenAI 的服务条款,或者绕过了 OpenAI 对数据获取的限制。
OpenAI 公司的 CEO 萨姆·阿尔特曼(Sam Altman)表示,DeepSeek 的行为可能是对 OpenAI 公司的知识产权的侵犯。然而,这一指控引发了人们的质疑,因为 OpenAI 公司本身也曾被指控过未经授权使用他人的数据来训练其人工智能模型。这种行为被称为“数据蒸馏”(distillation),即一个模型通过向另一个模型提问来学习其知识。
DeepSeek 的 R1 模型被认为是人工智能领域的一项重大突破,但其训练数据的来源却存在疑问。一些专家认为,DeepSeek 可能使用了 OpenAI 的数据来训练其模型,但这一行为是否违法或违反了服务条款仍然存在争议。
OpenAI 公司和微软公司的指控引发了人们对人工智能领域数据使用和知识产权保护的讨论。随着人工智能技术的发展,数据的获取和使用变得越来越重要,如何平衡数据使用的需求和知识产权保护的需要成为一个重要的问题。
人工智能领域的发展需要大量的数据来训练模型,但这些数据的来源和使用却存在许多问题。未经授权使用他人的数据可能会侵犯知识产权,甚至导致法律纠纷。因此,人工智能领域需要制定明确的数据使用和知识产权保护的规范和标准,以确保技术的发展和创新,同时保护相关方的权益。
HN 热度 1275 points | 评论 9 comments | 作者:latexr | 10 hours ago #
https://news.ycombinator.com/item?id=42865527
- 文章标题过于耸人听闻,试图让读者误以为 OpenAI 很愤怒
- OpenAI 只是怀疑 DeepSeek 违反了使用协议,并正在尝试验证这一点
- 有人怀疑 DeepSeek 通过企业间谍活动窃取了 OpenAI 的模型并进行了优化
- 文章标题不准确,试图让读者误以为 OpenAI 是伪君子
- 许多评论者没有理解幽默的意思
- 文章标题本身很吸引人,但被浪费在了耸人听闻的标题上
New speculative attacks on Apple CPUs #
SLAP 和 FLOP 是两种新的推测执行攻击,分别针对苹果公司的 M2/A15 和 M3/A17 处理器。SLAP 攻击利用了加载地址预测器(LAP)来猜测下一个内存地址,从而导致 CPU 执行任意计算,包括访问不应该访问的数据。FLOP 攻击则利用了加载值预测器(LVP)来猜测内存访问的结果,从而导致 CPU 执行任意计算,包括绕过关键的内存安全检查。
SLAP 攻击可以用来恢复敏感数据,例如电子邮件内容和浏览行为。研究人员展示了一个攻击场景,攻击者可以通过 Safari 浏览器来恢复电子邮件内容。FLOP 攻击可以用来恢复任意内存数据,包括位置历史、日历事件和信用卡信息。研究人员展示了一个攻击场景,攻击者可以通过 Safari 和 Chrome 浏览器来恢复这些数据。
SLAP 和 FLOP 攻击对苹果设备的影响重大,包括所有 Mac 笔记本电脑、Mac 台式机、iPad Pro、Air 和 Mini 模型,以及所有 iPhone 13、14、15 和 16 模型。这些攻击可以绕过硬件和软件措施,防止两个打开的网页之间的隔离,允许攻击者读取敏感数据。
研究人员建议苹果公司应该解决这些问题,并且用户应该启用自动更新,以确保设备运行最新的操作系统和应用程序。同时,研究人员也指出,其他处理器制造商的产品可能不受这些攻击的影响,但需要进一步的测试来确认。
SLAP 和 FLOP 攻击的检测和防御是具有挑战性的,因为这些攻击不留下任何系统日志文件的痕迹。研究人员建议,用户应该注意这些攻击的可能,并采取措施来保护自己的设备和数据。同时,研究人员也呼吁苹果公司和其他处理器制造商应该采取措施来防止类似的攻击在未来发生。
HN 热度 1034 points | 评论 336 comments | 作者:cylo | 1 day ago #
https://news.ycombinator.com/item?id=42856023
- Safari 没有采用完全的进程隔离,导致了安全漏洞。
- 浏览器的 JIT 编译对安全性有影响,但完全禁用 JIT 会导致性能问题。
- 完全的安全性和性能是矛盾的,需要在两者之间找到平衡。
- Apple 的安全性主张可能并不完全成立,尤其是在允许第三方浏览器使用 JIT 编译方面。
- 进程隔离是现代操作系统的基本功能,Apple 的实现存在问题。
- 限制第三方浏览器的 JIT 编译可能会降低用户的安全性。
- 完全的安全性可能需要牺牲性能,目前还没有找到完美的解决方案。
I still like Sublime Text #
https://ohdoylerules.com/workflows/why-i-still-like-sublime-text-in-2025/
作者仍然喜欢使用 Sublime Text 编辑器,尽管它已经存在了很长时间。作者从 2010 年开始使用 Sublime Text 2,并且一直沿用至今。Sublime Text 的速度快、资源占用少、处理大文件能力强、崩溃率低,这些都是作者喜欢它的原因。
Sublime Text 的语言服务器协议(LSP)功能使其能够提供代码补全、悬停信息等现代编辑器的功能。作者可以为每个文件启用多个 LSP 服务器,并且可以根据项目的需要进行配置。LSP 的配置也非常灵活,作者可以根据文件的语法范围启用或禁用 LSP 服务器。
Sublime Text 的代码片段功能也是作者喜欢的原因之一。作者可以创建自己的代码片段,并且可以根据语法范围启用或禁用这些片段。代码片段可以包含占位符、引用等功能,作者可以根据需要进行定制。
作者还提到了 Sublime Text 的项目工作区、构建系统、多光标、键盘绑定等功能。这些功能使得 Sublime Text 成为一个非常强大的编辑器,能够满足作者的各种需求。
尽管 Sublime Text 已经存在了很长时间,但它仍然在不断更新和改进。作者认为 Sublime Text 是一个“完成”的软件,它已经具备了所有必要的功能,作者可以放心地使用它。作者还提到了其他编辑器可能从 Sublime Text 中吸取了灵感,这也证明了 Sublime Text 的影响力。
总的来说,作者仍然喜欢使用 Sublime Text 编辑器,因为它速度快、功能强大、配置灵活。作者可以根据自己的需要进行定制,Sublime Text 也能够满足作者的各种需求。尽管 Sublime Text 已经存在了很长时间,但它仍然是一个非常好的选择。
HN 热度 948 points | 评论 501 comments | 作者:james2doyle | 18 hours ago #
https://news.ycombinator.com/item?id=42862246
- Sublime Text 是一个很好的文本编辑器,适合写个人笔记、博客文章和小规模代码编辑,但不适合作为 IDE。
- IDE 的功能太多,会让编辑器变得臃肿,不如使用轻量级的编辑器。
- 使用 Sublime Text 的同时,也会使用其他 IDE,例如 Visual Studio、XCode、Eclipse、IntelliJ 等。
- Sublime Text 的优势在于其轻量级和快速的性能,适合快速编辑和查看文件。
- IDE 的集成功能,例如代码补全、调试、版本控制等,还是很有用的。
- 使用鼠标和键盘快捷键可以提高工作效率,IDE 的鼠标支持可以带来更好的用户体验。
- 选择工具的标准应该是它是否能带来快乐和提高工作效率。
Science YouTuber physicsgirl (Dianna Cowern) stands for the first time in 2 yrs #
https://www.youtube.com/shorts/2ntx91cOYEc
这个网页是一个视频分享页面,视频的标题是“Dianna 站起来了!2 年来第一次!”。视频的内容是关于一位名叫 Dianna 的女性,她患有 ME/CFS 和长期新冠肺炎,最近她的健康状况有所改善,终于能够站起来了。
视频的描述中提到,Dianna 的健康状况有所改善,她终于能够站起来了,这是一个值得庆祝的时刻。视频的作者是 Dianna Cowern,她是一位物理学爱好者,创建了一个名为 Physics Girl 的频道,用于分享物理学相关的视频。
视频的描述中还提到,Dianna 的频道 Physics Girl 需要支持,可以通过 Patreon 进行捐赠。视频的背景音乐由 APM 提供,视频的编辑是 Levi Butner。视频的发布日期是 2025 年 1 月 24 日,目前已经有 19 万个赞同和 1.2 万个评论。
视频下方有一个评论区,用户可以在这里发表自己的评论和讨论。评论区中有一些用户对 Dianna 的康复表示祝贺和支持,也有一些用户分享了自己的经历和感受。
HN 热度 680 points | 评论 265 comments | 作者:m348e912 | 18 hours ago #
https://news.ycombinator.com/item?id=42862118
- 长期新冠患者可以尝试低 FODMAP 饮食来缓解症状
- 医生轻易下结论“问题出在你的头脑里”可能是由于时间有限或缺乏对患者的了解
- 有些患者被误诊为“问题出在你的头脑里”,实际上可能患有其他可以治疗的疾病
- 医疗系统应该对心理因素在疾病中的作用承担责任,而不是简单地将其归结为“问题出在你的头脑里”
- 有些患者通过改变饮食,如避免麸质、乳制品或其他特定食物,能够缓解长期新冠的症状
- 医疗系统应该提供更多的支持和资源来帮助患者解决心理和生理问题
- 长期新冠的患者可能需要尝试不同的方法来找到适合自己的治疗方案
- 医生应该对患者的症状保持开放的态度,而不是轻易下结论“问题出在你的头脑里”
Why DeepSeek had to be open source #
https://www.getlago.com/blog/deepseek-open-source
该网页主要讨论了 DeepSeek 开源其 LLM(大语言模型)以及这对 AI 行业的影响。DeepSeek 是一家中国公司,他们开发了一个名为 R1 的开源 LLM,该模型的性能与 OpenAI 的 o1 模型相当,但训练成本却远远低于后者。文章认为,DeepSeek 开源其模型是出于对西方市场的渗透需要,因为开源可以建立信任,并且可以让用户自行托管或使用第三方服务。
文章还讨论了开源在 AI 行业中的地位,认为开源模型将变得越来越重要,因为它们可以提供更高的可定制性和透明度。尤其是在基础设施领域,开源软件往往更受欢迎,因为它们可以让用户自行维护和定制。文章提到了 Lago 公司作为开源基础设施公司的例子,认为开源可以让工程师更好地控制和定制产品。
此外,文章还谈到了 OpenAI 在 LLM 领域的领先地位,但认为 DeepSeek 的开源模型 R1 可能会改变这种局面。文章指出,OpenAI 的模型虽然领先,但开源模型的出现可能会迫使 OpenAI 和其他公司寻找更高效的训练方法,从而推动整个行业的发展。最后,文章强调了开源在 AI 行业中的重要性,认为开源可以让用户更好地控制和定制产品,并推动整个行业的发展。
在最后,文章还提到了 Lago 公司的产品,包括 Lago Premium 和 Lago Open Source,认为这些产品可以提供更好的控制和灵活性。同时,文章还提供了相关资源和链接,包括 GitHub、文档、API 参考等,方便用户进一步了解和使用这些产品。
HN 热度 483 points | 评论 261 comments | 作者:AnhTho_FR | 9 hours ago #
https://news.ycombinator.com/item?id=42866201
- DeepSeek 开源的决定可能是为了获得用户的信任,尤其是在中国背景下。
- 只发布模型权重而不公开源代码的做法被认为不是真正的开源。
- 使用模型权重进行微调可以被视为一种修改二进制文件的方式,但这种方法存在局限性。
- 有人认为发布模型权重可以被视为一种开源形式,因为它允许用户进行微调和修改。
- 许多人认为真正的开源应该包括源代码和训练数据,而不仅仅是模型权重。
- 微调模型权重可以被视为一种优化问题,可以使用各种算法来解决。
- 有人将微调模型权重与编辑二进制文件进行比较,认为两者有相似之处。
- 开源的价值在于吸引顶尖人才和建立社区,而不仅仅在于代码本身。
- 许多人对当前的开源定义感到失望,认为它已经被过度商业化和滥用。
Using uv as your shebang line #
https://akrabat.com/using-uv-as-your-shebang-line/
本文介绍了作者 Rob Allen 在使用 Python 脚本时的一个技巧。作者创建了许多脚本来自动化任务,并将它们存放在~/bin/目录中。由于~/bin 目录在系统的路径中,作者希望能够直接在命令行中运行这些脚本。为此,作者使用了一种特殊的 shebang 行:#!/usr/bin/env -S uv run –script。这行代码告诉系统使用 uv 运行脚本,并将文件作为参数传递给 uv。uv 会忽略 shebang 行,并将脚本的其余部分作为正常的 Python 文件运行。
为了使脚本能够直接运行,作者需要确保脚本有可执行权限,这可以通过 chmod a+x {filename}命令来实现。一旦脚本有了可执行权限,作者就可以直接在命令行中运行它,而无需指定 Python 解释器。这种方法使得使用 Python 编写命令行脚本变得更加方便,尤其是当脚本需要处理依赖关系时。
本文还提到了作者的个人信息,包括他的职业、兴趣爱好和联系方式。作者是一位软件顾问和工程领导,专注于 HTTP API。他是开源软件的支持者,并维护了几个开源项目,包括 rst2pdf 和 Slim Framework。作者还参与了其他开源项目,例如 Apache OpenWhisk,并在 Mastodon、Bluesky、Instagram、Flickr、GitHub 和 YouTube 等平台上有账号。作者还写过几本书,包括《Zend Framework in Action》。
HN 热度 451 points | 评论 134 comments | 作者:Einenlum | 1 day ago #
https://news.ycombinator.com/item?id=42855258
- env -S 可以用来解决 shebang 行参数数量限制的问题,但其行为在不同操作系统上可能有所不同。
- 使用 env -S 可以让脚本在 Linux 和 macOS 上运行,但需要注意两者的 shebang 解析规则不同。
- 有些脚本可能会因为 shebang 行的限制而无法正常运行,需要使用其他方法来解决这个问题。
- env -S 的行为取决于操作系统的内核解析 shebang 行的方式,不同的系统可能有不同的限制和行为。
- 有些开发者建议使用 brew install coreutils 来安装 GNU 工具,以避免 shebang 行的限制问题。
- 也可以使用其他方法,如 polyglot 脚本或自编译 C 语言脚本来解决 shebang 行的限制问题。
- shebang 行的限制是一个历史遗留问题,可能永远无法完全解决,需要开发者使用各种 trick 来绕过这个问题。
I do not want AI to “polish” me #
https://thebloggess.com/2025/01/28/no-i-do-not-want-ai-to-polish-me/
这篇博客文章的作者 Jenny 讨论了她对人工智能(AI)在电子邮件写作中的应用的不满。 当她正在写一封电子邮件时,一个名为“Polish”的小工具突然出现,声称可以帮助她改善写作风格。 但是,当 Jenny 点击这个小工具时,它却将她的整个电子邮件内容改写成了一个完全不同的版本,使用了更加正式和拘谨的语言。
Jenny 对此感到非常不满,她觉得 AI 的“帮助”实际上破坏了她的原意和个性。 她指出,如果她的朋友和熟人收到这样的电子邮件,他们一定会怀疑她是否被绑架了,因为这根本不像她的写作风格。 Jenny 还提到,她的电子邮件通常充满了拼写错误、冗长的括号和道歉,这些都是她写作风格的特征。
Jenny 对 AI 的另一个抱怨是,它总是试图“改进”她的写作,即使她明确表示不需要这样的“帮助”。 她提到,当她试图插入图片到博客文章中时,AI 竟然建议使用 AI 生成的图片,而不是她自己选择的图片。 这让 Jenny 感到非常沮丧,因为她觉得 AI 正在试图控制她的创作过程。
在文章的后半部分,Jenny 分享了一些读者的评论,这些评论表达了对 AI 的类似不满。 一些读者指出,AI 在某些领域(如医学和天文学)可能有用,但在写作和创作方面,它们往往会产生反作用。 其他读者分享了他们自己与 AI“战斗”的经历,例如试图关闭 AI 的“智能功能”或避免使用 AI 生成的内容。
总的来说,这篇博客文章表达了 Jenny 和她的读者对 AI 在写作和创作中的应用的不满和担忧。 他们觉得 AI 的“帮助”往往会破坏个性和原意,甚至可能导致人们失去对自己写作风格的控制。 这篇文章也提醒我们,在使用 AI 时需要谨慎和批判,确保它真正能够帮助我们,而不是控制我们。
HN 热度 385 points | 评论 250 comments | 作者:doodpants | 11 hours ago #
https://news.ycombinator.com/item?id=42864854
- 人们对自动更正和自动建议的功能感到厌烦,认为它像一个不断打断他们的“帮手”
- 技术行业正在变得过于依赖人工智能,导致用户体验变差
- 新一代用户更愿意接受人工智能的“帮助”,但这可能是因为他们缺乏技术知识
- 公司们将人工智能作为一种手段来控制用户和获取更多的数据
- 用户已经习惯了被公司们“宠坏”,不再关心自己的隐私和自由
- 人工智能的发展可能会导致人类的自由意志被削弱
- 公司们将人工智能作为一种炒作手段来吸引用户和投资者
- 用户对人工智能的依赖会导致他们失去对技术的控制权
- 人工智能可能会成为一种工具来操纵和控制用户,而不是真正帮助他们
- 技术行业需要重新思考人工智能的发展方向和用户体验的重要性
OpenAI says it has evidence DeepSeek used its model to train competitor #
https://www.ft.com/content/a0dfedd1-5255-4fa9-8ccc-1fe01de87ea6
OpenAI 近期表示,他们发现了中国人工智能初创公司 DeepSeek 可能使用其专有模型进行训练的证据,这引发了对知识产权潜在侵犯的担忧。OpenAI 提到,发现了一些 “蒸馏” 技术的证据,怀疑这些技术来自 DeepSeek。蒸馏是一种行业常用的技术,通过使用较大、功能更强的模型的输出,开发者可以在小型模型上获得更好的性能,从而以更低的成本实现特定任务的相似结果。
尽管蒸馏是一种普遍的做法,但 OpenAI 关注的是 DeepSeek 可能利用这种技术来构建自己的竞争模型,这违反了 OpenAI 的服务条款。OpenAI 的条款中明确规定,用户不得 “复制” 其服务或 “利用输出开发与 OpenAI 竞争的模型”。据悉,OpenAI 和其合作伙伴微软去年对一些被怀疑使用其 API 的 DeepSeek 账户进行了调查,并因涉嫌违反服务条款而阻止了其访问。
DeepSeek 最近发布的 R1 推理模型在市场上引起了广泛关注,其低成本模型的表现与美国领先模型相当。这引发了投资者和技术公司的担忧,导致 Nvidia 的股价在短时间内下跌了 17%。DeepSeek 声称其 V3 模型使用了 2048 个 Nvidia H800 显卡,仅花费 560 万美元进行训练,参数量达到 6710 亿,而与之相当的 OpenAI 和 Google 模型的训练费用则要高得多。
一些专家表示,DeepSeek 生成的响应表明其可能是基于 OpenAI 的 GPT-4 输出进行训练,这也违反了 OpenAI 的服务条款。业内人士指出,中国和美国的 AI 实验室通常会使用 OpenAI 等公司的输出便让其模型的响应更加人性化,这种做法在初创公司和学术界十分常见。
OpenAI 在声明中表示,他们意识到中国其他国家的公司正在不断尝试蒸馏美国领先 AI 公司的模型,并强调保护技术优势的困难。同时,OpenAI 也面临来自《纽约时报》和一些内容创作者的版权侵犯指控,指控其在没有许可的情况下使用他们的文章和书籍来训练模型。
HN 热度 382 points | 评论 1146 comments | 作者:timsuchanek | 20 hours ago #
https://news.ycombinator.com/item?id=42861475
- OpenAI 的指控没有道理,因为他们自己也是通过使用别人的数据来训练模型的。
- 使用 OpenAI 的输出来训练模型并没有违反任何法律或道德原则。
- OpenAI 的行为是双重标准,因为他们自己使用别人的数据,但不允许别人使用他们的数据。
- DeepSeek 的做法是创新性的,因为他们找到了一种更廉价的方式来训练模型。
- OpenAI 的指控可能是出于维护自己商业利益的需要,而不是真正关心知识产权或道德问题。
- 使用 AI 生成的内容来训练模型是完全合法的,因为 AI 生成的内容不受版权保护。
- OpenAI 的行为可能会对整个 AI 研究领域产生负面影响,因为它会限制创新和进步。
Bacteria (and their metabolites) and depression #
https://www.science.org/content/blog-post/bacteria-and-their-metabolites-and-depression
这篇文章探讨了肠道微生物与人类健康之间的关系,特别是某种细菌 —— 摩根氏菌(Morganella morganii)与重度抑郁症之间的潜在联系。摩根氏菌通常被视为肠道微生物组的一部分,也是一种机会性病原体,可能与炎症性肠病(IBD)和尿路感染等疾病相关。
一项大型基因组关联研究(GWAS)表明,摩根氏菌可能在重度抑郁症中发挥了因果作用,这一结果起初让研究者感到意外,但研究显示在 5,959 名个体的样本中,摩根氏菌与重度抑郁症之间的联系非常强,并且在后续的多年度健康记录中得到了验证。
然而,研究人员提出的关键问题是:摩根氏菌是如何导致抑郁症的?最近的一项研究试图寻找可能的机制,发现摩根氏菌产生了一些结构异常的分子,这些分子类似于心磷脂(cardiolipins),这种脂质通常在细菌和线粒体的内膜中发现。尽管这些新分子与心磷脂在结构上相似,但它们的中间部分是二乙醇胺(diethanolamine),而不是甘油,这使得它们成为一种不同的物质。
值得注意的是,二乙醇胺并不是人类或细菌代谢的自然组成部分,而是一种工业污染物。研究发现,这些不自然的脂质具有明显的促炎特性,能够通过 TLR( Toll-like receptor)激活来释放 IL-6,而 IL-6 水平已被证实与重度抑郁症相关联。
综上所述,研究者们认为,继续探索炎症与抑郁症之间的关系,尤其是在摩根氏菌感染或环境中二乙醇胺暴露增加等可能加重因素的影响下,是非常重要的。这一领域仍然有许多知识有待揭示。
HN 热度 374 points | 评论 166 comments | 作者:Luc | 14 hours ago #
https://news.ycombinator.com/item?id=42863262
- 有些人通过自我控制和自我折磨来获得情绪上的满足和优越感
- 有人认为,通过控制饮食和身体来获得情绪上的平衡和满足
- 有人通过断食来缓解抑郁症状
- 有人认为,自我折磨和控制可以带来情绪上的提升和满足感
- 有人认为,通过情绪标签和写作来表达和处理自己的情绪
- 有人认为,自律和自我控制可以带来情绪上的稳定和满足感
- 有人认为,自我折磨和控制可能是由于成长环境和家庭教育的影响
- 有人认为,自我控制和自律可以帮助人们建立自信和情绪上的稳定感