2024-12-25 Hacker News Top Stories #
- 视频分享了世界上最大的CRT电视机的故事,讲述了作者如何找到并修复这台电视机的过程,以及他与日本游戏开发者Abebe的合作。
- 数学概念:π的邪恶孪生兄弟 ϖ,与圆形 ∞ 相关,与圆形 π 类似。
- 使用ESP32模块、MPU6050 IMU、核心无刷电机和塑料螺旋桨等组件,构建一款可以通过手机控制的小型无人机。
- 第38届混沌通信大会将于2024年12月27日至30日在汉堡举行,讨论技术、社会和乌托邦。
- 使用机器学习编译(MLC)技术,可以将LLM模型编译为适用于AMD显卡的代码,从而实现与NVIDIA显卡相似的性能。
- 文章探讨了癌症指南的格式问题,尤其是它们被限制在PDF文档中的现状,以及如何通过机器可读的格式来改善癌症护理的标准化。
- 乐高岛反编译项目是一项功能性完整的乐高岛(1997年版)反编译工作,目标是提供一个可修改、改进和移植到其他平台的可工作代码库。
- 东京市政府发布了整个城市的点云数据,并且这些数据是免费的,任何人都可以下载使用。
- 英特尔公司的股东们正在要求公司的前CEO Pat Gelsinger和CFO David Zinsner归还他们所获得的所有利润、利益和其他报酬。
- 研究文章介绍了人工智能模型Llama 3.3 70B的研究成果,包括训练了一个稀疏自编码器(SAE)来解释模型的潜在空间,并发布了一个可供公众使用的API。
What happened to the world’s largest tube TV? [video] #
https://www.youtube.com/watch?v=JfZxOuc9Qwk
视频标题为"What Happened to the World’s Largest Tube TV?"。视频内容讲述了一个关于世界上最大的 CRT 电视机的故事。视频作者 Shank Mods 分享了他如何找到并修复这台电视机的过程,以及他与日本游戏开发者 Abebe 的合作。
视频中提到了这台电视机的历史,称其为"PVM-4300",并展示了其巨大的尺寸和重量。视频作者还分享了他如何找到这台电视机的原主人,并与他们取得联系的过程。
视频中还包括了一些有趣的细节,例如电视机的重量超过 1000 磅,需要特殊的设备来搬运。视频作者还展示了电视机的内部结构,并解释了其工作原理。
视频的评论区中,有许多观众对视频内容进行了讨论和分享。一些评论者分享了他们自己的 CRT 电视机的经历,而其他人则对视频作者的工作表示赞赏。
HN 热度 597 points | 评论 267 comments | 作者:ecliptik | 1 day ago #
https://news.ycombinator.com/item?id=42497093
- 保存电视机的做法是正确的,电视机的原主人也希望它能被妥善保管和使用。
- 如果电视机被送到博物馆,它可能会被束之高阁,无法发挥其应有的价值。
- 保存历史文物的空间和资金是有限的,不能保留所有的历史文物。
- 有些公司或组织可能不重视保存历史文物,甚至会将其出售或丢弃。
- 保存历史文物需要独立的资金和组织来维持其运营。
- 将历史文物卖给私人收藏家可能是保留其价值的最佳方式。
- 保存历史文物的责任和自主权是一个复杂的问题,涉及文化遗产和保护的伦理困境。
- 将历史文物留在原产国可能更好,也可能更糟糕,取决于当地的保护和维护情况。
The number pi has an evil twin #
https://mathstodon.xyz/@johncarlosbaez/113703444230936435
约翰·卡洛斯·贝兹(John Carlos Baez)在推特上分享了一个有趣的数学概念:π 的邪恶孪生兄弟 ϖ。 ϖ 是一个与圆形 ∞ 相关的数字,与圆形 π 类似。贝兹分享了一个公式:r² = cos2θ,它定义了一个称为 lemniscate 的曲线。该曲线的周长是 2 ϖ,约为 2.62205755。贝兹还提到了与 ϖ 相关的变异三角函数 sl 和 cl,它们与圆形三角函数 sin 和 cos 类似。
贝兹还分享了一个有趣的观察:如果我们取两个点,并绘制所有曲线,使得这两个点之间的距离的乘积为一个常数,则会得到一系列称为 Cassini 的椭圆曲线。其中一个特殊的曲线是 lemniscate。贝兹还提到了一个与 ϖ 相关的公式:π 和 ϖ 之间的比率是高斯常数。
最后,贝兹分享了一个有趣的观察:蜜蜂在飞行时经常遵循一个类似 ∞ 的模式,这可能与数学中的 lemniscate 曲线有关。
HN 热度 410 points | 评论 172 comments | 作者:pkaeding | 19 hours ago #
https://news.ycombinator.com/item?id=42499567
- π 是从圆形中推导出来的,而圆形是由一个点的距离定义的。ϖ 是从伯努利的双曲线中推导出来的,而双曲线是由两个点的距离定义的。是否有一个类似的常数是从由三个点的距离定义的形状中推导出来的?
- 人类实际上是直观的对数尺度思想者。也就是说,没有接受过西方人早期算术训练的人类会更多地思考比率而不是差异。
- 人类有很多对数响应:亮度、声音的响亮度、音乐的八度和相对音高。
- 如果我们假设我们是线性存在,擅长直观加法但对直观乘法不太擅长,那么可能存在生活在对数空间的存在,他们的思想基于乘法。他们的圆圈就是双曲线。
- 有一个通用的双曲线:当你有 N 个点时,你可以找到一个由这些点的距离的常数乘积产生的有趣曲线。也许在更高维度中,对于 1 个点,你有一个球体。对于 2 个点,形状是两个滴状的双曲线。
- 有一个关于对数尺度的理论认为它在进化上更适应。
Build a Low-Cost Drone Using ESP32 #
使用 ESP32 构建低成本无人机的详细指南 #
项目概述 #
随着无人机技术的发展,它们从小众爱好转变为多功能工具,广泛应用于摄影、农业、国防等领域。本项目旨在使用 ESP32 模块、MPU6050 IMU、核心无刷电机和塑料螺旋桨等易于获得的组件,构建一款可以通过手机控制的小型无人机。
无人机的主要特点 #
- **WiFi 控制 **:通过智能手机控制无人机。
- ** 稳定性控制 **:采用 MPU6050 IMU 传感器进行飞行稳定性控制。
- ** 一体化 PCB 设计 **:无需 3D 打印部件,组装简单。
- ** 易于升级 **:可通过外部模块增加如位置保持或高度保持等额外功能。
- ** 小巧轻便 **:便于携带和操作。
- ** 内置电池充电器 **:便于无人机充电。
- **USB 接口 **:用于编程和调试。
- ** 支持 Android 和 iOS 应用 **:用户可以方便地通过手机应用控制无人机。
- ** 开源项目 **:用户可以修改和扩展功能。
完整电路图 #
无人机的电路图包括:
- USB Type C 端口,负责充电和编程。
- 电源管理电路,确保 USB 和电池电源之间的无缝切换。
- 使用 MIC5219 3.3V LDO 进行电压调节。
- MPU6050 传感器用于飞行稳定性控制。
- 使用 SI2302 N 沟道 MOSFET 控制电机,并配有保护二极管和电阻。
自定义 PCB 设计 #
为了确保最终产品尽可能紧凑且易于组装,本项目设计了自定义 PCB。PCB 的设计考虑了无人机的脚架,使其可以方便地与主 PCB 断开。
固件编写 #
无人机的固件基于 Espressif 的 ESP-drone 固件,使用 ESP-IDF 4.4.5 版本编写。用户可以选择从 GitHub 上克隆源代码并自行编译,或使用提供的二进制文件进行闪存。
固件闪存方法 #
用户可以通过三种方法将固件闪存到 ESP32 无人机上:
- ** 使用 ESPIDF 从源代码构建 **:安装 ESP-IDF,克隆固件库,并使用命令行工具进行构建和闪存。
- ** 使用 ESPTOOL**:在终端中使用 esptool.py 命令将固件写入 ESP32。
- ** 使用 ESP32 闪存下载工具 **:通过图形界面选择芯片类型、固件文件和串口进行闪存。
操作无人机 #
- 将无人机放在平坦的表面上并开机。
- 无人机启动后会创建 WiFi 热点,用户连接后可使用密码 “12345678”。
- 下载并打开相应的手机应用程序(可在 App Store 或第三方链接中找到)。
- 连接成功后,无人机指示灯会闪烁绿色,用户可通过应用控制无人机的起飞、降落和方向。
起飞前检查 #
- 确保无人机正确放置,并在水平面上启动。
- 检查 LED 指示灯状态,绿色闪烁表示连接正常,红色闪烁表示电池电量低。
- 使用控制器进行基本的响应测试,确保无人机能够接收到指令。
通过上述步骤,用户可以顺利构建并操作自己的低成本 ESP32 无人机,享受 DIY 乐趣与无人机飞行的体验。
HN 热度 333 points | 评论 112 comments | 作者:m3at | 23 hours ago #
https://news.ycombinator.com/item?id=42498648
- 开源无人机社区发展迅速,硬件成本降低,软件开源,降低了进入门槛
- 开源无人机的硬件和软件生态系统正在快速发展,包括飞控、电调、摄像头和无线通信等
- 开源无人机的软件框架,如 Betaflight、ArduPilot 和 iNav,提供了强大的飞行控制和导航功能
- 开源无人机的开发者社区活跃,提供了大量的文档、教程和支持
- 开源无人机的成本相对较低,尤其是对于初学者和爱好者来说
- 开源无人机的性能和功能已经接近商业级别,尤其是在飞行控制和导航方面
- 开源无人机的开发者社区正在努力改进飞行控制和导航算法,提高飞行性能和安全性
- 开源无人机的硬件和软件兼容性良好,易于集成和扩展
- 开源无人机的开发者社区正在探索新的应用领域,如农业、林业和搜索救援等
- 开源无人机的安全性和可靠性已经得到改善,尤其是在飞行控制和导航方面
- 开源无人机的开发者社区正在努力提高飞行性能和安全性,减少事故和故障的发生
38th Chaos Communication Congress #
https://events.ccc.de/congress/2024/infos/index.html
第 38 届混沌通信大会
第 38 届混沌通信大会(38C3)将于 2024 年 12 月 27 日至 30 日在汉堡举行,是混沌计算机俱乐部(CCC)和志愿者组织的年度四天会议,讨论技术、社会和乌托邦。
大会内容
大会提供讲座、工作坊和各种活动,涵盖信息技术、社会影响等多个主题。自 1984 年起,大会由社区组织,鼓励所有形式的参与。您可以通过志愿者、举办和主持活动、展示自己的项目等方式参与大会。
信息渠道
- 官网:本网站是大会的主要信息渠道,我们会在这里发布所有相关信息。
- 大会博客:大会博客和官网是大会的主要信息渠道,我们会在这里发布更新信息,并在博客上发布详细内容。如果您不想错过任何更新,请订阅博客的 RSS feed。
- 联系方式:您可以在我们的联系页面找到如何与其他参与者和组织团队联系的信息。
大会准备
- 门票:您可以在官网上购买门票。
- Bildungsurlaub:我们提供 Bildungsurlaub 服务,请在官网上查看详细信息。
- 到达大会地点:您可以在官网上找到如何到达大会地点的信息。
大会体验
- 场地:大会将在汉堡举行,我们会在官网上发布场地地图和导航信息。
- 酒吧:大会提供酒吧服务,您可以在官网上查看详细信息。
- 黑客之旅:我们提供黑客之旅活动,请在官网上查看详细信息。
支持和安全
- 获取帮助:如果您需要帮助,请在官网上查看我们的支持页面。
- 大会原则:我们致力于创建一个安全和尊重的环境,请在官网上查看我们的大会原则。
- 可访问性:我们致力于使大会对所有人都可访问,请在官网上查看我们的可访问性信息。
- 照相机和隐私:我们尊重您的隐私,请在官网上查看我们的照相机和隐私政策。
- COVID-19 和感染保护:我们致力于保护您的健康,请在官网上查看我们的 COVID-19 和感染保护措施。
HN 热度 312 points | 评论 171 comments | 作者:joeig | 15 hours ago #
https://news.ycombinator.com/item?id=42500475
- 今年的票务系统真的很糟糕,不公平。
- 大多数人对嵌入式和密码学方面的演讲很感兴趣。
- 有些人对生物学相关的演讲很感兴趣,但不确定是否值得一看。
- 有人认为今年的票务系统很糟糕,很难买到票。
- 有人建议通过黑客空间获取票务。
- 有人认为黑客空间获取票务需要帮助设置他们的空间。
- 有人认为黑客空间获取票务没有这样的要求。
- 有人认为今年的票务系统很公平,支持核心观众。
- 有人认为住宿费用很高,很难负担。
- 有人建议选择经济的住宿方式,比如附近的体育馆。
- 有人认为体育馆的住宿方式不适合所有人。
- 有人认为提前预订酒店可以节省费用。
Making AMD GPUs competitive for LLM inference (2023) #
https://blog.mlc.ai/2023/08/09/Making-AMD-GPUs-competitive-for-LLM-inference
本文讨论了使用 AMD 显卡进行大型语言模型(LLM)推理的性能。通过使用机器学习编译(MLC)技术,可以将 LLM 模型编译为适用于 AMD 显卡的代码,从而实现与 NVIDIA 显卡相似的性能。文章指出,AMD Radeon RX 7900 XTX 显卡的性能可以达到 NVIDIA GeForce RTX 4090 的 80%,而 AMD Radeon RX 7900 XTX 显卡的价格比 NVIDIA GeForce RTX 4090 显卡便宜 40%。
文章还讨论了 MLC 技术的优势,包括可以自动优化代码、支持多种后端(如 CUDA、Metal、ROCm、Vulkan 和 OpenCL)等。并且,MLC 技术可以让开发者使用 Python 语言开发和部署 LLM 模型,提高开发效率。
文章还提供了使用 MLC 技术在 AMD 显卡上运行 LLM 模型的 benchmark 结果,结果显示 MLC 技术可以实现与 NVIDIA 显卡相似的性能。并且,文章还讨论了使用 Vulkan 后端在 SteamDeck 设备上运行 LLM 模型的结果,结果显示 MLC 技术可以在 SteamDeck 设备上实现良好的性能。
总的来说,本文讨论了使用 MLC 技术将 LLM 模型部署到 AMD 显卡上的性能和优势,证明了 MLC 技术可以实现与 NVIDIA 显卡相似的性能,具有广阔的应用前景。
HN 热度 256 points | 评论 158 comments | 作者:plasticchris | 23 hours ago #
https://news.ycombinator.com/item?id=42498634
- AMD 的消费级 GPU 性能并不代表数据中心级 GPU 的性能
- AMD 的 CDNA 架构和 RDNA 架构有很大不同
- AMD 的 UDNA 架构预计在 2026 年发布
- AMD 的 CDNA GPU 支持 Mesa,理论上可以支持 Vulkan Compute 和 SYCL
- AMD 的 GPU 正成为大语言模型推理的严重竞争者
- AMD 决定不发布高端 GPU,因此投资于 7x00 或 6x00GPU 将会浪费
- Nvidia H200 的价格是 H100 的一半,因为人们无法在 H200 上运行 vLLM
- vLLM 不能在 Nvidia H200 上运行可能是由于 AMD64 依赖
- AMD 应该自己做 GPU 驱动程序,而不是依赖第三方
- Intel 的 oneAPI 和 IPEX-LLM 支持还不成熟
Why are cancer guidelines stuck in PDFs? #
https://seangeiger.substack.com/p/why-are-cancer-guidelines-stuck-in
这篇文章探讨了癌症指南的格式问题,尤其是它们被限制在 PDF 文档中的现状,以及如何通过机器可读的格式来改善癌症护理的标准化。
作者首先描述了两个患有相同癌症的患者在不同医院就诊的情景。尽管医学研究提供了丰富的证据,但由于医生的时间压力、不同的培训背景和对最新研究的即时访问能力有限,患者的治疗可能会有所不同。因此,临床指南的出现变得至关重要,它们将大量医学证据提炼成结构化的建议,帮助标准化不同医院和临床医生的护理。
每年,美国国家综合癌症网络(NCCN)的顶尖肿瘤专家会根据最新研究制定针对不同癌症类型的指南。尽管这些指南经过严格的审查和更新,但由于它们通常以 PDF 格式发布,医生在查阅时面临许多挑战:需要找到正确的文档、识别相关部分、跟踪多个超链接,同时还要管理繁重的患者负担。此外,指南的更新频繁,医生很容易参考到过时的版本。
作者指出,临床指南本质上是决策树,但目前的格式难以跟踪和应用。他提出,如果将指南以结构化的数据格式发布,机器就能够解读这些指南,从而使得医疗信息系统能够自动建议诊断测试并警告医生当治疗方案偏离指南时。
作者分享了自己作为软件工程师的经历,他构建了一个小型的概念工具,旨在将 NCCN 的乳腺癌指南提取为机器可理解的结构化格式。通过定义一个能够表示大部分指南信息的模式,他创建了一个图形化界面,能够更方便地从患者案例中找到相应的指南建议。他的工具目前虽然还有一定的误差(约 70-80% 准确率),但显示了通过机器学习和结构化数据改善指南可用性的潜力。
作者最后表示,自己对这一问题的探索仍在进行中,并希望能与在这一领域工作的其他人进行合作,共同推动指南的改进。他提到,未来的工作可以定义更结构化的模式,以便更好地评估和理解指南内容。
HN 热度 248 points | 评论 119 comments | 作者:huerne | 23 hours ago #
https://news.ycombinator.com/item?id=42498462
- PDF 格式虽然不理想,但具有可移植性和持久性,且无需额外的维护成本。
- 医疗信息系统供应商对确保患者死亡负有责任,主要是出于追求利润的动机。
- 医疗信息系统供应商不愿意正确实施现有的标准和协议,导致患者照护不佳。
- 开放标准和协议可以让更多人参与改进,减少错误和不一致。
- 医疗领域的标准和协议实现起来非常困难,需要大量投资和协调。
- 即使在社会化医疗体系中,没有利润动机的情况下,解决这些问题也非常复杂。
- 医疗信息系统供应商不实施开放标准和协议可能是出于对潜在责任和法律风险的担忧。
- 医疗信息系统供应商不实施开放标准和协议可能是出于对潜在责任和法律风险的担忧。
- 即使标准和协议开放,医疗信息系统供应商可能仍然不愿意实施,以避免潜在的法律责任和风险。
- 将医疗信息系统标准和协议开放给公众可能会带来更好的解决方案和改进。
- 医疗信息系统标准和协议的开放可以让更多人参与改进,减少错误和不一致。
Show HN: Complete decompilation of Lego Island #
https://github.com/isledecomp/isle
LEGO Island Decompilation 项目是一项功能性完整的 LEGO Island(1997 年版)反编译工作。该项目旨在尽可能准确地匹配原始机器码,目标是提供一个可修改、改进和移植到其他平台的可工作代码库。
项目状态:
- ISLE.EXE 和 LEGO1.DLL 已完全反编译,并且在功能上与原始版本相同。但是,仍在努力改进源代码的准确性、命名、文档和结构。虽然可能仍存在一些未解决的 bug,但从源代码派生的二进制文件应该是可玩的。
- 由于编译器的复杂性,这些二进制文件与原始可执行文件不完全匹配。希望有一天可以解决这个问题。
编译:
- 项目使用 CMake 构建系统,可以使用各种编译器和开发环境。为了获得最准确的结果,建议使用 Microsoft Visual C++ 4.20(与原始游戏相同的编译器)。
- 编译步骤:
- 安装 Microsoft Visual C++ 4.2 和 CMake。
- 运行 Visual C++ 4.2 的 BIN/VCVARS32.BAT x86 来设置环境变量。
- 创建一个用于编译对象的文件夹(例如源代码存储库中的 build 文件夹)。
- 使用 CMake 配置项目:cmake <path-to-source> -G “NMake Makefiles” -DCMAKE_BUILD_TYPE=RelWithDebInfo
- 构建项目:nmake 或 cmake –build <build-folder>
注意:
- Visual C++ 4.2 有路径中包含空格的问题。如果出现配置或构建错误,请确保 CMake、存储库和 Visual C++ 4.2 不在包含空格的路径中。
- RelWithDebInfo 是推荐的构建类型,因为它会生成调试符号,有助于进一步的反编译工作。也可以使用 Release 构建类型,但调试构建不推荐,因为它们可能与原始 LEGO1.DLL 不兼容。
HN 热度 224 points | 评论 30 comments | 作者:foxtacles | 1 day ago #
https://news.ycombinator.com/item?id=42497173
- 该项目的工具和基础设施很有趣,注重 1:1 的准确性,并侧重于兼容性和跨平台的重新实现。
- 该项目的作者 MattKC 在 YouTube 上有一个很好的频道,分享了他对一些游戏的逆向工程和分析。
- 该游戏的开发者 Mindscape 创造了一个奇怪的 RIFF 格式的资源流。
- 有人正在用 Unreal Engine 重制《乐高小小机器人》。
- 有人希望有人能重制《乐高阿尔法小队》。
- 该项目的作者使用了 D3D 保留模式,这是一种奇怪的渲染历史。
- 有人感谢该项目的贡献者,因为该游戏是他们童年时的最爱。
- 有人想学习逆向工程,但不知道从哪里开始。
- 有人在 Twitch 上直播逆向工程《卡斯尔瓦尼亚:夜之交响曲》。
- 有人认为该游戏的内容很少,但重玩性很高。
- 有人认为 Roblox 很奇怪。
Tokyo released point cloud data of the entire city for free #
https://twitter.com/spatiallyjess/status/1871342549958537326
东京市政府近日发布了整个城市的点云数据,并且这些数据是免费的,任何人都可以下载使用。点云数据是通过激光扫描等技术获取的三维空间信息,广泛应用于城市规划、建筑设计和地理信息系统等领域。
该消息引发了广泛的关注和讨论,表明数据开放和共享的重要性,同时也鼓励更多的人利用这些资源进行研究和开发。对于开发者、研究人员以及对城市规划感兴趣的个人来说,这无疑是一个宝贵的机会,可以深入了解东京的城市结构和空间布局。
HN 热度 210 points | 评论 28 comments | 作者:taubek | 12 hours ago #
https://news.ycombinator.com/item?id=42501102
- 瑞士是第一个拥有详细 3D 建筑模型的国家,覆盖了整个国家,包括每一栋建筑、桥梁、缆车、森林、树木和地理名称。
- 瑞士的防御不仅仅依靠隐秘的堡垒和防御位置,还依靠山脉、爆炸装置和大量武装训练有素的民众。
- 瑞士的防御堡垒和防御位置并不是秘密,很多信息可以通过卫星图片和维基百科获取。
- Surface-level 对象可以通过卫星成像来获取。
- 瑞士的防御堡垒和防御位置很多都是公开的,例如托布勒龙防线。
- 加拿大温哥华市也有类似的 3D 点云数据。
- 瑞士的 3D 建筑模型数据可以用于各种应用,包括视频游戏和建筑设计。
- 收集点云数据的方法包括飞机和无人机等。
- 点云数据可以用于创建 3D 模型,用于视频游戏和建筑设计等领域。
- 点云数据可以通过各种算法转换成 3D 模型,例如 Cesium tiles 和 OSM 数据。
Intel shareholders file case asking ex CEO, CFO to return 3 years of salary #
https://www.cfodive.com/news/intel-shareholders-yank-exceo-cfo-compensation-foundry/736193/
英特尔公司的股东们正在要求公司的前 CEO Pat Gelsinger 和 CFO David Zinsner 归还他们所获得的所有利润、利益和其他报酬。股东们指控这两位高管违反了他们的受托责任和合同义务,向股东们提供了误导性的财务信息和报告。
根据在美国北加州地区法院提交的股东派生诉讼,Gelsinger 和 Zinsner 被指控违反了他们的受托责任和合同义务,向股东们提供了误导性的财务信息和报告。诉讼还指控其他公司高管和董事会成员也参与了此次违规行为。
诉讼称,Gelsinger 和 Zinsner 向股东们提供了误导性的财务信息和报告,包括关于公司的晶圆代工业务的财务表现。根据诉讼,Gelsinger 和 Zinsner 在公司的财务报告和公开声明中表示,晶圆代工业务是公司业务的“重要增长点”,但事实上,这个业务在 2023 年亏损了 7 亿美元。
英特尔公司的股东们要求公司的董事会采取行动,追究 Gelsinger 和 Zinsner 的责任,并要求他们归还所获得的利润、利益和其他报酬。诉讼还要求公司采取措施,防止类似事件再次发生。
此次诉讼是英特尔公司近期面临的又一挑战。公司在今年早些时候宣布了一项重组计划,目标是通过削减成本和优化业务来恢复公司的盈利能力。然而,公司的财务表现仍然不佳,今年第三季度的亏损达到 16.6 亿美元。
HN 热度 202 points | 评论 106 comments | 作者:YetAnotherNick | 15 hours ago #
https://news.ycombinator.com/item?id=42500482
- 这起诉讼看起来像是 ambulance chaser(讹诈)诉讼,没有任何严肃的对 Intel 公司的指控
- 投资者做了错误的赌注,试图在客户面前挽回面子
- 律师们想要大笔的钱,找到了一个客户,利用他们来赚钱
- CEO 离开不是因为他做错了什么,而是因为他的计划没有成功,这是正常的
- Intel 公司没有足够的耐心来实施长期战略,导致 CEO 离开
- CEO 离开是 Intel 公司继续走下坡路的又一个迹象
- Intel 公司应该给 CEO 更多的时间来实施他的计划
- CEO 的计划可能是好的,但没有足够的时间来实施
- Intel 公司的董事会和投资者们只关心短期利益,不关心公司的长期发展
Show HN: Llama 3.3 70B Sparse Autoencoders with API access #
https://www.goodfire.ai/papers/mapping-latent-spaces-llama/
该网页是一篇关于人工智能模型 Llama 3.3 70B 的研究文章。文章首先介绍了研究人员训练了一个稀疏自编码器(SAE)来解释 Llama 3.3 70B 模型的潜在空间,并发布了一个可供公众使用的 API。研究人员发现,SAE 模型可以学习到广泛的概念,包括生物医学知识、物理学知识和编程概念等。文章还展示了如何使用 SAE 模型来控制语言模型的输出,例如让模型输出像海盗一样说话的文本。
文章还讨论了研究人员遇到的挑战,包括如何评估模型的性能以及如何避免模型输出有害内容。研究人员表示,他们已经采取了措施来移除有害的特征,并且正在开发一个负责的扩展计划来确保模型的安全性。
总的来说,该网页是一篇关于人工智能模型解释和控制的研究文章,展示了研究人员在这个领域的最新进展和成果。
HN 热度 184 points | 评论 47 comments | 作者:trq_ | 1 day ago #
https://news.ycombinator.com/item?id=42495936
- 人工智能研究人员总是以“安全”为借口限制他们的研究成果,这是没有必要的。
- 即使是数学和数据,也不能保证安全。
- 人工智能模型可能会产生有害的结果,需要进行适当的测试和审查。
- 限制人工智能模型的输出可能会导致模型无法产生有用的结果。
- 人工智能模型的安全性取决于其训练数据和算法,而不是其输出内容。
- 即使是基本的 ReLU 自编码器,也可能会产生高频特征和特征吸收的问题。
- 需要对自编码器的变体进行更详细的评估和测试。
- 自编码器的安全性取决于其训练数据和算法,而不是其输出内容。
- 使用 PaCMAP 和其他大规模变体可能会产生更好的结果。