2024-05-16 Hacker News Top Stories #
Ilya Sutskever to leave OpenAI #
https://twitter.com/ilyasut/status/1790517455628198322
这条推特是关于 Ilya Sutskever 宣布离开 OpenAI 的消息。他表示在 OpenAI 工作了将近十年后,决定离开。他对公司的发展轨迹表示赞赏,并相信 OpenAI 在 @sama、@gdb、@miramurati 以及现在在 @merettm 的卓越研究领导下,将建立出既安全又有益的人工通用智能(AGI)。
他感到荣幸并感激曾与大家共事,也会怀念大家。他表示期待未来的项目,这个项目对他个人意义重大,将在适当的时候分享更多细节。
HN 评论 725 comments | 作者:wavelander | 22 hours ago #
https://news.ycombinator.com/item?id=40361128
- Karpathy 和 Sutskever 离开 OpenAI,现在似乎是 Sam Altman 和 Greg Brockman 的舞台。
- OpenAI 的前六名科学家早已离开,现在由营销、商业、软件和产品化人员运作。
- AI 现在已经超越了科学,最大问题在于产品化。找到现有用例和新模型的成功之处将在于其中。
- ChatGPT 是 AI 领域的第一品牌,因此需要了解自己在卖什么,而不是技术如何运作。
- AI 公司没有发明者注定失败。
Glider – open-source eInk monitor with an emphasis on low latency #
https://github.com/Modos-Labs/Glider
这个 GitHub 地址包含了一个名为"Glider"的项目,是一个开源的电子墨水监视器项目,专注于低延迟。该项目仅包含硬件设计,而 FPGA 上运行的门控软件是作者的开源 Caster EPDC 设计。
该项目包含了关于 Eink 技术的详细信息,包括硬件设计、门控架构、固件功能、资源利用等方面。此外,还提供了关于 Eink 控制器、屏幕面板类型、波形理解、抖动处理、灰度显示、彩色显示等内容的详细介绍。
整个文档内容非常丰富,涵盖了 Eink 技术的各个方面,是一个深入了解电子墨水技术的综合指南。
HN 评论 129 comments | 作者:mistercheph | 1 day ago #
https://news.ycombinator.com/item?id=40358309
- 每个 eINK 控制器都很糟糕,但这个人着手解决了这个问题,并发布了结果,现在是开源硬件的最新技术。
- 有趣的巧合,很多滑翔机(滑翔机)飞行员使用 e-ink 显示屏(通常是根据 XCSoar 运行的根 kobo/kindle 阅读器)。
- 潜艇使用罗技控制器,滑翔机使用 e-ink 阅读器作为显示器。想知道其他技术在小众交通工具内部如何再利用:)
- 我作为一个 12 岁的初学者在 Python 中编写的代码正在运行德国铁路的所有内容,我认为是这样。我怀疑,它具有相同的性能特征。
- 我在 17 岁时的第一份工作任务之一是为国家铁路编写一些涉及铁路轨道倾斜公式的 Visual Basic。我真诚地希望没有人真的在任何地方使用过它。
- 我一直在使用 Kindle 超过 10 年了,但其反应速度一直让我不爽。我不确定这是硬件问题还是软件问题。很高兴看到这个项目专注于减少硬件方面的延迟。
- Kindle 之所以是糟糕的产品,是因为它是由亚马逊制造的。
- Kindle 是电子书阅读器的标杆,对于线性阅读来说,它是最常见的 e-ink 技术产品。在商业方面,它在任何方面都不是一个“糟糕的产品”。
- Kindle 是一个更好的书籍,比实际书籍好 98% 以上。带上任意数量的书去出差真是太棒了。我的孩子和妻子每天都在读他们的。
Gemini Flash #
https://deepmind.google/technologies/gemini/flash/
Gemini Flash 是 Google DeepMind 推出的一款轻量级模型,专为速度和效率最重要的场景进行了优化,具有最多可达一百万个标记的上下文窗口。该模型涵盖了 57 个学科领域的问题表征,包括 STEM、人文等。Gemini Flash 在不同领域的表现如下:
- 在代码生成方面,通过 Natural2Code 技术,生成 Python 代码,在类似 HumanEval 的数据集上表现良好。
- 在数学问题方面,涵盖了挑战性的数学问题,包括代数、几何、预微积分等。
- 在推理问题方面,包括了由生物学、物理学和化学领域专家编写的具有挑战性的问题数据集。
- 在多语言翻译方面,通过 WMT23 技术进行语言翻译,表现出色。
- 在图像问题方面,解决了多学科大学级推理问题,以及数学推理在视觉背景下的挑战。
- 在音频问题方面,通过 FLEURS 技术进行自动语音识别,表现优异。
- 在视频问题方面,通过 EgoSchema 技术进行视频问答,取得显著进展。
Gemini Flash 是一款多功能的 AI 模型,适用于各种领域的问题解决和应用,展现了出色的性能和多样化的应用场景。
HN 评论 136 comments | 作者:meetpateltech | 1 day ago #
https://news.ycombinator.com/item?id=40358071
- 评论中提到 Gemini Flash 具有 1M 上下文长度,但与 GPT-4 相比,性能可能不及预期。
- 有人认为 Gemini 1.5 的优势在于上下文长度,可在对话开始前将 2000 页文档放入上下文窗口。
- 有关输入令牌成本的讨论,云端 LLM 的上下文成本可能会使人望而却步。
- 有人质疑 Gemini 的价格,认为云端 LLM 的成本使得普通开发者无法构建需要大量用户提示的应用。
- 讨论了 Gemini 的上下文缓存功能,但指出对于大多数低流量应用来说,这可能不是一个有用的优化。
- 有人提出实现类似 JIT 编译的想法,通过在线微调重复使用的上下文序列。
- 讨论了 Gemini Flash 的性能,有人表示 Gemini 1.5 Pro 在实际使用中表现不佳,存在幻觉问题。
- 讨论了 Gemini Flash 的价格,与 GPT-3.5 Turbo 进行了比较。
- 有人对 Gemini Flash 的性能表示怀疑,认为快速交付错误答案并不可取。
- 讨论了 Gemini Flash 在 NYT Connections 基准测试中的表现,与其他模型进行了比较。
- 有人对 Gemini Flash 的使用体验进行了分享,指出其在特定用例中的准确性和速度。
- 讨论了 Gemini Flash 的定价策略,以及与其他模型的性能和价格比较。
- 讨论了 Gemini Flash 与其他产品的竞争,以及价格竞争对市场的影响。
- 有人对 Gemini Ultra 的存在提出疑问,认为 Google 在基准测试中可能存在问题。
- 讨论了 Gemini Ultra 的性能和可用性,以及与 GPT-4 的比较。
Adobe Photoshop Source Code (2013) #
https://computerhistory.org/blog/adobe-photoshop-source-code/
这篇文章介绍了 Adobe Photoshop 的源代码。在 1980 年代末,兄弟托马斯和约翰·诺尔开始设计和编写一款图像编辑程序。最初,他们并没有想到这个程序会成为词典中的一个词汇。托马斯是密歇根大学的计算机视觉博士生,于 1987 年编写了一个用于显示和修改数字图像的程序。他的兄弟约翰在电影视觉特效公司工作,发现这个程序对编辑照片很有用,但并不是为了成为产品。逐渐地,这个名为“Display”的程序变得更加复杂。
1988 年夏天,他们意识到它确实可以成为一个可信的商业产品。他们将其改名为“Photoshop”,并开始寻找一家公司来分发它。大约有 200 份 0.87 版本的副本被幻灯片扫描仪制造商 Barneyscan 捆绑为“Barneyscan XP”。Photoshop 的命运在 Adobe 的艺术总监 Russell Brown 的鼓励下尘埃落定,决定购买许可证以分发 Photoshop 的增强版本。交易于 1989 年 4 月完成,1.0 版本于 1990 年初开始发货。在接下来的十年里,超过 300 万份 Photoshop 副本被销售。文章还提到了 Photoshop 1.0.1 版本的源代码已经被计算机历史博物馆授权提供非商业使用。
源代码包含了大约 128,000 行代码,其中大约 75% 是 Pascal,15% 是 68000 汇编语言,其余是各种数据。此外,软件架构师 Grady Booch 对 Photoshop 源代码提供了评论,称其为“非常结构良好的系统”。源代码中几乎没有注释,但代码非常易读。最后,文章提到了 Photoshop 的早期截图,展示了软件的一些功能和界面。
HN 评论 135 comments | 作者:PaulHoule | 6 hours ago #
https://news.ycombinator.com/item?id=40368016
- Adobe 员工尝试归档 Photoshop 等软件源代码,希望更多源代码能公开
- Adobe 捐赠早期 PostScript 和 Photoshop 版本,呼吁公众要求释放更多
- 评论员感谢 Adobe,希望源代码能在 archive.org 或 Github 公开
- 评论员提到 LISP 1.5 源代码,表扬 Mike Schuster 是优秀的程序员
- 讨论围绕专利而非代码,提到 Illustrator 和 Freehand 的竞争
- 评论员分享了构建应用程序所需的工作量,指向详细的写作
- 评论员感叹用户界面仍然相似,但对软件性能感到失望
- 讨论过去硬件对软件性能的影响
- 评论员分享了与 Adobe 交换源代码的经历
- 讨论代码交换的故事,提到在学术/研究领域很常见
- 讨论 MacApp 在 Windows 上的使用,提到 PowerPlant 比 TCL 更好
- 讨论用户界面的定制性,提到保留旧版界面是重要的
- 讨论用户界面的变化,提到用户对熟悉界面的依赖
- 讨论软件界面的更新,提到用户对界面的反应
The Worst Website in the Entire World #
https://matduggan.com/the-worst-website-in-the-entire-world/
这个网站的内容是关于作者尝试创建世界上最糟糕的网站。作者提出了一个问题:如果你刻意设计一个糟糕到让用户不仅讨厌使用这个网站的体验,还会开始讨厌你的公司的网站,会怎么样?
作者分享了自己在互联网上遇到的一些糟糕网站的经历,并指出了他认为 Broadcom 公司的网站是最糟糕的。文章中提到了 VMware 软件免费使用的消息,但在尝试注册和下载时遇到了一系列令人沮丧的体验,包括注册页面的设计、验证码的问题、聊天机器人的无效性等。
作者对 Broadcom 网站的用户体验和设计表示了强烈的不满,认为这个网站表达了对用户的纯粹仇恨。文章最后呼吁 Broadcom 关闭这个网站,重新开始,或者考虑使用更友好的平台。
HN 评论 172 comments | 作者:speckx | 8 hours ago #
https://news.ycombinator.com/item?id=40366962
- 企业软件常常在用户体验上表现糟糕,如 SAP 和 Oracle 等软件存在技术债务和功能不明确问题;
- 企业软件通常由非专业开发者开发,存在技术债务和功能不明确问题;
- 企业软件的前端界面通常复杂且难以使用,如 SAP Netweaver 和 Sailpoint;
- 企业软件专家在 IT 组织中占比较大,如 Oracle 支持人员;
- 企业软件的用户体验通常较差,如 IBM 的 API Connect 文档问题;
Translation of Rust’s core and alloc crates to Coq for formal verification #
https://formal.land/blog/2024/04/26/translation-core-alloc-crates
这篇文章介绍了关于 Rust 程序的形式验证工作,使用了名为 coq-of-rust 的工具,将 Rust 代码翻译成形式证明系统 Coq。文章指出他们在处理 Rust 标准库中的原始构造时遇到了限制,比如 Option::unwrap_or_default 等原始函数,需要为每个函数制定一个 Coq 定义来表示其行为,这既繁琐又容易出错。
为了解决这个问题,他们使用 coq-of-rust 对 Rust 的 core 和 alloc crates 进行了翻译工作。这些是非常庞大的代码库,包含大量不安全或高级的 Rust 代码。他们展示了如何努力进行这些 crates 的翻译工作,并将结果放在了 CoqOfRust/alloc 和 CoqOfRust/core 文件夹中。
文章提到了对 alloc 和 core crates 运行 coq-of-rust 的初始结果,生成了数十万行 Coq 代码,但尽管错误非常罕见,生成的 Coq 代码仍无法编译。为了解决这个问题,他们将生成的代码进行了拆分,每个 Rust 文件对应一个 Coq 文件,以便更容易阅读、编译、调试和维护。
此外,文章还提到了一些修复的 bug,如模块名称冲突等,并展示了一个例子,说明了如何将 Rust 代码翻译成 Coq 代码,并证明它们等价。最后,文章总结了他们的工作,表示现在可以更加信任标准库的形式化,下一步目标是简化证明过程。
如果你对正式验证 Rust 项目感兴趣,可以通过 contact@formal.landmailto:contact@formal.land 联系作者。正式验证提供了对关键应用程序最高级别的安全性,对于给定规范的缺陷不存在有数学保证。
HN 评论 102 comments | 作者:p4bl0 | 15 hours ago #
https://news.ycombinator.com/item?id=40363744
- 自动翻译将信任转移到工具。coq-of-rust 本身是用 Rust 编写的,而不是 Coq。递归性质有些令人费解,但我认为可以通过类似 David A. Wheeler 的“通过多样化双重编译抵消信任攻击”(2009)的过程来证明其正确性,但需要结合 CompCert 方法。
- 为了验证它,您将使用 coq-of-rust 将 coq-of-rust 转换器从 Rust 转换为 Coq。然后,您证明所需的正确性属性 - 关键是,它在将程序转换为 Coq 时保留了 Rust 程序的语义。
- 与文章中一样,可能更容易使用更多功能性定义而不是生成的定义进行证明,因此您将进行与 stdlib 相同的过程,证明定义之间的等价性。由于 coq-of-rust 转换器(具体来说,lib/ [1])的当前行数为 6350 行 Rust,甚至似乎可以在 Coq 中编写一个完整的转换器,并证明其与生成的转换器的等价性。
- 然后,您在 coq-of-rust 转换器的 Rust 源代码上执行经过验证的 Coq。它输出的 Coq 定义应该与您开始的 Rust coq-of-rust 转换器的输出相匹配。
- 另外,很高兴看到像这样的工作获得行业资金支持。我经常对加密货币持怀疑态度,但其正确性约束确实推动了我喜欢的领域(Rust、Coq、我认识的硕士生的资助等)的改进。
Raspberry Pi Ltd is considering an IPO #
https://www.londonstockexchange.com/news-article/market-news/expected-intention-to-float/16470316
这篇新闻文章介绍了一项 Raspberry Pi Ltd. 公司预期的拟上市意向,发布时间为 2024 年 5 月 15 日早上 7 点 12 分。文章强调了伦敦证券交易所不对网站内容负责,并提醒用户自行核实内容。
任何仅针对特定人群和国家的新闻(包括招股说明书)不应该被其他人或指定国家以外的人依赖。文章还提到了使用和分发的条款和条件,以及版权信息。整体来看,这篇新闻涉及拟上市意向以及相关的监管信息。
HN 评论 285 comments | 作者:sohkamyung | 9 hours ago #
https://news.ycombinator.com/item?id=40366062
- Raspberry Pi Ltd 考虑 IPO,但观点认为价格上涨,性能下降,市场有更好选择;
- 低端、节能市场被 ESP32 吞噬,RPi 追求性能,但执行不佳;
- RPi 5 电源需求高,与 Intel 系统竞争;
- RPi 2040 与 ESP32 竞争,但市场份额少;
- RPi 适合电子项目,但不适合标准计算机;
- ESP32 满足 IoT 需求,Pi 不稳定,功耗高;
- Pi 适合运行 Linux,但不适合高性能需求;
Department of Justice says Boeing may be criminally liable in 737 MAX crashes #
根据《今日美国》的报道,美国司法部表示波音公司可能会因违反与 737 Max 飞机生产相关的协议而面临刑事起诉。波音公司违反了 2021 年的协议,该协议本应使其免受刑事起诉,但在两起 737 Max 飞机事故中共有 346 人丧生后,司法部在周二的法庭文件中告诉一名联邦法官。根据司法部的说法,波音未能“设计、实施和执行合规和道德计划,以防止和发现其运营中违反美国欺诈法的行为”。
政府尚未决定是否会起诉波音,但代表在事故中丧生的受害者家属的律师表示,他们希望看到进一步的行动。波音已承认收到该决定的通知,并表示计划做出回应。政府官员计划于 5 月 31 日与事故受害者会面,并要求波音在 6 月 13 日前回复文件。司法部将于 7 月 7 日通知法院其计划如何继续,这可能导致对公司提起刑事指控。今年以来,这家喷气式飞机制造商在最新一次停飞 737 Max 飞机后受到监管机构和立法者的加大审查。
在一月份,阿拉斯加航空公司的一架 737 Max 飞机在飞行中失去了一个门插件。尽管这一事件没有造成严重伤亡,但美国联邦航空管理局迅速停飞了所有具有相同类型门插件的 737 Max 飞机,并开始对波音的生产实践进行新的调查。随后,阿拉斯加航空公司航班上的乘客收到了来自联邦调查局的信函,通知他们可能是犯罪的受害者。
HN 评论 191 comments | 作者:andsoitis | 17 hours ago #
https://news.ycombinator.com/item?id=40363069
- 政府机构在权衡生命价值时会考虑统计价值,不会无限花钱拯救生命,而是设定一个生命的经济价值;
- 政府机构使用统计生命价值来评估规定的效益,而企业则会考虑利润,两者的考量方式不同;
- 政府规定产品召回时不会权衡公众利益和公司成本,而是关注公众利益;
- 波音低估了人命的价值,这才是问题所在,而不是冷静的成本效益分析;
- 波音可能会面临刑事指控,而不仅仅是罚款和牺牲几名员工;
- 波音可能需要做出改变,包括换掉高管,重视工程和流程问题;
- 波音的管理层可能会受到刑事起诉,企业也可能面临刑事指控。
A low budget consumer hardware espionage implant (2018) #
https://ha.cking.ch/s8_data_line_locator/
有关 S8 数据线定位器的详细分析。S8 数据线定位器是一个隐藏在标准 USB 数据/充电线插头内部的 GSM 监听和定位设备,支持 850、900、1800 和 1900 MHz 的 GSM 频率。其核心概念类似于 NSA/CSS 的 COTTONMOUTH 产品线,其中一个 RF 设备隐藏在 USB 插头内。
该设备被宣传为可用于汽车的定位跟踪器,但其恶意用途不可否认。它可以被调用以监听设备内部的小型麦克风的实时音频,也可以被编程在声音水平超过 45 dB 的阈值时回拨。设备具有多种窃听、间谍和监听功能,如实时定位、报警设置等。
设备内部包含多个芯片,包括 MediaTek MT6261MA 和 RDA 6626e。通过分析固件、硬件连接和隐藏命令,揭示了设备的工作原理和潜在漏洞。此外,还发现了设备与 SIM 卡之间的通信、设备的操作系统、Flash 内容等详细信息。网站 gpsui.net 提供了远程控制设备的功能,但也存在安全漏洞。
总体而言,这篇分析提供了对 S8 数据线定位器内部工作原理和潜在风险的深入了解。
HN 评论 86 comments | 作者:fanf2 | 15 hours ago #
https://news.ycombinator.com/item?id=40363704
- 评论中提到这个设备可能被用作跟踪设备,可能被用作礼物给商务会议或儿童等。
- 有人提到更容易的方法是修改键盘,将 esp32 放入键盘中,通过蓝牙或 WiFi 访问,仅在特定时间窗口打开无线电。
- 鼠标更容易被替换,尤其是那些非蓝牙无线鼠标容易受到远程按键注入的影响。
- 有人建议将设备放入原始键盘中。
- 评论中提到了使用 esp 长距离,通过连接到蜂窝网络的接收器,以避免在内部暴露额外网络。
- 有人认为更容易让目标使用 USB 设备而不是键盘。
- 评论中提到了使用非线性结点探测器来检测电子元件。
- 有人提到了购买 SIM 卡时的身份验证要求在不同国家之间存在差异。
- 评论中提到了使用 Signal 信使与设备进行通信。
- 有人提到了可能存在的 SSD 暗中传输数据的问题。
- 评论中提到了可能存在的具有 801.11ah 的受损电缆。
Show HN: I built a math website the internet loved, I’m back with more features #
https://teachyourselfmath.app/?page=1
这个网站( https://teachyourselfmath.app/?page=1)提供了数学相关的内容,包括不同难度级别的题目和解答。一些题目涉及数字理论、代数、微积分、复数、概率统计等领域。
举例来说,有关题目包括计算鸡的价格、矩阵求逆、求余数、积分、因式分解、方程求解等。网站提供了各种数学问题的解答和讨论,适合自学数学的人参考。
HN 评论 51 comments | 作者:viveknathani_ | 16 hours ago #
https://news.ycombinator.com/item?id=40363517
- 有人建议在网站中使用 https://vector-graph.com/ 添加数学图表
- 建议考虑 https://cortexjs.io/mathlive/ 以便普通人理解 LaTeX WYSIWYG
- 提到了 Asymptote: https://en.wikipedia.org/wiki/Asymptote_%28vector_graphics_l...
- 有人正在开发一个 STEM 辅导网站,计划测试库并购买许可证
- 有人对网站内容感兴趣,希望能与其合作
- 有人提到网站中的问题导航存在问题,建议改进
- 有人提到 X x Y x Z = 44 的质因数分解问题
- 有人问难度如何确定,建议添加“非常困难”或“高级”类别
- 建议让用户投票确定难度
- 建议隐藏评论以避免透露答案
- 有人分享了自己的数学网站,支持学校举办 Math-A-Thons
- 有人提到 UX/UI 需要改进
- 有人询问是否可以查看正确答案
- 有人赞扬网站设计
- 有人表示对学习数学感兴趣
- 有人建议在 r/learnmath 上宣传
- 有人提到网站在移动端字体有点小,布局会出问题
- 有人赞赏网站并买了咖啡
- 有人希望 HN 上不要出现类似标题,赞赏 HN 的“无标题党”政策