2024-04-24 Hacker News Top Stories #
一句话摘要 #
- The man who killed Google Search? 文章探讨了谷歌搜索引擎衰落的原因,指出管理层变动和技术决策导致了搜索质量的下降。
- Krazam OS Krazam网站提供幽默科技视频内容,其风格积极向上,但一些功能仍在完善中。
- NASA’s Voyager 1 Resumes Sending Engineering Updates to Earth NASA的旅行者1号在停止发送数据五个月后,通过重新定位和调整软件,恢复了向地球发送工程系统健康数据的能力。
- No one buys books 文章讨论了企鹅兰登书屋未能收购西蒙与舒斯特出版社的案件,揭示了出版业的商业模式和市场趋势。
- Help us invent CSS Grid Level 3, a.k.a. “Masonry” layout 文章介绍了CSS Grid Level 3中“Masonry”布局的概念,邀请设计师和开发者参与讨论如何实现这种布局。
- Phi-3 Technical Report 论文介绍了phi-3-mini语言模型,这是一个小型但性能强大的模型,能够在手机上部署,且在学术基准测试中表现优异。
- Show HN: Balancing game for the mobile browser with increasing difficulty 一个3D平衡球手机浏览器游戏,具有逐渐增加的难度,玩家需要保持球体平衡不掉落。
- Understanding and avoiding visually ambiguous characters in IDs 文章讨论了在系统标识符中避免使用视觉上易混淆字符的重要性,并提供了生成清晰标识符的建议。
- North Korean animation outsourcing for Amazon, HBO Max series 文章通过一个配置错误的北朝鲜云服务器揭示了北朝鲜动画外包业务,以及外国公司可能无意中违反制裁的风险。
- New Foundations is consistent – a difficult mathematical proof proved using Lean 利用交互式定理证明器Lean,研究者证明了自1937年以来提出的新基础理论的一致性。
The man who killed Google Search? #
https://www.wheresyoured.at/the-men-who-killed-google/
这篇文章讲述了谷歌搜索引擎的衰落以及导致其衰落的人。故事始于 2019 年 2 月 5 日,当时谷歌搜索主管本·戈梅斯(Ben Gomes)遇到了问题。当时的谷歌广告副总裁兼总经理杰瑞·迪施勒(Jerry Dischler)和当时的谷歌搜索和广告副总裁希夫·文卡塔拉曼(Shiv Venkataraman)发出了“黄色代码”警报,称搜索收入存在稳定下降的问题,可能导致季度收入大幅下滑。
文章详细描述了谷歌内部的“黄色代码”警报系统,以及在谷歌内部团队之间的紧张关系和增长压力。谷歌内部邮件披露了搜索查询增长远远落后于预期,收入推出时间滞后,以及对搜索存在的一些问题。文章还提到了一些关键人物,如本·戈梅斯和帕布哈卡尔·拉加万(Prabhakar Raghavan),以及他们之间的冲突和管理方式的变化。
文章还探讨了谷歌在管理层变动后的变化,特别是在拉加万接管搜索部门后,谷歌搜索质量下降,搜索结果中充斥着垃圾内容和广告。作者认为,拉加万代表了技术行业中一种以增长为导向的管理思维,对技术产品和用户体验造成了负面影响。
最后,文章指出了一些关键人物,如本·戈梅斯被降职,拉加万升任谷歌搜索负责人,以及谷歌内部管理层变动对公司和产品带来的影响。文章强调了管理层对技术行业的破坏性影响,以及对技术创新和产品质量的威胁。
HN 评论 419 comments | 作者:elorant | 7 hours ago #
https://news.ycombinator.com/item?id=40133976
这篇帖子中的评论观点包括:
-
- 一些老工程师对谷歌搜索团队的变化感到不满,认为失去了一些重要人员导致复杂性增加;
-
- 有人认为谷歌搜索质量下降与机器学习的增加有关,导致结果变差;
-
- 对当前人工智能浪潮提出警示,认为将机器学习子系统插入系统可能导致难以修复的问题;
-
- 技术人员希望那些推动使用机器学习的人了解其局限性,但商业层面对人工智能的认识仍存在偏差;
-
- 有人将机器学习比作新的 SOAP,认为过度复杂会导致难以理解的问题;
-
- 评论中还提到了 YouTube 和 Google News 的推荐问题,以及谷歌公司内部变化和困境。
Krazam OS #
网站名称为 KRAZAM,主打口号是“解锁数字永恒的秘密”。网站提供视频、联系方式、画廊、商品、赞助、终端、教学大纲等内容。网站的版权声明为 2024 年至无限年,硬件为 MMX2,与 FaceGoog, Inc.合作建立。
网站团队包括 Gooch Lawrence、Kurt Schoenfeld、Neil、JJ Freedump、Steve、Dale、Makro、Vikas、Gianni Roberto、Sajib Moskowitz、Sanuel Darnuld、Greg Moss 等人。
整体风格积极向上,但有一些功能尚未完善。网站还致谢了 98.css 等开源项目。
HN 评论 169 comments | 作者:zdgeier | 1 day ago #
https://news.ycombinator.com/item?id=40126751
-
- 观众希望在 Krazam 的“merch store”中看到他们最受欢迎的视频内容相关的商品;
-
- 评论中提到 Krazam 视频中的经典台词,如“我已经创造了价值…但代价是什么?”等;
-
- 有人提到 Krazam 的视频对科技幽默的表现很好,比如对硅谷和《生活大爆炸》的嘲讽;
-
- 评论中有人分享了 Krazam 视频中的笑点和内涵,以及对视频中的技术笑话的喜爱;
-
- 有人讨论了 Krazam 视频中的设计风格和用户界面设计;
-
- 评论中提到 Krazam 视频对工作生活的幽默刻画,特别是在科技行业中的体验;
-
- 有人分享了 Krazam 视频中的经典片段和对工作中常见情况的幽默诠释;
-
- 评论中有人表达对 Krazam 视频的喜爱和对其幽默的赞赏。
NASA’s Voyager 1 Resumes Sending Engineering Updates to Earth #
根据 NASA 的博客内容,自 2023 年 11 月以来,NASA 的旅行者 1 号太空船首次开始发送有关其机载工程系统健康状况的可用数据。该太空船及其孪生船旅行者 2 号是迄今为止唯一飞越星际空间(星际之间的空间)的太空船。
在 2023 年 11 月 14 日,旅行者 1 号停止向地球发送可读的科学和工程数据,尽管任务控制器可以确认太空船仍在接收指令并正常运行。在 3 月份,位于加利福尼亚南部的 NASA 喷气推进实验室的旅行者工程团队确认问题与太空船的三个机载计算机之一有关,称为飞行数据子系统(FDS)。
FDS 负责在发送到地球之前打包科学和工程数据。团队发现一个负责存储部分 FDS 内存的芯片不起作用,包括一些 FDS 计算机软件代码。这段代码的丢失使科学和工程数据无法使用。无法修复该芯片,团队决定将受影响的代码放置在 FDS 内存的其他位置。但没有一个位置足够大以完整保存代码部分。因此,他们制定了一个计划,将受影响的代码分成几部分,并将这些部分存储在 FDS 的不同位置。
为了使该计划奏效,他们还需要调整这些代码部分,以确保它们仍然作为一个整体运行。还需要更新其他 FDS 内存中该代码位置的任何引用。团队首先确定了负责打包太空船工程数据的代码。他们于 4 月 18 日将其发送到 FDS 内存的新位置。无线电信号需要大约 22 个半小时才能到达旅行者 1 号,距地球超过 150 亿英里(240 亿公里),另外 22 个半小时信号返回地球。当任务飞行团队于 4 月 20 日收到太空船的回应时,他们发现修改成功:自五个月以来,他们首次能够检查太空船的健康状况。
在接下来的几周里,团队将重新定位和调整 FDS 软件的其他受影响部分,包括将开始返回科学数据的部分。旅行者 2 号继续正常运行。这两艘孪生旅行者太空船已经飞行了超过 46 年,是历史上运行时间最长、距离最遥远的太空船。在开始星际探索之前,这两个探测器都曾飞越土星和木星,而旅行者 2 号还飞越了天王星和海王星。
加州帕萨迪纳的加州理工学院为 NASA 管理喷气推进实验室。
HN 评论 188 comments | 作者:jonathankoren | 1 day ago #
-
- 评论者认为 NASA 的新闻稿风格简洁易懂,值得称赞。
-
- 评论者认为 Voyager 的旅程令人感到美妙。
-
- 评论者想象后代可能会围绕 Voyager 建立博物馆。
-
- 评论者谈到了一些科幻情节,包括 Voyager 被飞船追赶的想法。
-
- 评论者讨论了 Voyager 的能源持续时间和未来运行的可能性。
-
- 评论者提到了 Star Trek 中基于 Voyager 的敌人。
-
- 评论者分享了关于 Voyager 持续运行的技术细节。
-
- 评论者对 Voyager 项目的工程成就表示赞赏。
-
- 评论者对 Voyager 的持续运行和远程维护表示惊叹。
-
- 评论者提到了 Voyager 项目可能对人类的影响和未来太空探索的计划。
No one buys books #
https://www.elysian.press/p/no-one-buys-books
这篇文章讨论了 2022 年企鹅兰登书屋想要收购西蒙与舒斯特出版社的情况。两家出版社在市场份额中分别占据了 37% 和 11%,合并后将把五大出版社压缩为四大。然而,政府干预并对企鹅提起反垄断诉讼,以确定这是否会导致垄断。法官最终裁定该合并将导致垄断,并阻止了 22 亿美元的收购。
在审判期间,每家主要出版社和文学代理机构的负责人都站起来谈论出版业,并提供数据,从内部给我们提供了一个令人瞠目结舌的行业情况。审判中的所有记录被编入一本名为《审判》的书中。作者总结了自己的发现,并提取了所有引人注目的亮点。
文章指出,五大出版社将大部分资金用于向像布兰妮·斯皮尔斯这样的大名人和像詹姆斯·帕特森这样的连载作者支付书籍预付款,这构成了他们业务的主要部分。他们还销售很多圣经、重复畅销书籍如《指环王》以及儿童书籍如《饥饿的毛毛虫》。这两个市场类别(名人书籍和回溯书目中的重复畅销书籍)构成了整个出版业的全部内容,甚至资助了他们的虚荣项目:出版我们在想到书籍出版时所想到的所有其他书籍(这些书籍根本不赚钱,通常销售不到 1000 本)。
文章还详细讨论了审判中的各种细节,包括出版业的商业模式、作者预付款、畅销书籍、市场趋势以及数字化转型对出版业的影响等。
HN 评论 580 comments | 作者:AlbertCory | 1 day ago #
https://news.ycombinator.com/item?id=40119958
这篇帖子中的评论观点包括:
公共图书馆是宝贵资源,提供各种资源和服务;
一些评论指出富人可能不支持公共图书馆,因为这可能增加普通民众的知识水平和批判性思维;
也有评论提到保守派在美国试图禁书和削减教育经费;
还有评论讨论富人对公共资源的态度,以及公共图书馆的资金来源和影响。
Help us invent CSS Grid Level 3, a.k.a. “Masonry” layout #
https://webkit.org/blog/15269/help-us-invent-masonry-layouts-for-css-grid-level-3/
这篇文章讨论了在 CSS Grid Level 3 中发明“Masonry”布局的重要性和挑战。传统上,在网页设计中使用 CSS 浮动布局是非常繁琐和耗时的。CSS Grid Level 1 和 Grid Level 2(Subgrid)已经显著改善了这一点,但是设计师们仍然面临无法实现所有设计布局的问题。其中一个常见问题是如何实现瀑布流布局。文章介绍了“Masonry”布局的概念,即内容像砖墙或石墙一样紧密排列,也被称为“瀑布流”布局。
“Masonry”布局的优点包括允许不同宽高比的内容,避免裁剪或截断内容以使其转换为统一的矩形,以及在页面上分布内容,而不是逐列向下流动。文章还介绍了如何通过 CSS Grid Level 3 提案实现“Masonry”布局,以及如何结合 CSS Grid 的全部功能来定义列、跨列内容、使用子网格和显式放置等。
作者提出了关于 CSS 应该如何处理“Masonry”风格布局的问题,以及是否有必要在 Web 上使用这种布局。他们邀请真实的网页设计师和开发者参与讨论,表达他们的想法和需求。文章还展示了四个演示,展示了为什么“Masonry”布局应该成为 CSS Grid 的一部分,并解释了如果 CSS 工作组创建 display: masonry 而不是将其纳入 CSS Grid 时的替代方案。
最后,文章呼吁读者参与讨论,探讨“Masonry”/“瀑布流”是否应该成为 CSS Grid 的一部分,以及他们对此功能的看法和可能的应用场景。读者被鼓励尝试演示,并在社交媒体上分享他们的想法,以帮助推动这一功能的发展。
HN 评论 312 comments | 作者:achairapart | 14 hours ago #
https://news.ycombinator.com/item?id=40130148
评论中的观点归纳如下:
-
- CSSWG DevRels 正在讨论如何将 Masonry 布局正式纳入 CSS,其中涉及如何处理每种布局选项;
-
- 一些人认为在 Grid 上构建 Masonry 存在紧张关系,因为它们在基本上以不同的方式工作;
-
- Masonry 可能需要不同的轨道尺寸调整算法来解决问题;
-
- 一些人认为 Masonry 不应该成为 Grid 的一部分,因为它不是网格;
-
- 一些人认为在当前 CSS Grid 规范中,“无行”网格很好地适应,但对浏览器引擎作者来说可能会增加难度;
-
- 有人建议使用
flex-grid
作为解决方案,以避免“砌体”这种特定结果命名;
- 有人建议使用
-
- 一些人认为 CSS Grid 是一个错误,认为过去的网页设计更有创意;
-
- 一些人认为 CSS Grid 已经彻底改变了响应式网页设计的方法,使得更复杂的布局成为可能;
-
- 一些人认为 CSS Grid 是为了标准化而存在,但也怀念过去网页设计的创意性。
Phi-3 Technical Report #
https://arxiv.org/abs/2404.14219
这篇论文介绍了 phi-3-mini,这是一个拥有 38 亿参数的语言模型,训练数据量达到了 3.3 万亿标记。该模型在学术基准测试和内部测试中的整体表现与 Mixtral 8x7B 和 GPT-3.5 等模型相媲美(例如,phi-3-mini 在 MMLU 上达到了 69%,在 MT-bench 上达到了 8.38),尽管规模小到可以部署在手机上。
创新完全在于用于训练的数据集,这是 phi-2 使用的数据集的扩展版本,由经过严格筛选的网络数据和合成数据组成。该模型还进一步针对鲁棒性、安全性和聊天格式进行了调整。
我们还提供了一些初始的参数缩放结果,使用了分别训练了 48 万亿标记的 7B 和 14B 模型,称为 phi-3-small 和 phi-3-medium,它们比 phi-3-mini 更具能力(例如,在 MMLU 上分别达到了 75% 和 78%,在 MT-bench 上分别达到了 8.7 和 8.9)。
HN 评论 123 comments | 作者:varunvummadi | 21 hours ago #
https://news.ycombinator.com/item?id=40127806
-
- 对于 Phi-3 模型的评估结果,需要对其性能保持怀疑态度,尤其是在实际任务中可能表现不佳。
-
- 认为小型模型也有可能表现出色,尤其是通过合成数据将大型模型性能转移到小型模型。
-
- 对于 LLM(大型语言模型)适合处理文本中答案明确的任务,如摘要、翻译和回答问题,但在回答问题时更容易产生幻觉。
-
- 针对小型模型在翻译方面表现不佳的观点,尝试各种技巧也无济于事,相比之下,编码器-解码器模型表现更优。
-
- 关于 LLM 训练数据中 95% 为英文的讨论。
-
- 对于 LLM 在长篇摘要任务中回答不完整的观点,提到请求模型“继续”会产生更好的结果。
-
- 讨论了 TruthfulQA 基准测试的争议性,以及在不同语境下训练模型可能导致的结果。
-
- 对于 Chinchilla 优化模型设计的讨论,强调了模型大小和训练数据量之间的权衡。
-
- 讨论了 Phi-2 模型在实际使用中表现不佳的情况,强调了模型过拟合和性能问题。
-
- 讨论了模型蒸馏的有效性,但指出目前尚无可靠机制将大型教师模型的知识蒸馏到较小的学生模型中。
Show HN: Balancing game for the mobile browser with increasing difficulty #
网页上玩的平衡球游戏,3D 的平衡球,需要保持平衡,不要掉到场地外。
HN 评论 89 comments | 作者:nargaw | 13 hours ago #
https://news.ycombinator.com/item?id=40130304
评论中的观点归纳如下:
-
- 对游戏摄像机角度和手机平放位置的不适感觉;
-
- 对游戏中的惩罚机制感到过于严厉;
-
- 建议增加更多生命次数或无限重试机会;
-
- 对游戏与经典游戏 Monkey Ball、Marble Blast 等的联系和比较;
-
- 建议改进游戏体验,如调整光线、加入时间限制等;
-
- 对游戏的反馈、控制、视角等方面提出建议;
-
- 希望有领袖板以及更多游戏元素。
Understanding and avoiding visually ambiguous characters in IDs #
https://gajus.com/blog/avoiding-visually-ambiguous-characters-in-ids
这篇文章讨论了在处理系统中的标识符时避免视觉上模糊的字符的重要性。作者指出了一些常见的视觉上相似的字符,如字母 O 和数字 0、字母 I、小写 l、数字 1 和 7、数字 5 和字母 S 等,这些字符在某些字体或手写形式下难以区分。
这些视觉上的模糊会导致数据输入时的混淆和错误,尤其是在手写或字体不清晰的情况下。文章还提到了一些系统字体中的视觉模糊对比,并探讨了标识符是否应该区分大小写的问题,以及如何选择字符集以避免视觉模糊。
最后,作者分享了自己在项目中生成标识符时使用的字符集,并建议在生成标识符时避免视觉上相似的字符组合。
文章还介绍了一些其他字符集的选择,如 Crockford’s Base32 和 Open Location Code,这些字符集也考虑了避免视觉模糊字符的问题。
HN 评论 190 comments | 作者:gajus | 23 hours ago #
https://news.ycombinator.com/item?id=40127124
这篇帖子中的评论观点包括:
在设备序列号中避免视觉混淆字符,使用不含歧义的字符,避免泄霩商业信息,
使用不易猜测的有效序列号,
避免难以辨认的字符,使用具有清晰区分度的字体,
使用基于用户的编码,避免数字和字母混淆,使用单词代替字符,
考虑不同国家的手写习惯,使用不含歧义的编码系统,避免类似字符的混淆。
North Korean animation outsourcing for Amazon, HBO Max series #
这篇文章讲述了一个北朝鲜互联网服务器的故事,通过一个配置错误的云服务器,让人们能够一窥北朝鲜动画外包业务的世界,以及外国公司可能无意中在信息技术项目中雇用了北朝鲜公司。这个事件也凸显了外国公司很难验证他们外包的工作是否潜在地违反制裁,并最终出现在平壤的电脑上的困难。
故事始于 2023 年底,发现了一个位于北朝鲜 IP 地址上的云存储服务器。这个服务器似乎已经不再使用,配置错误使得每天进出这个服务器的文件都可以被任何人查看,无需密码。
北朝鲜使用这样的服务器是因为该国普通的信息技术工作者没有直接接入互联网的权限。通常,一个组织可能只有一两台具有互联网访问权限的计算机;工作者需要获得批准才能使用这些计算机,并在使用过程中受到监控。
这个云服务器是由运营 NK 互联网博客的 Nick Roy 发现的。在今年 1 月,我们观察到了文件。每天都会出现一批新文件,其中包括动画工作的指示和当天工作的结果。
上传文件的人的身份无法确定。
这些文件通常包含了中文的编辑评论和指示,据推测是由制作公司撰写的,同时还有这些指示的韩文翻译。这表明一个中间人负责在制作公司和动画师之间传递信息。
北朝鲜合作伙伴的身份在观察到的所有文件中从未被揭示,但很可能是 4 月 26 日动画工作室,又称 SEK 工作室。这家总部位于平壤的组织是北朝鲜的主要动画制作公司,为国内电视广播制作系列节目,包括备受欢迎的“松鼠和刺猬”系列。
在过去,它曾参与过几个国际项目,包括在 2000 年代初“阳光政策”时期与韩国公司合作。
然而,2016 年,该工作室被美国财政部制裁为朝鲜国有企业。美国政府曾两次对与该工作室合作或充当中间人的中国公司进行额外制裁,分别是在 2021 年和 2022 年。
文章还提到了一些发现的项目,包括亚马逊原创动画系列“无敌”第三季,马里兰州 YouNeek Studios 创作的超级英雄动画“奇迹之子”,以及日本动画系列“魔导具师达利亚是不低头”,等等。
最后,文章指出了美国政府在 2022 年中期警告公司可能在寻找远程承包商时无意中雇用朝鲜 IT 工作者,包括动画师的可能性。建议公司采取一系列措施,如更好地验证工作文件、视频面试、背景调查和指纹登录,以确保雇佣的工作者被识别并继续在项目上进行工作。
HN 评论 166 comments | 作者:zdw | 1 day ago #
这篇帖子中的评论观点包括:
-
- 对于北朝鲜动画外包给亚马逊和 HBO 的项目的看法,有人认为标题过于夸张,原文指出亚马逊和 HBO 可能并非直接外包给北朝鲜;
-
- 有人认为将核心输入外包给其他公司在经济上不合理;
-
- 讨论了动画外包的历史,如《辛普森一家》在韩国制作等;
-
- 有人提到动画外包已有几十年历史,通常由内部艺术家提供关键帧,外包动画师制作“中间帧”;
-
- 有人认为公司可能只专注于动画技术的发展,而不关注其他重要方面,类似于 TSMC 专注于半导体制造;
-
- 讨论了公司外包核心产品的常见做法和风险;
-
- 有人提到欧盟最近出台法律规定公司对整个生产链负责;
-
- 讨论了公司外包对于产品质量和监督的挑战;
-
- 有人提到软件公司是否外包工程;
-
- 讨论了不同公司外包的例子和观点。
New Foundations is consistent – a difficult mathematical proof proved using Lean #
https://leanprover-community.github.io/con-nf//
这个网站是关于新基础理论(New Foundations)的一项研究,旨在证明其一致性。自 1937 年 Quine 提出新基础理论以来,Randall Holmes 声称已经证明了其一致性。该网站使用交互式定理证明器 Lean 验证了他的证明的困难部分,从而证明了新基础理论的一致性。证明现已完成,定理的陈述可以在 ConNF/Model/Result.lean(源代码,文档)中找到。
该项目的目标是在 Lean 中形式化构建了 Tangled Type Theory(TTT)的模型,从而证明了新基础理论的一致性。项目依赖于 mathlib,这是一个用 Lean 编写的社区数学库,允许使用关于基数和群等内容的熟悉结果,而无需自行证明。
Tangled Type Theory 是一种多重排序集合理论,具有相等性“=”和成员关系“∈”。该理论的构建涉及基本类型的构造、每个类型的构造、控制每个类型的大小以及最终的归纳过程等步骤。
整个项目的构建过程涉及构造模型的基本类型、每个类型的构造、控制每个类型的大小以及最终的归纳过程。通过这些步骤,成功构建了 Tangled Type Theory 的模型,证明了新基础理论的一致性。
HN 评论 78 comments | 作者:namanyayg | 12 hours ago #
https://news.ycombinator.com/item?id=40130924
-
- Lean 的证明很少出错的危险,但需要仔细阅读结论以确保正确性。
-
- Lean 无法检查定义和定理陈述与其英文对应是否匹配,需要谨慎翻译。
-
- 人类将始终参与软件创建,因为澄清人类意图需要人类参与。
-
- 机器学习模型已经写出比大多数母语为英语的人更好的英语,但不应完全依赖。
-
- 使用 Lean 的基础透视很重要,NF 和 Lean 核心之间的等价性证明是基础的一部分。
-
- NF 的形式化不容易受到错误的影响,但库的使用仍需谨慎。
-
- 人类交互有助于建立信心,但软件非常可靠,基于定理证明软件中的错误挑战不会站得住脚。
-
- Lean 的规约比验证/证明更重要,我们受限于我们的命题的准确性。