2023 12 24 HackerNews

Ferret: A Multimodal Large Language Model #

https://github.com/apple/ml-ferret

这是苹果公司的 ml-ferret 项目的 GitHub 页面。该页面提供了有关 ml-ferret 项目的详细信息,包括项目概述、关键贡献、发布信息、安装指南、训练和评估说明以及演示示例等。

ml-ferret 是一个端到端的多模态语言与视觉模型,用于在机器学习语言模型(MLLM)中进行细粒度的指代和定位。该项目的主要贡献是 Ferret 模型和 GRIT 数据集,以及 Ferret-Bench 评估基准。Ferret 模型结合了混合区域表示和空间感知的视觉采样器,实现了在 MLLM 中细粒度和开放词汇的指代和定位。GRIT 数据集是一个大规模、分层、鲁棒的指导性调优数据集。Ferret-Bench 是一个多模态评估基准,要求同时进行指代/定位、语义、知识和推理。

该项目提供了安装、训练、评估和演示的说明。您可以按照页面上提供的步骤进行操作,以安装 ml-ferret 并使用提供的示例进行训练和演示。

请注意,该项目的数据和代码仅供研究使用,并受限于 LLaMA、Vicuna 和 GPT-4 的许可协议。数据集采用 CC BY NC 4.0 许可,使用该数据集训练的模型不应用于研究目的之外的其他用途。


HN 评论 238 comments | 作者:weirdcat | 9 hours ago #

https://news.ycombinator.com/item?id=38745348

这篇评论中的各种观点如下:

  1. 对于谷歌在可访问性领域的表现不满意,希望苹果能提供更好的图像描述。
  2. 对于苹果正在开发的大型多模态语言模型表示期待,认为苹果在硬件和软件 AI 领域的发展有潜力超越微软 / 开放 AI 和谷歌。
  3. 对于苹果的自动完成功能表示不满,认为安卓平台的表现更好。
  4. 认为苹果可能会在 iOS 18 中推出基于 AI 的更新,并可能提供在线和离线场景的不同功能。
  5. 对于苹果的机器学习支持的不足表示担忧,认为他们需要赢得开发者的信任。
  6. 称赞苹果在硬件方面的表现,如 FaceID、照片中的面部识别和 “回忆” 功能等。
  7. 讨论了多模态大型语言模型的命名问题。
  8. 认为苹果在软件方面有待提升,但不会像其他厂商那样进行长时间的炒作和失望。
  9. 讨论了苹果的产品发布策略和成功记录。
  10. 对苹果可能在 LML 领域取得的进展表示期待,但也对他们过去的表现持怀疑态度。
  11. 讨论了苹果在音乐、耳机和虚拟现实等领域的竞争地位。
  12. 对于苹果的营销策略和泄漏信息表示怀疑。
  13. 对于苹果的 AI 助手 Siri 的可用性表达了期望,希望它能变得更好。
  14. 认为苹果应该彻底取消 Siri,因为其他开发者已经创建了更好的助手。
  15. 讨论了苹果对于关键词的控制权。

Xmas.c (1988) #

https://udel.edu/~mm/xmas/

文章是关于一个名为"xmas.c"的 C 代码的摘要。这个代码是在 1988 年赢得了国际混淆 C 代码大赛的一个令人印象深刻的作品。文章对代码进行了解析,并提供了代码的下载链接。代码实现了一个文本压缩标准,通过使用替代密码和递归来打印出圣诞颂歌的歌词。文章还提供了代码的简化版本。

文章的内容比较长,涉及了代码的详细解析和简化过程。以下是文章的主要内容:

代码解析:文章对代码进行了解析,解释了代码中各个部分的功能和作用。代码使用了替代密码和递归来实现文本压缩和打印圣诞颂歌的歌词。

代码简化:文章提供了对代码的简化版本,使用了迭代和 C 字符串库函数来替代递归和复杂的条件语句。简化后的代码更易读和理解。


HN 评论 63 comments | 作者:evah | 8 hours ago #

https://news.ycombinator.com/item?id=38745668

这是一个关于 1988 年的 C 语言程序的讨论。该程序是一个打印圣诞颂歌《12 Days of Christmas》歌词的程序。

评论中提到了一些与该程序相关的观点和讨论,包括与 TeX 世界的类比、Kolmogorov 复杂性、最短 C 程序的世界纪录等等。还有一些关于编译器警告、压缩算法等的讨论。

总的来说,这篇帖子主要是关于这个程序的技术讨论和相关观点的交流。


They want you to forget what a film looks like #

https://aftermath.site/true-lies-4k-uhd-blu-ray-james-cameron-peter-jackson-park-road-post

这篇文章讨论了电影《真实的谎言》(True Lies)在 4K 转换过程中出现的问题。文章指出,最近对《真实的谎言》以及《异形 2》(Aliens)、《深渊》(The Abyss)和《泰坦尼克号》(Titanic)等电影进行的转换存在着问题。这些转换使用了专有技术来覆盖和去噪历史影像,导致画面质量变差,失去了电影原本的外观和质感。

文章指出,《真实的谎言》的转换质量非常糟糕,画面看起来令人不适,充满了人工智能生成的图像的痕迹。《异形 2》和《深渊》的转换质量相对较好,但仍然存在问题,皮肤看起来过于光滑,去除了过多的胶片颗粒。《泰坦尼克号》的最新转换也遭到了类似的对待,引发了在线上的不同反应。

文章提到,这些转换是由彼得·杰克逊(Peter Jackson)旗下的 Park Road Post 负责的。Park Road Post 曾参与多部电影的修复工作,其中最相关的是杰克逊的《他们不会长大》(They Shall Not Grow Old)和迪士尼 + 纪录片《披头士:回来》(The Beatles: Get Back)。这两部电影都使用了机器学习的技术,重新解读了现有的影像素材。然而,这些转换的效果并不理想,画面看起来不自然,充满了人工处理的痕迹。

文章指出,使用机器学习技术进行修复和转换有其合理的用途,但是这些技术往往被用来替代正确的处理方法。正确的修复和转换需要大量的专业知识和劳动力,而现代的人工智能技术则试图减少这些工作量。然而,如果原始素材质量不好,使用人工智能技术进行转换往往会产生不理想的结果。

文章最后指出,许多人可能认为这些转换效果很好,因为他们喜欢过度平滑和高帧率的媒体。然而,这种趋势可能导致人们忘记电影原本的外观和质感,将过去的影像去噪、管理颗粒并清洁以符合现代标准。文章认为,保护电影的目的不应该是破坏电影本身,应该尽可能将电影保护与盈利动机分离。


HN 评论 178 comments | 作者:zer00eyz | 21 hours ago #

https://news.ycombinator.com/item?id=38741536

有人对最近的披头士项目感到非常激动,甚至流泪,但也有人对这些项目进行了批评。

有人喜欢对经典影片进行提升和着色,而有人则对此表示不满。

有人认为对电影进行去噪处理可以提高压缩效率,从而降低流媒体成本。

有人对电影的颜色校正表示不满,认为这种处理破坏了原始作品的效果。

有人对电影的画质提升表示质疑,认为这种处理可能导致画面看起来不真实或人工。

有人对电影的原始版本进行了讨论,包括原始负片和彩色分离存档等。

这些观点涵盖了对电影修复、提升和着色等技术的不同看法。不同的人对这些技术的应用和效果有不同的意见。


Suno AI #

https://www.suno.ai/

Suno AI 致力于构建一个未来,让任何人都能制作出优秀的音乐,无需乐器,只需想象力。他们的团队由音乐家和人工智能专家组成,总部位于马萨诸塞州的剑桥市。

他们的目标是打破您与梦想中的音乐之间的障碍。网站提供了关于团队的信息以及他们的联系方式。此外,他们还提供了一些关于如何制作音乐的提示和建议。

然而,我无法提供更详细的摘要,因为该网站上的内容非常简洁,没有具体的文章或文本可供摘要。如果您有特定的问题或需要进一步了解 Suno AI 的某个方面,请告诉我,我将尽力提供帮助。


HN 评论 108 comments | 作者:elsewhen | 13 hours ago #

https://news.ycombinator.com/item?id=38743719

帖子中的评论主要涉及用户对 Suno AI 的使用体验和生成的音乐的评价。

有些用户表示他们通过 Suno AI 生成了一些有趣的音乐,包括 8 位印度电子音乐和饶舌歌曲。

还有一些用户分享了他们使用 Suno AI 生成的完整歌曲,并提供了一些技巧和建议,例如如何使用“continue from this clip”功能和如何使用 DAW(数字音频工作站)进行后期处理。

此外,还有一些用户讨论了生成音乐的长度限制以及与其他类似项目(如 Uberduck)的比较。总体而言,用户对 Suno AI 的体验和生成的音乐持积极评价。


Endurain: Self-hosted Strava like service #

https://github.com/joaovitoriasilva/endurain

这是一个 GitHub 存储库,名为"endurain",由用户"joaovitoriasilva"创建和维护。该存储库的描述是一个类似于Strava的服务,可以自主托管。

它使用 PHP+HTML+ 基本 JS+Bootstrap CSS 作为前端,Python FastAPI 和 stravalib 作为后端,MariaDB 作为数据库引擎,Jaeger 作为基本的可观察性使用。

存储库中提供了 Docker 镜像以部署该服务,并且可以查看"docker-compose.yml"文件以获取示例。

存储库还列出了前端和后端所需的环境变量。该项目目前支持多用户、用户管理、活动导入、与 Strava 连接、活动展示等功能,并列出了一些待办功能。存储库中还提供了详细的环境变量和依赖项信息。


HN 评论 108 comments | 作者:thunderbong | 16 hours ago #

https://news.ycombinator.com/item?id=38742637

有用户表示正在逐渐转向类似 https://intervals.icu/的服务,因为它是基于捐赠的“开源”服务,比 Strava 更好。

有用户指出,自动跟踪智能手表记录的活动是一个缺失的功能,目前的解决方法是将这些活动自动导入到 Strava 并将 Strava 与 Endurain 连接起来。

有用户指出,Web 应用程序确实可以自动从 Garmin 智能手表导入活动。Garmin 提供了一个 REST 接口来导入 FIT 活动。

有用户指出,Garmin Connect 开发者计划理论上只对企业开放,而不是个人项目。但也有用户表示,在 COVID 期间,他们通过友好地发送电子邮件获得了访问权限。

有用户表示他们无法通过 API 访问自己的数据,尽管这些数据可以在网站上下载。

有用户提到了一些反向工程的库,可以与 Garmin 设备进行通信。

有用户指出,智能手表通常不会直接将活动上传到 Strava,而是连接到制造商的云服务(如 Garmin Connect),而 Strava 与这些云服务有 API 集成。

有用户提到了苹果手表可以通过 Health App 直接将活动导入到 Strava。

有用户提到了一些关于 Strava 的评论,包括对隐私和安全的担忧,以及 Strava 作为社交网络的功能。

请注意,这些摘要只是评论的一小部分,可能不代表所有观点。阅读完整的评论以获取更全面的了解。


Meta censors pro-Palestinian views on a global scale, Human Rights Watch claims #

https://www.theguardian.com/technology/2023/dec/21/meta-facebook-instagram-pro-palestine-censorship-human-rights-watch-report

根据《卫报》上的一篇文章,人权观察组织(Human Rights Watch)的一份新报告称,自 10 月 7 日以色列-加沙战争爆发以来,Meta 在全球范围内对支持巴勒斯坦的内容进行了“系统性和全球性”的审查。该组织在一份长达 51 页的报告中记录和审查了 Meta 在 Facebook 和 Instagram 上删除内容、暂时或永久封禁账户的超过一千个报告的情况。根据人权观察组织的报告,Meta 展示了对支持巴勒斯坦和巴勒斯坦人的内容进行“六种不当审查”的关键模式,包括删除帖子、故事和评论;禁用账户;限制用户与他人帖子的互动能力;以及“阴影封禁”,即显著减少个人材料的可见性和影响力。报告中列举的例子包括来自 60 多个国家的内容,主要是英文,以各种方式表达对巴勒斯坦的和平支持。报告称,甚至人权观察组织自己寻求在线审查例子的帖子也被标记为垃圾邮件。

Meta 在对此作出回应时承认会犯错误,这对人们来说是“令人沮丧的”,但否认有意压制特定声音的说法。Meta 表示,声称在大量关于冲突的内容中,仅凭 1,000 个例子就证明“系统性审查”是误导性的。Meta 表示,它是全球唯一一家公开发布与以色列和巴勒斯坦问题相关的人权尽职调查的公司。Meta 的声明称:“这份报告忽视了在快速变化、高度两极化和紧张的冲突期间全球执行我们政策的现实情况,这导致我们收到的举报内容增加。我们的政策旨在让每个人都有发声的机会,同时确保我们的平台安全。”

这是本月 Meta 第二次因被指定期压制支持巴勒斯坦的内容和声音而受到质疑。上周,马萨诸塞州民主党参议员伊丽莎白·沃伦写信给 Meta 的联合创始人兼首席执行官马克·扎克伯格,要求提供信息,因为自 10 月以来,有数百名 Instagram 用户报告称他们的内容被降级或删除,并且他们的账户受到了阴影封禁。

Meta 的监督委员会在周二表示,Meta 错误地删除了两个特定的冲突视频,这是错误的。该委员会表示,这些视频对“向世界展示双方人民的人道主义苦难”具有价值。其中一个视频通过 Instagram 展示了加沙的阿尔-希法医院附近空袭后的情况,另一个视频通过 Facebook 展示了 10 月 7 日袭击中被劫持的一名妇女。这些视频片段已经恢复。

Meta 产品的用户记录了他们所说的技术偏向支持以色列的内容,而对支持巴勒斯坦的帖子则持反对态度。Instagram 的翻译软件将后面跟着阿拉伯语短语“感谢真主”(Praise be to Allah)的“巴勒斯坦人”翻译为“巴勒斯坦恐怖分子”。WhatsApp 的人工智能在被要求生成巴勒斯坦男孩和女孩的图像时,生成了带有枪支的卡通儿童,而生成的以色列儿童图像则不包括枪支。

以上是对该文章的摘要。


HN 评论 241 comments | 作者:cratermoon | 8 hours ago #

https://news.ycombinator.com/item?id=38745673

有人指出 Instagram 上的标签“#GazaStarving”被无故禁止,认为存在不公正的审查。

有人提到在冲突开始时,他注意到他的信息流完全倾向于支持以色列,直到 11 月底才开始出现要求停止对平民轰炸的帖子。他认为 Meta 的算法决定不向他展示这些帖子。

有人认为在社交媒体上不应该进行任何审查,而应该快速标记虚假或宣传性的内容,并解释为什么是虚假的,就像 Xitter 一样。

有人表示对于内容平台来说,审查是一项非常困难的任务,因为需要平衡各种法律规定、道德标准和用户偏好。他们认为按时间顺序显示帖子并不适合人类阅读,尤其是当你关注的人越来越多时。

有人认为应该给用户更多关于审查决策的可见性,例如删除帖子的统计数据、更明确的审查规则以及公开的审查决策理由。

有人认为社交媒体的算法推荐功能很难在存在真正冲突的问题上做出良好的覆盖,他们更倾向于从新闻网站、播客、小组讨论和与信任的人进行一对一交流中获取信息。

请注意,这些摘要仅代表该帖子下评论者的观点,可能不代表所有人的意见。


In 2023 Organic Maps got its first million users #

https://organicmaps.app/news/2023-12-23/in-2023-organic-maps-got-its-first-million-users/

根据提供的链接,这篇文章是关于 Organic Maps 在 2023 年获得了第一百万用户的消息。文章提到了一些关于 Organic Maps 在 2023 年的新功能、更新和改进,以及用户评分和贡献者的统计数据。此外,文章还提到了 Organic Maps 在 2024 年的目标和未来计划。

以下是文章的摘要:

在 2023 年,Organic Maps 获得了第一百万用户,并感谢了社区的支持和捐赠。

在 2023 年,Organic Maps 添加了一些新功能,包括 GPX 导入、测量工具、户外地图样式、背景语音导航、Android Auto 等。

在 2023 年,Organic Maps 发布了 15 个应用程序更新和修复程序,并进行了搜索和路线规划、地图图标和样式以及用户体验的改进。

在 Google Play 上,Organic Maps 的平均评分为 4.6,来自 7372 名用户;在 AppStore 上,平均评分为 4.8,来自 2717 名用户。

在 Github 上,有 167 名贡献者提交了 1992 个代码提交,合并了 960 个 Pull 请求,关闭了 724 个问题。

在 OpenStreetMap 上,有近 9000 次编辑和地图贡献。

Organic Maps 的目标之一是提供一个注重隐私的地图替代品,另一个目标是教育和吸引更多用户为 OpenStreetMap 做贡献。

Organic Maps 希望通过捐赠来扩展基础设施、奖励贡献者或雇佣全职团队,以实现更多的目标。

Organic Maps 还提到了一些在 2023 年 12 月发布的新功能,包括 Android Auto、户外地图样式、搜索村庄地址等。

请注意,这是根据提供的链接和文章内容进行的摘要,可能不包含所有细节。建议阅读完整的文章以获取更多信息。

文章链接:In 2023 Organic Maps got its first million users


HN 评论 77 comments | 作者:RicoElectrico | 7 hours ago #

https://news.ycombinator.com/item?id=38746187

有用户表示 Organic Maps 是最好的免费徒步应用程序,因为它可以导航到任何位置,并显示海拔变化的概况。

有用户希望 Organic Maps 能够实现书签同步功能,以防止丢失书签。

有用户建议将书签导出到文件,并使用自己的工具进行同步。

有用户提到使用 Syncthing 或 KDE Connect 来在设备之间同步文件夹。

有用户认为这种方法不方便,并表示普通用户不太可能这样做。

有用户表示 Organic Maps 的用户不是普通用户,他们更关注隐私和完全离线的替代品。

有用户认为保存文件对于普通用户来说并不困难,但也有用户质疑如何保存文件的工作流程。

有用户建议将文件自动保存到备份位置。

有用户表示他们更喜欢将数据保存在自己的文件系统中,而不是使用云存储。

有用户提到 iOS 的 iCloud API 和 Android 的 Google 存储可以用于自动备份。

有用户对 WhatsApp 的备份方式表示不满,因为它不允许将备份保存到文件。

有用户提到 WhatsApp 实际上可以备份到文件,但需要找到一个隐藏的文件夹。

有用户提到在 Android 上可以使用 Google Drive 进行备份。

有用户表示对于隐私和开放平台来说,支持 iCloud 备份可能不符合 Organic Maps 的目标。

有用户建议使用 OpenStreetMap(OSM)来改善 POI(兴趣点)数据的质量,但也有用户表示在某些地区更新 POI 数据很困难。

有用户提到 Street Complete 是一个友好的应用程序,可以帮助改善 OSM 数据。

请注意,这些摘要只是对帖子评论的概述,并不代表所有观点。阅读完整的评论以获取更全面的了解。

摘要来源:Hacker News


How Pinterest scaled #

https://read.engineerscodex.com/p/how-pinterest-scaled-to-11-million

这篇文章是关于 Pinterest 如何在只有 6 名工程师的情况下扩展到 1100 万用户的。以下是文章的摘要:

Pinterest 于 2012 年 1 月达到了 1170 万月活跃用户,当时只有 6 名工程师。在 2010 年 3 月推出后,Pinterest 成为当时增长最快的公司,突破 1000 万月活跃用户的速度最快。

Pinterest 是一个以图片为主的社交网络,用户可以将图片保存或“固定”到他们的画板上。

Pinterest 的技术堆栈选择了已知且经过验证的技术,并遵循简单和限制选择的原则。他们采用了能够添加更多相同节点以进行扩展的架构。

Pinterest 的初始架构包括一个小型的 MySQL 数据库、一个小型的 Web 服务器和一个工程师。随着用户的增长,他们逐渐演进了架构,引入了更多的服务器和数据库技术。

在快速增长的过程中,Pinterest 犯了一个错误,他们过度复杂化了架构,使用了多种不同的数据库技术。这导致了数据损坏和其他问题。

Pinterest 后来决定简化架构,去除了不太成熟的技术,如数据库集群和 Cassandra,转而使用经过验证的 MySQL 和 Memcached。

Pinterest 采用了数据库分片的方法来处理大量数据,通过将单个数据集分成多个数据库来实现高可用性和负载均衡。

随着用户的增长,Pinterest 的工程团队逐渐扩大,但架构基本保持不变,只是增加了更多相同类型的系统。

Pinterest 还采用了独特的 ID 结构来处理分片数据库,使用 64 位 ID 来标识对象类型和位置。

文章基于 Pinterest 团队在 2012 年的演讲《Scaling Pinterest》。

请注意,这是我根据链接提供的信息进行的摘要,具体内容可能会有所不同。


HN 评论 138 comments | 作者:stanulilic | 16 hours ago #

https://news.ycombinator.com/item?id=38742692

有人认为在 2012 年,Pinterest 只有 6 名工程师,却拥有 1170 万月活跃用户。他们认为现在应该追求的目标是如何用 6 名工程师扩展到 1 亿用户以上。

有人认为现在的技术环境更加复杂,存在人为的复杂性和过度工程化的问题。

有人质疑硅谷是否过于依赖水平扩展,而忽视了垂直扩展的瓶颈问题。

有人指出,水平扩展的缺点是数据迁移、架构变更、备份和恢复等操作耗时,而且缺乏故障隔离能力。

有人认为垂直扩展在成本上更昂贵,而水平扩展在云服务提供商(如 AWS)中更具成本优势。

有人提到 Python 和 Ruby 等编程语言在垂直扩展方面存在一些限制和性能问题。

有人讨论了团队的稳定性和工程师的流动性对技术决策的影响。

有人提到 Pinterest 的技术架构在过去十年中发生了很大变化,现在的用户规模是当时的 40 倍。

请注意,这些摘要仅代表帖子中的一部分观点,可能不包含所有评论。阅读完整的帖子和评论可以获得更全面的了解。