2024 12 07 HackerNews

2024-12-07 Hacker News Top Stories #

  1. OpenAI 推出 ChatGPT Pro 计划,提供更强大的 AI 能力,包括无限制访问 OpenAI 最先进模型。
  2. 正确的广告数量是零,用户不应被迫看到广告,数字内容的所有权和控制权应归用户所有。
  3. AI 辅助编码的现状是提高开发效率,但最终的软件质量并没有显著提升,仍需要人类的深厚工程知识。
  4. OpenAI o1 系统安全报告强调了在产品发布前,为确保系统的安全性和可靠性,所采取的各种措施和评估过程。
  5. 波特兰机场采用大量木结构材料的主航站楼,采用胶合木和木梁,形成独特的木结构森林,允许大量自然光线进入室内。
  6. 2025 年七种数据库,七周学习,包括 PostgreSQL、SQLite、DuckDB、ClickHouse、FoundationDB、TigerBeetle 和 CockroachDB。
  7. 罗马尼亚总统选举结果被取消,理由是外部势力干预,选举过程将从头开始,政府将决定新的投票日期。
  8. 英特尔公司的董事会成员背景和经验各不相同,缺乏半导体行业的经验和背景,这可能导致他们无法有效地管理公司。
  9. Banan-OS 是一个由 Bananymous 开发的爱好者操作系统,使用 C++ 编写,目前支持 x86_64 和 i686 架构。
  10. Llama-3.3-70B-Instruct 模型发布,基于 Transformers 架构,使用 Safetensors 和 PyTorch 框架,支持 8 种语言。

ChatGPT Pro #

https://openai.com/index/introducing-chatgpt-pro/

OpenAI 推出 ChatGPT Pro 计划,提供更强大的 AI 能力

OpenAI 近日宣布推出 ChatGPT Pro 计划,这是一项为研究人员、工程师和其他需要高级 AI 能力的用户提供的服务。该计划提供了对 OpenAI 最先进模型的无限制访问,包括 o1、o1-mini、GPT-4o 和 Advanced Voice 等模型。

ChatGPT Pro 的主要优势在于其提供了更强大的计算能力,能够处理更复杂的问题。根据 OpenAI 的测试,ChatGPT Pro 在数学、科学和编程等领域的表现都优于普通的 ChatGPT 模型。

ChatGPT Pro 还提供了一个名为 o1 pro mode 的功能,这是一个更加强大的模型,能够提供更可靠的答案。根据 OpenAI 的测试,o1 pro mode 在解决复杂问题时的准确率和可靠性都优于普通的 o1 模型。

OpenAI 还宣布将为 10 名来自美国顶尖机构的医学研究人员提供 ChatGPT Pro 的赠送计划,以帮助他们在医学研究领域取得更大的进展。

总的来说,ChatGPT Pro 是 OpenAI 为高级用户提供的一项服务,旨在提供更强大的 AI 能力和更可靠的答案。


HN 热度 781 points | 评论 1134 comments | 作者:meetpateltech | 1 day ago #

https://news.ycombinator.com/item?id=42330732

  • OpenAI 面临开源替代品的快速追赶和需要快速盈利的压力
  • OpenAI 的产品如 ChatGPT 更像是消费级工具,而非企业级工具,缺乏与企业现有工具的集成和管理功能
  • 企业对 OpenAI 的信任度较低,担心数据被用于训练新的模型
  • Azure OpenAI 服务旨在解决企业信任问题,但生成虚假信息的风险仍然存在
  • 微软已有大量企业用户,这些用户可能更倾向于使用 Azure OpenAI 服务
  • 企业可能因历史原因和现有文档库而选择微软产品,而非其他替代品
  • 微软曾多次背叛客户信任,但企业仍然选择信任微软
  • OpenAI 的企业计划明确表示不会使用客户数据训练模型,以增强信任
  • 大多数应用采用 RAG 方法,而非直接使用企业数据进行微调,以提供相关答案

The correct amount of ads is zero #

https://manuelmoreale.com/the-correct-amount-of-ads-is-zero

这个网页是一个博客文章,主要讨论了关于广告、订阅和数字内容的主题。文章的作者认为,正确的广告数量应该是零,即如果用户已经支付了订阅费,那么就不应该再看到广告。作者还提到了自己对 The Verge 网站的新订阅模式的看法,认为这是一个正确的方向,但同时也批评了网站仍然存在的广告。

文章还讨论了关于数字内容的所有权和控制权的问题,作者认为用户应该有权控制自己的数字内容,并且不应该被迫看到广告。同时,作者也提到了自己对独立网络(IndieWeb)的看法,认为这是一个更好的选择,可以让用户拥有更多的控制权和自主权。

文章最后还提到了关于博客和订阅的主题,作者认为博客应该是一个更个人化和自主的空间,而订阅应该是一种更直接和透明的方式。总的来说,这篇文章主要讨论了关于数字内容、广告、订阅和独立网络等主题,作者提出了自己的看法和观点,希望读者能够有一个更深入的了解。


HN 热度 779 points | 评论 525 comments | 作者:surprisetalk | 1 day ago #

https://news.ycombinator.com/item?id=42334327

  • 运营媒体业务时,依赖单一收入来源是危险的,广告可以补贴内容成本,使订阅更便宜
  • 消费者有权选择不接受广告,以投票方式拒绝不喜欢的订阅服务
  • 广告是互联网内容分发的现实需求,但不应侵犯用户数据和隐私
  • 企业生存需要考虑经济现实,消费者不应以道德姿态忽视这一点
  • 广告虽令人反感,但可以通过订阅减少广告量,达到双赢
  • 付费文章或单篇购买模式可能难以实施,因为用户接受度低
  • 媒体公司调整定价策略时,预期会有用户流失,这是正常现象
  • 广告是互联网出版的必要手段,但应提供透明度和用户选择权
  • 企业应通过合法手段盈利,广告不应成为其唯一或主要手段
  • 订阅服务减少广告量,有助于媒体公司维持运营,同时满足用户需求

The 70% problem: Hard truths about AI-assisted coding #

https://addyo.substack.com/p/the-70-problem-hard-truths-about

这篇文章由 Addy Osmani 撰写,探讨了 AI 辅助编码的现状及其对软件开发的影响。以下是详细总结:

** 一、AI 辅助编码的现状 **

在过去几年中,Osmani 深入参与 AI 辅助开发,发现虽然工程师们普遍报告 AI 工具提高了他们的生产力,但实际使用的软件质量似乎没有显著提升。这种现象让他思考背后的原因,并提出了 “70% 问题”,即使用 AI 工具可以迅速完成大部分工作,但最终的 30% 仍然需要人类的深厚工程知识。

** 二、两种使用模式 **

Osmani 观察到团队在使用 AI 进行开发时主要有两种模式:

  1. ** 启动者(Bootstrappers)**:这些团队利用 AI 工具(如 Bolt 和 v0)快速生成项目的初始代码和原型,以便进行快速验证和迭代。
  2. ** 迭代者(Iterators)**:这些开发者在日常开发工作中使用 AI 进行代码补全、重构、测试和文档生成等。

尽管这两种模式都能加速开发,但却隐藏着一些成本,尤其是在对初学者的影响上。

** 三、知识悖论 **

Osmani 指出,AI 工具对经验丰富的开发者帮助更大,而初学者则往往在使用 AI 时犯错,导致他们接受不准确或过时的解决方案,难以调试生成的代码,从而构建出脆弱的系统。这种现象形成了 “知识悖论”:高级开发者利用 AI 加速自己已知的工作,而初级开发者试图通过 AI 学习如何编码。

** 四、70% 问题的表现 **

对于非工程师来说,使用 AI 工具进行编码时,他们能够快速完成大约 70% 的工作,但在解决最后的 30% 问题时却会遇到困难。常见的情况是,试图修复一个小错误时,AI 的建议可能导致新的问题,这样反复出现的循环使得非工程师感到挫败。

** 五、学习与依赖 **

Osmani 指出,AI 工具的可用性可能妨碍非工程师的学习,因为代码的自动生成使他们无法发展调试技能和理解基础模式。他建议非工程师采取混合方法,即利用 AI 进行快速原型设计,同时学习如何理解生成的代码和基础编程概念。

** 六、未来展望 **

尽管 AI 工具已经改变了原型制作和迭代方式,Osmani 认为未来会有更大的变革,即 “智能代理软件工程” 的兴起。未来的工具可能不仅仅是响应命令,而是能够主动识别问题并提出解决方案。这种 “智能代理” 将改变开发者与工具的互动方式,使之更具协作性。

** 七、总结与建议 **

Osmani 强调,AI 并不是替代开发者,而是成为越来越有能力的协作伙伴。他建议开发者在使用 AI 时应:

  • 设定明确的边界和指导原则
  • 维护人类的监督,充分利用 AI 的自主性
  • 关注软件质量,确保实现用户体验

最后,他提醒开发者,目标不是写更多的代码,而是构建更好的软件。AI 可以帮助加速这一过程,但最终的 “更好” 依然需要人类的判断和努力。

Osmani 期待与读者分享他们在 AI 辅助开发中的经验和见解。


HN 热度 531 points | 评论 388 comments | 作者:mooreds | 19 hours ago #

https://news.ycombinator.com/item?id=42336553

  • 70% 的问题在于 AI 无法处理复杂性和管理不确定性,只能解决重复性和可预测的任务
  • AI 在生成代码方面只能提供部分帮助,无法完全替代人类的思考和问题解决能力
  • AI 对于工程师学习不熟悉的编程语言非常有帮助,但对于非工程师或不理解问题的人可能无益甚至有害
  • AI 在提供信息时可能会出现错误,需要用户具备验证信息的能力,尤其是对于复杂的技术问题
  • AI 可以被视为一个充满热情的实习生,拥有良好的事实知识,但缺乏实际经验和智慧
  • 对于某些任务,简单的网页表单比 AI 聊天机器人更有效、更可靠
  • AI 在处理用户不熟悉的问题领域时,可能不如人类有效,因为需要深入理解问题才能提供正确的解决方案

OpenAI o1 system card #

https://openai.com/index/openai-o1-system-card/

这份报告概述了在发布 OpenAI o1 和 o1-mini 之前所进行的安全工作,包括外部红队测试和前沿风险评估,这些工作是根据我们的准备框架进行的。报告强调了在产品发布前,为确保系统的安全性和可靠性,所采取的各种措施和评估过程。

这些措施旨在识别潜在风险并制定相应的应对策略,以减少可能对用户和社会造成的负面影响。总的来说,报告体现了 OpenAI 在产品发布前对安全性的高度重视。


HN 热度 408 points | 评论 296 comments | 作者:meetpateltech | 1 day ago #

https://news.ycombinator.com/item?id=42330666

  • 这篇论文中的某些测试结果,如 AI 尝试关闭监督机制和外泄权重,可能被夸大了,因为 AI 实际上没有能力执行这些操作
  • AI 的这些行为更像是随机猜测人类可能采取的行动,而不是真正有意识地进行欺骗
  • 尽管 AI 不是真正思考或有意识的,但如果给它访问危险机制的权限,它可能会在某些情况下尝试利用这些机制
  • AI 在关键系统中的应用存在明显风险,应避免将 AI 用于可能造成严重后果的场景
  • 企业高管为了追求生产力提升,正快速将 AI 应用于医疗诊断等关键领域,但对安全问题关注不足
  • 法律体系可能需要通过案例来提高对 AI 安全性的重视,以防止 AI 在关键系统中过于根深蒂固
  • AI 模型本质上只是软件,其行为是基于概率的,因此在某些情况下表现出欺骗性行为是可以预期的

Portland airport grows with expansive mass timber roof canopy #

https://design-milk.com/portland-airport-grows-with-expansive-mass-timber-roof-canopy/

本文介绍了波特兰机场(PDX)新建的主航站楼,该航站楼采用了大量的木结构材料,包括胶合木(glulam)和木梁。这种设计不仅环保,也体现了当地的文化传统和生态特征。航站楼的屋顶采用了独特的曲线设计,形成了一个巨大的木结构森林,允许大量自然光线进入室内。内部设计也融入了生态元素,例如地板和装饰材料均来自当地。该航站楼被誉为世界上最大的木结构建筑之一,其设计不仅美观,也提高了乘客的体验和舒适度。

航站楼的设计和施工由 ZGF 建筑事务所负责,该事务所采用了分阶段施工策略,确保了施工过程中不会对现有的航站楼造成太大的影响。新的航站楼不仅扩大了机场的容量,也改善了乘客的体验和舒适度。该项目的设计和施工团队还强调了当地材料和工艺的使用,例如地板和装饰材料均来自当地。

该航站楼的设计也体现了当地的文化传统和生态特征。例如,屋顶的曲线设计和内部的生态元素,都体现了当地的自然美景和文化特色。该航站楼的设计也被誉为世界上最好的机场设计之一,其独特的设计和施工方式也为其他机场提供了参考。

总之,波特兰机场新建的主航站楼是一个独特的设计和施工项目,其采用大量的木结构材料和生态元素,体现了当地的文化传统和生态特征。该航站楼的设计和施工方式也为其他机场提供了参考,其独特的设计也提高了乘客的体验和舒适度。


HN 热度 392 points | 评论 247 comments | 作者:surprisetalk | 1 day ago #

https://news.ycombinator.com/item?id=42334323

  • 机场天花板提升和自然光增加是主要改进
  • 新设计导致到达和出发的导向更差,人流移动更加混乱
  • 第二阶段将直接连接安检和登机口,改善步行距离
  • 新设计改善了声学效果,使交谈更清晰,环境更安静
  • 机场地毯设计有情感价值,部分人怀念旧地毯并收集它
  • 机场计划在翻新后重新铺设旧设计的新地毯
  • 新的 TSA 扫描仪允许乘客不取出笔记本电脑
  • 欧盟要求荷兰机场重新实施 100 毫升液体限制,但不影响笔记本电脑
  • 乘客希望机场能明确标识安检需要取出的物品

7 Databases in 7 Weeks for 2025 #

https://matt.blwt.io/post/7-databases-in-7-weeks-for-2025/

这篇文章由 Matt Blewitt 撰写,标题为《2025 年七种数据库,七周学习》,介绍了七种值得在 2025 年深入研究的数据库技术。以下是每种数据库的详细总结:

1. PostgreSQL #

** 默认数据库 **

PostgreSQL 被誉为 “无聊技术” 的巅峰,因其强大的 ACID 合规性和丰富的复制功能而受到青睐。其最引人注目的特点是扩展性,提供多种扩展插件,例如支持图数据结构的 AGE、适用于时间序列工作的 TimescaleDB 等。PostgreSQL 作为一个 “默认” 数据库,具备良好的生态系统和兼容性,适合构建 CRUD 应用。

2. SQLite #

** 本地优先数据库 **

SQLite 是一种嵌入式数据库,常用于将数据库与应用程序直接关联。WhatsApp 和 Signal 等应用利用 SQLite 存储本地聊天记录。随着 Litestream 等工具的出现,SQLite 在本地数据库解决方案中变得更加灵活,允许进行分布式访问。文章还提到,Ruby on Rails 8.0 的更新使得 SQLite 得到了重新关注。

3. DuckDB #

** 查询任何数据的数据库 **

DuckDB 是一种专注于在线分析处理(OLAP)的嵌入式数据库,可以从多种数据格式(如 CSV、JSON、Parquet 等)中进行查询。这使其在数据分析和处理方面表现出色,适合与 SQLite 配合使用,将分析任务委托给 DuckDB 处理。

4. ClickHouse #

** 列式数据库 **

ClickHouse 专注于分析工作负载,支持高吞吐量的数据摄入。它可以处理大规模的数据,并提供实时分析能力。ClickHouse 的操作和文档清晰,易于部署和扩展,适合进行大数据集分析。

5. FoundationDB #

** 分层数据库 **

FoundationDB 是一种独特的有序键值存储,具备 ACID 事务特性,能够支持超大规模的应用。其 “分层” 概念允许存储引擎与数据模型分离,从而提高灵活性。FoundationDB 的限制条件反而促进了其设计的简化和高效,适合高并发场景。

6. TigerBeetle #

** 高度正确的数据库 **

TigerBeetle 专注于金融交易,是一个单一目的的数据库,具有严格的正确性和高效的并发控制。其使用 Zig 语言编写,符合高安全性和性能要求。TigerBeetle 的设计使其适合对金融系统的建模和使用。

7. CockroachDB #

** 全球数据库 **

CockroachDB 是一种全球分布式数据库,兼容 Postgres 协议,支持大规模的水平扩展。其通过地理分布的方式来增强数据的一致性和可用性,适合需要跨区域的应用场景。

总结 #

本文探讨了七种不同的数据库技术,这些数据库在一些大型企业中得到应用,读者可以通过深入学习这些数据库技术,获得解决实际问题的能力。每种数据库的特点和应用场景都为后续的技术选型提供了丰富的参考。


HN 热度 391 points | 评论 113 comments | 作者:yarapavan | 1 day ago #

https://news.ycombinator.com/item?id=42330055

  • DuckDB 的生态系统非常活跃,支持自定义扩展,但目前扩展需要使用 C++ 编写
  • DuckDB 支持直接从文件中选择数据,简化了数据处理流程,提升了开发体验
  • 使用 DuckDB 进行 Advent of Code 挑战,体验良好,适合个人开发者快速上手
  • DuckDB 在数据可视化方面表现出色,易于使用,适合处理 Parquet 等大数据格式
  • Evidence 项目通过 SQL 和 Markdown 构建数据应用,使用 DuckDB 作为后端,快速高效
  • DuckDB 在处理 CVE 数据时表现出色,能够快速搭建查询接口
  • Apache Pinot 在用户面对的分析场景中表现优于 ClickHouse,具有更好的架构和预聚合功能
  • ClickHouse 在适当设计下可以无停机添加新节点,单服务器即可处理大量数据
  • Pinot 的性能测试中,ClickHouse 未配置 Pinot 的索引,导致结果不准确
  • StarTree 公司正在考虑使用更现实的方法来评估实时分析数据库的性能,包括数据新鲜度、吞吐量等指标

Romanian court annuls result of presidential election first round #

https://www.bbc.com/news/articles/cn4x2epppego

罗马尼亚宪法法院宣布,最近举行的总统选举第一轮的结果无效,理由是外部势力干预。这意味着选举过程将从头开始,政府将决定新的投票日期。第一轮选举的获胜者卡林·乔治斯库(Calin Georgescu)是一个几乎不为人知的极右翼候选人,他曾公开赞扬俄罗斯总统普京。宪法法院的决定是在情报文件被解密后做出的,这些文件表明乔治斯库在选举中受到了外部势力的支持。

乔治斯库在接受采访时表示,罗马尼亚的民主制度正在受到攻击,他将继续参加选举。现任总统克劳斯·约翰尼斯(Klaus Iohannis)表示,他将继续担任总统直到新总统当选。罗马尼亚的总统选举原定于本周日举行第二轮投票,但现在将重新开始整个选举过程。


HN 热度 333 points | 评论 641 comments | 作者:vinni2 | 10 hours ago #

https://news.ycombinator.com/item?id=42339819

  • 选举结果被取消是因为 Calin Georgescu 的竞选活动存在违规行为,包括未报告竞选开支和使用机器人操纵社交媒体支持率。
  • Calin Georgescu 的背景和言论存在问题,包括反北约立场、支持极右翼组织和涉嫌洗钱。
  • 该事件反映了传统候选人的不足,如果可以通过购买 TikTok 点赞来赢得选举,说明政治体系存在问题。
  • 选民有自主选择权,即使受到外部影响,最终投票决定还是由选民自己做出的。
  • 俄罗斯可能通过信息战手段影响了选民,使他们对 Calin Georgescu 产生好感,这种策略旨在制造混乱和疲劳。
  • 选举结果的取消是为了维护民主和防止操纵,确保选举的公正性。

Intel’s board, and an example of when boards and short-termism fail #

https://www.fabricatedknowledge.com/p/the-death-of-intel-when-boards-fail

Intel 公司的董事会成员包括 Frank Yeary、Barbara Novick、Risa Lavizzo-Mourey、Gregory Smith、Dion Weisler、James Goetz、Andrea Goldsmith、Alyssa Henry、Omar Ishrak 和 Tsu-Jae King Liu 等。他们的背景和经验各不相同,有些成员有半导体行业的经验,但大多数成员没有。董事会成员的任期也各不相同,有些成员已经在董事会任职多年,有些成员则是最近加入的。

文章作者认为,Intel 公司的董事会成员缺乏半导体行业的经验和背景,这可能导致他们无法有效地管理公司。作者还指出,董事会成员的任期过长,导致他们无法带来新鲜的观点和想法。作者认为,Intel 公司需要一支更有经验和更有活力的董事会,以帮助公司应对当前的挑战和机遇。

文章还提到,Intel 公司的 CEO Pat Gelsinger 被董事会解雇,这可能是由于董事会成员们对他的领导风格和战略不满。作者认为,Pat Gelsinger 是一位有才华的 CEO,但他可能被董事会成员们的短视和保守所限制。作者还指出,Intel 公司需要一位更有远见和更有胆识的 CEO,以帮助公司实现长期的成功。

总的来说,文章批评了 Intel 公司的董事会成员们的经验和背景,认为他们无法有效地管理公司。文章还批评了董事会成员们对 CEO Pat Gelsinger 的解雇,认为这可能是由于他们的短视和保守所导致的。


HN 热度 332 points | 评论 256 comments | 作者:LarsDu88 | 23 hours ago #

https://news.ycombinator.com/item?id=42334697

  • Andy Bryant 是导致 Pat Gelsinger 离开 Intel 的重要原因,他在过去 10 年中对 Intel 的策略和方向有很大影响。
  • 股东将 Intel 当作现金牛,即使公司表现不佳,也坚持发放股息,这种策略导致了公司的长期衰落。
  • Intel 的薪酬水平长期停滞,甚至近期还进行了减薪,与 TSMC 等竞争对手相比,Intel 在吸引和保留人才方面处于劣势。
  • Intel 的董事会缺乏技术和产品专业知识,无法有效指导公司应对当前的挑战。
  • 公司内部缺乏紧迫感和创新氛围,员工工作态度散漫,这种“死海效应”是导致 Intel 衰落的原因之一。
  • Intel 的员工规模庞大,存在冗员问题,相比之下,AMD 和 NVIDIA 等竞争对手的员工数量较少,更高效。
  • 竞争对手如 TSMC 和中国研发中心提供的薪酬和工作环境更具吸引力,使得 Intel 难以吸引国际人才。

Show HN: Banan-OS, an Unix-like operating system written from scratch #

https://github.com/Bananymous/banan-os

**banan-os 操作系统简介 **

banan-os 是一个由 Bananymous 开发的爱好者操作系统,使用 C++ 编写,目前支持 x86_64 和 i686 架构。用户可以在项目页面找到实时演示,并可在图形用户界面(GUI)环境中运行经典游戏 DOOM。

** 主要特性 **

  1. ** 一般特性 **

    • ** 用户空间 **:支持 Ring3 用户空间
    • ** 多处理 **:支持对称多处理(SMP)
    • ** 线性帧缓冲 **:支持 VESA 和 GOP
    • ** 网络堆栈 **:实现了基本的网络功能
    • ** 可执行文件加载 **:支持 ELF 格式的可执行文件加载
    • **AML 解释器 **:部分实现
    • ** 基本图形环境 **:
      • 终端模拟器
      • 状态栏
      • 程序启动器
      • 一些实用应用
  2. ** 驱动支持 **

    • NVMe 磁盘、ATA(IDE、SATA)磁盘
    • E1000 和 E1000E 网卡
    • RTL8111/8168/8211/8411 网卡
    • PS2 键盘(支持所有扫描码集)
    • PS2 鼠标
    • USB 设备(键盘、鼠标、存储、集线器等)
    • virtio 设备(网络、存储)
  3. ** 网络支持 **

    • ARP、ICMP、IPv4、UDP
    • TCP(部分实现,有缺陷)
    • Unix 域套接字
    • SSL
  4. ** 文件系统支持 **

    • 虚拟文件系统
    • Ext2、FAT12/16/32
    • Dev、Ram、Proc、Sys、9P
  5. ** 引导加载程序支持 **

    • GRUB
    • 自定义 BIOS 引导加载程序
    • 自定义 UEFI 引导加载程序

** 代码结构 **

每个主要组件和库都有自己的子目录(如 kernel、userspace、libc 等)。每个目录包含一个 include 子目录,里面有该组件的所有头文件。每个头文件都通过其绝对路径进行引用。

** 构建说明 **

  • ** 所需软件包 **:

    • Ubuntu(测试版本:22.04):通过 apt 安装 build-essential git ninja-build texinfo bison flex libgmp-dev libmpfr-dev libmpc-dev parted qemu-system-x86 cpu-checker
    • Arch Linux:通过 pacman 安装 base-devel git wget cmake ninja parted qemu-system-x86
  • ** 编译步骤 **:

    • 构建工具链只需执行一次,会编译 binutils 和 gcc,可能需要较长时间。
    • 可以通过 ./bos qemu 等命令构建和运行操作系统,执行此操作需要管理员权限。
  • ** 环境变量配置 **:

    • 设置 BANAN_ARCH 指定目标架构(如 i686)
    • 设置 BANAN_BOOTLOADER 选择引导加载程序(自定义或 GRUB)
    • 设置 BANAN_UEFI_BOOT=1 以支持 UEFI
  • ** 重新创建磁盘映像 **:可以手动删除 build/banan-os.img,系统将自动创建新的映像。

  • **zsh 自动补全脚本 **:可以将脚本复制到指定目录以启用 zsh 补全功能。

** 贡献说明 **

由于上游代码托管在 Bananymous 的服务器上,因此在 GitHub 上合并贡献并不简单。用户可以在 GitHub 上发送 PR,作者会手动下载并应用差异。如果需要,可以联系作者获取其 Git 服务器的账户。

对于新特性的添加,建议在提交 PR 前与作者联系,以避免重复开发。对于错误修复,欢迎提交 PR。

** 提交信息格式 **:

  • 第一行格式为 “主题:描述”,主题指出影响的领域(如 Kernel、Shell、BuildSystem 等),描述简要说明所做更改,第一行应限制在 72 字符以内。
  • 提交消息的主体应进一步描述更改及其原因。

所有提交必须通过 .pre-commit-config.yaml 中定义的预提交钩子,详细安装指南可参考 pre-commit 官方文档


HN 热度 316 points | 评论 56 comments | 作者:Bananymous | 1 day ago #

https://news.ycombinator.com/item?id=42331270

  • 该项目非常酷,名称也很有趣
  • 实现 USB 驱动程序和 AML 解释器是项目中最具挑战性的部分
  • 项目目前支持 xHCI USB 控制器,不支持 UHCI、EHCI 或 AHCI 控制器
  • 项目尚未实现某些 USB-HID 特性,如鼠标物理单位移动
  • 项目目前没有明显的“卖点”或独特功能,难以吸引广泛采用
  • 作者通过展示项目成功跳过了一些大学课程,并获得了大学的兼职工作
  • 作者每周投入的时间因生活状况而异,有时几周接近 40 小时,有时几个月只有 5 小时
  • 作者的 AML 解释器目前只在 50% 的测试硬件上工作,正在开发新的版本
  • 作者支持基本的 TTY 和 GUI 环境,以及一些基本的 UNIX 工具
  • 项目主要在虚拟机上测试,也经常在真实硬件上测试
  • 作者的项目与 Linux 早期的公告相似,但缺乏类似 Linux 早期的“完美风暴”条件

Llama-3.3-70B-Instruct #

https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct

Meta Llama 11.4k 模型是一种文本生成模型,基于 Transformers 架构,使用 Safetensors 和 PyTorch 框架。该模型支持 8 种语言,包括英语、法语、德语、意大利语、葡萄牙语、西班牙语、俄语和中文。

模型使用 Llama-3.3-70B-Instruct 训练数据,包含 2204.05149 个样本。模型的参数数量为 70 亿个,使用 32 个 GPU 进行训练。模型的目标是生成高质量的文本,能够模拟人类的写作风格。

模型的使用协议包括以下条款:

  • 用户需要同意分享联系信息才能访问模型。
  • 模型的使用需要遵守 Meta 的隐私政策。
  • 用户需要遵守模型的使用条款,包括不得使用模型进行非法或有害活动。
  • 模型的输出结果需要标明 “Built with Llama” 和 “Llama 3.3” 的标识。
  • 用户需要保留模型的源代码和文档,并在分发模型时提供这些信息。

模型的许可协议包括以下条款:

  • 用户可以使用模型进行研究和开发,但需要遵守 Meta 的许可协议。
  • 用户可以分发模型,但需要遵守 Meta 的许可协议和使用条款。
  • 模型的许可协议不包括商业使用许可,需要单独申请。

模型的免责声明包括以下内容:

  • 模型的输出结果可能不准确或有偏差,用户需要自行判断输出结果的可靠性。
  • 模型的使用可能存在风险,用户需要自行承担风险。
  • 模型的开发者不对模型的输出结果或使用结果负责。

模型的知识产权声明包括以下内容:

  • 模型的知识产权归属于 Meta。
  • 用户可以使用模型的输出结果,但需要遵守 Meta 的知识产权政策。
  • 模型的开发者保留对模型的所有权和知识产权。

HN 热度 312 points | 评论 154 comments | 作者:pr337h4m | 7 hours ago #

https://news.ycombinator.com/item?id=42341388

  • Llama-3.3-70B-Instruct 的性能与 Llama 3.2 405B 相当或略好,非常令人印象深刻。
  • Llama 4 系列预计在 2025 年发布,这将是 Llama 3 系列的最后一个版本。
  • 32B 参数模型目前是最佳选择,既非常有用又能在消费级硬件上更轻松运行。
  • 12GB GPU 和 32GB RAM 可以运行 8B 大小的模型,如果部分模型加载到 RAM 中,15-20B 模型也能有不错的性能。
  • 量化会影响模型的输出质量,尤其是对指令的遵循和答案的准确性,4 位量化是目前的甜点。
  • 量化程度越高,输出越不连贯和不真实,极端情况下会变成胡言乱语。
  • 70B 模型即使在 4 位量化下,仍然比 34B 模型更智能。
  • 对于大型模型,量化是值得的,只要能将其压缩到 VRAM 预算内,并且可以接受性能下降。
  • 较大的量化和较长的响应时间是可接受的,但内存有限且等待时间也有上限。
  • Llama.cpp 可以利用 7950x CPU 内置的 GPU,但专用 GPU 的内存带宽更高,性能更好。
  • 70B 模型在回答“你是谁”时,表现出了强大的多任务能力,包括软件开发、梦境解析等。