Lex Fridman 播客节选:DeepSeek 到底用了多少张显卡训练?

Lex Fridman 播客节选:DeepSeek 到底用了多少张显卡训练?:

在本期 Lex Fridman 播客中,嘉宾深入探讨了中国对冲基金幻方及其 AI 子公司 DeepSeek 的发展历程。幻方历史上专注于量化交易,拥有大量 GPU 资源。早在 2021 年,他们宣布拥有中国首个由 10,000 张 A100 GPU 组成的集群。这些资源不仅用于交易,还用于训练大型语言模型等 AI 项目。

DeepSeek 的 CEO 梁文锋被视为中国的 AI 先锋,致力于推动中国在 AI 生态系统中的领先地位。截至目前,DeepSeek 拥有约 50,000 张 GPU,分布于对冲基金运营、AI 研究和模型训练等多个领域。在最新的 V3 模型训练中,他们使用了 2,000 张 H800 GPU,展示了在资源优化和 AI 研发方面的卓越能力。

揭示了幻方和 DeepSeek 在 AI 领域的战略布局,以及他们如何利用现有资源推动技术创新。

bogolyx:总结:觉得这个采访很中肯。 1.他们放的梁的照片还是错误的吧? 2.他们猜测整个幻方有5万张卡。(感觉还是准的。但是比起其他的MEta等还是少了,而且人家真的还要用在对冲基金上的)

吃成胖子子:量化基金,不是对冲基金[二哈]

(视频)



喷嚏网官方App :【安卓】在 豌豆荚 、360手机助手、小米应用商店,搜索:喷嚏阅读;【ios】App store里搜索:喷嚏网官方阅读;

喷嚏网官方网站:http://dapenti.com (海外访问:https://dapenti.com)

每天网络精华尽在【喷嚏图卦】       喷嚏网官方新浪围脖

评论

此博客中的热门博文

名廚Lucas與Eric品嚐台北知名早餐店「阜杭豆漿」!燒餅油條就是要現吃才美味,明天早起排隊去!|GQ Taiwan

走進紐約Una Pizza!跟著超酷老闆體驗世界第一披薩店的工作日!美味甜點雪酪也是手工自製!揭秘3分鐘出餐的效率工作法|GQ Taiwan

DeepSeek一出,吃人血馒头的搜索引擎,某田系医院要完了