周鸿祎谈DeepSeek成功原因:资源紧张但足够聚焦

刘峰
2025-02-04 11:06

2月4日消息,周鸿祎日前发文谈到DeepSeek能够取得巨大技术突破的原因。周鸿祎认为,首先在人才策略上,DeepSeek研究人员都是年轻人,且为国内名校硕博毕业五年内;其次,组织架构上,DeepSeek是扁平研究的文化,团队一百多人,只有梁文锋、小组长和一线员工三层,并且很多组长不打绩效,不会过度分工;第三,梁文锋对创新的渴求很高,鼓励突破式创新。而且DeepSeek用自己的钱,“不用看任何人脸色”;第四,目标,DeepSeek最重要的是专注,它的资源很紧张,但是足够聚焦。

image-800.png

图源:周鸿祎微博

以下是周鸿祎全文(有部分删改):

很多人问我说为什么deepseek能取得如此大的技术突破,以至于以一己之力撼动了全球的ai工业。别的公司为什么研究不出来?

我觉得分成这么几点吧。

第一,人才策略上,deepseek的研究人员是清一色的年轻人,都是国内名校硕博毕业五年内的。梁文峰也说过自己的招聘标准,聪明加热爱,不要经验多的,与大厂要经验完全不同,没有行业老人,没有十年以上所谓的资深ai研究员。因为大模型17年才出来,国内正式研究大模型23 年才开始,所以以前积累的所谓的人工智能经验,什么自然语言处理经验,基本都是负资产。很多大厂的老研究人员因为有历史的包袱,还停留在哪里不懂就标注哪里的阶段,没有scaling规模化的理念。

不客气的讲,在巨大的技术变革面前,经验更多的是束缚,一张白纸加上第一性原理才是创新的源头。

第二,组织结构上,是扁平化研究的文化,deepseek团队也就一百来人,就三层,梁文峰、小组长和一线员工,并且很多组长也不打绩效,主要协调下面的资源,也不会过度分工,大家一起为最终模型的效果负责。日常都在一些群里讨论,主打一个自由宽松的研究风格。

反观互联网大厂,一线到一把手少的五层多的八层,传话就够累的,更别提高效决策了。分工也分的特别细,就像我要吃个炒鸡蛋,有人打蛋,有人切葱花,有人倒油,有人架锅,有人炒蛋,还有人端盘子。分工分的细呢就导致每个人都不对结果负责,每个人都要背一个自己的kpi,短期压力很大,即使有能力也没有勇气创新,半年没产出就要给你降级了。

那为什么创业公司也不行呢?那就要聊聊文化。

其实公司的文化核心就是老板的文化,在小公司更是如此。梁峰对创新的渴求很高,小创新他根本看不上,会鼓励突破式创新。同时也亲自为高风险负责,失败了也不用你背锅。而其他公司哪个老板能做到呢?

这里还有一个重要的点,deepseek用自己的钱,不用看任何人脸色,就不用被VC或者CEO牵着鼻子转,想咋干就咋干。所以一个懂技术、有理想、财富自由的老板才是核心。

第四个,目标,deepseek最重要的是专注。其实deepseek的资源是非常紧张的,应该也就一万来张卡吧,肯定不止两千张卡了,但是它足够聚焦。

image-800.png

图源:周鸿祎微博

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
鸿表示,“中美现在AI竞争日益激烈,但最终一定是中国的胜利。我们每个人都要有信心。”
10月26日消息,2024中国国际数字经济博览会近日召开。对于人工智能如何促进新质生产力发展这话题,鸿认为,面对全球大模型产业之争,中国大模型则要打赢“三大战役”,即通用大模型之战、大模型安全之战和应用场景之战。
360创始人鸿回应“年轻人如何拥抱AI”这话题。
11月28日消息,360新品直播发布会上,鸿发布了全新的AI搜索产品,并命名为“纳米搜索”,该产品定位为多模态创作引擎。他表示,自己做网的目的,是为360的AI代言。他给纳米搜索定下了一个目标,他说“纳米搜索的目标是做世界第一的纯AI搜索。今天看起来是在发短剧,实际上是在发AI搜索工具,看起来是在发AI产品,实际上是在推多模态创作引擎。”
鸿苹果放弃造车
2月28日消息,鸿发布视频苹果放弃造车,他猜测,苹果放弃造车或为ALL IN AI
2月22日消息,在2024亚布力中国企业家论坛第二十四届年会上,360集团创始人、董事长鸿表示,最近OpenAI推出Sora大模型,这不是AIGC工具的产生这么简单,也不是AI能够做视频这么简单。这暗示着,过去我们认为通用人工智能需要10年、20年才能到来,现在可能会缩短至两三年。很多企业需要抓住这个机遇。