干掉英伟达4万亿市值, DeepSeek再发文生图大模型, 中国AI稳了?

一家名为DeepSeek的中国公司突然在全球AI领域引起了轩然大波。其最新推出的DeepSeek-V3大模型,以仅557.6万美元的训练成本和280万个GPU小时的训练时间,向世界展示了惊人的效率与性能。

更令人瞩目的是,在某些特定领域,这款模型的表现甚至超越了OpenAI的顶尖推理模型o1,后者可是全球第一大模型推出的产品。

这一消息迅速在科技圈内发酵,尤其是在美国,一众AI公司如临大敌,股价暴跌的阴影笼罩在它们的心头。其中,受影响最大的莫过于本轮AI革命的最大受益者——英伟达。

作为全球唯一能提供最先进的GPU芯片的公司,英伟达在近年来凭借其在算力领域的绝对优势,股价飙升,成为了市场上的明星股。然而,DeepSeek的出现似乎打破了这一格局。

DeepSeek的大模型能够在较少的算力芯片下实现与英伟达芯片相当的效果,这意味着包括美国和中国在内的大模型公司们可以不再像过去那样大量囤积GPU芯片。对于英伟达来说这无疑是一个巨大的打击。

在周一美股开盘后,科技公司的股价普遍下跌,其中英伟达股价更是狂跌16.9%,市值蒸发5890亿美元,折合人民币超过4万亿元。另一家明星芯片企业博通也未能幸免,股价跌幅达到了17.4%,市值同样大幅缩水。

就在英伟达等巨头们为股价暴跌而焦头烂额之际,DeepSeek却再次给人们带来了惊喜。

北京时间1月28日凌晨,DeepSeek发布了一款名为Janus-Pro的新模型,这次挑战的是“文生图”领域。

根据测试报告,这款新模型在部分文生图基准测试中表现抢眼,甚至超越了OpenAI开发的DALL-E 3模型。这一消息无疑再次给美国AI科技公司带来了沉重的打击。

可以确定的是,凭借DeepSeek的出彩表现,中国AI首次实现了在某一领域的遥遥领先,压了美国一头。那么DeepSeek的爆火是否意味着中国AI稳了,甚至已经达到与美国并驾齐驱的程度?

我们还是应该更谨慎和务实一些,而不是追求这种虚名,DeepSeek爆火及英伟达股价闪崩的背后,可能有华尔街金融机构的身影。

首先,我们需要明确一点,那就是DeepSeek的开源算法虽然能够减少对一些最先进GPU芯片的需求,但并不意味着完全不需要使用GPU芯片。换言之,在AI工具领域,英伟达依然无可取代。

以DeepSeek为例,其背后的幻方量化是国内最有名的私募量化基金公司,很早就开始使用GPU训练量化交易模型,成为了中国最早且为数不多囤积了上万块先进GPU的公司之一,囤积的英伟达GPU芯片远超国内“AI六小龙”,与中国一线互联网公司相仿。

这足以证明在AI大模型的开发过程中,先进GPU芯片仍然扮演着至关重要的角色。

DeepSeek的大模型能够减少GPU芯片的使用量,会产生两个截然不同的结果。一方面,对于美国的互联网巨头们来说可能会减少购买英伟达的产品,从而对英伟达的业绩和股价构成利空。

另一方面,对于资金有限的中小企业来说,DeepSeek的大模型却为它们打开了一扇新的大门。这些企业原本因为高昂的算力成本而放弃开发自己的大模型,但现在可能会成为英伟达的潜在客户。

这样一来,一家大公司减少的购买量,可能会被数家新入局的小公司的累计购买量所抵消。

回顾DeepSeek爆火的过程,我们可以发现虽然这几天国内官媒和自媒体争相报道,但起源却并非来自中国。实际上,这场风暴最初是在美国的论坛和媒体上炒起来的,之后才逐渐引起国内媒体的关注并火爆了起来。

一家中国公司发布的大模型在国内是能够使用的,结果却是美国那边先炸开了锅。更关键的是,出圈的时间点选择在周末,给了民众充分的讨论时间。这种引导和时间点的选择,真的很难说没有人为因素的干预。

事实上,英伟达的股价已经积累了一定的风险,只要稍有利空消息传出,股价便可能经历崩盘式下跌。美国股市完善的做空机制更是为这种下跌提供了可能。股指期货、看空期权等金融工具都能让做空者在股价下跌的情景下大赚特赚。会不会是华尔街的一部分金融机构希望借DeepSeek的出圈来一场针对英伟达股价的做空呢?

在美股历史上类似的事情已经发生过很多次。金融市场对信息是最敏感的,任何风吹草动都可能创造成百上千亿美元的财富,或导致同等数额资产的蒸发。因此,在DeepSeek爆火的背后很可能隐藏着华尔街金融机构的推波助澜,借此对英伟达等AI明星股发动一轮做空潮。

对我们而言,更应该关注的是国内能否涌现更多类似DeepSeek的公司,拥有强大的创新能力,而不是一味模仿西方科技巨头的发展路线。创新是推动科技发展的核心动力,无论是从0到1的突破还是从1到10的完善,都是创新的重要组成部分。

同时,中国需要继续加大对高端芯片研发和制造支持力度。尽管DeepSeek的大模型能够减少GPU芯片的使用量,但这并不意味着我们只用中低端算力芯片就能实现顶级的效果。算法上取得突破不表示解决了硬件方面的“卡脖子”问题,我们绝不能忽视对高端芯片技术的持续投入和研发。

只有“软硬兼施”,才能在未来的人工智能竞争中占据主导位置。

以上纯属个人观点,欢迎关注、点赞,您的支持是对原创最好的鼓励!