马斯克Grok-3正面对决OpenAI、DeepSeek

首页 > 科技 > 正文

2025-02-19 05:00:00 21世纪经济报道倪雨晴

在AI的牌桌上，埃隆·马斯克（Elon Musk）从不缺席。

太平洋时间2月17日，马斯克旗下人工智能初创公司xAI的大模型Grok-3正式面世。发布会上，xAI展示了一系列家族，包括Grok-3（Beta）、Grok-3 mini、首个推理模型Grok-3 Reasoning（Beta）、Grok-3 mini Reasoning。

同时，xAI还推出了名为Deepsearch的智能搜索引擎Agent工具。从大模型到AI搜索应用，xAI紧跟竞品步伐通通上线。时常“一线冲锋”的马斯克，正加速在AI赛场上奔跑。

在预告中，马斯克将Grok-3标榜为“地球上最聪明的人工智能”。根据xAI展示的数据，Grok-3在多项基准测试中超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o，刷新最新成绩。

在大模型的你追我赶中，AI的细分赛道上，最聪明的AI不断易主。这场“不进则退”的残酷竞赛中，马斯克也着急了。上周他还表示，为了提供最好的用户体验，xAI还在打磨产品，还需要一两周的时间。

但是面对新贵DeepSeek和劲敌OpenAI，马斯克快马加鞭急于让Grok-3亮相。一周后，xAI将会陆续上线完整功能，不过当前付费用户才能使用，Grok-3也未开源。新王不断涌现，AI界的技术狂人们还将继续过招。

谁是“最聪明的AI”

本次直播发布的时间并不长，只有半小时左右，马斯克和xAI团队基本上都在用数据和实操展现Grok-3的“智力”。

和很多模型一样，Grok-3在数学推理、科学逻辑推理和代码编写等方面表现出色。多项基准测试成绩显示，Grok-3在数学（AIME 2024）、科学问答（GPQA）、编码（LCB）上刷新SOTA（State of the Art，描述在某一特定领域内当前最佳的技术、方法或模型），击败了谷歌的Gemini-2 Pro、DeepSeek的V3模型、OpenAI的GPT-4o。

按照xAI提供的数据，在多个AI领域内，Grok-3已经登顶。马斯克表示，Grok-3的计算能力是前一代的“10倍以上”，并于1月初完成了预训练，“我们每天都在不断改进模型，实际上在24小时内，你就会看到改进。”

AI，正在以每分每秒的速度不分昼夜地进化着，大模型厂商之间的火药味更加浓烈。在Grok-3发布不久前，OpenAI的CEO Sam Altman还在社交媒体上发布了GPT-4.5的相关信息，表示测试者们尝试GPT-4.5后，有比预期更多的“感受到AGI”的时刻。

在铺天盖地的Grok-3报道中，Sam Altman穿插新品预告，吸引了不少关注。Sam Altman和马斯克的“针锋相对”，也将显示在产品的PK中。

xAI工程师介绍，虽然Grok起步较晚，但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。

与此同时，Grok-3也很明显在对标竞品，比如，马斯克还特别提到了推理性能，而推理是DeepSeek-R1的强项。

马斯克表示，Grok-3接受了合成数据的训练，可以通过反复检查数据来审查所犯的错误，以达到逻辑上的一致性，“因此，如果它得到了错误的数据，它会反思并删除错误的数据。它的基本推理非常好。”

而对于OpenAI，从Grok-3目前的数据看，其似乎领先于OpenAI最新的ChatGPT。随着Grok-3即将上线，xAI和OpenAI之间的竞争将日益激烈。“最聪明的AI”，将会是一场持续的排位赛。

大模型竞速

近年来快速崛起的AI明星着实不少，xAI当属其一。技术狂热又多金的马斯克，在和OpenAI“决裂”后，转而成立自己的AI公司。

2023年，马斯克的xAI公司成立，时隔半年便发布了Grok和Grok-1.5模型，可谓进展迅速。2024年8月，xAI又发布了Grok-2大模型；12月，xAI宣布开始向X平台上的所有用户免费推出新版Grok-2模型，而此前该模式只向订阅了Premium Plus的用户开放。

在算力基础上，马斯克也迅速囤卡。xAI团队自建Colossus超级计算集群，集群规模已经从10万块英伟达GPU扩展到20万块，基于自家集群训练出的Grok-3的性能也得到了增强。

在xAI一日千里之时，AI圈的同行也在飚速。2025年，大洋彼岸的DeepSeek-V3和R1掀起新浪潮，尤其是R1为业内称道。R1大模型的一个特点是采用了MOE架构（混合专家，Mixture-of-Experts），事实上Grok初代版本也使用了MOE架构。在开源世界中，如何练出绝世武功，还得看各家功力。

DeepSeek-R1模型的冲击下，在AI领域有大动作可不止xAI一家，不少公司都陆续放出大招。

2月6日，OpenAI宣布扩大ChatGPT搜索功能的用户范围，任何人无需注册，就可以使用ChatGPT的搜索功能；同一天，谷歌正式推出Gemini 2.0系列模型，包括Flash、Pro及Flash-Lite版本，继续提升AI能力，并提供更具性价比的解决方案。

2月13日，Sam Altman宣布，将很快发布GPT-5，并且免费无限使用；同日，文心一言官宣将于4月1日0时起全面免费，并且即日起上线深度搜索功能。

AI的第一梯队玩家都感受到“危机感”，不由得加快了迭代脚步，直接开启新一轮价格战，并探索更多应用场景形成商业闭环。有AI资深人士向21世纪经济报道记者表示，目前Grok-3需要付费使用，马斯克也在探索解决算力商业模式问题。

在技术、Agent应用竞速的同时，大模型厂商的融资也在竞速。有报道称，xAI正在接洽潜在的投资者，计划筹集约100亿美元资金，此轮融资可能使该公司估值达到约750亿美元；还有报道称OpenAI正在进行谈判，希望在新一轮融资中筹集高达400亿美元，这将使其估值达到3000亿美元。

在这场资金、技术、智力的金字塔游戏中，大模型竞速已从单纯的技术迭代演变为全维度的生态博弈。算力军备竞赛与开源策略并行，价格战倒逼商业闭环重构。有云计算高管向记者表示，目前AI产业已经过了炒作阶段，开始出现一些真正规模化的应用，大家会看到更多实用价值。

而这场以硅基智能为燃料的竞逐，能否加速构建通向AGI之路，大家都在拭目以待。