马斯克Grok-3正面对决OpenAI、DeepSeek
在AI的牌桌上,埃隆·马斯克(Elon Musk)从不缺席。
太平洋时间2月17日,马斯克旗下人工智能初创公司xAI的大模型Grok-3正式面世。发布会上,xAI展示了一系列家族,包括Grok-3(Beta)、Grok-3 mini、首个推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning。
同时,xAI还推出了名为Deepsearch的智能搜索引擎Agent工具。从大模型到AI搜索应用,xAI紧跟竞品步伐通通上线。时常“一线冲锋”的马斯克,正加速在AI赛场上奔跑。
在预告中,马斯克将Grok-3标榜为“地球上最聪明的人工智能”。根据xAI展示的数据,Grok-3在多项基准测试中超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o,刷新最新成绩。
在大模型的你追我赶中,AI的细分赛道上,最聪明的AI不断易主。这场“不进则退”的残酷竞赛中,马斯克也着急了。上周他还表示,为了提供最好的用户体验,xAI还在打磨产品,还需要一两周的时间。
但是面对新贵DeepSeek和劲敌OpenAI,马斯克快马加鞭急于让Grok-3亮相。一周后,xAI将会陆续上线完整功能,不过当前付费用户才能使用,Grok-3也未开源。新王不断涌现,AI界的技术狂人们还将继续过招。
谁是“最聪明的AI”
本次直播发布的时间并不长,只有半小时左右,马斯克和xAI团队基本上都在用数据和实操展现Grok-3的“智力”。
和很多模型一样,Grok-3在数学推理、科学逻辑推理和代码编写等方面表现出色。多项基准测试成绩显示,Grok-3在数学(AIME 2024)、科学问答(GPQA)、编码(LCB)上刷新SOTA(State of the Art,描述在某一特定领域内当前最佳的技术、方法或模型),击败了谷歌的Gemini-2 Pro、DeepSeek的V3模型、OpenAI的GPT-4o。
按照xAI提供的数据,在多个AI领域内,Grok-3已经登顶。马斯克表示,Grok-3的计算能力是前一代的“10倍以上”,并于1月初完成了预训练,“我们每天都在不断改进模型,实际上在24小时内,你就会看到改进。”
AI,正在以每分每秒的速度不分昼夜地进化着,大模型厂商之间的火药味更加浓烈。在Grok-3发布不久前,OpenAI的CEO Sam Altman还在社交媒体上发布了GPT-4.5的相关信息,表示测试者们尝试GPT-4.5后,有比预期更多的“感受到AGI”的时刻。
在铺天盖地的Grok-3报道中,Sam Altman穿插新品预告,吸引了不少关注。Sam Altman和马斯克的“针锋相对”,也将显示在产品的PK中。
xAI工程师介绍,虽然Grok起步较晚,但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。
与此同时,Grok-3也很明显在对标竞品,比如,马斯克还特别提到了推理性能,而推理是DeepSeek-R1的强项。
马斯克表示,Grok-3接受了合成数据的训练,可以通过反复检查数据来审查所犯的错误,以达到逻辑上的一致性,“因此,如果它得到了错误的数据,它会反思并删除错误的数据。它的基本推理非常好。”
而对于OpenAI,从Grok-3目前的数据看,其似乎领先于OpenAI最新的ChatGPT。随着Grok-3即将上线,xAI和OpenAI之间的竞争将日益激烈。“最聪明的AI”,将会是一场持续的排位赛。
大模型竞速
近年来快速崛起的AI明星着实不少,xAI当属其一。技术狂热又多金的马斯克,在和OpenAI“决裂”后,转而成立自己的AI公司。
2023年,马斯克的xAI公司成立,时隔半年便发布了Grok和Grok-1.5模型,可谓进展迅速。2024年8月,xAI又发布了Grok-2大模型;12月,xAI宣布开始向X平台上的所有用户免费推出新版Grok-2模型,而此前该模式只向订阅了Premium Plus的用户开放。
在算力基础上,马斯克也迅速囤卡。xAI团队自建Colossus超级计算集群,集群规模已经从10万块英伟达GPU扩展到20万块,基于自家集群训练出的Grok-3的性能也得到了增强。
在xAI一日千里之时,AI圈的同行也在飚速。2025年,大洋彼岸的DeepSeek-V3和R1掀起新浪潮,尤其是R1为业内称道。R1大模型的一个特点是采用了MOE架构(混合专家,Mixture-of-Experts),事实上Grok初代版本也使用了MOE架构。在开源世界中,如何练出绝世武功,还得看各家功力。
DeepSeek-R1模型的冲击下,在AI领域有大动作可不止xAI一家,不少公司都陆续放出大招。
2月6日,OpenAI宣布扩大ChatGPT搜索功能的用户范围,任何人无需注册,就可以使用ChatGPT的搜索功能;同一天,谷歌正式推出Gemini 2.0系列模型,包括Flash、Pro及Flash-Lite版本,继续提升AI能力,并提供更具性价比的解决方案。
2月13日,Sam Altman宣布,将很快发布GPT-5,并且免费无限使用;同日,文心一言官宣将于4月1日0时起全面免费,并且即日起上线深度搜索功能。
AI的第一梯队玩家都感受到“危机感”,不由得加快了迭代脚步,直接开启新一轮价格战,并探索更多应用场景形成商业闭环。有AI资深人士向21世纪经济报道记者表示,目前Grok-3需要付费使用,马斯克也在探索解决算力商业模式问题。
在技术、Agent应用竞速的同时,大模型厂商的融资也在竞速。有报道称,xAI正在接洽潜在的投资者,计划筹集约100亿美元资金,此轮融资可能使该公司估值达到约750亿美元;还有报道称OpenAI正在进行谈判,希望在新一轮融资中筹集高达400亿美元,这将使其估值达到3000亿美元。
在这场资金、技术、智力的金字塔游戏中,大模型竞速已从单纯的技术迭代演变为全维度的生态博弈。算力军备竞赛与开源策略并行,价格战倒逼商业闭环重构。有云计算高管向记者表示,目前AI产业已经过了炒作阶段,开始出现一些真正规模化的应用,大家会看到更多实用价值。
而这场以硅基智能为燃料的竞逐,能否加速构建通向AGI之路,大家都在拭目以待。