ITCOW牛新网 2 月 18 日消息,马斯克创立的人工智能公司 xAI 今日正式发布了其最新一代大模型 Grok 3。马斯克表示,Grok 3 相比前代产品 Grok 2 取得了“一个数量级的提升”,并强调该模型追求“极致真实”,即便这可能与“政治正确”存在冲突。

Grok 3 在多项 AI 基准测试中领先 GPT-4o
Grok 3 主要在 数学推理、科学逻辑推理和代码写作 方面进行了显著优化,并在多个 benchmark(基准测试)中取得了优于 DeepSeek-v3、GPT-4o、Gemini-2 Pro 的成绩。xAI 方面声称,Grok 3 在 AIME(数学能力测试)和 GPQA(博士级物理、生物、化学问题测试)等关键指标上超越了 GPT-4o。

此外,Grok 3 的早期版本还在 Chatbot Arena(一个由用户投票决定最佳 AI 答案的对比测试平台)中表现出色。马斯克更是在社交平台 X 上称赞其为“地球上最聪明的 AI”。
Colossus 超算赋能,训练规模达 2 亿 GPU 小时
Grok 3 的研发周期大幅缩短,主要得益于 xAI 旗下 Colossus 超级计算机的强大计算能力。该超算最初部署了 10 万颗英伟达 H100 GPU,后续扩展至 20 万颗,累计训练时长高达 2 亿 GPU 小时,这一规模是 Grok 2 训练量的 10 倍。如此庞大的计算能力,使得 Grok 3 能够更高效地处理海量数据,并显著提高推理能力和答案准确性。

除了硬件升级,xAI 还在软件层面进行了深度优化,包括 改进训练流程、引入合成数据集、自我纠错机制及强化学习技术,进一步提升了 Grok 3 在复杂任务中的表现。
Grok 3 引入推理变体与 DeepSearch 功能
Grok 3 并非单一模型,而是一个模型家族,包括多个变体:
- Grok 3 mini:牺牲部分准确性以提升回答速度。
- Grok 3 Reasoning(推理模型):类似 OpenAI 的 o3-mini 或 DeepSeek R1,能够进行更严谨的逻辑推理,减少错误。
- Grok 3 mini Reasoning:较小版本的推理模型,适用于计算资源受限的场景。
xAI 还推出了一项新功能 DeepSearch,其本质类似于搜索引擎,能够实时扫描互联网和 X 平台上的信息,并以摘要形式回答用户问题,进一步增强 AI 的信息检索能力。
此外,Grok 3 计划在未来推出“语音模式”,允许用户以更自然的方式与 AI 交互。然而,该功能并未如期上线,马斯克在 X 平台回应称:“语音模式目前还存在一些问题,预计将在大约一周后推出。”
SuperGrok 订阅计划 & Grok 2 开源计划
Grok 3 目前已向 X 平台的 Premium+ 订阅用户 开放体验,而额外的推理与 DeepSearch 权限则被整合进 SuperGrok 订阅计划。该订阅服务价格为 每月 30 美元或每年 300 美元,除了更高级的 AI 功能外,还提供 无限制的图像生成功能。

此外,xAI 计划在未来几个月内开源 Grok 2。马斯克表示:“我们的策略是,在发布新版本后开源前一代模型。因此,当 Grok 3 进入成熟阶段,我们将向公众开放 Grok 2。”
