马斯克旗下 xAI 发布 Grok 3，称其为“地球上最聪明的 AI”

ITCOW牛新网 2 月 18 日消息，马斯克创立的人工智能公司 xAI 今日正式发布了其最新一代大模型 Grok 3。马斯克表示，Grok 3 相比前代产品 Grok 2 取得了“一个数量级的提升”，并强调该模型追求“极致真实”，即便这可能与“政治正确”存在冲突。

Grok 3 在多项 AI 基准测试中领先 GPT-4o

Grok 3 主要在 数学推理、科学逻辑推理和代码写作 方面进行了显著优化，并在多个 benchmark（基准测试）中取得了优于 DeepSeek-v3、GPT-4o、Gemini-2 Pro 的成绩。xAI 方面声称，Grok 3 在 AIME（数学能力测试）和 GPQA（博士级物理、生物、化学问题测试）等关键指标上超越了 GPT-4o。

此外，Grok 3 的早期版本还在 Chatbot Arena（一个由用户投票决定最佳 AI 答案的对比测试平台）中表现出色。马斯克更是在社交平台 X 上称赞其为“地球上最聪明的 AI”。

Colossus 超算赋能，训练规模达 2 亿 GPU 小时

Grok 3 的研发周期大幅缩短，主要得益于 xAI 旗下 Colossus 超级计算机的强大计算能力。该超算最初部署了 10 万颗英伟达 H100 GPU，后续扩展至 20 万颗，累计训练时长高达 2 亿 GPU 小时，这一规模是 Grok 2 训练量的 10 倍。如此庞大的计算能力，使得 Grok 3 能够更高效地处理海量数据，并显著提高推理能力和答案准确性。

除了硬件升级，xAI 还在软件层面进行了深度优化，包括 改进训练流程、引入合成数据集、自我纠错机制及强化学习技术，进一步提升了 Grok 3 在复杂任务中的表现。

Grok 3 引入推理变体与 DeepSearch 功能

Grok 3 并非单一模型，而是一个模型家族，包括多个变体：

Grok 3 mini：牺牲部分准确性以提升回答速度。
Grok 3 Reasoning（推理模型）：类似 OpenAI 的 o3-mini 或 DeepSeek R1，能够进行更严谨的逻辑推理，减少错误。
Grok 3 mini Reasoning：较小版本的推理模型，适用于计算资源受限的场景。

xAI 还推出了一项新功能 DeepSearch，其本质类似于搜索引擎，能够实时扫描互联网和 X 平台上的信息，并以摘要形式回答用户问题，进一步增强 AI 的信息检索能力。

此外，Grok 3 计划在未来推出“语音模式”，允许用户以更自然的方式与 AI 交互。然而，该功能并未如期上线，马斯克在 X 平台回应称：“语音模式目前还存在一些问题，预计将在大约一周后推出。”

SuperGrok 订阅计划 & Grok 2 开源计划

Grok 3 目前已向 X 平台的 Premium+ 订阅用户 开放体验，而额外的推理与 DeepSearch 权限则被整合进 SuperGrok 订阅计划。该订阅服务价格为 每月 30 美元或每年 300 美元，除了更高级的 AI 功能外，还提供 无限制的图像生成功能。

此外，xAI 计划在未来几个月内开源 Grok 2。马斯克表示：“我们的策略是，在发布新版本后开源前一代模型。因此，当 Grok 3 进入成熟阶段，我们将向公众开放 Grok 2。”

马斯克旗下 xAI 发布 Grok 3，称其为“地球上最聪明的 AI”

Grok 3 在多项 AI 基准测试中领先 GPT-4o

Colossus 超算赋能，训练规模达 2 亿 GPU 小时

Grok 3 引入推理变体与 DeepSearch 功能

SuperGrok 订阅计划 & Grok 2 开源计划

相关文章

百度文心大模型 4.5 将于3月16日发布，原生多模态+深度思考

OpenAI推出GPT-4.5，开启新一代AI聊天模型革命，提升“情商”和创意能力

小米 SU7 Ultra 正式发布：1548 马力、1.98 秒零百加速、620km 续航，售价 52.99 万元起

更多资讯

网易云音乐致歉：机房交换机故障，受影响用户获赠 7 天黑胶 VIP

闲鱼升级“小法庭”争议解决机制，推出专业评审员体系

百度文心大模型 4.5 将于3月16日发布，原生多模态+深度思考

2025款小鹏G6发布：81项升级，搭载图灵AI智驾与5C超充电池