人工智能头条关注

谷歌发布Gemini 2.5 Pro：百万token上下文窗口多项基准测试领先

3 月 27, 2025 #Gemini 2.5 Pro

ITCOW牛新网 3月27日消息谷歌于当地时间3月25日正式发布”最智能的AI模型”Gemini 2.5系列，其中实验版Gemini 2.5 Pro作为该系列首款推理模型率先亮相。这款被谷歌称为”最先进的复杂任务模型”展现了卓越的推理和代码能力，集成了Gemini系列此前所有模型的功能特性。

谷歌发布Gemini 2.5 Pro

据ITCOW牛新网了解，Gemini 2.5 Pro目前已面向Gemini Advanced订阅用户开放，可通过Google AI Studio和Gemini应用程序使用。该模型即将登陆谷歌模型商店Vertex AI，谷歌将在未来几周公布公开定价方案，支持用户进行大规模商业应用。

核心技术创新：

原生多模态处理能力：可同时处理文本、音频、图像、视频及大型数据集输入
代码理解突破：能够解析完整代码存储库
超长上下文窗口：支持100万tokens（即将扩展至200万tokens）

性能表现：
在多项权威基准测试中，Gemini 2.5 Pro表现抢眼：

在GPQA和AIME 2025测试中取得优异成绩
以39分优势领跑Chatbot Arena榜单，超越Grok-3和GPT-4.5
在Humanity’s Last Exam测试中获得18.8%的最高得分（OpenAI o3-mini为14%，DeepSeek-R1为8.6%）

谷歌发布Gemini 2.5 Pro

不过值得注意的是，谷歌尚未公布Gemini 2.5 Pro与OpenAI完整版o1、o3等模型的对比数据。在SWE-bench verified编程评估中，其表现不及Claude 3.7 Sonnet。

谷歌发布Gemini 2.5 Pro — Gemini 2.5 Pro在各项基准测试中的成绩

应用场景展示：
谷歌演示视频显示，Gemini 2.5 Pro具备：

根据提示创建交互式图表
复杂数据可视化处理
开发兼具设计美感与可玩性的小游戏

谷歌发布Gemini 2.5 Pro — Gemini 2.5 Pro根据要求生成的小游戏

谷歌DeepMind首席技术官Koray Kavukcuoglu表示：”Gemini 2.5代表了我们在实现’更智能、更具推理能力的AI’道路上的重要里程碑。通过增强的基础模型与改进的后训练相结合，我们达到了新的性能高度。”

随着Gemini 2.5系列的推出，全球AI竞赛进入新阶段。业界关注该模型在实际商业应用中的表现，以及其与OpenAI、Anthropic等竞争对手产品的后续较量。

相关文章

人工智能头条关注

ChatGPT图像生成功能向免费用户开放每日限3次使用机会

李开复：大模型推理成本年降十倍 2025年将成AI应用落地关键年

Manus收费方案公布：月费39美元起，实现全流程自动化任务处理

更多资讯

中兴通讯换帅：方榕出任新董事长将推进”连接+算力”AI战略转型

2025年 3月 31日

国内运营商内测iPhone eSIM功能或为无卡槽iPhone 17 Air铺路

2025年 3月 31日

vivo Y300t手机发布：天玑7300+6500mAh电池国补后最低976元起

2025年 3月 31日

vivo Y300 Pro+手机发布：7300mAh电池+职业模式售价1799元起

2025年 3月 31日