ITCOW牛新网 3月27日消息 谷歌于当地时间3月25日正式发布”最智能的AI模型”Gemini 2.5系列,其中实验版Gemini 2.5 Pro作为该系列首款推理模型率先亮相。这款被谷歌称为”最先进的复杂任务模型”展现了卓越的推理和代码能力,集成了Gemini系列此前所有模型的功能特性。

谷歌发布Gemini 2.5 Pro

据ITCOW牛新网了解,Gemini 2.5 Pro目前已面向Gemini Advanced订阅用户开放,可通过Google AI Studio和Gemini应用程序使用。该模型即将登陆谷歌模型商店Vertex AI,谷歌将在未来几周公布公开定价方案,支持用户进行大规模商业应用。

核心技术创新:

  • 原生多模态处理能力:可同时处理文本、音频、图像、视频及大型数据集输入
  • 代码理解突破:能够解析完整代码存储库
  • 超长上下文窗口:支持100万tokens(即将扩展至200万tokens)

性能表现:
在多项权威基准测试中,Gemini 2.5 Pro表现抢眼:

  • 在GPQA和AIME 2025测试中取得优异成绩
  • 以39分优势领跑Chatbot Arena榜单,超越Grok-3和GPT-4.5
  • 在Humanity’s Last Exam测试中获得18.8%的最高得分(OpenAI o3-mini为14%,DeepSeek-R1为8.6%)
谷歌发布Gemini 2.5 Pro

不过值得注意的是,谷歌尚未公布Gemini 2.5 Pro与OpenAI完整版o1、o3等模型的对比数据。在SWE-bench verified编程评估中,其表现不及Claude 3.7 Sonnet。

谷歌发布Gemini 2.5 Pro
Gemini 2.5 Pro在各项基准测试中的成绩

应用场景展示:
谷歌演示视频显示,Gemini 2.5 Pro具备:

  • 根据提示创建交互式图表
  • 复杂数据可视化处理
  • 开发兼具设计美感与可玩性的小游戏
谷歌发布Gemini 2.5 Pro
Gemini 2.5 Pro根据要求生成的小游戏

谷歌DeepMind首席技术官Koray Kavukcuoglu表示:”Gemini 2.5代表了我们在实现’更智能、更具推理能力的AI’道路上的重要里程碑。通过增强的基础模型与改进的后训练相结合,我们达到了新的性能高度。”

随着Gemini 2.5系列的推出,全球AI竞赛进入新阶段。业界关注该模型在实际商业应用中的表现,以及其与OpenAI、Anthropic等竞争对手产品的后续较量。