ITCOW牛新网 7月19日消息,OpenAI于当地时间7月18日发布了其最新的小型高性价比模型GPT-4o Mini,致力于以更低的成本提供高效的AI解决方案。GPT-4o Mini在多项测试中表现优异,如MMLU测试中得分82%,并在聊天偏好上优于GPT-4。与前代模型相比,其每百万input tokens仅需15美分,output tokens则为60美分,成本大幅下降,比GPT-3.5 Turbo便宜超过60%。

GPT-4o Mini
GPT-4o Mini

GPT-4o Mini不仅在文本生成和理解方面表现优秀,还具备处理图像、视频和音频的能力。其128K的上下文窗口和16K的输出令牌容量,使其能够处理复杂的上下文信息,适用于广泛的应用场景。值得注意的是,该模型在推理任务、数学和编码能力等方面均优于市场上其他小型模型,并在MMLU、多模态推理、MGSM和HumanEval测试中取得了不俗的成绩。

GPT-4o mini 已经在几个关键基准上进行了评估:

  • 推理任务: GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准 MMLU 上的得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
  • 数学和编码能力: GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上之前的小型模型。在测量数学推理的 MGSM 上,GPT-4o mini 得分为 87.0%,而 Gemini Flash 得分为 75.5%,Claude Haiku 得分为 71.7%。在测量编码性能的 HumanEval 上,GPT-4o mini 得分为 87.2%,而 Gemini Flash 得分为 71.5%,Claude Haiku 得分为 75.9%。  
  • 多模态推理: GPT-4o mini 在多模态推理评估 MMMU 上也表现出色,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
GPT-4o Mini

据ITCOW牛新网了解,GPT-4o Mini的安全性和可靠性也得到大幅提升。其采用最新的指令层级法,有效防止了越狱和提示注入等安全风险。

GPT-4o Mini

GPT-4o Mini

目前,GPT-4o Mini已在Assistants API、Chat Completions API和Batch API中上线,未来几天还将推出微调功能。ChatGPT的免费、Plus和团队用户今天起可以使用GPT-4o Mini,以替代 GPT-3.5,企业用户则将在下周开放使用。