人工智能头条关注

OpenAI推出新模型GPT-4o Mini，用以替代 GPT-3.5

7 月 19, 2024 #GPT-4o Mini, #OpenAI

ITCOW牛新网 7月19日消息，OpenAI于当地时间7月18日发布了其最新的小型高性价比模型GPT-4o Mini，致力于以更低的成本提供高效的AI解决方案。GPT-4o Mini在多项测试中表现优异，如MMLU测试中得分82%，并在聊天偏好上优于GPT-4。与前代模型相比，其每百万input tokens仅需15美分，output tokens则为60美分，成本大幅下降，比GPT-3.5 Turbo便宜超过60%。

GPT-4o Mini

GPT-4o Mini

GPT-4o Mini不仅在文本生成和理解方面表现优秀，还具备处理图像、视频和音频的能力。其128K的上下文窗口和16K的输出令牌容量，使其能够处理复杂的上下文信息，适用于广泛的应用场景。值得注意的是，该模型在推理任务、数学和编码能力等方面均优于市场上其他小型模型，并在MMLU、多模态推理、MGSM和HumanEval测试中取得了不俗的成绩。

GPT-4o mini 已经在几个关键基准上进行了评估：

推理任务： GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型，在文本智能和推理基准 MMLU 上的得分为 82.0%，而 Gemini Flash 为 77.9%，Claude Haiku 为 73.8%。
数学和编码能力： GPT-4o mini 在数学推理和编码任务中表现出色，优于市场上之前的小型模型。在测量数学推理的 MGSM 上，GPT-4o mini 得分为 87.0%，而 Gemini Flash 得分为 75.5%，Claude Haiku 得分为 71.7%。在测量编码性能的 HumanEval 上，GPT-4o mini 得分为 87.2%，而 Gemini Flash 得分为 71.5%，Claude Haiku 得分为 75.9%。
多模态推理： GPT-4o mini 在多模态推理评估 MMMU 上也表现出色，得分为 59.4%，而 Gemini Flash 为 56.1%，Claude Haiku 为 50.2%。

GPT-4o Mini

据ITCOW牛新网了解，GPT-4o Mini的安全性和可靠性也得到大幅提升。其采用最新的指令层级法，有效防止了越狱和提示注入等安全风险。

GPT-4o Mini

GPT-4o Mini

目前，GPT-4o Mini已在Assistants API、Chat Completions API和Batch API中上线，未来几天还将推出微调功能。ChatGPT的免费、Plus和团队用户今天起可以使用GPT-4o Mini，以替代 GPT-3.5，企业用户则将在下周开放使用。

相关文章

头条关注科技动态

高通发布骁龙8s Gen4：AI性能提升44% 小米等厂商将首批搭载

深度求索数据采集新专利公布解决大模型训练数据获取难题效率提升40%

Runway发布Gen-4视频生成模型保真度、一致性创新高

更多资讯

文远知行联手优步进军迪拜中国自动驾驶技术首度登陆中东最大城市

2025年 4月 2日

广州地铁开通澳门MPay扫码乘车大湾区三地电子钱包实现互联互通

2025年 4月 2日

头条关注科技动态

高通发布骁龙8s Gen4：AI性能提升44% 小米等厂商将首批搭载

2025年 4月 2日

OpenAI承认ChatGPT服务承压：图像生成功能致用户激增周活突破5亿

2025年 4月 2日