OpenAI新模型o1-preview和o1-mini在聊天机器人竞技场登顶榜首

9 月 20, 2024 #o1-mini, #o1-preview, #OpenAI

ITCOW牛新网 9月20日消息，据科技媒体The Decoder报道，OpenAI的最新人工智能模型o1-preview和o1-mini在聊天机器人竞技场Chatbot Arena上取得了优异成绩，登顶榜首。

聊天机器人竞技场是一个评估和比较不同人工智能模型性能的平台，它通过社区评分来衡量模型的表现。在这次评估中，o1-preview和o1-mini在数学任务、复杂提示和编程方面展现出色的能力，得分超过1360分，远超其他模型。

OpenAI新模型o1-preview和o1-mini在聊天机器人竞技场登顶榜首

这些模型的目标是为AI推理设定新的标准，它们在回答问题前会进行更长时间的“思考”，以提供更准确的答案。然而，o1模型在某些任务上并不总是优于GPT-4o，尤其是那些不需要复杂逻辑推理的任务，GPT-4o的反应速度可能更快。

需要注意的是，尽管o1-preview和o1-mini在Chatbot Arena上的表现令人印象深刻，但它们的票数远低于GPT-4o或Anthropic的Claude 3.5等成熟模型。每个模型的评论数量不到3000条，这样的样本量可能无法完全准确地代表所有用户的实际体验，因此这些结果的意义可能受到一定限制。

人工智能头条关注

OpenAI新模型o1-preview和o1-mini在聊天机器人竞技场登顶榜首

相关文章

OpenAI 正式上线 Sora 文生视频模型，支持多场景创作

小米首款SUV车型YU7申报图曝光，预计明年中旬上市

英伟达因涉嫌违反《反垄断法》被立案调查

更多资讯

美版三星 Galaxy S25 Ultra 配置曝光：2 亿像素主摄，搭载骁龙 8 至尊版

《黑神话：悟空》1.0.12.16581 更新推出全新挑战模式与地图功能

阿里巴巴回应河源数据中心火情：未对云服务造成任何影响

极氪 009 推送 OS 5.3 更新，新增多项智能化功能