字节跳动Seed-Thinking-v1.5模型发布：推理成本降50% 17日开放体验

4 月 14, 2025 #字节跳动Seed-Thinking-v1.5模型

ITCOW牛新网 4月14日消息，字节跳动旗下豆包大模型团队今日公开了Seed-Thinking-v1.5技术细节，这款采用MoE架构的200B参数大模型将于4月17日通过火山引擎开放体验。该模型在保持顶尖性能表现的同时，单位推理成本较DeepSeek R1降低50%，实现效率与性能的完美平衡。

据ITCOW牛新网了解，Seed-Thinking-v1.5采用总参数200B、激活参数20B的MoE架构设计，在数学推理、编程竞赛和科学推理等专业领域表现亮眼：AIME 2024得分86.7追平OpenAI o3-mini-high，Codeforces pass@8达55.0%接近Gemini 2.5 Pro，GPQA得分77.3%同样达到业界第一梯队水平。通用任务表现更是超越DeepSeek R1达8%。

创新数据体系与训练方法

数据体系采用”双轨制”：可验证数据通过三重清洗保留10万道高难度题目，非可验证数据优化生成质量
训练方法创新：监督精调阶段构建40万高质量实例，强化学习阶段通过三重数据引擎动态调整
评测基准升级：构建超难数学数据集BeyondAIME，解决现有测试区分度不足问题

为支撑20B MoE模型的复杂训练需求，团队开发HybridFlow编程模型和流式推理系统(SRS)，训练速度提升3倍。三层并行架构结合KARP算法，在万亿参数规模下仍保持95%的稳定性。

人工智能

字节跳动Seed-Thinking-v1.5模型发布：推理成本降50% 17日开放体验

相关文章

快手可灵AI 2.0发布：视频生成技术再突破，月活用户激增25倍

OpenAI发布GPT-4.1系列API：编程效率提升40% 成本最高降83%

OpenAI将推出全新开源模型阿尔特曼：DeepSeek未影响GPT增长

更多资讯

《流浪地球3》开机！原班人马集结开启中国科幻新篇章

三星One UI 7.0更新现Bug：电池图标神秘消失，官方给出解决方案

快手可灵AI 2.0发布：视频生成技术再突破，月活用户激增25倍

百度地图V21版发布：全球首个”智驾级导航”系统，4月18日全量上线