ITCOW牛新网 3月3日消息,科大讯飞今日宣布其深度推理大模型星火X1全面升级,并同步发布星火一体机等系列新品。此次升级重点提升了星火X1的数学能力,全面对标DeepSeek R1和OpenAI o1,在竞赛级难题处理、中小学作业批改及辅导等任务中展现出明显优势。

星火X1数学测试
星火X1数学测试:中文测试集来自 2023/2024 年各学段考试真题 / 模拟题 / 竞赛题,英文测试集来自 AIME 2024/2025 和 MATH 500 竞赛集

据ITCOW牛新网了解,升级后的星火X1不仅在数学领域表现突出,还推动了讯飞晓医、星火教师助手、AI法官助理等应用与产品的全面升级。其中,讯飞晓医首次搭载星火医疗大模型X1,大幅降低了医疗幻觉问题,在复杂场景推理中表现出更高的逻辑正确性和专业性。例如,用户在咨询疾病用药时,晓医能够结合个人健康档案,提供个性化且详实的处理意见。

星火X1医疗测试
星火X1医疗测试

星火教师助手则通过思维链显性化技术,实现了AI教学工具的“思维可视化”,帮助教师更清晰地设计教学方案,并提升课堂互动效果。此外,AI法官助理在证据审查、量刑辅助等法律场景中,深度融合星火长思维链技术,显著提升了法律推理能力,为案件审理提供了更高效的支持。


星火X1教学模拟测试
星火X1教学模拟测试
星火X1法律相关测试
星火X1法律相关测试