根据最新消息,小米公司的 AI 大模型 MiLM-6B 已经悄然出现在 C-Eval 和 CMMLU 的大模型评测榜单中。截至目前,小米的大模型在 C-Eval 总榜单中排名第10,在同等参数量级的模型中排名第一。

小米 AI 大模型 MiLM-6B 曝光,C-Eval 总榜单第10

MiLM-6B 是小米公司开发的一款大规模预训练语言模型,拥有64亿个参数。根据 GitHub 项目页的介绍,该模型在各科目上表现出色。在STEM(科学、技术、工程和数学教育)的20个科目中,包括计量师、物理、化学和生物等多个项目,都取得了较高的准确率。

据了解,MiLM-6B 在大多数文科科目中表现良好,但在涉及”抽象思维”的科目如法学、数学、编程、概率论和离散数学等方面仍有进步的空间。

在10个社会科学测试科目中,MiLM-6B 在除教育学和地理之外的其他8个科目中都取得了较为理想的准确率。而在人文科学的11个科目中,MiLM-6B 在历史与法律方面的表现也相当不错。

MiLM-6B 是一款高度完成度的 AI 大模型,将来可能会被应用于小米旗下的虚拟助理服务,如”小爱同学”等。