AMD发布首款小型AI语言模型，采用“推测解码”技术减少内存占用

9 月 29, 2024 #AMD-Llama-135m

ITCOW牛新网 9月29日消息，AMD公司近日在Huggingface平台发布了其首款小型AI语言模型——AMD-Llama-135m。这款模型以“推测解码”能力为卖点，旨在通过优化算法减少内存占用。

AMD发布首款小型AI语言模型

据报道，AMD-Llama-135m模型拥有6700亿个token，采用Apache 2.0开源许可，允许开发者自由使用和修改。模型地址可通过点击此处访问。

该模型的“推测解码”技术通过使用小型草稿模型生成候选token，再由更大的目标模型进行验证，从而实现在不影响性能的情况下，每次前向传递生成多个token，显著降低RAM的占用，提高运行效率。

AMD透露，该模型在四个AMD Instinct MI250节点上训练了六天，而其“编程专用版本”AMD-Llama-135m-code则额外花费了四天时间进行微调。

相关文章

深度求索数据采集新专利公布解决大模型训练数据获取难题效率提升40%

Runway发布Gen-4视频生成模型保真度、一致性创新高

人工智能头条关注

ChatGPT图像生成功能向免费用户开放每日限3次使用机会

更多资讯

京东再推薪酬改革：达达员工将享20薪优秀者获集团股票奖励

2025年 4月 2日

乐道汽车总裁艾铁成离职蔚来创始成员沈斐接任重整销售体系

2025年 4月 2日

宁德时代澄清：高速爆燃事故SU7未使用其电池

2025年 4月 2日

真我GT7官宣首批搭载天玑9400+ 3.7GHz主频创联发科芯片新纪录

2025年 4月 2日