ITCOW牛新网12月14日消息,开发人员Oliver Wehrens进行了对苹果M1 Pro、M2 Ultra和M3 Max三款Apple Silicon芯片升级MLX框架后在AI训练方面的性能测试,同时与英伟达的RTX 4090显卡进行了对比。
Wehrens采用OpenAI的语音识别模型Whisper进行测试,主要测量了转录10分钟音频文件所需的时间。
测试结果显示,M1 Pro处理音频的时间为216秒,而英伟达RTX 4090显卡的处理时间为186秒。
而搭载76个GPU的M2 Ultra和搭载40个GPU的M3 Max在处理性能上表现更为优越,分别为95秒和100秒。
此外,苹果的Apple Silicon芯片在功耗方面也表现得更为出色。在运行状态下,英伟达RTX 4090的功耗比闲置状态高出242W。
而搭载M1 Pro芯片的设备在运行状态下,仅比闲置状态高出38W。
MLX框架的特点包括:
- 熟悉的API: Python和C++ API具有熟悉的框架,如NumPy和PyTorch,使经验丰富的研究人员易于学习。
- 轻松高效: MLX使用可组合的功能转换来优化Apple Silicon的性能。
- 延迟计算: 能够防止不必要的计算并提高资源效率。
- 动态设计: 能够适应输入形状变化,简化了调试和测试过程。
- 软硬结合: MLX无缝利用苹果设备的CPU和GPU,确保用户能够充分利用硬件。
- 统一内存优势: MLX利用苹果统一内存,能够进一步加强数据移动速度。
- 研究人员友好: MLX专为研究人员设计。
这一系列的测试结果显示,苹果的M系列芯片在AI训练方面表现出色,不仅超越了同类的英伟达RTX 4090显卡,而且在功耗方面也有明显的优势。