M4芯片AI算力排行:开发者绕过限制实测15.8TFLOPS

2026-06-17阅读 0热度 0
AI算力

苹果M4芯片集成的神经网络引擎原本仅面向推理场景开放——开发者虽能借此执行预训练模型,却无法直接在引擎上启动模型训练。如今,X平台用户@0x0SojalSec宣称已成功绕过这一软件限制,并对M4 SoC完成了彻底逆向解析。


破解的核心策略在于将所有数据驻留在RAM中运行,完全避开标准读写路径,因此执行速度极快,交互体验也相当流畅。

@0x0SojalSec于今天凌晨在X平台分享了一个GitHub代码仓库,演示如何解锁M4的全部算力。他没有借助苹果官方的Core ML或Metal等框架(原因是苹果并未开放芯片的直接通信权限),也未调用GPU,而是从零构建了一套自定义MIL(模型中间语言),通过该工具直接与M4进行底层数据交换。

由于苹果对M4硬件能力施加了封锁,整个流程需要采用变通手段。举例来说:当训练进程卡死、必须重置才能继续时,这套自定义MIL会调用exec()指令,使进程重新启动并恢复训练。这样一来,程序能够刷新当前状态,避免直接崩溃,同时维持模型的学习进程。

为提升速度,整个解锁过程完全避免向NAND闪存写入数据。NAND闪存写入较慢,而RAM速度快得多,因此整体流程能够保持高效运转。突破软件限制后,iPad或Mac搭载的M4可达到15.8 TFLOPS的AI处理性能——这一算力足以支撑AI模型的完整训练任务。


需要说明的是,目前尚无法验证这套自定义MIL能否在更新的Apple Silicon芯片上运行,也无法确认exec()在新平台下是否能按预期正常工作。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策