苹果端侧AI与云端AI对比：Foundation Models评测

2026-06-13阅读 0热度 0

Model

在WWDC26主题演讲上，苹果正式发布了第三代Apple Foundation Models（AFM）。这次阵容不小，一共五款模型，有的跑在终端设备上，有的部署在云端，还有一款比较特殊——它运行在谷歌云服务器上，依托英伟达芯片提供算力。这个体系怎么运作？我们拆开来看。

从端侧到云端，苹果的AI路径不是一天建成的

时间倒回2024年，苹果最早发布基础模型时，产品线比较简单：一款约30亿参数的端侧语言模型，加上一款更大的服务器端模型，通过Private Cloud Compute（私有云计算）提供服务，运行在苹果自研芯片服务器上。

Private Cloud Compute的定位很明确——在云端提供AI能力的同时，隐私保护级别向端侧看齐。这听起来像一句口号，但苹果确实砸了不少资源去做这件事。把整个系统约束在苹果生态内部，是当时的核心思路：自建数据中心、自研芯片、自有服务器，隐私保障机制还开放给第三方安全研究人员验证。

但AI这件事，光靠“自己玩”是不够的。随着苹果在AI层面的推进遇到天花板，公司选择跟谷歌合作，把Gemini拉进了生态圈。这次WWDC26的成果发布，正是这套新架构的首次公开亮相。

五款模型，各司其职

第三代AFM的具体阵容如下：

端侧模型：AFM 3 Core、AFM 3 Code Advanced
服务器/云端模型：AFM Cloud、ADM 3 Cloud（Image）、AFM 3 Cloud Pro

其中ADM 3 Cloud（Image）里的“D”代表扩散技术（Diffusion），专门负责图像生成。除了AFM 3 Cloud Pro，其他所有模型都跑在苹果自研芯片设备上。而AFM 3 Cloud Pro，则是部署在谷歌云平台的英伟达GPU上。

这件事值得多说一句——这是苹果第一次把Private Cloud Compute架构延伸到第三方基础设施。用他们自己的话说：“在保持同样强大的安全与隐私保护能力的前提下”，实现了跨平台部署。

以下是各模型的官方说明摘要：

重点模型：端侧200亿参数，云端首次“外设”

先说AFM 3 Core Advanced。这是一款端侧模型，参数规模却达到200亿——放在同类产品里算是一个不小的数字。大家知道，消费级产品的端侧模型一般都在几十亿参数徘徊，200亿是如何塞进终端的？

苹果的做法是稀疏架构。简单说，模型不是把200亿参数全部保持激活，而是根据每次输入的提示，动态激活最多40亿参数。这种思路和混合专家模型（Mixture of Experts）有点像，但苹果用的是自己研发的技术——具体细节在一年前的研究论文《面向大语言模型的指令跟随剪枝》里有详细阐述。

换句话说：优先保证计算效率，而不是堆参数就好。

再看AFM 3 Cloud Pro。这是这次唯一部署在外部基础设施的模型。苹果本周在安全博客里发布了架构扩展的技术细节，其中最值得关注的一条是：

苹果与谷歌在此基础上携手构建了一系列能力，其完备程度远超传统保密计算部署的范畴。

这意味着一层更强的封装，不是简单的“把模型放到别人家GPU上跑就完事”。

训练数据：公开、授权、合成——但不碰用户数据

在机器学习研究博客中，苹果指出，这五款模型“在分化为各自架构与应用场景之前，共享同一初始基础”，随后在音频、图像理解、长上下文推理和高质量视觉生成方面分别扩展了多模态能力。

训练数据的来源包括：公开可用信息、经许可或购买的第三方数据、开源数据、专项研究获取的数据、合成数据。苹果特别强调，训练过程中没有使用任何用户数据或用户交互记录。此外，网页发布者可以选择退出基础模型训练，这一点也在功能层面予以支持。

人工评估：与前代对比，表现如何？

苹果对第三代基础模型进行了大规模人工评估。内部评审人员从指令遵循能力、真实性、呈现效果、图像理解等多个维度打分，结果跟自己的前代产品做了对比。

上图展示的是：在通用文本任务的人工同步评估中，AFM 3 Core和AFM 3 Cloud相较于前代模型的优选响应占比。结果按四个地区语言分组呈现——English代表全球英语评估集，PFIGSCJK、DNNSTV、AFIHHMPRTU对应其他受支持的全球语言区域。可以看到，各版本表现基本一致。

在英语图像理解任务的评估中，两代模型的表现差距也比较明显。

听写任务方面，AFM 3 Core Advanced对比苹果现有的生产级听写系统，在七个质量维度上全面领先。整体质量上的正向胜率很明显，格式化和理解两个关键维度也保持了优势。

Q&A

Q1：苹果第三代Apple Foundation Models包含哪些模型？

A：一共五款。端侧模型：AFM 3 Core和AFM 3 Code Advanced，直接在苹果设备上本地运行。服务器端模型：AFM Cloud、ADM 3 Cloud（Image）和AFM 3 Cloud Pro。其中AFM 3 Cloud Pro跑在谷歌云平台托管的英伟达GPU上，是苹果首次把Private Cloud Compute扩展到第三方基础设施。

Q2：AFM 3 Core Advanced的200亿参数，在端侧设备上怎么跑？

A：靠稀疏架构。不是所有200亿参数都激活，而是根据每次输入提示的内容，最多只激活40亿参数。这和混合专家模型（MoE）的概念类似，但苹果用的是自研技术，具体原理参见论文《面向大语言模型的指令跟随剪枝》。这一机制让端侧运行的资源消耗大幅降低。

Q3：训练数据来源有哪些？用没用用户数据？

A：来源包括公开信息、授权或购买的第三方数据、开源数据、专项研究数据和合成数据。苹果明确表示：没有使用任何用户数据或用户交互记录。网页发布者还可以选择退出基础模型训练，确保自身内容不被用于模型开发。

苹果端侧AI与云端AI对比：Foundation Models评测

从端侧到云端，苹果的AI路径不是一天建成的

五款模型，各司其职

重点模型：端侧200亿参数，云端首次“外设”

训练数据：公开、授权、合成——但不碰用户数据

人工评估：与前代对比，表现如何？

Q&A

相关阅读

最新教程

最新资讯