苹果端侧AI与云端AI对比:Foundation Models评测

2026-06-13阅读 0热度 0
Model

在WWDC26主题演讲上,苹果正式发布了第三代Apple Foundation Models(AFM)。这次阵容不小,一共五款模型,有的跑在终端设备上,有的部署在云端,还有一款比较特殊——它运行在谷歌云服务器上,依托英伟达芯片提供算力。这个体系怎么运作?我们拆开来看。

苹果全新Foundation Models详解:端侧AI、云端AI及其全面解析

从端侧到云端,苹果的AI路径不是一天建成的

时间倒回2024年,苹果最早发布基础模型时,产品线比较简单:一款约30亿参数的端侧语言模型,加上一款更大的服务器端模型,通过Private Cloud Compute(私有云计算)提供服务,运行在苹果自研芯片服务器上。

Private Cloud Compute的定位很明确——在云端提供AI能力的同时,隐私保护级别向端侧看齐。这听起来像一句口号,但苹果确实砸了不少资源去做这件事。把整个系统约束在苹果生态内部,是当时的核心思路:自建数据中心、自研芯片、自有服务器,隐私保障机制还开放给第三方安全研究人员验证。

但AI这件事,光靠“自己玩”是不够的。随着苹果在AI层面的推进遇到天花板,公司选择跟谷歌合作,把Gemini拉进了生态圈。这次WWDC26的成果发布,正是这套新架构的首次公开亮相。

五款模型,各司其职

第三代AFM的具体阵容如下:

  • 端侧模型:AFM 3 Core、AFM 3 Code Advanced
  • 服务器/云端模型:AFM Cloud、ADM 3 Cloud(Image)、AFM 3 Cloud Pro

其中ADM 3 Cloud(Image)里的“D”代表扩散技术(Diffusion),专门负责图像生成。除了AFM 3 Cloud Pro,其他所有模型都跑在苹果自研芯片设备上。而AFM 3 Cloud Pro,则是部署在谷歌云平台的英伟达GPU上。

这件事值得多说一句——这是苹果第一次把Private Cloud Compute架构延伸到第三方基础设施。用他们自己的话说:“在保持同样强大的安全与隐私保护能力的前提下”,实现了跨平台部署。

以下是各模型的官方说明摘要:

重点模型:端侧200亿参数,云端首次“外设”

先说AFM 3 Core Advanced。这是一款端侧模型,参数规模却达到200亿——放在同类产品里算是一个不小的数字。大家知道,消费级产品的端侧模型一般都在几十亿参数徘徊,200亿是如何塞进终端的?

苹果的做法是稀疏架构。简单说,模型不是把200亿参数全部保持激活,而是根据每次输入的提示,动态激活最多40亿参数。这种思路和混合专家模型(Mixture of Experts)有点像,但苹果用的是自己研发的技术——具体细节在一年前的研究论文《面向大语言模型的指令跟随剪枝》里有详细阐述。

换句话说:优先保证计算效率,而不是堆参数就好。

再看AFM 3 Cloud Pro。这是这次唯一部署在外部基础设施的模型。苹果本周在安全博客里发布了架构扩展的技术细节,其中最值得关注的一条是:

苹果与谷歌在此基础上携手构建了一系列能力,其完备程度远超传统保密计算部署的范畴。

这意味着一层更强的封装,不是简单的“把模型放到别人家GPU上跑就完事”。

训练数据:公开、授权、合成——但不碰用户数据

在机器学习研究博客中,苹果指出,这五款模型“在分化为各自架构与应用场景之前,共享同一初始基础”,随后在音频、图像理解、长上下文推理和高质量视觉生成方面分别扩展了多模态能力。

训练数据的来源包括:公开可用信息、经许可或购买的第三方数据、开源数据、专项研究获取的数据、合成数据。苹果特别强调,训练过程中没有使用任何用户数据或用户交互记录。此外,网页发布者可以选择退出基础模型训练,这一点也在功能层面予以支持。

人工评估:与前代对比,表现如何?

苹果对第三代基础模型进行了大规模人工评估。内部评审人员从指令遵循能力、真实性、呈现效果、图像理解等多个维度打分,结果跟自己的前代产品做了对比。

上图展示的是:在通用文本任务的人工同步评估中,AFM 3 Core和AFM 3 Cloud相较于前代模型的优选响应占比。结果按四个地区语言分组呈现——English代表全球英语评估集,PFIGSCJK、DNNSTV、AFIHHMPRTU对应其他受支持的全球语言区域。可以看到,各版本表现基本一致。

在英语图像理解任务的评估中,两代模型的表现差距也比较明显。

听写任务方面,AFM 3 Core Advanced对比苹果现有的生产级听写系统,在七个质量维度上全面领先。整体质量上的正向胜率很明显,格式化和理解两个关键维度也保持了优势。

Q&A

Q1:苹果第三代Apple Foundation Models包含哪些模型?

A:一共五款。端侧模型:AFM 3 Core和AFM 3 Code Advanced,直接在苹果设备上本地运行。服务器端模型:AFM Cloud、ADM 3 Cloud(Image)和AFM 3 Cloud Pro。其中AFM 3 Cloud Pro跑在谷歌云平台托管的英伟达GPU上,是苹果首次把Private Cloud Compute扩展到第三方基础设施。

Q2:AFM 3 Core Advanced的200亿参数,在端侧设备上怎么跑?

A:靠稀疏架构。不是所有200亿参数都激活,而是根据每次输入提示的内容,最多只激活40亿参数。这和混合专家模型(MoE)的概念类似,但苹果用的是自研技术,具体原理参见论文《面向大语言模型的指令跟随剪枝》。这一机制让端侧运行的资源消耗大幅降低。

Q3:训练数据来源有哪些?用没用用户数据?

A:来源包括公开信息、授权或购买的第三方数据、开源数据、专项研究数据和合成数据。苹果明确表示:没有使用任何用户数据或用户交互记录。网页发布者还可以选择退出基础模型训练,确保自身内容不被用于模型开发。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策