中国移动MoMA平台深度测评：一站式调用超300款AI模型，单位Token成本直降30%

2026-05-09阅读 0热度 0

中国移动

5月8日，中国移动在2026移动云大会主论坛正式推出移动模型服务平台MoMA。该平台已集成超过300款业界主流AI模型，在模型生态丰富度上确立了行业标杆。其首创的Token集约化运营模式，旨在将AI能力转化为如同水电般的基础设施，实现“随时可得、随处可用”，从而加速人工智能在消费市场与垂直行业的规模化落地。

开放普惠，让AI触手可及

MoMA平台的核心设计理念，是构建一个“一次接入、智能优选、普惠可用、安全可信”的一站式模型服务体系，其战略目标在于系统性降低AI技术的应用门槛与集成成本。

通过统一的API网关，用户完成单次接入即可调用平台内全部模型资源。目前，MoMA已整合中国移动自研的“九天”基座大模型，并接入了DeepSeek、通义千问、豆包、Kimi、GLM等市场主流优质模型。这些模型覆盖了文本生成、语音交互、多模态理解等核心能力，能够有效支撑政务、金融、工业、医疗、教育等多元化场景的复杂智能化需求。

平台内置的智能路由引擎，可基于用户任务需求，在“成本优先”、“效果优先”、“均衡优先”三种策略间动态切换，实现模型的最优匹配。当遭遇模型超时、限流或服务异常时，系统支持秒级自动故障切换，保障业务连续性不受影响。

在成本优化层面，MoMA依托国产算力部署自研推理引擎，结合智能路由对长尾模型资源的灵活调度，实现了单位Token成本降低约30%，资源占用率下降超50%的显著成效。通过智能缓存、上下文复用、Token压缩等技术的综合应用，进一步压低了综合使用成本。平台恪守的中立路由原则，协助用户在业务效果与算力支出之间达成精准平衡。

安全可信是AI服务的基石。MoMA为此推出“机密模型”服务，将模型部署于硬件隔离的机密容器中，确保计算全过程的数据“可用不可见”。该能力实现了从芯片层到应用层的全链路机密计算，为政务、金融等高敏感数据场景提供了可靠的安全支撑。

集约运营，助力Token高效调用

如果说开放普惠解决了“用得起、用得上”的准入问题，那么集约化运营则聚焦于“用得好、管得住”的效能挑战。MoMA围绕Token的全生命周期，构建了涵盖精准计量、风险管控与经营分析的完整运营闭环，旨在推动算力资源实现规范化、集约化的高效流转与安全管控。

首先，平台实施流式实时精准计量，端到端计费时延控制在1分钟以内，实现“即用即付”。这彻底改变了传统包时计费模式可能导致的资源浪费，确保了账单的透明性与成本的可控性。

其次，专属风控机制保障了流程的可追溯性与可审计性。该机制从根源上防范了资源挤占、费用超支及服务中断风险，使得每一笔Token的消耗路径清晰、闭环可控。

最后，全链路可观测能力为精细化决策提供了数据支撑。平台实时采集时延、吞吐量、Token消耗、GPU利用率等关键指标，构建了集监控、预警、诊断于一体的一站式运营指标体系，覆盖客户、订购、使用及收入等多维度。这使得AI投入产出比一目了然，为用户进行成本优化与效能提升提供了具体、可操作的数据依据。

展望未来，中国移动将持续优化MoMA平台的服务质量与运营效率，协同产业合作伙伴，共同释放算力基础设施的潜能，开拓智能化应用新空间，最终推动人工智能更广泛、更高效、更安全地赋能经济社会各领域。

中国移动MoMA平台深度测评：一站式调用超300款AI模型，单位Token成本直降30%

开放普惠，让AI触手可及

集约运营，助力Token高效调用

相关阅读

最新教程

最新资讯