中国移动MoMA平台深度测评:一站式调用超300款AI模型,单位Token成本直降30%

2026-05-09阅读 0热度 0
中国移动

5月8日,中国移动在2026移动云大会主论坛正式推出移动模型服务平台MoMA。该平台已集成超过300款业界主流AI模型,在模型生态丰富度上确立了行业标杆。其首创的Token集约化运营模式,旨在将AI能力转化为如同水电般的基础设施,实现“随时可得、随处可用”,从而加速人工智能在消费市场与垂直行业的规模化落地。

开放普惠,让AI触手可及

MoMA平台的核心设计理念,是构建一个“一次接入、智能优选、普惠可用、安全可信”的一站式模型服务体系,其战略目标在于系统性降低AI技术的应用门槛与集成成本。

通过统一的API网关,用户完成单次接入即可调用平台内全部模型资源。目前,MoMA已整合中国移动自研的“九天”基座大模型,并接入了DeepSeek、通义千问、豆包、Kimi、GLM等市场主流优质模型。这些模型覆盖了文本生成、语音交互、多模态理解等核心能力,能够有效支撑政务、金融、工业、医疗、教育等多元化场景的复杂智能化需求。

平台内置的智能路由引擎,可基于用户任务需求,在“成本优先”、“效果优先”、“均衡优先”三种策略间动态切换,实现模型的最优匹配。当遭遇模型超时、限流或服务异常时,系统支持秒级自动故障切换,保障业务连续性不受影响。

在成本优化层面,MoMA依托国产算力部署自研推理引擎,结合智能路由对长尾模型资源的灵活调度,实现了单位Token成本降低约30%,资源占用率下降超50%的显著成效。通过智能缓存、上下文复用、Token压缩等技术的综合应用,进一步压低了综合使用成本。平台恪守的中立路由原则,协助用户在业务效果与算力支出之间达成精准平衡。

安全可信是AI服务的基石。MoMA为此推出“机密模型”服务,将模型部署于硬件隔离的机密容器中,确保计算全过程的数据“可用不可见”。该能力实现了从芯片层到应用层的全链路机密计算,为政务、金融等高敏感数据场景提供了可靠的安全支撑。

集约运营,助力Token高效调用

如果说开放普惠解决了“用得起、用得上”的准入问题,那么集约化运营则聚焦于“用得好、管得住”的效能挑战。MoMA围绕Token的全生命周期,构建了涵盖精准计量、风险管控与经营分析的完整运营闭环,旨在推动算力资源实现规范化、集约化的高效流转与安全管控。

首先,平台实施流式实时精准计量,端到端计费时延控制在1分钟以内,实现“即用即付”。这彻底改变了传统包时计费模式可能导致的资源浪费,确保了账单的透明性与成本的可控性。

其次,专属风控机制保障了流程的可追溯性与可审计性。该机制从根源上防范了资源挤占、费用超支及服务中断风险,使得每一笔Token的消耗路径清晰、闭环可控。

最后,全链路可观测能力为精细化决策提供了数据支撑。平台实时采集时延、吞吐量、Token消耗、GPU利用率等关键指标,构建了集监控、预警、诊断于一体的一站式运营指标体系,覆盖客户、订购、使用及收入等多维度。这使得AI投入产出比一目了然,为用户进行成本优化与效能提升提供了具体、可操作的数据依据。

展望未来,中国移动将持续优化MoMA平台的服务质量与运营效率,协同产业合作伙伴,共同释放算力基础设施的潜能,开拓智能化应用新空间,最终推动人工智能更广泛、更高效、更安全地赋能经济社会各领域。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策