移远通信大模型深度解析:重构人机交互的AI革命与未来展望
2025年初,DeepSeek的崛起深刻重塑了全球AI产业格局。其技术路径不仅引发了广泛探讨,更关键的是,它强力催化了“边缘+AI”的规模化需求,使得大模型在终端设备的部署与运营成本显著降低。从搜索引擎到机器人,从智能汽车到移动设备,各类应用都在积极寻求与这一新晋技术力量的融合路径。
在此背景下,一个核心议题凸显:端侧AI的演进方向是什么?移远通信产品总监王韬在近期直播中指出,DeepSeek正驱动端侧AI从“被动响应”迈向“主动智能”。当然,伴随机遇而来的,是关于算力分配、算法优化与商业化路径的全新思考与挑战。
DeepSeek带来端侧AI发展新范式
端侧AI并非全新概念。早期实践多依赖DSP等专用芯片处理基础的语音识别或图像增强任务。随着芯片算力持续提升,行业开始尝试将更复杂的算法集成至终端设备。真正的范式转变始于2021年前后,将AI大模型能力植入设备端的思路兴起,标志着端侧AI进入了追求“认知智能”的新阶段。
市场数据清晰印证了这一趋势的潜力。头豹研究院报告显示,2023年中国端侧AI市场规模已达1939亿元,预计到2028年将增长至19071亿元,年均复合增长率高达58%。
中国端侧 AI 市场规模,图源:头豹研究院
从千亿级迈向万亿级市场,未来的增长动力将不再局限于硬件本身,而更依赖于端侧应用与边缘计算、AI大模型的深度融合。这种融合正从技术架构、场景创新与产业生态三个维度,重新定义端侧AI的边界。
相较于云端AI,端侧AI的优势明确:具备更优的实时性、更低的推理成本,并从根本上保障了用户数据隐私。更重要的是,它使大模型的推理能力摆脱了网络依赖,即便在离线或无网环境下,服务也能持续运行。
然而,将庞大的云端AI模型成功部署至资源受限的终端,始终是一项复杂工程。如何平衡端侧的推理效率与模型的强大性能?又该如何实现硬件、软件及商业模式的协同演进?这些都是亟待解决的实际问题。
在DeepSeek出现之前,行业普遍面临一个困境:受限于算力、存储和功耗,端侧设备很难独立承载参数超过100亿的大模型,往往需要云端协同才能完成复杂任务。这不可避免地带来了响应延迟,并引入了隐私风险。同时,当时的模型功能相对单一,难以支撑多模态交互或复杂的主动决策。
DeepSeek的突破性,恰恰在于为破解这些难题提供了新的方法论。其创新的MoE(混合专家)架构是关键。以DeepSeek-V3为例,每层包含256个路由专家和1个共享专家,但每个Token实际仅激活8个专家。这种设计显著降低了训练和推理成本。此外,通过高效的蒸馏技术,能够将大模型的推理能力“迁移”到更小、更高效的版本上,弥补了小模型在自我博弈学习上的不足。更具启发性的是,其实验性版本DeepSeek-R1-Zero证明,仅通过强化学习也能获得强大的推理能力。
这一系列技术路径,使得端侧设备独立处理复杂任务成为可能,真正将应用决策权从云端下放至边缘。移远通信产品经理王柯指出,DeepSeek阐释了一种“少即是多”的部署哲学,极大地加速了模型的小型化进程。如今,一个3B或4B参数级别的模型,其性能表现可能已等效于过去的7B模型。
从硬件视角看,这带来了直接收益。产品经理罗铮补充道,DeepSeek能以更小的模型体量实现更强的能力,这意味着可以采用算力更低的芯片、容量更小的存储和更低的硬件成本,来构建高性能的端侧AI方案。
目前,端侧AI大模型的主要落地场景已覆盖AI PC、AI手机、可穿戴设备、智能家居、智能汽车及新零售等领域。而机器人,特别是人形机器人,则被普遍视为下一个蓝海市场。端侧AI部署正通过技术架构革新与场景适配,推动机器人产业向更高阶的自主化与智能化演进。
一方面,本地化部署能大幅降低数据传输延迟,实现毫秒级的环境感知、决策与执行闭环,满足工业场景中精准抓取、快速避障等高实时性要求。另一方面,端侧大模型能更好地支持视觉、语音、触觉等多模态数据的实时融合处理,让服务型机器人实现更自然、更拟人化的交互。
正如移远通信产品经理沈锋所言,DeepSeek这类模型带来的最直接影响,是实现同等性能的成本显著降低。这促使更多原本处于观望的领域,开始愿意投入并尝试端侧AI。
移远通信为端侧AI落地提供一站式解决方案
面对市场的热情与挑战,产业需要的不仅是理念,更是能够快速将概念转化为产品的工具箱。正如移远通信几位专家所透露,他们正致力于提供一套涵盖智能硬件、算力、算法和服务的完整解决方案,帮助客户跨越从想法到商业落地的鸿沟。
高效支持主流 AI 大模型
AI大模型是智能体的“大脑”。目前,移远的解决方案已能实现AI模型的端侧部署,并支持包括通义千问、DeepSeek在内的主流模型。
以当下备受关注的DeepSeek为例,其R1版本专注于强化学习技术路线,并通过蒸馏技术产生了从1.5B到70B不等的多个小参数版本。这些小模型体量精巧但性能出色,成为端侧部署的理想选择。目前,移远通信的高算力AI智能模组SG885G已经能够稳定运行经过针对性微调的DeepSeek-R1蒸馏小模型。
实测数据颇具说服力:基于SG885G模组的方案,生成Tokens的速度超过每秒40个。作为参考,人类正常语速约为每分钟300-400字,折合500-600个Tokens。这意味着,一个能支持每秒准确输出10个Tokens的AI模型,就已具备商业落地的基本条件。移远当前的方案性能远超此基准线,并且未来仍有优化空间。
这套方案的应用场景非常广泛,涵盖智能机器人、智能座舱、机器视觉、个性化虚拟助理、平板电脑、老人监护、智能家居乃至AI玩具和可穿戴设备。
王柯提到,当许多厂商还在探索如何支持DeepSeek模型时,移远通信已率先取得实质性突破。这背后,体现了技术团队卓越的工程化能力,能够快速完成从方案设计、模型微调、端侧部署到资源调度的全链条工作。
在端侧AI至关重要的语音交互环节,移远的大模型解决方案实现了全语音链路的无缝衔接与高效运行,覆盖了从语音唤醒、人声检测到语音识别和语音播报的主流功能,助力用户快速构建基于语音的无感交互体验。
满足端侧 AI 广泛需求的模组产品矩阵
边缘计算智能模组是承载AI智能体的硬件基石。为满足不同场景下对算力、成本和功耗的差异化需求,移远通信提供了丰富的模组产品矩阵。
SG885G-WF是目前在端侧AI领域的主推型号,它集成高通QCS8550芯片,综合算力高达48 TOPS,并提供了包括显示、摄像头、音频、高速接口在内的丰富资源。此外,其产品线还包括:
■ 基于高通QCS8250的SG865W系列,算力为15 TOPS;
■ 基于高通QCM6490的SG560D系列,算力为12 TOPS;
■ 基于展锐UIS7885的SG530C系列,算力为8 TOPS;
■ 基于瑞芯微RK3568的SG368Z系列,算力为1 TOPS。
罗铮介绍,移远的智能模组产品能够覆盖从1 TOPS到48 TOPS的算力谱系。并且,公司已在规划算力高达80-100 TOPS甚至更高的产品,以应对客户未来不断增长的需求。
除了模组,配套的开发板也是加速方案落地的重要一环。例如在MWC 2025上推出的QuecPi Alpha智能生态开发板,基于高通跃龙QCS6490处理器打造,AI算力达12 TOPS,能够满足众多AIoT应用中对物体识别、图像分析等功能的多样化需求。这些硬件方案都能灵活支持安卓、Linux和Ubuntu等主流操作系统,方便客户在高端机器人和端侧AI产品上进行开发。移远提供的软硬件组合及技术支持,能让客户在不同算力平台间的切换与产品迭代过程变得更加顺畅。
QuecPi Alpha智能生态开发板
智能模组 + AI 大模型,重构端侧 AI 应用
技术与产品的价值,最终需通过场景验证。移远通信“智能模组+AI大模型”的组合拳,正在多个领域重构端侧AI的应用体验。
第一个典型案例是AI机器人。基于SG885G-WF智能模组和全语音链路架构,服务机器人能够对用户的指令、提问或求助做出迅速响应,准确理解意图,并以清晰自然的语音进行反馈,实现真正的无感交互。特别值得一提的是,得益于SG885G-WF的高算力,这套“大模型+AI机器人”解决方案在离线状态下也能提供完整的AI性能,这大大拓展了其应用范围。
这使得服务机器人在医疗康养、智能客服、接待导览、零售导购等领域展现出巨大价值。在落地过程中,移远的技术团队提供全面的工程化支持,帮助客户产品快速上市并形成差异化优势。例如在医疗康养领域,德壹机器人基于移远的方案推出了“全能王AI具身机器人”,它支持8自由度3D视觉导航,融合了尖端AI技术与中医理疗智慧,重新定义了智能理疗服务的边界。
沈锋认为,DeepSeek等AI大模型的涌现,为机器人行业注入了新的活力,重塑了机器人的“大脑”。当前大多数机器人仍以基础功能为主,交互能力存在明显短板,而AI大模型的加入将有效改善这一状况。未来五年,落地到终端的AI机器人数量将快速增长,这是一个极具潜力的赛道。
第二个案例是AI智能无人零售解决方案。在MWC 2025上,移远通信推出了围绕“动态视觉+边缘计算”构建的新方案。该方案基于高性能5G AI算力模组SG560D,支持先进的全链路商品识别算法,识别准确率高达99%,并具备创新的商品上新平台等软硬件服务。除了SG560D搭载的QCM6490平台,该方案还能兼容更多算力平台,以满足不同零售机厂商的差异化竞争需求。
目前,这套AI智能无人零售解决方案已与兴元科技“喵星人”智能售货机等多家客户产品完成系统集成,并进入了实地场景测试阶段。
结语
作为端侧AI生态的关键构建者之一,移远通信正通过“智能模组”与“AI大模型”的双轮驱动,深度参与并重塑产业格局。其一站式解决方案深度融合了DeepSeek等前沿模型,并凭借SG885G-WF等高性能模组,成功突破了端侧部署的算力与工程瓶颈。
在机器人、智能零售、汽车电子等场景中,这种组合正在构建起“本地决策-实时交互-隐私保护”的闭环能力。展望未来,随着更高算力模组的持续迭代以及场景化算法的不断优化,AI大模型的能力必将被拓展至更多、更广阔的端侧应用场景之中。


