机器人控制算法权威排行榜：ICRA 2026 KAN网络与主流方法深度对比及推荐

2026-05-29阅读 0热度 0

机器人

先给出几个关键结论：在机器人三维操控领域，扩散策略尽管分布建模能力突出，但其多步去噪导致推理迟滞、模型臃肿，实际部署阻力极大。流匹配方法虽通过一步向量场加速了生成，但现有方案仍普遍绑定UNet骨架，计算负载与推理延时居高不下。

那么，能否在维持精度的同时，把模型做轻、做快？

一、整体概览

本文提出的KAN-We-Flow正是直击这一痛点。其核心思路简洁：以RWKV+KAN替代传统的大规模UNet主干。最终参数量压缩约86.8%，推理延迟降至毫秒级，关键是成功率未降反升，在Adroit、Meta-World、DexArt三大主流基准上达到当前最优或持平水平。

换句话说，它在保持甚至提升操作精度的同时，把模型从“重型卡车”换成了“跑车”，真正实现了实时控制。

先看看当前领域卡在何处。

扩散策略的优势在于动作分布建模能力强，生成的动作平滑自然，但代价是迭代去噪导致推理慢、模型笨重，直接部署到真实机器人上，延迟根本无法接受。

流匹配策略作为改进方向，通过学习一步向量场实现快速生成，但现有流匹配方法仍普遍依赖UNet这样的庞大结构，计算与存储开销依然不低。

因此核心问题明确：如何在保证精度的前提下，进一步缩小模型并提升实时性？

讲完问题，再看推动该方案的直觉逻辑。其实并不复杂：

RWKV凭借线性复杂度的时序建模能力，天然适配机器人长序列动作预测。KAN则通过可学习的一维函数逼近，用更少参数表达更复杂的非线性映射。两者结合，直接瞄准“长时序依赖”与“参数效率”两个痛点。

换言之，与其在UNet大框架下修修补补，不如直接换一个更轻量、更高效率的骨干。

整体框架采用“一致性流匹配”方向，目标为一步动作生成。输入包含点云感知信息、机器人当前状态及时间编码。

核心网络部分替换为RWKV-KAN骨干：RWKV负责时间与通道混合，专门建模动作序列上下文；GroupKAN则对特征通道分组，进行非线性函数校准，直接取代传统MLP。

值得重点提及的是Action Consistency Regularization（ACR）。它利用欧拉外推，使一步预测的动作在末端与专家轨迹对齐——相当于在训练阶段额外提供一层稳定监督，且推理阶段完全零额外开销。

最终学习目标清晰：将一致性流匹配损失与ACR正则项联合进行端到端训练。

性能层面，在Adroit、Meta-World、DexArt三个基准上，KAN-We-Flow的整体成功率全面优于FlowPolicy和DP3，尤其在高难度、长时序任务中优势显著。

效率数据更直接：参数量约33.6M，相比DP3减少86.8%；推理时间仅8~11毫秒，足以支撑100Hz的实时控制。

消融实验验证了预期：RWKV、GroupKAN、ACR三个组件均提供稳定的正向增益。其中ACR在长预测窗口下能明显抑制动作漂移问题。