机器人控制算法权威排行榜:ICRA 2026 KAN网络与主流方法深度对比及推荐
先给出几个关键结论:在机器人三维操控领域,扩散策略尽管分布建模能力突出,但其多步去噪导致推理迟滞、模型臃肿,实际部署阻力极大。流匹配方法虽通过一步向量场加速了生成,但现有方案仍普遍绑定UNet骨架,计算负载与推理延时居高不下。
那么,能否在维持精度的同时,把模型做轻、做快?
一、整体概览
本文提出的KAN-We-Flow正是直击这一痛点。其核心思路简洁:以RWKV+KAN替代传统的大规模UNet主干。最终参数量压缩约86.8%,推理延迟降至毫秒级,关键是成功率未降反升,在Adroit、Meta-World、DexArt三大主流基准上达到当前最优或持平水平。
换句话说,它在保持甚至提升操作精度的同时,把模型从“重型卡车”换成了“跑车”,真正实现了实时控制。
二、研究背景
先看看当前领域卡在何处。
扩散策略的优势在于动作分布建模能力强,生成的动作平滑自然,但代价是迭代去噪导致推理慢、模型笨重,直接部署到真实机器人上,延迟根本无法接受。
流匹配策略作为改进方向,通过学习一步向量场实现快速生成,但现有流匹配方法仍普遍依赖UNet这样的庞大结构,计算与存储开销依然不低。
因此核心问题明确:如何在保证精度的前提下,进一步缩小模型并提升实时性?
三、动机与直觉
讲完问题,再看推动该方案的直觉逻辑。其实并不复杂:
RWKV凭借线性复杂度的时序建模能力,天然适配机器人长序列动作预测。KAN则通过可学习的一维函数逼近,用更少参数表达更复杂的非线性映射。两者结合,直接瞄准“长时序依赖”与“参数效率”两个痛点。
换言之,与其在UNet大框架下修修补补,不如直接换一个更轻量、更高效率的骨干。
四、技术路线
整体框架采用“一致性流匹配”方向,目标为一步动作生成。输入包含点云感知信息、机器人当前状态及时间编码。
核心网络部分替换为RWKV-KAN骨干:RWKV负责时间与通道混合,专门建模动作序列上下文;GroupKAN则对特征通道分组,进行非线性函数校准,直接取代传统MLP。
值得重点提及的是Action Consistency Regularization(ACR)。它利用欧拉外推,使一步预测的动作在末端与专家轨迹对齐——相当于在训练阶段额外提供一层稳定监督,且推理阶段完全零额外开销。
最终学习目标清晰:将一致性流匹配损失与ACR正则项联合进行端到端训练。
五、实验结果
性能层面,在Adroit、Meta-World、DexArt三个基准上,KAN-We-Flow的整体成功率全面优于FlowPolicy和DP3,尤其在高难度、长时序任务中优势显著。
效率数据更直接:参数量约33.6M,相比DP3减少86.8%;推理时间仅8~11毫秒,足以支撑100Hz的实时控制。
消融实验验证了预期:RWKV、GroupKAN、ACR三个组件均提供稳定的正向增益。其中ACR在长预测窗口下能明显抑制动作漂移问题。




