微面科技发布全球首个实时生理情绪基座模型，布局硬件

2026-06-12阅读 0热度 0

机器人

开场先抛出一个关键问题：当前AI人机交互的边界，究竟在哪里？

当我们对着智能音箱下达指令，或让机器人协助拿取物品时，它的响应本质上是“按指令执行”——用户下达一条命令，它响应一个动作。但用户内心的真实状态，例如心不在焉的游离、深层的疲惫感，系统完全无从感知。这正是当下人机交互的核心瓶颈：过于依赖用户的显性输入，而对于那些真正决定沟通质量的隐性信息——譬如一个细微的表情、语调中的波动、甚至一丝难以言说的倦意——几乎处于盲区。

简单来说，当前机器要么只能捕捉肢体动作，要么只能解析语音指令，但始终无法穿透表层，去感知一个人真实的心跳节律与情绪波动。

针对这一痛点，近期一家名为微面科技的科创企业发布了新动作。硬氪获悉，微面科技已完成数百万美元融资，领投方为顺为资本。核心团队来自清华大学，学术背景横跨大模型、人机交互、软件工程与临床医学，技术底蕴扎实。该公司致力于自研人类感知理解的基座模型，目标正是打通这条“看不见的交互通道”。

其解决方案的核心引擎，是rPPG（远程光电容积描记）技术。基于该技术，微面科技全栈自研了面部基座模型FacePhys。该系统可在非接触条件下，实时输出超过120项精细化生理指标——涵盖心率、心率变异性、呼吸率、面部动作单元、眼动特征，乃至深层的情绪维度与语音韵律特征。更关键的是，结合HRV情绪生理晴雨表，模型能将心率变化与剧烈情绪进行精准绑定，不仅能识破刻意装出的假笑，还能捕捉到连用户自身都未察觉的压抑情绪，获取无法伪装的生理真相。这为大模型提供了一个扎实的生理情绪数据入口，打通了感知层。

说起来容易，但rPPG技术在实际落地中挑战极大。最大的障碍，是光照突变、头部运动等“生理噪声”对信号的影响。为解决这一难题，微面科技投入了大量资源——构建了一个万人级的临床标注数据集，包含数千万测量采样点，覆盖了不同肤色与复杂光照场景，并在北京安贞医院完成了严谨的临床实验验证。该数据集使得模型对复杂生理状态的建模能力，真正融入到了基座模型之中，提升了鲁棒性。

技术突破并非止步于此。

微面科技还将“状态空间模型”引入了生理信号建模。创始人唐健凯对此做了一个精妙类比：这与大语言模型“预测下一个Token”的逻辑异曲同工。不同的是，大模型预测下一个词，而状态空间模型预测人体在下一时刻的生理行为状态。它持续追踪心跳、呼吸等生命体征的动态演变过程。唐健凯的原话是——“本质上，我们是将心跳建模为一个连续的物理过程，而非离散视频帧的简单拼接。”

（图片来源：企业供图）

这一突破使系统在捕捉心脏搏动的时间动态特征上，达到了极高的精度。核心性能指标方面，心率检测精度已做到≤2 BPM，达到医疗级标准；端侧的模型推理延迟≤10ms，满足实时交互要求；同时，端侧小模型参数量仅为0.2M，这意味着普通智能手机和摄像头即可本地运行，彻底摆脱云端算力依赖。

在生理理解的基础之上，微面科技进一步构建了多模态的“人类理解系统”。

通过融合动作、姿态、眼动等空间特征，再配合HRV情绪生理晴雨表对心率与急剧情绪的绑定，该模型不仅能准确识别用户情绪，更能深入理解行为背后的需求与动机——甚至预测交互意图与动作轨迹。真正实现了“察言观色”与“知行先觉”的协同能力。

（图片来源：企业供图）

基于这套基座模型，微面科技也在同步推进软硬件一体化的完整布局。

在软件层面，算法能力通过SDK/API形式，向机器人、智能座舱以及健康设备厂商输出。目前规模化落地的核心场景主要有三个：家庭机器人领域，已与海尔机器人等头部客户达成量产合作；康养机器人领域，正助力养老院及社区实现快速健康筛查；仿生机器人领域，实现了毫秒级低延时的自然交互体验。此外，在车载方向，正在与某头部Tier 1供应商合作，推进驾驶员疲劳监测方案的技术验证与量产准备。

硬件层面，公司推出了搭载FacePhys模型的嵌入式摄像头模组。其中核心产品——Findings科研数据采集系统，主要面向科研机构与医院提供高精度数据采集终端，目前已进入批量采购阶段。

以下为硬氪与唐健凯的对话节选（内容经编辑整理）：

硬氪：国内外是否还有其它公司在采用rPPG路线进行生理与情绪识别？

唐健凯：海外已有先例。例如FaceHeart，主要聚焦心脏健康监测，并已获得FDA认证，目前更多服务于远程医疗场景。但我们选择的方向不仅限于心率监测，还覆盖情绪、压力、眼动行为等更丰富维度。从能力边界看，我们是在生理感知的基础上，向“人的状态深度理解”拓展。

国内同样有团队研究rPPG，但大部分方案仍处于“录制视频+云端分析”阶段。通常需要录制30秒以上的视频，再上传云端进行统一计算，整体分析过程可能耗时几十秒，难以实现实时响应。一旦用户在采集过程中出现移动、光照变化或姿态波动，系统的鲁棒性会显著下降。

硬氪：为什么微面科技能将基于rPPG的生理感知做得更精准？

唐健凯：模型层面我们做了大量针对性优化。核心思路是引入“状态空间模型”来预测人体下一时刻的生理状态。人的生理状态不会从心率60瞬间跳变到100，它本身具有连续性和周期性。我们的状态空间模型会精准捕捉这种稳定的变化规律，再结合医学上的周期波动特征，持续预测人体当前状态。

此外，数据质量是另一个关键壁垒。我们的训练数据并非依赖大模型“虚拟打标”，而是来自医院合作与专业医疗级设备采集。目前已经建立了万人级临床数据库，客观性与精准度远高于行业标准。

在情绪理解方面，我们也有完整的逻辑框架。例如，心理学研究已证实，高HRV通常对应更积极、放松或兴趣盎然的状态；而剧烈运动导致心率升高，并不意味着情绪波动。因此，我们不仅分析生理指标本身，还会结合动作、姿态、眼动等空间特征，整合判断人的真实状态。

简而言之，我们是将“时间维度上的生理连续性”与“空间维度上的视觉感知能力”融合进一个统一模型中，让AI同时理解人的生理、情绪与行为。

硬氪：为什么决定进一步开发硬件模组？

唐健凯：视频数据与文本不同，信息量巨大。如果所有数据都上传云端处理，不仅延迟高，还会严重影响实时交互体验。因此，我们更倾向于端侧处理方案，让感知与推理直接发生在设备本地，响应更及时，交互也更流畅。

另一个关键因素在于隐私。我们处理的是生理与情绪相关数据，本身高度敏感。尤其是在医疗、健康管理等应用场景中，用户更愿意数据留在本地设备，而不是全部上传到云端API进行处理。

投资人观点

顺为资本表示：微面科技研发的实时生理与情绪理解基座模型，在技术路线与底层架构上具备全球范围内的独特性。该技术可快速适配智能座舱、机器人及智能硬件等多类场景，应用前景广阔。顺为高度认可团队的技术研发与产品落地能力，愿意与微面科技在人、车、家全场景中深度协同、长期陪伴，共同开拓下一代人机交互与具身智能赛道的商业版图。

微面科技发布全球首个实时生理情绪基座模型，布局硬件

相关阅读

最新教程

最新资讯