微面科技发布全球首个实时生理情绪基座模型,布局硬件
开场先抛出一个关键问题:当前AI人机交互的边界,究竟在哪里?
当我们对着智能音箱下达指令,或让机器人协助拿取物品时,它的响应本质上是“按指令执行”——用户下达一条命令,它响应一个动作。但用户内心的真实状态,例如心不在焉的游离、深层的疲惫感,系统完全无从感知。这正是当下人机交互的核心瓶颈:过于依赖用户的显性输入,而对于那些真正决定沟通质量的隐性信息——譬如一个细微的表情、语调中的波动、甚至一丝难以言说的倦意——几乎处于盲区。
简单来说,当前机器要么只能捕捉肢体动作,要么只能解析语音指令,但始终无法穿透表层,去感知一个人真实的心跳节律与情绪波动。
针对这一痛点,近期一家名为微面科技的科创企业发布了新动作。硬氪获悉,微面科技已完成数百万美元融资,领投方为顺为资本。核心团队来自清华大学,学术背景横跨大模型、人机交互、软件工程与临床医学,技术底蕴扎实。该公司致力于自研人类感知理解的基座模型,目标正是打通这条“看不见的交互通道”。
其解决方案的核心引擎,是rPPG(远程光电容积描记)技术。基于该技术,微面科技全栈自研了面部基座模型FacePhys。该系统可在非接触条件下,实时输出超过120项精细化生理指标——涵盖心率、心率变异性、呼吸率、面部动作单元、眼动特征,乃至深层的情绪维度与语音韵律特征。更关键的是,结合HRV情绪生理晴雨表,模型能将心率变化与剧烈情绪进行精准绑定,不仅能识破刻意装出的假笑,还能捕捉到连用户自身都未察觉的压抑情绪,获取无法伪装的生理真相。这为大模型提供了一个扎实的生理情绪数据入口,打通了感知层。
说起来容易,但rPPG技术在实际落地中挑战极大。最大的障碍,是光照突变、头部运动等“生理噪声”对信号的影响。为解决这一难题,微面科技投入了大量资源——构建了一个万人级的临床标注数据集,包含数千万测量采样点,覆盖了不同肤色与复杂光照场景,并在北京安贞医院完成了严谨的临床实验验证。该数据集使得模型对复杂生理状态的建模能力,真正融入到了基座模型之中,提升了鲁棒性。
技术突破并非止步于此。
微面科技还将“状态空间模型”引入了生理信号建模。创始人唐健凯对此做了一个精妙类比:这与大语言模型“预测下一个Token”的逻辑异曲同工。不同的是,大模型预测下一个词,而状态空间模型预测人体在下一时刻的生理行为状态。它持续追踪心跳、呼吸等生命体征的动态演变过程。唐健凯的原话是——“本质上,我们是将心跳建模为一个连续的物理过程,而非离散视频帧的简单拼接。”
(图片来源:企业供图)
这一突破使系统在捕捉心脏搏动的时间动态特征上,达到了极高的精度。核心性能指标方面,心率检测精度已做到≤2 BPM,达到医疗级标准;端侧的模型推理延迟≤10ms,满足实时交互要求;同时,端侧小模型参数量仅为0.2M,这意味着普通智能手机和摄像头即可本地运行,彻底摆脱云端算力依赖。
在生理理解的基础之上,微面科技进一步构建了多模态的“人类理解系统”。
通过融合动作、姿态、眼动等空间特征,再配合HRV情绪生理晴雨表对心率与急剧情绪的绑定,该模型不仅能准确识别用户情绪,更能深入理解行为背后的需求与动机——甚至预测交互意图与动作轨迹。真正实现了“察言观色”与“知行先觉”的协同能力。
(图片来源:企业供图)
基于这套基座模型,微面科技也在同步推进软硬件一体化的完整布局。
在软件层面,算法能力通过SDK/API形式,向机器人、智能座舱以及健康设备厂商输出。目前规模化落地的核心场景主要有三个:家庭机器人领域,已与海尔机器人等头部客户达成量产合作;康养机器人领域,正助力养老院及社区实现快速健康筛查;仿生机器人领域,实现了毫秒级低延时的自然交互体验。此外,在车载方向,正在与某头部Tier 1供应商合作,推进驾驶员疲劳监测方案的技术验证与量产准备。
硬件层面,公司推出了搭载FacePhys模型的嵌入式摄像头模组。其中核心产品——Findings科研数据采集系统,主要面向科研机构与医院提供高精度数据采集终端,目前已进入批量采购阶段。
以下为硬氪与唐健凯的对话节选(内容经编辑整理):
硬氪:国内外是否还有其它公司在采用rPPG路线进行生理与情绪识别?
唐健凯:海外已有先例。例如FaceHeart,主要聚焦心脏健康监测,并已获得FDA认证,目前更多服务于远程医疗场景。但我们选择的方向不仅限于心率监测,还覆盖情绪、压力、眼动行为等更丰富维度。从能力边界看,我们是在生理感知的基础上,向“人的状态深度理解”拓展。
国内同样有团队研究rPPG,但大部分方案仍处于“录制视频+云端分析”阶段。通常需要录制30秒以上的视频,再上传云端进行统一计算,整体分析过程可能耗时几十秒,难以实现实时响应。一旦用户在采集过程中出现移动、光照变化或姿态波动,系统的鲁棒性会显著下降。
硬氪:为什么微面科技能将基于rPPG的生理感知做得更精准?
唐健凯:模型层面我们做了大量针对性优化。核心思路是引入“状态空间模型”来预测人体下一时刻的生理状态。人的生理状态不会从心率60瞬间跳变到100,它本身具有连续性和周期性。我们的状态空间模型会精准捕捉这种稳定的变化规律,再结合医学上的周期波动特征,持续预测人体当前状态。
此外,数据质量是另一个关键壁垒。我们的训练数据并非依赖大模型“虚拟打标”,而是来自医院合作与专业医疗级设备采集。目前已经建立了万人级临床数据库,客观性与精准度远高于行业标准。
在情绪理解方面,我们也有完整的逻辑框架。例如,心理学研究已证实,高HRV通常对应更积极、放松或兴趣盎然的状态;而剧烈运动导致心率升高,并不意味着情绪波动。因此,我们不仅分析生理指标本身,还会结合动作、姿态、眼动等空间特征,整合判断人的真实状态。
简而言之,我们是将“时间维度上的生理连续性”与“空间维度上的视觉感知能力”融合进一个统一模型中,让AI同时理解人的生理、情绪与行为。
硬氪:为什么决定进一步开发硬件模组?
唐健凯:视频数据与文本不同,信息量巨大。如果所有数据都上传云端处理,不仅延迟高,还会严重影响实时交互体验。因此,我们更倾向于端侧处理方案,让感知与推理直接发生在设备本地,响应更及时,交互也更流畅。
另一个关键因素在于隐私。我们处理的是生理与情绪相关数据,本身高度敏感。尤其是在医疗、健康管理等应用场景中,用户更愿意数据留在本地设备,而不是全部上传到云端API进行处理。
投资人观点
顺为资本表示:微面科技研发的实时生理与情绪理解基座模型,在技术路线与底层架构上具备全球范围内的独特性。该技术可快速适配智能座舱、机器人及智能硬件等多类场景,应用前景广阔。顺为高度认可团队的技术研发与产品落地能力,愿意与微面科技在人、车、家全场景中深度协同、长期陪伴,共同开拓下一代人机交互与具身智能赛道的商业版图。

