AI数据泄露风险排行榜:甲方乙方应对策略
聊工业AI的数据安全,谁最紧张?答案往往落在乙方服务商身上。蘑菇物联CEO沈国辉直言,服务商泄露数据等于砸自己饭碗,甲方最多就是掉颗饭粒。你见过哪个快递员为了一个包裹,会拿自己的生计开玩笑?没这种傻事。
这个比喻精准点破了数据安全里微妙的权责关系。真正如履薄冰的,是服务商,不是客户。
沈国辉讲得很坦率:“数据从甲方工厂设备里采集出来,借个胆子也不敢泄露。真出事,公司直接关门,赔偿能把人压死。甲方呢?数据泄露可能算个事故,但完全不是一个量级。”他进一步强调,公司的护城河由三大支柱构成:算法、协议和数据。算法是入场券,没有硬实力,客户连服务机会都不会给;通讯协议是数据采集的前提,连不上设备,再好的产品也只是纸上谈兵。过去十年,他们积累了超过1600种设备通讯协议,业内甚至有一种说法:“蘑菇物联连不上的设备,别人也连不上。”最后才是数据积累——目前日均处理超过100GB工业数据,这些数据必须经过清洗、标准化到特征工程的完整流程,这才形成了独特壁垒。即使在当前市场环境下,他们依然保持了增长。
但市场正在变局。沈国辉观察到,客户的预算和需求都在收缩,更棘手的是,“劣币驱逐良币”的现象开始抬头。一些厂商为了迎合客户对短期回报的焦虑,在合同里写满承诺、海口乱夸,最后验收时不了了之,留下一堆烂摊子。这种情况,他看在眼里,也颇感无奈。
【 以下为本次访谈核心内容 】
工业AI的“黄金场景”:哪些环节最值得投入?
沈国辉:工业AI的价值落点,可以清晰划分为三个层级。
最优的场景,是直接帮客户拿订单、创造营收。在制造业里,这才是真正能让客户眼前一亮的硬价值。其次是创造可量化、可衡量的降本价值,比如省电、省人。这件事必须能装个电表测出来,或者明确算出少花了几个人工成本。最后,才是大家常说的提效提质。当然也有价值,但说服力相对更弱。
简单总结,制造业最关心的就是四个关键词:增收、降本、提效、提质。增收最难,但价值天花板最高。从当前市场反馈看,第二层级——可验证、可量化的降本效果,是客户最愿意掏真金白银买单的价值点。
工厂空压站现场图
巨头环伺,蘑菇物联的差异化壁垒在哪?
沈国辉:我们的护城河非常清晰,就是算法、协议和数据三位一体的闭环。
首先是算法能力。很多人以为工业AI等于大模型,但我们远不止于此。只用大模型根本形不成壁垒,因为谁都能用,甲方自己也能调。我们的独特之处,是把大模型跟强化学习、马尔科夫过程、傅里叶变换、随机森林这些传统AI技术进行了深度融合。大语言模型擅长文字推理,但对工业设备产生的时序数据效率并不高,甚至会出现“幻觉”。结合传统算法,才能更高效地处理设备数据。
其次是设备通讯协议。这是数据采集的“桥”,连不上设备,再好的算法也只是空中楼阁。我们专攻空压机、中央空调这类高耗能通用设备,这两个特点很关键:能耗高,节能需求强;通用性强,市场空间大。过去十年,我们积累了超过1600种设备通讯协议。协议对别人是巨大障碍,但我们却手到擒来,这是实打实的门槛。现在行业里有种说法,“蘑菇物联连不上的设备,别人也连不上”,这正是我们的价值所在。
最后才是数据积累。通过实际服务客户,获取真实场景下的设备运行数据。目前我们日均处理超过100GB工业数据,都要经过严格的三步处理:数据清洗,去除传感器噪声;数据标准化,转换成可分析格式;特征工程,提取有价值的工业特征。这个闭环,让我们形成了独特的数据优势,也是即使在艰难市场环境下仍能保持增长的核心原因。
工厂制冷站房现场图
从监控到优化:工业客户的需求是如何演变的?
沈国辉:这个问题问得很到位。举个生活化的例子,就像我们买智能手表,有人为了测心率,有人为了计步数,还有人纯粹为了好看。设备监控也是这个逻辑。
最初,客户的需求很简单:随时知道设备是否正常运转。这就像给设备装了个“健康手环”。但随着发展,客户发现光知道“设备现在好不好”远远不够,他们更想知道“设备什么时候会坏”。这就是预测性维护的价值所在。以空压机为例,突然停机可能让整条生产线瘫痪,损失高达上百万。通过AI分析设备数据,我们可以提前预警潜在故障,避免非计划停机。
现在,客户的需求又升级了:不仅要设备不坏,还要运行得更高效。就像我们不光希望手表能测心率,还希望它能给出健康建议。能效优化,就是在保证设备可靠性的前提下,帮客户省下真金白银的能耗成本。
这个发展过程,本质上是从“事后处理”到“事前预防”,再到“主动优化”的升级。每一步都对应着客户痛点的深化和需求的升级。预测性维护是被动防御,而能效优化则需要主动控制设备运行参数。
这一发展路径,与行业特点密切相关。2009年“感知中国”战略催生了一批设备监测公司,主要解决“设备会不会坏”的问题。但空压机、中央空调这些高耗能设备占工厂能耗的40%~60%,客户更迫切的需求是“怎么更省电”。我们选择专注于这个领域,主要基于三个维度的考量:一是通用性带来的庞大市场规模;二是高能耗特性蕴含的巨大节能潜力,客户付费意愿强;三是这类设备有实时的控制需求,为技术介入提供了重要切入点。
以电子行业为例,我们通过优化空压机群控策略,成功帮客户实现了15%~20%的能耗节省,而且这种节能效果是完全可测量、可验证的。
工程师在AI云智控软件上查看供气压力数据
经济下行,市场到底发生了哪些变化?
沈国辉:变化很明显,可以概括为三点。
第一,客户预算极度谨慎。现在的工业客户,就像手里攥着5000块钱,却只敢花1000块的消费者。投资回报周期要求从原来的3-4年,直接压缩到2年以内。他们对“增收”类项目普遍观望,更看重“降本”,尤其是可量化的节能项目,而不是模糊的效率提升。
第二,客户需求更加务实。现在,最愿意买单的是“看得见、算得清”的价值:节能效果要精确到度,故障预测能力要可验证,最好还能省下人力。
第三,也是我最担心的,是“劣币驱逐良币”现象。部分厂商为了迎合客户短期回报的诉求,在合同里乱承诺、夸海口,最后项目验收时不了了之,留下一堆烂尾工程。但我们蘑菇物联始终坚持三个底线原则:所有数据真实可追溯,效果必须经得起第三方验证,不承诺超出技术能力范围的回报。
标准化与定制化,如何权衡?
沈国辉:我们标准化SaaS的占比很高,超过了80%,定制化只占一小部分。标准化SaaS主要面向多数客户的共性需求,通过SaaS化部署快速落地;部分大型客户有私有化部署需求,会涉及少量定制化。
专注于高耗能通用设备这个特性,让我们能用标准化产品覆盖大部分场景。如果去做专用设备的数字化,同行往往不得不依赖私有化部署,最后大概率会沦为定制化解决方案。我们通过聚焦通用设备场景,成功避免了这种困境。
数据样本少,如何训练高精度模型?
沈国辉:核心在于数据治理。无论是大模型还是小模型,数据质量直接决定精度。数据治理不到位、结构混乱,模型就容易出“幻觉”,优化效果也会大打折扣。
我们的路径很清晰:先通过物联网采集数据,然后过滤掉传感器产生的噪点和毛刺,完成清洗;再将数据结构化,完善治理,形成数据集;最后用高质量数据集训练模型,不断迭代提升精度。物联网数据量极大,人工清洗不现实,必须靠算法自动化处理,这本身就是技术门槛。打个比方,数据就像石油,纯度不够的油会让发动机抖动,而经过治理的“纯正数据”才能为模型提供持续动力。基础打牢,模型精度才有保障。
通用工业设备空压机的数据正在被采集上传
数据存在你们那,安全怎么保证?
沈国辉:工业AI与智能驾驶类似,都采用云边端架构。核心是根据功能需求分配算力与存储资源。云端负责需要大存储、大算力的任务,比如模型训练和迭代。边缘端部署的是经过“蒸馏”的训练好的模型,负责实时计算与控制,服务器直接安装在空压站、中央空调机房等能源站房内,离设备只有几米到十几米,能实现毫秒级响应。
我们的决策标准是:需要实时处理、强调及时反应与独立运行的任务,比如设备控制,必须放在边缘端,避免依赖无线网络。大存储和模型训练迭代则放在云端。边缘端与云端每小时同步一次数据即可,模型迭代时通过OTA远程升级从云端推送到边缘端。
回到安全问题。数据是从甲方工厂设备里采出来的,设备是他的,数据自然也是他的。我们拿了他的数据,敢乱来?借个胆子也不敢!真泄露了,公司直接关门,赔得倾家荡产。甲方呢?数据泄露了可能算工作失误,根本不是一码事。我们比甲方紧张多了。
我们拿数据是当石油来加工的,是帮他创造价值的,不是拿去卖钱的。真能卖钱这生意倒好做了,可甲方能答应吗?甲方真没必要担心,实在不放心,签协议,加惩罚条款,怎么罚都行,规矩我们都认。还是那句话,乙方泄露数据是砸自己饭碗,甲方最多掉颗饭粒,谁傻啊!
一个真实案例:AI是如何解决企业问题的?
沈国辉:就拿德福科技来说,它是铜箔行业的龙头企业。生产铜箔,需要空压机、中央空调、水泵这些通用设备来保障水电气冷热的供应。但问题在于,这些高耗能设备的管理极其复杂,涉及空气动力学、机械制造、电气工程自动化、暖通工程、热能与动力工程好几个学科。大学里都没哪个专业能把这些全教了,招人都难,想找能同时管好这么多设备的人才,更是难上加难。而且设备多了,能耗也跟着飙升。
这不正是工业AI能发挥作用的地方吗?我们做的,就是把“老师傅”的经验“软件化”,变成一个数字人。我们的“云智控”产品,就相当于一个训练有素的老师傅分身,不仅懂那五大专业,连语数外、数理化这些基础学科知识也都掌握,是大模型结合小模型训练出来的。德福科技买的就是这个“数字老师傅”。它在产能扩张期,既要保证生产不掉链子,又要降能耗,还缺设备管理的人手,我们的产品全给解决了。既能节能,又能帮着省人,还不耽误生产。现在测下来,节能效果超过了15%。
沈国辉在与客户交流
客户最常见的认知误区是什么?
沈国辉:最典型的就是客户过度自信,老外管这叫“OC(Over Confidence)”。他们太相信自己那套老经验了,觉得“我干这行十几年,参数都是手调的,你一个软件能比我强?”这其实是对过往经验的路径依赖。他们一开始就对你的POC做“有罪推定”,先认定你不行,然后到处找理由证明自己是对的。想挑刺还不容易?有人会直接怼“你又不是干这个的,你懂还是我懂?”但他们忘了,现在的AI可能真的比他懂,只是很多人不愿意承认。
为什么坚持深耕“一厘米宽”的领域?
沈国辉:我们就是要在窄领域做深做透,让客户看到我们的工业AI软件,比如云智控,就是比最有经验的老师傅还靠谱。做工业得有敬畏心。现在在这“一公尺宽”的领域里,都还有人天天挑刺、想证明我们错了,要是贪多求广,那不就被批得体无完肤了?
至于进入新行业时适配设备协议和工艺逻辑,没别的捷径,全靠一点点啃那些脏活累活。朱啸虎也说过,工业领域,把脏活累活干扎实了,自然就有了护城河。光靠算法耍花架子,根本成不了事。这就像毛竹生长,前四年在地下默默扎根,看起来没动静,可根扎够深了,一旦破土,就能蹭蹭往上长。我们蘑菇物联快十年了,现在就像刚冒头的毛竹。碰上行业环境不好,时代的尘埃一层层压上来,更得把根扎稳、把脏活累活干透,才能不管多少土压着,都能顶破出来。我们已经在做出海的事情,东南亚的越南、泰国、马来西亚,还有日韩都在推进,这些国家都已经有POC概念验证项目了。
AI商业化,面临的主要挑战是什么?
沈国辉:主要是三大挑战。
一是客户认知与信任问题。部分客户过度依赖传统经验,认为手动调参比AI更可靠。我们的策略是筛选客户,优先与愿意尊重专业分工的客户合作,同时借助媒体力量提升行业认知。
二是预算约束。当前工业企业资金压力大,对AI投入的回报周期要求更严,从过去的三年缩短到两年以内。尽管短期困难,但我坚信制造业是中国的经济支柱,长期市场必将回暖。
三是数科公司对行业的冲击。大量数科公司以“包工头”模式运作,将研发外包,自己赚取利润,导致真正投入创新的企业利润缩减、研发受限。这种模式不可持续,行业终将回归良性生态。