端侧智能全球化落地:云端强却难解端侧痛点

2026-06-17阅读 0热度 0
全球化

云端的能力边界,恰恰是端侧的起点

一个看似矛盾的事实正在发生:GPT、Claude、Gemini的模型能力越来越强,行业反而开始重注端侧。不是因为云端不够强,而是因为“强”本身解决不了落地的痛点。 Wa venote创始人华琨的判断很直接。作为从AI infra到AI应用、再到智能语音可穿戴设备的连续创业者,他指出了一个被忽视的现实:ChatGPT周活跃用户已超7亿,但这仅占全球成年人的10%左右。也就是说,全球绝大多数人并未深度接触过大模型产品。对这近90%的人群而言,云端的“强”毫无意义——他们既不会下载复杂的App,也看不懂如何编写Prompt。“让普通人以他们熟悉的方式用上AI”,唯一可行的路径是先把硬件送到他们手里:一键操作,无需学习。端侧的价值不在于“替代云端”,而在于“创造入口”。 从硅谷回到深圳的创业者Grace,则从情感计算的角度揭示了另一个“云端够不着”的场景。她创立的VerylovingAI聚焦家庭情感陪伴,第一代产品是AI情感陪伴饰品。在她看来,这个场景的核心刚需是情感交互,需要“活人感”——而“活人感”对时延的要求极为苛刻。行业数据显示,理想的对话交互延迟在200至500毫秒之间,一旦超过1.5秒,用户就会产生明显的迟滞感并放弃交互。“云端模型再强,网络传输的物理延迟降不下来,情感交互就成立不了。” 在宠物健康管理领域,“在线”比“智能”更紧迫。SATELLAI联合创始人顾岩表示:“云端大模型很强,但它不在现场。”宠物情绪、行为习惯的洞察,需要连续的数据支持,“先保证在线,再逐步变聪明”。这也是SATELLAI选择宠物项圈这个硬件形态的原因——24小时不间断收集宠物健康数据,这是“最落地的方式”。不是技术路线的选择,而是场景属性的决定:有些数据,错过了就永远补不回来。 TuyaSmart(涂鸦智能)APAC市场创新负责人屠熙蔚,基于Tuya平台连接的全球近200万开发者和数以亿计的智能设备,给出了总结:“凡是延时、可靠性与安全敏感的场景,端侧或边缘侧就更刚需。”比如安防、养老、医疗——这些场景相比于模型有多强,更看重响应有多快、多稳、多安全。 端侧智能不是在跟云端比“谁更强”,而是在回答一个云端答不了的问题——当用户需要AI在现场、在当下、在毫秒级响应时,你怎么做到?

形态之争的本质:以最无感的方式交付最大价值

当端侧成为共识,下一个问题变得具体:选什么硬件形态?端侧硬件的竞争,已经从比拼功能丰富度,转向了比拼“谁能让用户以最无感的方式获得最大价值”。 Gyges Labs联合创始人邓旭东选择了智能戒指。Vocci Ring是他们继AI智能眼镜之后的第二个AI硬件产品。有趣的是,Vocci Ring没有选择健康监测这条已被Oura Ring(2025年预计销量破400万枚)验证过的红海赛道。在邓旭东看来,戒指的价值在于成为“Agent调用的最短路径”。无论是眼镜还是戒指,都是Gyges Labs用AI能力服务核心目标人群(年轻商务人群)的介质。商务交流是更共性的刚需场景——会议中点一下戒指进行高亮标记、长按触发对话,交互负担极低。 华琨的Wa venote则走了一条更极简的路线。面对全球更广泛的年龄偏长人群,他们“不追求黑科技,只要把几个场景做到极致”。团队投入极高的研发成本,将复杂的按键精简为一个——一键开启,甚至主动去掉了那些可能炫技但会增加学习成本的功能。“真正难的不是往上加功能,是往下压门槛。” Grace的选择同样体现了“减法逻辑”。她没有做功能繁杂的智能手表,而是选择了手镯、项链、耳饰这些情感属性更强的形态。因为目标人群(独居者)的核心诉求不是“功能多”,而是“有人陪”和“有人救”。AI手镯的一键报警功能极简,但安全与情感的价值极高。 这些形态选择背后有一条暗线。邓旭东说得很直白:“眼镜就该像普通眼镜一样好戴、戒指就该像普通戒指一样好戴;让智能融入16到24小时的日常。”当一个AI硬件能让用户忘记它是AI硬件时,它才算真正成立。这也回答了商业模式的终极拷问——用户不会为“AI”这个词付费,但会为“非AI做不到的结果”(如实时转写、情感陪伴、行为洞察、场景自动化)持续买单。

端云协同不仅是技术架构,更是商业取舍

端侧和云端的关系到底怎么摆?这不仅是技术问题,更是残酷的商业算账。 屠熙蔚认为,云端协同的难点不在于模型放在哪里,而在于如何分配智能能力。以涂鸦平台为例,现实世界里的设备并非整齐划一:摄像头、网关、传感器、插座、空调,它们的算力、成本、功耗、使用频率完全不同。不是每个设备都适合跑大模型,也不是每个场景都需要大模型。因此,涂鸦的逻辑是“分层智能”: 第一层:设备端的基础感知和执行(稳定、低功耗、低成本); 第二层:边缘侧/网关侧的本地协同(本地联动、场景规则和部分AI判断); 第三层:云端AI和平台能力(复杂模型训练、数据分析、跨设备协同)。 但这个框架落到具体产品上,就变成了真金白银的取舍。华琨算过一笔账:除了硬件BOM成本,还有持续的订阅与Token成本。日本用户非常在意能否过滤“无效语音”来节省Token;巴西、中亚市场的支付能力又完全不同。“作为做过infra的人,我们有义务把推理成本持续降下来,让订阅可负担。”他选择在全球化调度中“选性价比最佳的模型”——这不是技术最优解,而是商业可行解。 顾岩的取舍更为极致。宠物项圈24小时在线联网,天然需要运营商网络费用,订阅是生存的基础。但他“不想把云服务和Token成本简单转嫁给用户”,而是通过提供“有用的能力与价值”来收费——基于连续的行为数据给出喂养、营养、作息建议。“用户为结果付费,不为‘AI’付费。” 这引出了一个更深层的问题:当每个设备商都开始跑自己的端侧模型,平台会不会退化成“连接管道”?屠熙蔚的答案是反直觉的——设备商越跑模型,平台越有价值。因为“市场不会自然变简单,只会更碎片化”。用户家里不可能只买一个品牌,真正的问题变成了:这些智能设备如何协同?数据如何打通?场景如何统一?“单个设备可以很智能,但用户要的是一个完整场景。”

全球化不是“复制粘贴”,是“重新做一遍”

几乎所有的AI端侧产品都是生而全球化的,但“全球化”背后的坑,远比想象中多。全球化落地真正的门槛,不是技术适配,不是合规隐私,而是“理解差异”——理解不同市场的用户到底在为什么付费,以及他们愿意付多少。 屠熙蔚的第一个提醒是:“不要以为一个产品在中国跑通,就可以直接复制到海外。”家庭结构、居住环境、网络环境、安装习惯、售后体系全不一样。东南亚用户对价格敏感但实用价值要求高;新加坡则高度重视合规、政府背书和长期运维。 华琨在全球化运营中感受到的是“付费心智”的差异。日本用户极度在意Token消耗,而新兴市场的订阅价格必须打到极低。“我们要做全球化的算力与模型调度”——同一个产品,背后的成本结构需要为每个市场重新设计。 邓旭东遇到的则是物理层面的约束。眼镜的第一视角显示与信息采集无可替代,但重量与续航限制了普及速度。“接下来会持续寻找采集方便、交互自然、长期佩戴无感的形态”——全球化不是同一个产品卖全球,而是在不同市场找到最适合当地的形态。 顾岩补充了一个常被忽视的维度:“AI的本地化不是翻译语言这么简单。”不同国家的用户习惯、表达方式、家庭场景、服务期待都不同。“真正的本地化,是产品逻辑、服务逻辑和商业逻辑的本地化。”这需要本地合作伙伴、标准化平台能力和可复制行业方案的叠加。

结语

这次讨论最锋利的观点,或许是顾岩那句话:“不要为‘上智能而上智能’。” 端侧智能的全球化落地,不缺热情,不缺技术,甚至不缺资金。缺的是对场景的深刻理解,在功耗、成本、体验约束下的清醒取舍,以及对不同市场用户需求的细腻洞察。 云端模型会越来越强,但这恰恰会让端侧的“真需求”更加凸显——不是每个设备都需要完整的Agent,但每个场景都需要“刚好够用”的智能。当AI创业者停止在云端能力上做加法,转而在用户痛点上做减法,找到那个“非你不可”的刚需场景时,端侧智能的全球化,才算真正开始落地。 「Talk To The World」是钛媒体打造的全球科技对话品牌,致力于在全球最重要的科技创新场景中搭建中国与世界对话的桥梁。此次Singapore AI Week期间的对话,是「Talk To The World」继CES、IFA、MWC之后的又一重要站点,链接改变全球创新趋势的前沿领袖。 (本文根据活动现场速记整理,经嘉宾审阅授权发布)
免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策