2024WAIC深度解析:非Transformer大模型量产落地,加速商业变革

2026-05-16阅读 0热度 0
岩芯数智

在智能世界的构建中,基石的角色至关重要。RockAI的使命,便是成为这一坚实而普适的底层支撑。

离线智能:一条被低估的“小路”

自Yan大模型首次发布至今,已过去18个月。许多人尚未察觉,搭载其能力的量产设备已进入市场。这家以非Transformer架构为核心的技术公司,正成为端侧智能领域一个不可忽视的变量。

其官网首页的标语清晰地表明了目标:“让世界上每一台设备拥有自己的智能”。深入解读,这句话锚定了两个核心:“每一台设备”与“自己的”。

“每一台设备”指向极致的兼容性、可控的成本与普惠的部署能力。“自己的”则定义了智能的归属——它应具备自主进化、持续生长并与环境广泛交互协作的能力。

这标志着RockAI选择了一条与主流不同的技术路径。它并未盲目追求参数的极限膨胀,而是转向了一条更注重实效与可行性的赛道。

然而,RockAI联合创始人邹佳思并不认同这是一条“小径”。在他看来,端侧是一个体量巨大的市场,承载着全球绝大多数用户对智能的真实需求。这不仅是发展中国家的现实,更关乎构建一种更“体面”的人机关系。

“离线”是这种“体面”的关键维度。作为端侧能力的自然延伸,离线意味着智能完全归属于用户。数据无需上传至遥远陌生的云端服务器,而是安全地留存于用户最熟悉的设备之中——无论是个人手机,还是办公笔记本电脑。

实现端侧离线能力本身已具挑战,但这仅是起点。路径或许独特,但既然选择了,就必须坚定前行。

邹佳思坦言,自Yan 1.3发布后,团队的核心工作就是“填坑”——攻克技术难题,验证实际场景。正是这些扎实的工作,推动了Yan在量产设备上的落地,并催生了如今的Yan 2.0 Preview版本。

市场对2.0版本的期待已久。在今年的世界人工智能大会(WAIC)上,RockAI给出了阶段性答案。

这延续了公司一贯的务实作风。Yan 2.0 Preview是其第四代产品,此前经历了1.0、1.2、1.3的迭代。他们拒绝像某些社区那样,仅凭性能指标粗暴划分代际。

然而,这或许是RockAI目前最接近其愿景的产品。据邹佳思介绍,Yan 2.0 Preview主要在两方面实现了关键突破。

首先是视觉感知能力的显著提升。团队针对视频模态采用了稀疏取帧策略,有效降低了时序冗余。随后,通过视觉编码器进行逐帧编码生成视觉Token,并运用Token Merge策略削减语义冗余,从而大幅压缩了视觉Token序列的长度。这使得Yan 2.0 Preview具备了更连贯的视频理解能力,用邹佳思的话说,“实现了从‘识图’到‘懂视频’的跨越”。

但更重要的升级在于基于“训推同步”的自主学习能力。RockAI通过可微的记忆模块实现信息的存储、检索与动态遗忘。该架构支持记忆的持续更新,特别是通过创新机制实现了记忆强度的灵活调节:既能通过门控更新保留长期依赖,又能根据输入特性整合新知。这让模型能够像生物大脑一样,筛选并巩固关键信息。

过去,“训推同步”常与昂贵的大模型一体机绑定。RockAI的尝试,是将这一能力部署到每个人的个人设备上。这在外界看来颇具挑战性——因为缺乏先例,应用前景也尚在探索。

邹佳思透露,团队正与一些国际头部玩具公司进行初步探索,构想能够自主学习的AI玩具。孩子可以与玩具对话、发出指令,而玩具能持续学习成长,最终成为独特的陪伴伙伴。

“我们发布Preview版本,也是希望激发上下游的真实需求,”邹佳思表示,“我们确信其拥有广阔的应用空间。”而“广阔”二字,意味着其潜力绝不仅限于单一场景。

如果说1.0是纯文本模型,1.3是具备了图像与音频理解的多模态模型,那么2.0的目标,是成为一个能理解视频、能自主学习、实现实时自然交互的全新智能基座。

场景、场景,还是场景

“攻克技术难题”只是RockAI过去一年的部分工作。相比之下,“验证实际场景”是更大的挑战。

场景落地之难,邹佳思深有体会。从技术演示到产品落地存在鸿沟,而要实现规模化量产,难度更是倍增。

如果说将Yan 1.2成功部署到树莓派是技术手册上的一个里程碑,那么Yan 1.3发布后,获得某出海头部硬件公司的订单,无疑是业务拓展的关键一步。

邹佳思清晰记得,当合作伙伴向海外经销商展示搭载Yan 1.3的PC时,对方表现出的惊讶与兴奋。甚至一些行业巨头的代表也专程来到展台,探询离线端侧功能的具体实现方式。

“离线”的价值,被严重低估了。

“海外市场对离线端侧大模型存在旺盛需求,”邹佳思指出,只是许多需求尚未找到最优的解决方案。

首先,对于出海硬件企业,海外复杂多变的信息安全政策是首要挑战。端侧方案能规避大量因数据上传云端带来的政策风险与合规成本。“海外对隐私极其敏感,”邹佳思解释道,“不同国家的个人信息保护法律和审查机制各异。若要上传数据,厂商就必须逐一攻克每个国家的法律和监管壁垒。”

更不用说全球错综复杂的网络环境。当前世界主要人口生活在发展中国家,其中农村人口远多于城市人口。根据国际电信联盟2022年的报告,欧洲和北美国家80%至90%的人口使用互联网,而在阿拉伯国家和亚太地区,这一比例降至约三分之二。在非洲,互联网普及率仅为40%,在最不发达国家和内陆发展中国家,只有36%的人口能够上网。城乡差异同样显著:全球城市居民在家上网的比例为82%,而农村地区则低得多,前者几乎是后者的1.8倍。

这份报告仅涉及网络覆盖率,尚未触及更复杂的网络质量和资费问题。RockAI的愿景是“每一台设备”,这个定语前面没有“欧美”、“中国”或“城市”的限制,就是不加任何修饰的“每一台”。

“很多设备连NPU甚至GPU都没有,只有CPU。你要如何把大模型放进去?目前,只有RockAI能做到。”邹佳思的语气笃定。

从某种程度上说,未来一些海外用户接触到的第一个人工智能大模型产品,很可能就是Yan。这或许能解释,为何Yan 2.0 Preview的合作伙伴的经销商们,会对一台AIPC产品感到如此惊讶。

“他们没见过这种产品,”邹佳思说,“不需要网络,直接就能在中低端CPU设备上运行的AI产品,他们确实没见过。”

为了量产项目,RockAI投入了巨大资源。这不能简单称之为投入,更像是一场笃定的技术投资,其背后是一种独特的市场策略:“标杆战略”。

RockAI向来被认为是一家不热衷于追逐评测榜单的公司。“我们会测试一些榜单,但不会刻意去‘打榜’,”邹佳思说。公司并非完全排斥榜单,只是对部分榜单的价值持有审慎态度。未来,团队会选择一些严肃的榜单参与,以便外界更直观地看到Yan的成果。但即便如此,“重点也不会放在这里”,因为RockAI是一个着重场景落地的团队,其业务逻辑核心是打造“标杆案例”。

“就像当年ARM与德州仪器、诺基亚的关系——德州仪器将那时名不见经传的ARM推荐给诺基亚,希望在其小型机上试一试。ARM花费了巨大精力说服诺基亚,最终诺基亚高管的点头,不仅成就了其当时的手机霸主地位,也铸就了今天的ARM帝国。”邹佳思以此类比。

RockAI或许并未奢望遇到像诺基亚那样“性感”的贵人。邹佳思对“标杆”的期待,是一个真正跑通的、可见的、能够交付到用户手中的具体场景。

团队对潜在的标杆客户极为重视。邹佳思回忆,之所以能拿下那家头部公司的订单,部分原因在于他们是唯一带着真实样机前往客户公司演示的团队。

“一个见面两周前临时购买的酷睿i5小盒子,现场接上麦克风和显示器,调试了十几分钟,”邹佳思描述着那个场景,“现场其实挺杂乱的。但其他厂家都带着PPT,只有我们带了真机样品直接开始演示。”团队甚至没来得及好好自我介绍,对方就已流露出合作意向,回过神来才问:“你们公司是什么时候成立的?”

尽管RockAI是这家头部公司接触最晚的供应商,却最终拿下了合作。于是,才有了那些激动的海外经销商和前来探听虚实的巨头友商。

榜单分数或许可以优化,但用户的体验是诚实的,商业订单更是如此。设备量产是RockAI的起点,也是Yan生态构建的起点。

留在牌桌上

毫无疑问,RockAI正在与巨人同行。就像大卫面对歌利亚,手中握着的也是几块石头。大卫用投石索,让石头在旋转中积蓄起小而强大的力量。

当然,Yan与庞大的Transformer社区之间,并非你死我活的关系。它们更像是一条奔涌的河流与浩瀚海洋的潮汐在竞速。

但对于一个以闭源为主的模型生态而言,节奏把控至关重要。因为它既要构建底层基础,又要探索上层应用;既要优化人机交互,又要完成广泛的底层适配。必须在技术与场景之间反复摸索,踏平一个又一个坑。

邹佳思透露,过去一年,RockAI团队已扩张至近百人,其中绝大部分是研发人员。

对一家商业公司来说,所谓节奏,无非是明确哪些要快,哪些可慢;哪些必须抓紧,哪些可以暂时放弃。

邹佳思并不愿简单地将RockAI定义为“闭源”模型。他表示,公司有自己的开源节奏,部分计划可能尚未对外披露,但已向核心合作伙伴(如芯片厂商)开源了部分代码,这能大幅降低Yan在具体硬件上落地的磨合成本。

有些事情,RockAI确实选择暂缓。例如“文生图”功能。邹佳思认为,设备端的核心诉求集中在感知、决策和行动这三个环节。“就像人脑一样,”他比喻道,“人脑通常不会直接输出一幅图像,而是指挥手去使用工具作画。Yan的设计思路也是如此。”

而另一些更具远景、虽未落地但代表行业趋势的方向,邹佳思给团队的要求是:必须“留在牌桌上”。

在邹佳思看来,机器人就是这样一个未来场景,是Yan必须争取“留在牌桌上”的赛道。他认为,Yan的架构天然适合与机器人结合,因为它不以生成为主,而是专注于感知与认知的多模态能力。在内部实验中,团队发现基于Yan的架构已经能够实现部分动作轨迹的复刻能力。

“这次我们在展台上放置了一个灵巧手,可以玩一些游戏,”邹佳思举例说,“还有机器狗,能够学习人的动作。”

在RockAI的构想中,Yan将成为一个横跨上至无人机、下至机器人,大到手机电脑等核心消费算力设备,小到智能眼镜、陪伴玩具等探索型低算力设备的智能底座。让每一台设备都成为Yan算力网络中的节点,共同构成通向“群体智能”未来世界的途径。

谁说小小的石头,不能垒成高山呢?

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策