对话 Floatboat 谭少卿:Agent 办公最大的痛点,不在模型能力

2026-04-27阅读 510热度 510
Agent

一、AI办公的最大痛点,不是模型不够强

“我们内部测试过,即使用户完全不调用floatboat的Agent功能,仅凭其工具层面的整合,办公效率也能提升2到5倍。”创始人谭少卿的这句话,恰恰点中了当前AI办公赛道一个普遍却常被忽视的现状——行业里,大家似乎都在卷模型能力、拼多模态效果、比工具调用的丰富度,但AI与用户原生的、真实的工作流程之间,那道无形的割裂感,依然存在。

这场景想必每位知识工作者都不陌生:为了撰写一篇深度稿件,你得先在浏览器里翻找行业资料、挖掘数据,然后切换到文档工具整理素材,接着再打开GPT或Claude的对话窗口,把素材一段段粘贴进去,费心撰写prompt描述风格要求。等AI生成内容后,又得复制回文档手动修改。过程中一旦发现数据缺失,整个“浏览-复制-粘贴-投喂”的循环就得重来一遍。

对于身兼数职的OPC(One-Person Company,一人公司)创业者而言,这种割裂感更为强烈。撰写商业计划书,需要同步产品设计文档、用户反馈和市场数据;起草招聘需求,得兼顾公司愿景、产品特性和团队情况;进行市场投放,则要管理素材制作、账号运营与数据复盘。所有这些信息,散落在本地文件夹、微信聊天记录、浏览器书签以及各类SaaS工具中,AI根本无法触及完整的工作流,只能处理一些单点的、碎片化的任务。

floatboat的解决方案,跳出了“对话框即Agent”的行业惯性思维。它没有选择在传统办公流程里简单地嵌入一个AI对话入口,而是直接构建了一个“浏览器+文件管理器+AI Agent”三位一体的AI原生办公环境——这也是产品早期代号“AoE”的由来,既指游戏中的“范围伤害”,也寓意着“AI Office Environment”。

这个设计的核心逻辑在于,让Agent主动融入用户的工作流,而不是让用户围着对话框打转。在floatboat构建的环境里,AI并非一个被动等待指令的工具,而是一个能感知上下文的协同者:你打开的产品设计文档、正在浏览的行业网站、操作的本地文件夹,都会自动成为AI可感知的上下文。无需手动上传、复制粘贴或撰写冗长的prompt,AI天然就了解你正在做什么、可能需要什么。

举个例子:当你需要撰写融资BP时,只需在界面左侧打开相关的产品设计文档和市场调研材料,然后对AI说一句“写一版种子轮融资BP”。AI便能自动读取所有相关上下文,生成结构完整的BP内容,甚至能根据反馈迭代数十个版本,全程无需任何文件传输操作。招聘时写岗位描述(JD)也是如此,不必再向AI大段解释公司背景,一句“帮我写一个测试岗位的招聘JD”,AI就能基于左侧打开的公司资料,生成精准匹配的文案,用户只需微调细节即可使用。内容创作场景下,你可以直接用内置浏览器浏览博主的社交媒体,然后一句话指令,让AI将博主三天的帖子内容进行整理、转录、配音,直接生成一期完整的播客,全程无需切换窗口或借助外部转录工具。

图片来源:极客公园

在实际体验中,这种设计的便利性显而易见。在工作空间内,可以同时开启并自由切换多个文件夹,文件浏览与查找效率显著提升。也能直接将多份文档拖入对话区域,让AI分析它们之间的关联与逻辑。处理网页信息时,内容可以随手拖拽保存至本地文件夹,告别复制粘贴。内置编辑器支持直接修改文档,而每一处改动都会被AI同步感知,无需重新上传或手动同步上下文。

更值得一提的是“Combo Skill”功能。完成一次特定任务(例如按个人风格生成稿件)后,可以将整段工作流程一键保存为技能模板。系统会自动记录操作步骤、表达偏好与执行逻辑。后续遇到相似任务时,AI会根据当前上下文主动推荐匹配的Skill,加载即用,彻底省去手动查找或输入命令的麻烦。

可以说,传统对话式产品的逻辑是“人找AI”,用户必须主动将所有信息和指令“喂”给AI。而floatboat的逻辑则是“AI跟着你的工作走”,它深度嵌入你的办公环境,你的工作流延伸到哪里,它的能力就覆盖到哪里。

二、Agent行业的内卷误区:我们到底需要什么样的端侧智能?

Openclaw带火了端侧Agent概念,但随之而来的,是整个赛道陷入同质化竞争的怪圈:似乎人人都在做端侧产品,个个都在搭建Skill市场,仿佛谁拥有的Skill数量更多、开放的权限更高,谁就能赢得市场。然而现实是,全球超过10亿的知识工作者中,真正能将端侧Agent熟练运用起来的,依然凤毛麟角。

在谭少卿看来,绝大多数产品都陷入了行业的三大核心误区,而floatboat从产品底层设计上,就试图避开这些内卷陷阱。

误区一:试图讨好所有人,却忽略了用户需求的根本对立。“我们可以粗略地将用户分为三个层级:极客用户、专家用户和大众用户。每一类用户的核心需求,几乎是完全相反的。”这是谭少卿在打造过多款亿级用户产品后得出的核心洞察,也恰恰反映了当前许多Agent产品的通病。

极客用户追求极致的开放性与可编程性。他们需要产品的底层能力完全暴露,能够自己编写代码、修改脚本、自定义所有规则。这也是Openclaw、Claude Code等产品吸引极客群体的根本原因。但代价是极高的使用门槛,非技术用户可能光是在安装部署阶段就会耗费数日,面对命令行界面手足无措。

专家用户(如专业的内容创作者、设计师、分析师)追求的是极致的可控性。他们需要AI“指哪打哪”,在需要时能精准完成任务,不需要时则绝不能画蛇添足。他们无法接受AI随意修改自己的核心作品,而目前绝大多数Agent产品,都难以实现这种精准的“收放自如”。

大众用户则追求极致的易用性与安全性。对他们而言,AI工具的核心价值就是“快点把活干完,早点下班”。他们没有时间和兴趣去学习如何撰写prompt、安装Skill或调试Agent。复杂的工作流编排与知识管理,对他们而言本质上是伪需求。

市面上的产品往往陷入两难:要么完全倒向极客,做成了只有少数人能玩转的“玩具”;要么试图面面俱到,结果成了“四不像”——极客觉得不够开放,大众觉得过于复杂,专家又觉得不可控。

floatboat的策略是,首先锚定OPC(一人公司)这一核心群体。他们是最特殊的一类用户:既是各自领域的专家,又需要身兼数职,同时处理法务、财务、运营、创作等复杂工作流,对效率提升的需求最为迫切。在此基础上,产品尝试实现三层用户需求的兼顾:在底层保留极客所需的开放性,支持自定义Combo Skills与API调用;在交互层面做到大众用户能接受的开箱即用,零代码门槛,自然口语即可驱动;在功能上满足专家对可控性的要求,内置编辑器允许随时手动调整,避免AI过度发挥,实现真正精准的“人机协同”。

这里有一个本质的判断:“我们每个人在不同的事务上,其实处于不同的用户分层。你可能在技术上是极客,但在处理法务问题时就是个大众用户;你可能是内容创作专家,但在数据分析上又只是个普通用户。一个真正具备普适性的生产力工具,必须有能力覆盖这三层用户在不同场景下的需求。”

误区二:将Skill市场视为核心壁垒,却忽略了其过渡形态的本质。当前的Agent行业,几乎所有的参与者都在疯狂内卷Skill的数量,仿佛谁构建了最大的Skill生态,谁就能掌握下一代应用入口。但谭少卿的判断颇为犀利:“绝大多数Skill市场,最终都会消亡。”

理由主要有两点。首先,第三方Skill存在难以解决的安全与信任问题。普通用户根本看不懂Skill背后的代码,无法判断其是否存在安全风险。而平台如果只做聚合而不承担责任,用户使用后一旦出现电脑故障或数据泄露,后果只能自行承担。这类似于某些开源项目的逻辑:“玩法我都开放了,你的电脑搞坏了与我无关。”但在谭少卿看来,对于一款面向大众的商业产品,这种价值观是行不通的。

其次,Skill本质上可能只是一个过渡形态。“Skill是什么?其实就是人类在将自己的行业知识(Know-how)‘蒸馏’给模型。模型厂商当然乐见其成,终于有人系统性地把各行各业的经验喂给他们。”谭少卿解释道,“而大模型本身的能力正在飞速进化。今天需要特定Skill才能实现的功能,未来很可能被模型直接内化为通用能力。”在他看来,Skill或许只会在对确定性要求极高的企业级场景中长期存在,对于绝大多数普通用户而言,它很可能只是AI能力演进过程中的一个过渡产物。

因此,floatboat没有陷入Skill数量的军备竞赛,而是打造了一套截然不同的Combo Skills体系。它采用Markdown这种人与机器都能轻松理解的格式,将指令、模板、脚本、API调用整合在一个文件包内。用户无需懂得低代码或编写复杂脚本,就能轻松自定义技能。同时,这些技能与用户的特定工作流、上下文深度绑定,而非孤立的功能插件。更重要的是,官方出品的Skill都经过严格的安全审核,为用户提供兜底保障,从根本上缓解了安全焦虑。

误区三:只停留在工具层面的创新,不敢挑战延续数十年的数据垄断格局。从PC时代的Office套件,到互联网时代的SaaS服务,办公领域几十年的发展史,某种程度上也是一部平台垄断用户数据的历史。

传统的Office软件,通过私有协议将数据、交互、逻辑强行分离。你必须使用特定的软件(如Word)才能正确打开.doc文件,否则看到的可能只是一堆乱码——平台垄断了文件的唯一解释权。后来的SaaS产品,则将数据垄断推向新的高度。你存储在飞书、Notion等平台上的文档,大多不支持完整的原生格式导出。即便是ChatGPT的记忆功能,通常也只允许导出用户自己发送的内容,AI回复中的核心信息往往无法完整带走。

结果就是,用户使用的工具越来越多,却从未真正“拥有”过自己的数字资产。跨产品、跨Agent的协同更是奢望:你在floatboat中构建的工作流,无法同步到Openclaw;你在Claude中积累的AI记忆,也无法用于GPT。不同平台之间,数据与上下文是完全割裂的孤岛。

这才是办公领域最底层的顽疾,也是floatboat试图攻破的核心壁垒——它推出了开源的“Self Aware”协议,旨在重新定义AI时代的数字文件格式。谭少卿用一个形象的比喻解释道:“floatboat就像一艘承载用户数字资产的船。而船与船之间流转的,正是基于‘Self Aware’协议的文件包。它就像是新时代Agent世界里的标准化集装箱。”

这个协议从底层重构了数字文件的逻辑:它将数据、交互逻辑与创作过程重新整合到一个统一的文件包中。这个文件包不仅包含最终交付物,还完整保留了整个创作、协同过程中的所有想法、决策、修改记录、用到的Skill与API调用,把AI所需的完整上下文全部封装在内。它致力于实现真正的跨产品兼容,任何支持该协议的Agent产品都能打开、编辑、使用这个文件包,用户不再被单一平台绑定,真正实现“我的数据我做主”。同时,它保障了用户的数据所有权,所有文件包、数据、AI记忆都默认存储在用户本地,从根源上避免了平台“蒸馏”用户数据、泄露隐私的可能,用户带着自己的设备,就带走了全部数字资产。

这无疑是一次大胆的尝试,其目标是对整个办公行业的底层规则进行重构,将生产资料的所有权,重新交还给每一个个体。

三、OPC时代,Agent的终局是重构生产关系

“我们选择OPC作为切入点,是因为我们相信,OPC代表了先进生产力的发展方向。”谭少卿如此阐述产品的初衷。

AI大模型的爆发,正在深刻重构社会的劳动分工。过去需要专业团队协作完成的任务,现在一个人借助AI就可能实现:编程、视频制作、网页开发、设计……这些曾经需要专门职业训练的技能,正被AI转化为普通人也能掌握的基础能力。越来越多的人选择成为OPC,以十人以内的小团队,甚至独自一人,运营起完整的业务。

然而,传统的办公软件并非为这群人设计。中大型企业内部分工明确,法务、财务、运营、创作各司其职,工作流是标准化、线性的。而OPC创业者需要一人分饰多角,工作流是动态、交叉且高度复杂的,信息散落在无数平台与文件中,他们对于上下文无缝流转、多角色快速切换的需求,远比大型企业员工更为强烈。

“你的工作越复杂,上下文流转越频繁,一个人需要扮演的角色越多,floatboat能带来的效率提升就越显著。”谭少卿指出,“反之,如果你的任务是单点、分工极其明确的,那么它的提升可能有限。但未来的趋势是,越来越多的人会走向OPC模式,需要‘一个人顶一个团队’,这正是我们的核心用户群。”

工具层面的创新,只是floatboat的第一步。它真正的愿景,是构建一套分布式的Agent协同网络,让个体生产力首次具备网络效应,从而重构AI时代的生产关系。

传统的协同办公,本质是“人找人”。你必须将自己的文件、文档乃至工作记忆全部暴露给对方,才能实现协作,效率低下且存在显著的隐私风险。而在floatboat设想的分布式网络里,协同的主体变成了Agent。你与同事可以通过各自的Agent实现安全、高效的协同,无需暴露完整的数字资产,只需在约定的项目区间内共享上下文,双方的Agent就能提前完成多轮信息同步与内容处理,最终人类只需做出核心决策即可。

更具想象空间的是,这个网络能够指数级放大个体生产力。你的Agent可以在你休息时,与网络中其他用户的Agent进行对接、协作,甚至完成基础的商业交易。原本一个人可能只能服务四五个客户,在Agent的加持与网络协同下,其服务上限可能拓展至上百人。

“当每个个体的生产力都被AI放大十倍、百倍,再通过开放的分布式网络实现协同,整个社会的生产关系,都将发生根本性的变革。”谭少卿总结道。

在交流的最后,他反复强调了一个核心观点:产品设计本身就在定义和塑造用户需求。“你把产品叫做‘Agent Infra Browser’(Agent基础设施浏览器),那么来的用户里,70%可能都是来抓取数据的。但当你把产品明确定义为‘面向OPC的Agent工作空间’时,用户才会把剪辑视频、进行科研、撰写播客、做战略分析这些真实而复杂的需求,真正释放出来。”

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策