对话 Floatboat 谭少卿：Agent 办公最大的痛点，不在模型能力

2026-04-27阅读 510热度 510

Agent

一、AI办公的最大痛点，不是模型不够强

“我们内部测试过，即使用户完全不调用floatboat的Agent功能，仅凭其工具层面的整合，办公效率也能提升2到5倍。”创始人谭少卿的这句话，恰恰点中了当前AI办公赛道一个普遍却常被忽视的现状——行业里，大家似乎都在卷模型能力、拼多模态效果、比工具调用的丰富度，但AI与用户原生的、真实的工作流程之间，那道无形的割裂感，依然存在。

这场景想必每位知识工作者都不陌生：为了撰写一篇深度稿件，你得先在浏览器里翻找行业资料、挖掘数据，然后切换到文档工具整理素材，接着再打开GPT或Claude的对话窗口，把素材一段段粘贴进去，费心撰写prompt描述风格要求。等AI生成内容后，又得复制回文档手动修改。过程中一旦发现数据缺失，整个“浏览-复制-粘贴-投喂”的循环就得重来一遍。

对于身兼数职的OPC（One-Person Company，一人公司）创业者而言，这种割裂感更为强烈。撰写商业计划书，需要同步产品设计文档、用户反馈和市场数据；起草招聘需求，得兼顾公司愿景、产品特性和团队情况；进行市场投放，则要管理素材制作、账号运营与数据复盘。所有这些信息，散落在本地文件夹、微信聊天记录、浏览器书签以及各类SaaS工具中，AI根本无法触及完整的工作流，只能处理一些单点的、碎片化的任务。

floatboat的解决方案，跳出了“对话框即Agent”的行业惯性思维。它没有选择在传统办公流程里简单地嵌入一个AI对话入口，而是直接构建了一个“浏览器+文件管理器+AI Agent”三位一体的AI原生办公环境——这也是产品早期代号“AoE”的由来，既指游戏中的“范围伤害”，也寓意着“AI Office Environment”。

这个设计的核心逻辑在于，让Agent主动融入用户的工作流，而不是让用户围着对话框打转。在floatboat构建的环境里，AI并非一个被动等待指令的工具，而是一个能感知上下文的协同者：你打开的产品设计文档、正在浏览的行业网站、操作的本地文件夹，都会自动成为AI可感知的上下文。无需手动上传、复制粘贴或撰写冗长的prompt，AI天然就了解你正在做什么、可能需要什么。

举个例子：当你需要撰写融资BP时，只需在界面左侧打开相关的产品设计文档和市场调研材料，然后对AI说一句“写一版种子轮融资BP”。AI便能自动读取所有相关上下文，生成结构完整的BP内容，甚至能根据反馈迭代数十个版本，全程无需任何文件传输操作。招聘时写岗位描述（JD）也是如此，不必再向AI大段解释公司背景，一句“帮我写一个测试岗位的招聘JD”，AI就能基于左侧打开的公司资料，生成精准匹配的文案，用户只需微调细节即可使用。内容创作场景下，你可以直接用内置浏览器浏览博主的社交媒体，然后一句话指令，让AI将博主三天的帖子内容进行整理、转录、配音，直接生成一期完整的播客，全程无需切换窗口或借助外部转录工具。

图片来源：极客公园

在实际体验中，这种设计的便利性显而易见。在工作空间内，可以同时开启并自由切换多个文件夹，文件浏览与查找效率显著提升。也能直接将多份文档拖入对话区域，让AI分析它们之间的关联与逻辑。处理网页信息时，内容可以随手拖拽保存至本地文件夹，告别复制粘贴。内置编辑器支持直接修改文档，而每一处改动都会被AI同步感知，无需重新上传或手动同步上下文。

更值得一提的是“Combo Skill”功能。完成一次特定任务（例如按个人风格生成稿件）后，可以将整段工作流程一键保存为技能模板。系统会自动记录操作步骤、表达偏好与执行逻辑。后续遇到相似任务时，AI会根据当前上下文主动推荐匹配的Skill，加载即用，彻底省去手动查找或输入命令的麻烦。

可以说，传统对话式产品的逻辑是“人找AI”，用户必须主动将所有信息和指令“喂”给AI。而floatboat的逻辑则是“AI跟着你的工作走”，它深度嵌入你的办公环境，你的工作流延伸到哪里，它的能力就覆盖到哪里。

二、Agent行业的内卷误区：我们到底需要什么样的端侧智能？

Openclaw带火了端侧Agent概念，但随之而来的，是整个赛道陷入同质化竞争的怪圈：似乎人人都在做端侧产品，个个都在搭建Skill市场，仿佛谁拥有的Skill数量更多、开放的权限更高，谁就能赢得市场。然而现实是，全球超过10亿的知识工作者中，真正能将端侧Agent熟练运用起来的，依然凤毛麟角。

在谭少卿看来，绝大多数产品都陷入了行业的三大核心误区，而floatboat从产品底层设计上，就试图避开这些内卷陷阱。

误区一：试图讨好所有人，却忽略了用户需求的根本对立。“我们可以粗略地将用户分为三个层级：极客用户、专家用户和大众用户。每一类用户的核心需求，几乎是完全相反的。”这是谭少卿在打造过多款亿级用户产品后得出的核心洞察，也恰恰反映了当前许多Agent产品的通病。

极客用户追求极致的开放性与可编程性。他们需要产品的底层能力完全暴露，能够自己编写代码、修改脚本、自定义所有规则。这也是Openclaw、Claude Code等产品吸引极客群体的根本原因。但代价是极高的使用门槛，非技术用户可能光是在安装部署阶段就会耗费数日，面对命令行界面手足无措。

专家用户（如专业的内容创作者、设计师、分析师）追求的是极致的可控性。他们需要AI“指哪打哪”，在需要时能精准完成任务，不需要时则绝不能画蛇添足。他们无法接受AI随意修改自己的核心作品，而目前绝大多数Agent产品，都难以实现这种精准的“收放自如”。

大众用户则追求极致的易用性与安全性。对他们而言，AI工具的核心价值就是“快点把活干完，早点下班”。他们没有时间和兴趣去学习如何撰写prompt、安装Skill或调试Agent。复杂的工作流编排与知识管理，对他们而言本质上是伪需求。

市面上的产品往往陷入两难：要么完全倒向极客，做成了只有少数人能玩转的“玩具”；要么试图面面俱到，结果成了“四不像”——极客觉得不够开放，大众觉得过于复杂，专家又觉得不可控。

floatboat的策略是，首先锚定OPC（一人公司）这一核心群体。他们是最特殊的一类用户：既是各自领域的专家，又需要身兼数职，同时处理法务、财务、运营、创作等复杂工作流，对效率提升的需求最为迫切。在此基础上，产品尝试实现三层用户需求的兼顾：在底层保留极客所需的开放性，支持自定义Combo Skills与API调用；在交互层面做到大众用户能接受的开箱即用，零代码门槛，自然口语即可驱动；在功能上满足专家对可控性的要求，内置编辑器允许随时手动调整，避免AI过度发挥，实现真正精准的“人机协同”。

这里有一个本质的判断：“我们每个人在不同的事务上，其实处于不同的用户分层。你可能在技术上是极客，但在处理法务问题时就是个大众用户；你可能是内容创作专家，但在数据分析上又只是个普通用户。一个真正具备普适性的生产力工具，必须有能力覆盖这三层用户在不同场景下的需求。”

误区二：将Skill市场视为核心壁垒，却忽略了其过渡形态的本质。当前的Agent行业，几乎所有的参与者都在疯狂内卷Skill的数量，仿佛谁构建了最大的Skill生态，谁就能掌握下一代应用入口。但谭少卿的判断颇为犀利：“绝大多数Skill市场，最终都会消亡。”

理由主要有两点。首先，第三方Skill存在难以解决的安全与信任问题。普通用户根本看不懂Skill背后的代码，无法判断其是否存在安全风险。而平台如果只做聚合而不承担责任，用户使用后一旦出现电脑故障或数据泄露，后果只能自行承担。这类似于某些开源项目的逻辑：“玩法我都开放了，你的电脑搞坏了与我无关。”但在谭少卿看来，对于一款面向大众的商业产品，这种价值观是行不通的。

其次，Skill本质上可能只是一个过渡形态。“Skill是什么？其实就是人类在将自己的行业知识（Know-how）‘蒸馏’给模型。模型厂商当然乐见其成，终于有人系统性地把各行各业的经验喂给他们。”谭少卿解释道，“而大模型本身的能力正在飞速进化。今天需要特定Skill才能实现的功能，未来很可能被模型直接内化为通用能力。”在他看来，Skill或许只会在对确定性要求极高的企业级场景中长期存在，对于绝大多数普通用户而言，它很可能只是AI能力演进过程中的一个过渡产物。

因此，floatboat没有陷入Skill数量的军备竞赛，而是打造了一套截然不同的Combo Skills体系。它采用Markdown这种人与机器都能轻松理解的格式，将指令、模板、脚本、API调用整合在一个文件包内。用户无需懂得低代码或编写复杂脚本，就能轻松自定义技能。同时，这些技能与用户的特定工作流、上下文深度绑定，而非孤立的功能插件。更重要的是，官方出品的Skill都经过严格的安全审核，为用户提供兜底保障，从根本上缓解了安全焦虑。

误区三：只停留在工具层面的创新，不敢挑战延续数十年的数据垄断格局。从PC时代的Office套件，到互联网时代的SaaS服务，办公领域几十年的发展史，某种程度上也是一部平台垄断用户数据的历史。

传统的Office软件，通过私有协议将数据、交互、逻辑强行分离。你必须使用特定的软件（如Word）才能正确打开.doc文件，否则看到的可能只是一堆乱码——平台垄断了文件的唯一解释权。后来的SaaS产品，则将数据垄断推向新的高度。你存储在飞书、Notion等平台上的文档，大多不支持完整的原生格式导出。即便是ChatGPT的记忆功能，通常也只允许导出用户自己发送的内容，AI回复中的核心信息往往无法完整带走。

结果就是，用户使用的工具越来越多，却从未真正“拥有”过自己的数字资产。跨产品、跨Agent的协同更是奢望：你在floatboat中构建的工作流，无法同步到Openclaw；你在Claude中积累的AI记忆，也无法用于GPT。不同平台之间，数据与上下文是完全割裂的孤岛。

这才是办公领域最底层的顽疾，也是floatboat试图攻破的核心壁垒——它推出了开源的“Self Aware”协议，旨在重新定义AI时代的数字文件格式。谭少卿用一个形象的比喻解释道：“floatboat就像一艘承载用户数字资产的船。而船与船之间流转的，正是基于‘Self Aware’协议的文件包。它就像是新时代Agent世界里的标准化集装箱。”

这个协议从底层重构了数字文件的逻辑：它将数据、交互逻辑与创作过程重新整合到一个统一的文件包中。这个文件包不仅包含最终交付物，还完整保留了整个创作、协同过程中的所有想法、决策、修改记录、用到的Skill与API调用，把AI所需的完整上下文全部封装在内。它致力于实现真正的跨产品兼容，任何支持该协议的Agent产品都能打开、编辑、使用这个文件包，用户不再被单一平台绑定，真正实现“我的数据我做主”。同时，它保障了用户的数据所有权，所有文件包、数据、AI记忆都默认存储在用户本地，从根源上避免了平台“蒸馏”用户数据、泄露隐私的可能，用户带着自己的设备，就带走了全部数字资产。

这无疑是一次大胆的尝试，其目标是对整个办公行业的底层规则进行重构，将生产资料的所有权，重新交还给每一个个体。

三、OPC时代，Agent的终局是重构生产关系

“我们选择OPC作为切入点，是因为我们相信，OPC代表了先进生产力的发展方向。”谭少卿如此阐述产品的初衷。

AI大模型的爆发，正在深刻重构社会的劳动分工。过去需要专业团队协作完成的任务，现在一个人借助AI就可能实现：编程、视频制作、网页开发、设计……这些曾经需要专门职业训练的技能，正被AI转化为普通人也能掌握的基础能力。越来越多的人选择成为OPC，以十人以内的小团队，甚至独自一人，运营起完整的业务。

然而，传统的办公软件并非为这群人设计。中大型企业内部分工明确，法务、财务、运营、创作各司其职，工作流是标准化、线性的。而OPC创业者需要一人分饰多角，工作流是动态、交叉且高度复杂的，信息散落在无数平台与文件中，他们对于上下文无缝流转、多角色快速切换的需求，远比大型企业员工更为强烈。

“你的工作越复杂，上下文流转越频繁，一个人需要扮演的角色越多，floatboat能带来的效率提升就越显著。”谭少卿指出，“反之，如果你的任务是单点、分工极其明确的，那么它的提升可能有限。但未来的趋势是，越来越多的人会走向OPC模式，需要‘一个人顶一个团队’，这正是我们的核心用户群。”

工具层面的创新，只是floatboat的第一步。它真正的愿景，是构建一套分布式的Agent协同网络，让个体生产力首次具备网络效应，从而重构AI时代的生产关系。

传统的协同办公，本质是“人找人”。你必须将自己的文件、文档乃至工作记忆全部暴露给对方，才能实现协作，效率低下且存在显著的隐私风险。而在floatboat设想的分布式网络里，协同的主体变成了Agent。你与同事可以通过各自的Agent实现安全、高效的协同，无需暴露完整的数字资产，只需在约定的项目区间内共享上下文，双方的Agent就能提前完成多轮信息同步与内容处理，最终人类只需做出核心决策即可。

更具想象空间的是，这个网络能够指数级放大个体生产力。你的Agent可以在你休息时，与网络中其他用户的Agent进行对接、协作，甚至完成基础的商业交易。原本一个人可能只能服务四五个客户，在Agent的加持与网络协同下，其服务上限可能拓展至上百人。

“当每个个体的生产力都被AI放大十倍、百倍，再通过开放的分布式网络实现协同，整个社会的生产关系，都将发生根本性的变革。”谭少卿总结道。

在交流的最后，他反复强调了一个核心观点：产品设计本身就在定义和塑造用户需求。“你把产品叫做‘Agent Infra Browser’（Agent基础设施浏览器），那么来的用户里，70%可能都是来抓取数据的。但当你把产品明确定义为‘面向OPC的Agent工作空间’时，用户才会把剪辑视频、进行科研、撰写播客、做战略分析这些真实而复杂的需求，真正释放出来。”

对话 Floatboat 谭少卿：Agent 办公最大的痛点，不在模型能力

一、AI办公的最大痛点，不是模型不够强

二、Agent行业的内卷误区：我们到底需要什么样的端侧智能？

三、OPC时代，Agent的终局是重构生产关系

相关阅读

最新教程

最新资讯