2024年Transformer替代方案深度测评:这家创业公司如何突破技术瓶颈?
Subquadratic 宣称突破 Transformer 七年架构瓶颈,AI 长上下文处理迎来拐点?
一家名为 Subquadratic 的迈阿密初创公司近期脱离隐身模式,其发布的核心宣言直指 AI 领域的基础性挑战:声称已突破自 2017 年 Transformer 架构确立以来,制约所有主流大模型的数学瓶颈。其模型 SubQ 在发布 24 小时内获得超 1200 万次曝光,并吸引了超过 3 万名开发者加入候补名单,迅速成为技术社区热议的焦点。
理解 Transformer 的根本瓶颈
要评估 SubQ 主张的价值,必须首先厘清 Transformer 架构的核心约束:其注意力机制的计算复杂度随序列长度呈平方级(O(n²))增长。
flowchart LRsubgraph Transformer["? 传统 Transformer"]direction TBA1["Attention 计算量 = O(n²)"]A2["token 翻倍 → 计算量翻四倍"]A3["长上下文:越贵 · 越慢 · 注意力退化"]endsubgraph SubQ["? SubQ 架构"]direction TBB1["Attention 计算量 ≈ O(n)"]B2["token 翻倍 → 计算量也翻倍"]B3["线性增长,长上下文友好"]endTransformer -- "SSA 次二阶选择注意力" --> SubQ
正是 O(n²) 的复杂度,迫使 Claude、GPT、Gemini 等模型在处理长上下文时,面临计算成本飙升、推理延迟增加以及“中间注意力退化”的难题。模型看似拥有庞大的上下文窗口,但在实际推理时,难以对长序列中所有关键信息进行有效关联与调用。
这也催生了当前行业普遍采用的 RAG(检索增强生成)、向量数据库、上下文压缩等复杂工程方案。从本质上讲,这些都是在为底层架构的瓶颈打补丁,而非根本性的解决方案。
SubQ 的技术主张与产品布局
mindmaproot((SubQ 核心主张))指标12M token 上下文1000× 算力节省$29M 种子轮融资架构 SSA只关注重要 token稀疏图动态路由平方复杂度 → 线性产品线全上下文 APISubQ Code 代码 AgentSubQ Search 长文档搜索投资人Justin Mateen Tinder 联合创始人Ja vier Villamizar 前软银Anthropic OpenAI Stripe Brex 早期投资人
该公司将其核心技术命名为 SSA(次二阶选择注意力)。其核心思路是摒弃传统注意力机制中全连接的计算模式,转而通过稀疏图上的动态路由,让每个 token 仅与序列中少数关键 token 进行交互。理论上,这能将注意力计算复杂度从平方级降至近似线性。
根据其公布的数据,在处理 1M token 上下文时,SSA 比当前高效的 FlashAttention 快 52 倍;在研究版支持 12M token 的规模下,相比前沿模型可节省近 1000 倍算力。其产品矩阵包括面向开发者的全上下文 API、代码智能体 SubQ Code 以及长文档搜索工具 SubQ Search,目前均处于私测阶段。
其投资人阵容也备受关注,包括 Tinder 联合创始人 Justin Mateen、前软银愿景基金合伙人 Ja vier Villamizar,以及 Anthropic、OpenAI、Stripe、Brex 的早期投资人,这为其技术叙事增添了一定的行业背书。
为何 AI Agent 领域反响强烈
当前 AI Agent 发展的核心瓶颈,往往不是推理能力,而是受限于上下文长度的“工作记忆”。无论是 Cursor 还是 Claude Code,都需要依赖复杂的 RAG、代码分块和摘要技术,其根本原因在于无法将完整的代码工程仓库一次性载入模型的有限上下文窗口。
SubQ 的关键主张在于,它不仅宣称能容纳超长上下文,更强调在长序列中保持高精度的信息提取与关联能力。许多现有长上下文模型存在“Lost in the Middle”问题,即对序列中间部分的信息处理能力显著下降。SubQ 报告在 RULER 128K 基准测试中达到 95% 的精确度,并在“大海捞针”等任务中表现突出。若经得起验证,这将直接扩展 AI Agent 的能力边界。
突破 Transformer 的技术路线图
事实上,突破 Transformer 的平方注意力瓶颈已是行业公开的技术竞赛。目前主要存在多条并行演进路径:
flowchart TDsubgraph 目标["? 突破 Transformer O(n²) 天花板"]direction TBend目标 --> R1["次二阶稀疏注意力"]目标 --> R2["状态空间模型 SSM"]目标 --> R3["线性注意力"]目标 --> R4["检索增强"]目标 --> R5["外部记忆"]目标 --> R6["混合架构"]R1 --> S1["SubQ ?"]S1 --> S1S["⚠️ 私测中,待验证"]R2 --> S2["Mamba"]S2 --> S2S["已有一定规模验证"]R3 --> S3["RetNet / RWKV"]S3 --> S3S["下游任务仍有差距"]R4 --> S4["RAG 生态"]S4 --> S4S["最成熟,广泛部署"]R5 --> S5["MemGPT 等"]S5 --> S5S["应用层 patch"]R6 --> S6["Gemini / Claude 内部"]S6 --> S6S["主流厂商折中路线"]style S1 fill:#EEEDFE,stroke:#534AB7,color:#534AB7style S1S fill:#FAEEDA,stroke:#EF9F27,color:#854F0Bstyle S2S fill:#E1F5EE,stroke:#1D9E75,color:#0F6E56style S4S fill:#E1F5EE,stroke:#1D9E75,color:#0F6E56
SubQ 的独特价值主张在于,它声称是首个“从头设计、全程保持次二阶复杂度、且在下游任务性能上无显著妥协”的商用架构。此前的多数方案,要么在综合性能上难以匹敌标准 Transformer,要么最终回归混合架构,其核心仍未完全脱离平方复杂度。
保持审慎:社区提出的关键质疑
在热度之下,技术社区与研究界也提出了多重审慎观点:
flowchart TDsubgraph 警报["⚠️ 社区警报"]W1["论文细节不够公开"]W2["Benchmark 多是自测"]W3["API 仍处私测阶段"]W4["架构未开源"]endsubgraph 先例["? 历史先例:Magic.dev"]H1["2024.08 声称 1 亿 token 上下文"]H2["同样宣称 1000× 效率优势"]H3["融资 5 亿美元"]H4["2026 年初:外部使用证据几乎为零"]H1 --> H2 --> H3 --> H4endsubgraph 前车["其他承诺过线性复杂度的方案"]P1["Kimi Linear"]P2["DeepSeek 稀疏注意力"]P3["Mamba"]P4["RWKV"]end警报 --> 先例先例 --> 前车style 警报 fill:#FCEBEB,stroke:#E24B4A,color:#A32D2Dstyle 先例 fill:#FAEEDA,stroke:#EF9F27,color:#854F0Bstyle 前车 fill:#FAEEDA,stroke:#EF9F27,color:#854F0B
回顾过往,无论是 Kimi Linear、DeepSeek 的稀疏注意力,还是 Mamba 与 RWKV,都曾提出过线性复杂度的愿景。然而,一个普遍的挑战在于:理论上的效率优势,在应对大规模、多样化的实际任务时,往往难以完全转化为与标准 Transformer 相媲美的鲁棒性和综合性能,有时仍需引入传统注意力层作为补充。
因此,在获得独立、可复现的第三方基准测试验证之前,对于“1000倍效率提升”这类具体数字,保持专业上的审慎是必要的。
长期关注的价值与行业意义
抛开对 SubQ 具体声明的争议,其所指向的技术方向具有明确的行业重要性。在 2025-2026 年,突破 Transformer 的平方注意力瓶颈,是整个 AI 领域公认的核心工程挑战与研发重点之一。
如果 SubQ 的技术主张最终能在开放环境中通过严格验证,其影响将是结构性的:代码智能体、企业级知识库、法律与医疗长文档分析、AI 的长期记忆系统等关键场景,将可能迎来架构层面的根本性变革,而非渐进式优化。
反之,若其主张无法被独立验证,这将成为 AI 发展浪潮中又一个关于过度融资与技术承诺的典型案例。最终结局如何,取决于其能否通过以下几道关键检验:
flowchart TDsubgraph 待验证["? SubQ 需要通过的三道关"]G1["独立基准测试"]G2["同行评审"]G3["开放访问"]end待验证 --> 情景A["✅ 通过 → 行业格局改变"]待验证 --> 情景B["❌ 未通过 → 又一个过度承诺案例"]情景A --> A1["代码 Agent 质变"]情景A --> A2["企业知识库重构"]情景A --> A3["法律医疗长文档分析升级"]情景A --> A4["AI 长期记忆突破"]style 待验证 fill:#EEEDFE,stroke:#534AB7,color:#534AB7style 情景A fill:#E1F5EE,stroke:#1D9E75,color:#0F6E56style 情景B fill:#FCEBEB,stroke:#E24B4A,color:#A32D2D