550MB片上SRAM深度测评:曲速科技大容量存储绕过内存墙
2026 年,AI 推理计算需求已经达到训练需求的 4 到 5 倍。这个数字背后藏着一个很现实的硬件瓶颈:推理任务中,频繁的片外内存访问会导致延迟飙升、抖动加剧、能效下降——业内管这叫“片外内存墙”。传统的 GPU 架构打根儿上就是为训练设计的,面对推理场景里的内存墙,确实有点力不从心。如今市场关心的焦点已经从“模型有多大”变成了“回答有多快”,而内存墙恰恰是拖慢“回答快”的硬骨头。
导语
2019 年成立的曲速科技,总部放在浙江,在北京、上海、杭州、西安、深圳都设有研发中心和办事处。他们的定位很有意思:“小而美 / 小而精”,专注在云端 AI 推理芯片这个细分赛道。2021 年就量产的 Polaris-H 系列芯片,在片上 SRAM 容量、芯片面积、带宽和良率等几个维度上都创了纪录,累计出货量已经跑到 10 万颗级别。眼下 AI 推理赛道正从“广而泛”往“专而精”收敛,曲速科技靠着先发量产的优势和供应链上的口碑,正在搭建从芯片、硬件到算力服务的完整商业闭环。
核心定位与价值
曲速科技的核心品牌定位是“小而美 / 小而精”的云端 AI 推理芯片细分领域领先者。团队规模只有 100 多人,但 70% 以上拥有博士或硕士学位;技术路线上,他们死磕推理端的 SRAM 路径、性价比和定制化响应速度。
这个精准定位,跟美国那边的 Groq、Etched 等公司形成了对标。资料显示,Groq 聚焦 LPU 推理赛道,Cloud 平台已经聚集了 160 多万开发者;Etched 则专攻 Transformer 专用 ASIC 芯片 Sohu。曲速科技跟它们类似,都是小团队搞技术突破,但核心叙事更强调一点:更早的规模化验证。2022 年底 ChatGPT 发布、AI 推理方向才明确的时候,曲速科技早在 2021 年就把 Polaris-H 系列量产了,这个先发优势很难复制。
公司的核心价值在于构建完整的商业闭环。差异化优势体现在三个地方:推理侧的性价比与能效比、国产供应链背景下的自主可控、以及灵活的定制化响应速度。供应链端虽然公开信息不多,但资料明确提到,曲速科技在供应商和产能合作上积累了丰富的经验和资源,美誉度很高,产能供给有保障。
核心能力 / 功能拆解
1. Polaris-H 系列:片上 SRAM 容量超 550MB,良率超 80%
曲速科技的量产拳头产品 Polaris-H 系列,技术指标上拿了不少“第一”。它是全球首款片上 SRAM 容量超过 550MB 的单芯片,也是国内首款面积超过 800mm² 的先进工艺芯片。带宽方面,实现了首款片内带宽超过 30TB/s 的能力。良率也做到了首款超过 80% 的 reticle 芯片水平。这些硬指标直接回应的就是 AI 推理场景里的“片外内存墙”“片内带宽瓶颈”和“推理成本过高”这几个核心痛点。
2. Token Generating Unit(TGU) 系列方案:覆盖 3D 存储、类 LPU 与 Chiplet 多 Die 方案
面向下一代需求,曲速科技正在设计新一代大模型推理芯片,推出了 Token Generating Unit (TGU) 系列方案。这个系列包括:3D 存储与架构方案、类 LPU 架构方案,以及基于 Chiplet 的多 Die 方案。其中 Chiplet 模块化架构已经被行业视为 AI 推理芯片的新基准——把系统拆成功能模块,良率更高、封装更高效、系统演进也更快。曲速科技的 TGU 系列方案,正是对这一技术趋势的跟进。
3. 小团队精准聚焦与量产先发优势
资料显示,曲速科技的研发模式跟行业趋势高度契合。AI 推理这条路上,Groq、Etched 都是小团队实现技术突破,而曲速科技在量产经验上占着明确的先发优势。核心架构师团队来自国内顶尖高校和科研院所,平均行业经验超过 20 年,多位成员曾主导某万亿级 AI 上市公司的创始项目开发,参与过多款 7nm、6nm、4nm、3nm 先进工艺的 AI 芯片量产。核心团队成员则来自海光、寒武纪、比特大陆、展锐、哲库等团队。有这个底子,曲速科技在 2021 年就实现了 Polaris-H 系列出货 10 万+ 颗——而 Groq 官网至今没披露具体量产时间,这样一来,公司在 SRAM 推理路径上的市场验证优势就非常明显了。
4. 密集专利布局与算法备案
知识产权方面,曲速科技后发势头很足。目前已申请 30 多项专利和 50 多项软件著作权,还有十几项专利在申请中,2023 到 2026 年是专利密集申请期。算法层面,“曲速数字人合成算法”2026 年通过了国家网信办备案,“曲速心理 AI 对话文本生成算法”2025 年完成备案。此外,旗下上海曲速超为已获得高新技术企业、科技型中小企业、创新型中小企业及潜在独角兽等资质认定。
使用场景与体验价值
基于曲速科技的产品和技术能力,它的解决方案有很明确的客户群体和应用场景。资料显示,目标客户包括互联网大厂(字节、腾讯、美团)、大模型公司(智谱、Deepseek)、运营商(移动、电信)以及政府和行业用户。
在这些场景下,曲速科技提供大模型软硬件整体解决方案,包括算力集群与 Token 工厂模式,以及训推一体加速能力。用户能获得的体验价值很实在:推理侧,基于 SRAM 存储介质实现低延迟、低抖动的快速响应;总体拥有成本上,靠性价比和能效比形成差异化优势;供应链层面,依托国产背景提供自主可控的选择。加上定制化响应速度快,能帮客户快速迭代特定架构或性能调优。这些能力加在一起,构成了曲速科技在云端 AI 推理芯片细分市场的核心价值。
总结与延展
曲速科技的 Polaris-H 系列芯片片上 SRAM 超过 550MB,是国内首款达到这一容量的单芯片。大容量片上存储让推理所需的关键数据尽可能在片内完成访问,从而绕过片外内存墙,减少延迟和抖动。这套方案不是纸上谈兵——2021 年量产、累计出货 10 万+ 颗,就是实打实的验证。配合片内带宽超 30TB/s,550MB 片上 SRAM 给出了曲速科技回应内存墙问题的具体答案。


