AI算力争夺战：下一个Cerebras候选者排行榜

2026-05-29阅读 0热度 0

AI算力

AI模型对算力的需求仍在持续攀升，这是所有人都看得见的趋势。但要想真正参与这场游戏，绕不开两个核心障碍：一是拿到合适的芯片，二是把这芯片塞进数据中心，让它真正开始产生收益。

General Compute就是这么一家新冒出来的推理云服务商，专注的正是AI模型完成训练后的推理阶段——也就是模型实时运转、响应请求的那一环。这家公司对上述两大问题给出了自己的解法，而这些解法也在某种程度上揭示了AI生态接下来可能走向何方。凭借这套思路，General Compute完成了一轮1500万美元的种子轮融资，投后估值6000万美元，领投方是FUSE VC，Carya Venture Partners和Village Global Ventures也跟了进来。

那么，什么才算得上“合适的芯片”？GPU的需求早就涨上天了，但业界正在慢慢形成一种共识：GPU未必是跑AI模型的最优解。AI在推理阶段——也就是模型主动生成响应的过程——需要的算力结构与训练阶段是两回事。专门为推理设计的新一代芯片正在崛起。英伟达去年年底砸了200亿美元收购Groq，上周Cerebras又完成了570亿美元的IPO，这些都是风向标。

不过，Groq和Cerebras的产能都已经绷得很紧了。General Compute的联合创始人兼CEO Finn Puklowski和CTO Jason Goodison于是另辟蹊径——他们选择了SambaNova的专用芯片。SambaNova是一家从英特尔体系里走出来的公司，专攻推理芯片，这几年在硅谷的存在感稍微弱了一些。

但情况可能很快会有变化。SambaNova今年推出了新一代芯片，架构灵活性明显更强，推理计算时内存容量更大，能存储更多上下文。公司宣称，其性能不仅碾压GPU，也比Groq、Cerebras等同类专用芯片更胜一筹。Puklowski透露，新芯片的Token生成速度能达到每秒600到700个，而GPU大概只有每秒250个。

General Compute已经下了价值3亿美元的订单，购买SambaNova的SN50芯片，并且声称将成为首家部署这款芯片的云服务商。

这块芯片还顺手解决了第二大难题——部署场所的问题。SN50用的是风冷，不是水冷，功耗也更低，直接装进现有的数据中心就行，不用额外砸钱搞基础设施改造。

Puklowski目前正在忙着拓展托管合作——也就是把自家的硬件设备部署到合作伙伴的场地。合作对象不光是数据中心运营商，还包括加密货币矿工。原因很简单：比特币生产成本长期高于币价，这些矿工正愁手里的基础设施怎么转型再利用。

General Compute上周已经正式上线了云服务，并且宣称是目前跑MiniMax 2.7——一个很强大的开源大语言模型——速度最快的服务商。

风险投资人Joe Hassleman早在2021年就投了Groq，算是赶上了推理算力浪潮的早班车。今年他设立了专注于AI的新基金Evercrest Partners，第一个投资标的就选了General Compute。在他看来，SambaNova和General Compute的合作关系，有点像Corewea ve和英伟达的深度绑定，也类似Groq在芯片制造和它的前云服务之间的互动模式。

“他们确实得找到一批优质的客户，把芯片部署到高速增长的应用场景里去，”Hassleman说，“General Compute在赌SambaNova，SambaNova也在赌General Compute，这就是个互相反赌的局面。”

说到底，最核心的问题还是：在AI的未来图景里，哪种计算架构能成为最大的价值收割者？推理云服务的崛起，本质上是对一个多模型、多智能体并存世界的隐性押注——在那个世界里，没有哪家供应商能一家独大，推理的速度和成本才是决定胜负的关键。这周OpenRouter完成的1.13亿美元B轮融资，就是一个有力的印证——这家公司帮客户接入多个模型，优化Token使用成本。

在这个逻辑下，速度就是一切。速度快，直接决定了价格和性能的上限。Puklowski希望把编程智能体原本需要一小时才能完成的任务压缩到五到十分钟，同时让用在客服场景的语音智能体变得更经济实惠——这类智能体的对话流畅度高度依赖推理速度。“如果ChatGPT能给你每秒50个Token的输出速度，已经比人类阅读速度快多了，”Puklowski对TechCrunch说，“但现在场景已经进化到智能体之间互相协作，智能体要替我们去读信息、查数据库，它们需要更快。”

Q&A

Q1：General Compute到底是一家什么样的公司？主要做什么？

回答：General Compute是一家专门做AI推理阶段云服务的公司，说白了就是出租AI算力。推理阶段指的是模型训练完之后，实时响应用户请求的那一环。他们用的是SambaNova的专用推理芯片，主打高速、低成本的推理云服务。目前已经上线了云服务平台，并且声称是跑开源大语言模型MiniMax 2.7速度最快的服务商。

Q2：SambaNova的芯片比GPU和其他专用芯片强在哪？

回答：SambaNova新一代芯片在推理场景下的优势很明显：Token生成速度能达到每秒600到700个，是GPU（大约250个/秒）的两倍还多；架构更灵活，推理时上下文存储的内存也更大；而且用风冷、功耗低，不需要改造现有数据中心就能部署，能省下不少基础设施成本。SambaNova声称它的性能超过了GPU，也优于Groq、Cerebras等同类专用芯片。

Q3：为什么资本这么看重推理云服务这个方向？

回答：因为AI应用正在从单个模型回答问题，进化到多个智能体协同工作。智能体之间需要高速交互、实时读取数据，对推理性能的要求远超原来的人机交互场景。资本在押注一个多模型共存、没有单一供应商能通吃的AI生态——在这个生态里，推理云服务商很可能占据非常重要的价值节点。Groq、Cerebras的高估值，加上OpenRouter这周完成的1.13亿美元融资，都说明市场对这个赛道非常认可。

AI算力争夺战：下一个Cerebras候选者排行榜

Q&A

相关阅读

最新教程

最新资讯