谷歌Gemini AI评测：百度阿里必看的三大启示

2026-06-19阅读 0热度 0

图片来源：X

与此同时，Anthropic（Claude）上月也刚宣布了最新一批百万级Google TPU订单，就连OpenAI联合创始人、前首席科学家Ilya Sutskever新创立的SSI，年初也选择了Google TPU作为算力来源。

坦白讲，这背后不止是Gemini 2.5到Gemini 3的“模型胜利”，更是Google身上另一种叙事的成功——体系的胜利。Gemini、TPU、Google Cloud、Android、Google Search这套长期被贴上“太慢”“太重”标签的策略，突然之间就有了压迫感。

行业的情绪变化尤为显著。

今年以前，流行论调是“Google老了、官僚化了”。如今，风向几乎完全逆转：Google的节奏稳了、产品线统一了、技术底座终于显露出威力。甚至有分析师将Google称为“醒来的巨人”，暗示这家公司可能正在重新定义整个产业的技术路线。

但真正让人感到戏剧性的，不是今天的掌声，而是它与过去的落差。两年前，Google还在为Bard的“翻车”公开道歉，被当作大模型时代最典型的失败案例之一。如今，同一家公司却成了最受追捧的那一个。

从被群嘲到被追捧，Google到底是怎么做到的？

被ChatGPT打醒了，但路线从未改变

2022年底的ChatGPT是一声惊雷，被这声雷劈醒最彻底的，恰恰是设计开发了Transformer架构、当时如日中天的Google。

基于Transformer架构和Scaling Law（扩展法则），GPT-3.5的横空出世让全球第一次意识到通用大模型的潜力。而Google内部的反应远比外界猜想的更激烈——搜索团队紧急成立“Code Red”应急小组，DeepMind与Google Brain在内部反复讨论路线，管理层连续数周加班开会，内部邮件里都弥漫着一种压力和窘境：

图片来源：Google

在这种背景下，Bard仓促上线，问题百出，甚至因为一条错误回答导致市值狂跌千亿美元。社交媒体和科技圈都在质疑Google“尚能饭否”？至少在当时，更关键的不是产品本身，而是背后许多人的行业判断：Google失去了节奏，躺在功劳簿上，被OpenAI打得措手不及。

这就是“Google掉队论”的起点。但真正反转的是，Google在最被看衰的那段时间，并没有换路线。2016年起，Google就宣布“AI-first”（AI优先），并在那之后持续投入了一条业内最重、最系统的“全栈式AI”路线：

图片来源：Google

更不用说，Google还有全球规模最大的搜索场景、Google Photos、YouTube上海量的多模态训练素材。这些看起来“不性感”“非爆发式”的长期工程，在ChatGPT的巨大冲击下并没有被抛弃。

掉队不是方向错，而是路线太长。既然路线正确，那就不能换，而是要加码。所以Google在经历ChatGPT的冲击和Bard的失败后，也经历了最猛烈的调整期。

“Google式全栈”：十年投入，一朝兑现

首先是当年被认为“不可能”的事情发生了——2023年4月，Google Brain与DeepMind合并为一个统一团队，两支全球最强的研究力量被强行揉成一支，路线和节奏由曾经主导开发AlphaGo的DeepMind创始人Demis Hassabis（杰米斯·哈萨比）统一指挥。

图片来源：Google

对外说法是“统一资源”，但业内都知道，这背后真正清理掉的是Google内部长期存在、几乎无法调和的路线分歧和组织壁垒。AI-first战略喊了很多年，但直到这次重组，它才第一次真正“力出一孔”。

与此同时，Google过去十年一点一点打下的底座开始显露出价值。TPU本来就是为谷歌自身服务的芯片，先是给搜索和广告做推理加速，然后逐步支撑内部模型的训练。当大模型时代到来，这种优势恰好成为了一个行业变量，也是Google与其他所有大模型厂商最核心的差异之一。

尤其是在ChatGPT之后，TPU v5、v6、v7（Ironwood）的节奏明显加快、加大。从Anthropic开始，Google也开始把自家芯片拿出去做外部大规模商用，从本地训练、云部署，到现在的专线算力、TPU@Premises等方案，一步一步抬升自家云的含金量。

图片来源：Google

而从Bard到Gemini，本质上还伴随着一次“架构统一工程”：从跑在Pixel和Chrome上的Gemini Nano，到侧重吞吐和延迟的Gemini Flash，再到最强的Gemini Pro，背后都共享同一套架构、训练方法和评测体系。

这套统一后的体系，让Gemini 2.5能在推理和多模态上重返第一梯队，也让Gemini 3能在视觉、语音、文本和代码理解上全面进化。Google过去被嘲笑的“慢”，恰恰来自于它在为这条统一路线铺底，而不是没有方向。

体系的成形，最终还是要落地到产品上才能证明价值。在Bard的失败后，Google可能也意识到模型的核心价值，以及盲目生成式AI化的问题，选择了一条不同优先级的路线。

最激进的突破是搜索，不仅支持了AI预览，还在早些时候下定决心，正式上线了AI Mode。Pixel手机也是Google AI化改造的另一个主力，云端和设备端不同尺寸、不同设计目的的Gemini模型，也在影像、翻译、信息处理以及语音助手体验上带来质的改变，Magic Cue智能信息提示更是手机AI化的关键方向之一。

图片来源：Google

不同于已有产品和服务的AI化改造，NotebookLM和Nano Banana作为今天原生AI应用的代表，则代表了Google探索AI时代的另一种路径——一个重构了学习与知识管理，一个把视觉生成推向了更轻、更快、更自由的方向。

可以说，过去差不多十年，Google把芯片、模型、云基础设施、搜索规模、移动端生态、视频和图像数据全部捏成了一套体系。这看上去笨重、缓慢，但当模型能力、算力底座和产品矩阵在同一条路径上汇合时，也突然具备了别人难以复刻的整体性。

阿里、百度能否实现Google式“反转”？

如果把国内这两年的大模型竞争放到同一个坐标系里，豆包的领先已经不是“更快一点”，而是彻底甩开了身后的所有追赶者。

QuestMobile的数据显示，今年第三季度豆包App的月活已经冲到1.59亿，超越了DeepSeek，并且遥遥领先其他AI应用。同时，火山引擎的公有云大模型调用量份额更是逼近一半，日均token调用量突破三十万亿。

图片来源：QuestMobile

这种规模带来的滚雪球效应，让豆包在用户侧、应用生态和模型调用上都形成了“越用越强”的正循环。

但如果把视角稍微拉高一点，又会发现豆包的领先并不意味着这场竞争已经盖棺定论。因为在Google身上我们已经看到，真正决定胜负的从来不是一两次爆发，而是体系。阿里这两年在模型、算力、开源和应用层的连招，正在让它成为最有可能走出“Google式反转”的国内玩家。

千问App的爆发只是最外层的信号。真正支撑它的，是阿里过去两年在全球开源社区建立起来的Qwen模型号召力，以及大规模基础设施投入带来的底层优势。

Qwen2.5到Qwen3-Max这条路线，把模型的推理、多模态和代码能力推到国际一线；Qwen在Hugging Face、GitHub的累计下载量已经摆在全球前列，甚至多次登上全球开源榜前几的位置。

而阿里今年明确以千问取代通义，也是在把这些底层能力重新压缩成一个C端入口，让自身的技术体系第一次具备了向大众规模化输出的可能。

图片来源：阿里

某种意义上，千问现在的状态很像Google之前的阶段——模型够强，生态够深，入口刚刚成型，真正的大考才刚开始。

而百度虽然在产品，尤其是在C端产品的节奏上慢半拍，但仍然有着极强的技术底座。文心5.0原生全模态架构、万亿参数规模、与昆仑芯的深度绑定，让百度在技术完整性上保持着独特的位置。它的AI云、城市级业务、自动驾驶体系，也让它在To B / To G领域拥有别人难以复制的纵深。

只是，这种体系化的投入并不会自然转化成C端用户规模，中间还有很多路要走。

把国内这三家放在一起看，更能理解Google的启示意义。豆包证明了“规模”本身就是能力的一部分，是最现实、最直接的飞轮；阿里证明了开源、全栈和大生态的深耕可以在关键时刻形成反转势能；百度则证明了底座的完整性永远不会过时，只是在等待一个足够大的应用窗口把体系推向前台。

国内的竞争还远未结束，而真正决定未来的，很可能不是谁跑得最快，而是谁能把模型、算力和应用最终捏成一条完整的路径。

谷歌Gemini AI评测：百度阿里必看的三大启示

被ChatGPT打醒了，但路线从未改变

“Google式全栈”：十年投入，一朝兑现

阿里、百度能否实现Google式“反转”？

相关阅读

最新教程

最新资讯