谷歌Gemini AI评测:百度阿里必看的三大启示

2026-06-19阅读 0热度 0
ai

图片来源:X

与此同时,Anthropic(Claude)上月也刚宣布了最新一批百万级Google TPU订单,就连OpenAI联合创始人、前首席科学家Ilya Sutskever新创立的SSI,年初也选择了Google TPU作为算力来源。

坦白讲,这背后不止是Gemini 2.5到Gemini 3的“模型胜利”,更是Google身上另一种叙事的成功——体系的胜利。Gemini、TPU、Google Cloud、Android、Google Search这套长期被贴上“太慢”“太重”标签的策略,突然之间就有了压迫感。

行业的情绪变化尤为显著。

今年以前,流行论调是“Google老了、官僚化了”。如今,风向几乎完全逆转:Google的节奏稳了、产品线统一了、技术底座终于显露出威力。甚至有分析师将Google称为“醒来的巨人”,暗示这家公司可能正在重新定义整个产业的技术路线。

但真正让人感到戏剧性的,不是今天的掌声,而是它与过去的落差。两年前,Google还在为Bard的“翻车”公开道歉,被当作大模型时代最典型的失败案例之一。如今,同一家公司却成了最受追捧的那一个。

从被群嘲到被追捧,Google到底是怎么做到的?

被ChatGPT打醒了,但路线从未改变

2022年底的ChatGPT是一声惊雷,被这声雷劈醒最彻底的,恰恰是设计开发了Transformer架构、当时如日中天的Google。

基于Transformer架构和Scaling Law(扩展法则),GPT-3.5的横空出世让全球第一次意识到通用大模型的潜力。而Google内部的反应远比外界猜想的更激烈——搜索团队紧急成立“Code Red”应急小组,DeepMind与Google Brain在内部反复讨论路线,管理层连续数周加班开会,内部邮件里都弥漫着一种压力和窘境:

图片来源:Google

在这种背景下,Bard仓促上线,问题百出,甚至因为一条错误回答导致市值狂跌千亿美元。社交媒体和科技圈都在质疑Google“尚能饭否”?至少在当时,更关键的不是产品本身,而是背后许多人的行业判断:Google失去了节奏,躺在功劳簿上,被OpenAI打得措手不及。

这就是“Google掉队论”的起点。但真正反转的是,Google在最被看衰的那段时间,并没有换路线。2016年起,Google就宣布“AI-first”(AI优先),并在那之后持续投入了一条业内最重、最系统的“全栈式AI”路线:

图片来源:Google

更不用说,Google还有全球规模最大的搜索场景、Google Photos、YouTube上海量的多模态训练素材。这些看起来“不性感”“非爆发式”的长期工程,在ChatGPT的巨大冲击下并没有被抛弃。

掉队不是方向错,而是路线太长。既然路线正确,那就不能换,而是要加码。所以Google在经历ChatGPT的冲击和Bard的失败后,也经历了最猛烈的调整期。

“Google式全栈”:十年投入,一朝兑现

首先是当年被认为“不可能”的事情发生了——2023年4月,Google Brain与DeepMind合并为一个统一团队,两支全球最强的研究力量被强行揉成一支,路线和节奏由曾经主导开发AlphaGo的DeepMind创始人Demis Hassabis(杰米斯·哈萨比)统一指挥。

图片来源:Google

对外说法是“统一资源”,但业内都知道,这背后真正清理掉的是Google内部长期存在、几乎无法调和的路线分歧和组织壁垒。AI-first战略喊了很多年,但直到这次重组,它才第一次真正“力出一孔”。

与此同时,Google过去十年一点一点打下的底座开始显露出价值。TPU本来就是为谷歌自身服务的芯片,先是给搜索和广告做推理加速,然后逐步支撑内部模型的训练。当大模型时代到来,这种优势恰好成为了一个行业变量,也是Google与其他所有大模型厂商最核心的差异之一。

尤其是在ChatGPT之后,TPU v5、v6、v7(Ironwood)的节奏明显加快、加大。从Anthropic开始,Google也开始把自家芯片拿出去做外部大规模商用,从本地训练、云部署,到现在的专线算力、TPU@Premises等方案,一步一步抬升自家云的含金量。

图片来源:Google

而从Bard到Gemini,本质上还伴随着一次“架构统一工程”:从跑在Pixel和Chrome上的Gemini Nano,到侧重吞吐和延迟的Gemini Flash,再到最强的Gemini Pro,背后都共享同一套架构、训练方法和评测体系。

这套统一后的体系,让Gemini 2.5能在推理和多模态上重返第一梯队,也让Gemini 3能在视觉、语音、文本和代码理解上全面进化。Google过去被嘲笑的“慢”,恰恰来自于它在为这条统一路线铺底,而不是没有方向。

体系的成形,最终还是要落地到产品上才能证明价值。在Bard的失败后,Google可能也意识到模型的核心价值,以及盲目生成式AI化的问题,选择了一条不同优先级的路线。

最激进的突破是搜索,不仅支持了AI预览,还在早些时候下定决心,正式上线了AI Mode。Pixel手机也是Google AI化改造的另一个主力,云端和设备端不同尺寸、不同设计目的的Gemini模型,也在影像、翻译、信息处理以及语音助手体验上带来质的改变,Magic Cue智能信息提示更是手机AI化的关键方向之一。

图片来源:Google

不同于已有产品和服务的AI化改造,NotebookLM和Nano Banana作为今天原生AI应用的代表,则代表了Google探索AI时代的另一种路径——一个重构了学习与知识管理,一个把视觉生成推向了更轻、更快、更自由的方向。

可以说,过去差不多十年,Google把芯片、模型、云基础设施、搜索规模、移动端生态、视频和图像数据全部捏成了一套体系。这看上去笨重、缓慢,但当模型能力、算力底座和产品矩阵在同一条路径上汇合时,也突然具备了别人难以复刻的整体性。

阿里、百度能否实现Google式“反转”?

如果把国内这两年的大模型竞争放到同一个坐标系里,豆包的领先已经不是“更快一点”,而是彻底甩开了身后的所有追赶者。

QuestMobile的数据显示,今年第三季度豆包App的月活已经冲到1.59亿,超越了DeepSeek,并且遥遥领先其他AI应用。同时,火山引擎的公有云大模型调用量份额更是逼近一半,日均token调用量突破三十万亿。

图片来源:QuestMobile

这种规模带来的滚雪球效应,让豆包在用户侧、应用生态和模型调用上都形成了“越用越强”的正循环。

但如果把视角稍微拉高一点,又会发现豆包的领先并不意味着这场竞争已经盖棺定论。因为在Google身上我们已经看到,真正决定胜负的从来不是一两次爆发,而是体系。阿里这两年在模型、算力、开源和应用层的连招,正在让它成为最有可能走出“Google式反转”的国内玩家。

千问App的爆发只是最外层的信号。真正支撑它的,是阿里过去两年在全球开源社区建立起来的Qwen模型号召力,以及大规模基础设施投入带来的底层优势。

Qwen2.5到Qwen3-Max这条路线,把模型的推理、多模态和代码能力推到国际一线;Qwen在Hugging Face、GitHub的累计下载量已经摆在全球前列,甚至多次登上全球开源榜前几的位置。

而阿里今年明确以千问取代通义,也是在把这些底层能力重新压缩成一个C端入口,让自身的技术体系第一次具备了向大众规模化输出的可能。

图片来源:阿里

某种意义上,千问现在的状态很像Google之前的阶段——模型够强,生态够深,入口刚刚成型,真正的大考才刚开始。

而百度虽然在产品,尤其是在C端产品的节奏上慢半拍,但仍然有着极强的技术底座。文心5.0原生全模态架构、万亿参数规模、与昆仑芯的深度绑定,让百度在技术完整性上保持着独特的位置。它的AI云、城市级业务、自动驾驶体系,也让它在To B / To G领域拥有别人难以复制的纵深。

只是,这种体系化的投入并不会自然转化成C端用户规模,中间还有很多路要走。

把国内这三家放在一起看,更能理解Google的启示意义。豆包证明了“规模”本身就是能力的一部分,是最现实、最直接的飞轮;阿里证明了开源、全栈和大生态的深耕可以在关键时刻形成反转势能;百度则证明了底座的完整性永远不会过时,只是在等待一个足够大的应用窗口把体系推向前台。

国内的竞争还远未结束,而真正决定未来的,很可能不是谁跑得最快,而是谁能把模型、算力和应用最终捏成一条完整的路径。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策