二零二四年最新量化巨头AI大模型野望排行榜与全面实力对比
DeepSeek:剑指“全能天才”
在量化私募的版图中,幻方始终是一个独特的存在。自2018年在A股江湖声名鹊起后,其净值曲线成了量化交易的“风向标”。2023年5月,由幻方实控人梁文锋牵头、依托幻方量化体系孵化并持续提供资金与算力支持的深度求索(DeepSeek)正式成立。DeepSeek的目标只有一个:AGI(通用人工智能)。 如今,“AI”这个词已经被过度泛化,成为科技圈的“万能标签”。从客服机器人到自动写周报的工具,甚至只是给照片加个滤镜,都被冠以“人工智能”的名号。但DeepSeek所追求的AGI,与市面上这些泛滥的“弱AI”有着本质区别。 AGI是要培养一个“全能天才”。它不满足于在单点任务上刷分,而是追求让机器拥有像人类一样通用的推理能力、自主的学习能力和跨领域的迁移能力。简单说,AGI是“通才”——它能理解世界的底层逻辑,今天能分析股市K线,明天就能推导物理公式,后天能自主编写复杂的软件系统。DeepSeek的选择,意味着他们不再满足于做证券市场的“掠食者”,而是试图成为智能时代的“造物主”。这种技术理想主义的色彩,在他们近期的人才招募中体现得淋漓尽致。 DeepSeek最新的招聘启事里,对核心人才需求的描述颇有“区分度”:“对世界充满好奇心,这种好奇心会自然延伸到对复杂系统底层运作机制的持续探索……不满足于被动执行,对通用人工智能(AGI)的技术路径与发展有着独立的思考与执着的好奇心……探索高价值Agent应用场景,推动能力落地与持续迭代。” 这段话可以通俗解读为:拒绝“工具人”——他们不要那些只会照着文档敲代码的人(即“不满足于被动执行”);寻找“本质探索者”——需要那种看到问题,不仅想解决它,更想搞懂背后“为什么是这样”的人。 值得注意的是,近一年DeepSeek团队接连发表多篇底层架构创新论文,梁文锋均为核心署名作者。这些论文分别从长文本稀疏注意力、训练稳定性的残差连接约束、知识与推理分离的条件记忆机制等关键方向入手,研究当前大语言模型最核心的基础架构革新问题,目的是让大模型训练更稳、长文本更快、推理更省算力等。九坤投资:攻克大模型垂直领域的应用
九坤投资是中国第一代量化私募的“指标性”机构,其发展历程堪称中国量化投资行业的一个缩影。早在2017年末,其管理规模便突破50亿元大关,成为当时中国规模最大的量化机构,而彼时大部分同行的规模尚在10-20亿元之间。进入2018年,九坤继续乘势而上,规模迅速扩张,由此奠定了“北九坤、南幻方”的行业格局,近三年市场不时有其规模破千亿元大关的说法。 在量化投资领域突飞猛进的同时,九坤并未止步。面对人工智能技术的飞速发展,他们敏锐地捕捉到AI将为各细分领域带来的巨大变革。2025年,九坤投资正式发力大模型领域,成立了“至知创新研究院”。 但与DeepSeek致力于打造“全能型通用大脑”不同,九坤并未选择去卷通用的“聊天机器人”,而是另辟蹊径:它更倾向于训练“专家型”的垂直大模型,不追逐模型什么都懂,而聚焦于代码编写、医疗诊断等特定深水区。2026年开年第一天,该研究院宣布全新开源一个代码大语言模型,功能是能读懂、能写、能改代码的AI助手,帮助程序员自动完成编程、修bug、解释代码。 在至知创新研究院官网页面可以看到,他们正在攻关的三个核心课题(如下图)。
借助大语言模型,可以这样解读三个课题的研究意义(上图从左至右):其一,传统的大模型处理复杂数据时效率低下,九坤的研究旨在让模型变得更高效(计算成本更低)、更“懂”数据中的对称关系并且能线性扩展处理能力,这相当于打造更强大的“CPU”。其二,研究如何让大模型从一个单纯能写代码的“工具”,进化成一个能自主思考、规划和执行任务的“智能体”。其三,迈向通用医学视觉推理的多模态大语言模型,让大模型不仅能“看懂”2D、3D的医学影像,还能“理解”手术视频等复杂信息,并成为医生的“超级助手”。
或许九坤给出的答案是:AGI的演进不应是空中楼阁,这家大厂正试图以开源代码模型为支点,撬动更多垂直领域的智能化变革,最终为AGI的规模化落地铺设基石。
宽德投资:瞄准“科研超级助手”
2023年,在A股整体低迷、募资难度极大的背景下,宽德投资却逆势迈过了百亿大关,新增规模超百亿元,一举成为当年整个中国证券私募圈的“募资王”。这一成绩很大程度上得益于其在前一年熊市里跑出的绩优业绩。 带着雄厚的资金实力和对技术的敏锐嗅觉,2025年宽德也正式加入了大模型的战局。值得注意的是,宽德的大模型定位不仅与DeepSeek追求AGI的宏大叙事不同,与尝试垂直领域的九坤也有本质区别——宽德是要在“未知”的科学前沿中培养“探索者”,直接加速人类对自然规律的认知突破。 来仔细拆解宽德智能学习实验室的官方表述:
他们要做的,是一个“超级科技助手(ASI for Sci-Tech)”。根据宽德发布的战略愿景,其核心逻辑非常清晰:“专注于研发通用性的超级科技助手,追求技术复利与持续性领先。”通俗来说,宽德实验室想打造一个专门服务于科学研究和技术创新的超级助手。
宽德在官方渠道的表述中还提到“以工业级研发的方式,探索AI能力的上限”,以及“面向科学技术领域,持续推进模型能力建设与深度应用探索”。
那么,到底需要什么样的人来干这件事?近期,宽德招聘的核心岗位是AI研究员。对于这个岗位的要求,官方描述得很具体:“专注于开发下一代AI模型与算法,开展大语言模型创新研究并实现规模化落地。涵盖预训练、后训练、数据与评估、智能体系系统四大方向。”
从宽德的布局来看,他们似乎找到了一条差异化的赛道:深耕B端的科研与工业场景。这既符合其作为量化机构对数据和逻辑的严谨要求,也为其庞大的资金找到了一个具有长期想象力的技术出口。至于这个“超级科技助手”能否真的成为科研人员的左膀右臂,我们拭目以待。