人大高瓴AI金融分析师:查数据画图表写研报超越GPT-5

2026-06-19阅读 0热度 0
ai

一款能自动检索数据、撰写深度分析并生成专业金融图表的AI金融分析师正式面世。

中国人民大学高瓴人工智能学院最新推出面向真实金融投研场景的多模态研报生成系统——玉兰·融观(Yulan-FinSight)。

针对用户研究需求,FinSight自动拆解任务,从互联网与金融数据库采集股价、财报、新闻等多源异构数据,最终生成涵盖“发展历程”、“核心业务架构”、“竞争格局”等章节的万字图文研报。

该系统在AFAC 2025金融智能创新大赛挑战组1289支队伍中夺冠,并在多项评测中超越GPT-5 w/Search、OpenAI Deep Research与Gemini-2.5-Pro Deep Research,其金融分析与写作能力已逼近人类专家水平。

以下为详细技术解析。

通用AI为何难以胜任金融研报?

核心问题并非模型缺乏文字生成能力,而是金融研报本身就属于高度结构化、强逻辑、强可视化的专家级工作,涉及多流程协同,远非简单问答或文本生成所能覆盖。

金融投研对数据整合、分析深度与表达形式的要求比通用任务高出一个数量级。当前通用AI系统主要面临三大挑战:

1、领域知识与数据割裂:
通用搜索系统无法有效整合股价、财务报表等结构化数据与新闻、公告等非结构化信息。缺少统一数据表示与多智能体协作分析机制,系统只能对单一信息源进行浅层处理,难以形成系统性金融洞察。

2、专业级可视化能力缺失:
金融研报依赖图表传递高密度信息,但现有模型通常仅生成静态图片或简单折线图,无法支持多维对比、事件标注等专业可视化需求。图文间缺乏严格数据一致性约束,图文无关或信息矛盾屡见不鲜。

3、迭代式研究能力缺失:
多数系统沿用固定“先检索后生成”流程,研究路径一旦确定无法调整。人类分析师则依据中间发现不断修正重点。这种基于中间结果的动态策略调整能力,正是当前通用AI系统普遍欠缺的。

FinSight核心思路:模拟金融分析师工作流程

为突破上述限制,FinSight并未简单堆叠模型,而是从认知流程切入,模拟人类金融专家的工作方式,提出三项关键技术革新。

核心架构:代码驱动的可变内存智能体(CA VM)

FinSight底层采用全新Code-Driven Variable-Memory(CA VM)多智能体架构。现有Agent架构受限于对话式记忆范式,以消息或任务进度等历史作为状态载体。当任务复杂度与流程长度增加时,这种方式暴露出表达能力与可控性的结构性瓶颈。

CA VM将范式重构为代码驱动的变量记忆空间:系统不再以自然语言对话为协作媒介,而是将数据、工具与中间推理结果统一映射为可读写的程序变量,多个Code Agent通过共享变量空间协同推理。将“记忆”从消息序列提升为可操作变量结构后,CA VM支持复杂任务的显式建模、持续修正与模块化组合,为长时程、多流程专家级推理提供结构支撑。

该设计将数据、工具与智能体统一抽象为可编程变量空间:财务报表、行情数据、新闻文本作为数据变量;搜索、分析、绘图等能力作为工具变量;不同功能的Agent通过Python代码调度与协作。这种“以代码为中枢”的架构,使系统高效处理大规模异构金融数据,并支持复杂多流程任务协作。

视觉突破:迭代式视觉增强机制(Iterative Vision-Enhanced Mechanism)

针对金融图表生成中专业性与可信度不足的问题,研究者提出Iterative Vision-Enhanced Mechanism,将绘图过程建模为可迭代优化的视觉生成任务。

该机制采用Actor-Critic协作范式:文本大模型作为Actor,负责生成可编译、可执行的绘图代码,发挥其在代码生成与逻辑控制上的优势;视觉语言模型作为Critic,直接对图像进行视觉审视,从数据完整性与美观性等维度提供反馈。

关键优势在于互补:语言模型擅长编码与逻辑推演,却缺乏真实视觉反馈;视觉模型具备强大感知与判别能力,但复杂代码生成受限。通过解耦并形成闭环,系统在测试时通过多轮“生成—评估—修正”实现持续优化,绘图质量随迭代次数自然提升。

最终系统能稳定生成包含双轴对齐、事件标注及复杂结构的专业金融图表,将原本一次性生成的静态结果转化为测试时扩展(test-time scaling)过程。

两阶段写作框架:先分析后成文

在写作层面,FinSight不试图一次生成完整长篇研报,而是将其重构为“分析—整合”两阶段过程。

首先,系统生成一组“分析链”(Chain-of-Analysis,CoA):每条分析链对应一个明确子任务(如公司历程、财务分析、竞品分析、风险因素等),在局部范围内完成证据收集、关键判断与核心结论提炼。必要性在于一份研报由多个子问题耦合构成,若直接端到端生成长文,难以兼顾所有分析的准确性与深度。

随后,系统以CoA为“骨架”,将分散洞察在全局层面组织编排,生成大纲并分章节写作。在保证章节结构与论证链条连贯的同时对齐文本叙述、数据引用与图表呈现,最终合成为逻辑自洽的长篇报告。这种“先分析后写作”策略有效避免长文逻辑松散,使报告超过2万字仍保持结构清晰、论证深入。

为保障长篇研报的事实准确性与图文一致性,作者在写作阶段引入生成式检索(Generative Retrieval)机制。不同于传统“先检索后生成”的后处理方式,该方法将检索过程嵌入写作:模型在生成具体段落时,根据当前分析链与上下文动态生成数据与图片的索引标识符,再通过后处理统一嵌入,从而最大化保证引用准确性与图文一致性。

通过该机制,FinSight在长篇写作中持续对齐文本叙述、数据来源与可视化结果,避免事实错配与图文脱节,报告篇幅扩展时仍保持整体逻辑与证据链的稳定一致。

实测结果:全面超越主流Deep Research系统

研究团队在覆盖公司研究与行业研究的高质量基准测试中,对FinSight进行了系统评估。

结果显示,FinSight在事实准确性、分析深度与呈现质量三项核心指标上显著优于Gemini-2.5-Pro Deep Research与OpenAI Deep Research,综合评分8.09。可视化维度得益于迭代式视觉增强机制,FinSight获得9.00评分,大幅领先对比系统,验证了专业金融图表生成能力的有效提升。

迭代式绘图的效果分析同样令人瞩目:

在长文本生成场景中,系统输出研报平均长度超20000字,包含50余张图表与结构化数据引用。随篇幅增长,报告质量保持稳定,未出现明显退化。

此外,在AFAC 2025金融智能创新大赛中,FinSight从1289支企业及高校参赛队伍中脱颖而出,夺得挑战组赛题四冠军,进一步验证了其在真实场景中的实用性与鲁棒性。

FinSight不仅是一个金融工具,更展示了Agent架构在高复杂度垂直领域的潜力。通过统一数据、工具与智能体,并引入视觉与写作的多阶段闭环,AI系统首次在金融投研这一专家密集型场景中展现出接近人类分析师的工作能力。

该范式的意义不止于金融。它表明,在高度依赖专业知识、长时程推理与多模态表达的专家密集型场景中,AI系统不再是单纯的信息汇总器,而开始承担起类似人类专家的工作方式——分解问题、验证假设、修正结论,并最终形成可审阅、可追溯的完整成果。

从这个角度看,FinSight更像是一个起点。随着Agent架构持续成熟,未来的科研分析、法律研判、医疗决策等复杂领域,或将逐步迎来以专家级AI Agent为核心的新一代生产力形态。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策