金融机构大模型AI+应用排行榜
过去一年,大模型加速向AGI迈进,迭代速度创下历史之最。正如阿里巴巴CEO吴泳铭在2024云栖大会所言,AI的真正想象力不在手机屏幕内,而在重塑整个物理世界。当前,大模型在各行业的应用路径分化明显:一边是模型智能持续跃升,多模态交互与生成能力日趋成熟,并逐步渗透至自动驾驶、人形机器人等实体场景;另一边则是高度要求专业性与严谨性的行业,更关注模型的准确与可靠,核心诉求转向如何将基座大模型与行业数据、领域知识深度融合。
先梳理几个关键判断:金融行业正迈入AI Native的全新阶段。回顾“十四五”时期,金融数字化建设成果显著,但数字化投入巨大与业务转型深度、广度不足的问题并存。2023年中央金融工作会议明确提出“五篇大文章”新要求。AI大模型的兴起与高速演进,恰好为数字技术赋能金融带来全新机遇——让“想象力”真正落地为“生产力”。
基座大模型的发展路径已逐渐清晰,多模态与强化学习持续强化推理能力,AI Native概念获得行业广泛认同。AI Native的本质,是将人工智能深度嵌入业务流程与系统,使其成为业务核心组件。在金融领域,这意味着将AI技术与金融业务深度融合,实现智能投决策、风险管理、精准营销、客户服务、研发运维等场景的全面智能化。
AI Native的发展还驱动计算架构、系统架构、应用与数据范式发生根本性变革。大模型的Scaling law法则中,算力、数据、算法构成三大核心要素。随着金融企业对大模型能力的探索日益深入,更强的算力、更大规模或更高质量的数据、更优的算法,成为金融机构构建金融级AI Native架构的三大关键考量。
AI Native Infra:拓展云基础设施的边界
当前,多数金融机构已完成或正推进云平台建设,部分已参照公共云架构搭建起多地多中心多活架构与云原生体系。然而,随着大模型应用场景持续深化,无论是训练或微调阶段对并行计算、高速网络、高性能文件存储的渴求,还是推理阶段对弹性、时延、业务连续性的严苛要求,都对现有云基础设施能力构成新挑战。如何基于云基础设施实现异构算力一体化管理、公专弹性一体化调度,以及端到端监控与运维,成为必须攻克的问题。
异构算力的统一管理。算力架构分散、利用率不高,是当前国内AI技术应用的核心瓶颈。通过算力虚拟化与池化屏蔽底层异构差异,再依赖推理调度框架优化显存、算子、编译等环节,实现不同性能算力的统一加速,已是金融机构在AI算力基础设施上的必然选择。
算力的弹性供给与统一调度。当大模型应用从试点走向规模化生产,支撑推理应用的高并发场景并提供即时可用的弹性能力,成为刚性需求。在特定峰值时段,将负载弹性调度至行业云、金融云等公共基础设施,可有效平衡效果与成本。
端到端的监控与运维。将大模型训练类比为开发,推理则是典型的生产环节。如何在硬件层、模型层、应用层实现端到端监控与运维,确保大模型应用具备与传统交易类应用同等的可观测性与业务连续性,是规模化投产的关键前提。AI基础设施需提供全链路、高精度的监控数据用于性能分析与调度优化,并具备更快速、更自动化的故障发现与隔离能力。
AI Native Data:激活一切数据资产
多数金融机构已完成数据中台建设,围绕结构化数据构建了“采建管用”能力,部分支撑了经营决策、客户营销、风险管理等场景。但这些数据仅占企业整体数据的小部分,且因质量与工具问题,大量数据未被有效利用。推动企业更大范围数据与大模型深度融合,不仅能让大模型更好学习企业知识,还能充分激活数据价值。简言之,需构建从数据到信息、再到知识、最终到智能的完整链路(DIKW)。
多模态数据管理能力。金融机构拥有大量半结构化与非结构化数据,这些数据可显著提升大模型应用的专业性与严谨性。数据中台需升级多模态数据管理能力,涵盖采集、存储、向量化、知识图谱、查询等环节。训练阶段需满足大模型对数据规模与多样性的要求;推理阶段则需满足查询效率、响应时间及实时数据更新的需求。
数据工程的智能化。利用大模型能力构建智能化数据工程,如智能数据分析、数据探查、建模、全域数据集成,以及主动式数据资产治理。此举旨在提升数据资产加工处理效率、保障数据质量、降低数据分析与应用门槛,从而最大化数据资产价值。
Data+AI全链路打通。为高效实现从数据到信息、知识再到智能的转化,需将此前分散的DataOps与MLOps打通。如此一来,无论在数据开发平台还是AI开发平台,均可便捷完成数据加工、模型训练、发布与应用等全链路操作。
AI Native Application:打造先进智能服务
伴随金融机构云平台建设,各类金融应用已完成云原生相关改造与优化——从狭义的容器化、微服务、CI/CD、DevOps,到广义的单元化、服务网格、全链路可观测等。应用的云原生化实现了金融机构的数字化。接下来,智能化的下一站——如何将AI能力与金融业务紧密结合,实现智能化风险管理、精准营销与客户服务,成为构建与管理金融应用的新挑战。
灵活开放的基础模型选择。大模型能力决定金融应用的智能化水平。当前国内大模型生态涵盖开源与闭源,能力上分为语言、语音、图像、视频模型,尺寸上包含0.5B、7B等小参数模型,以及72B、100B等大参数模型,且模型迭代速度极快。因此,金融机构应构建灵活开放的模型市场,综合考量性能、成本、开发进度及发展潜力等因素,选择合适模型,并在必要时进行替换。
一站式模型应用工程服务。目前,单靠基础大模型能力尚难以处理复杂金融逻辑与长流程业务场景。为满足金融行业对专业性与严谨性的要求,需借助企业内部结构化与非结构化数据,对基础模型进行知识增强与结果验证。一站式大模型应用开发平台可大幅降低开发门槛、提升效率——训练阶段提供数据处理、微调、模型评测等能力;应用阶段提供RAG、Agent、Multi-Agent等工程化能力。
多智能体的构建与融入。在大模型时代,每个应用都值得被智能化重做一遍。智能体作为可自主执行任务的新应用形态,具备更强的自主能力、交互能力与学习能力,能在复杂环境中优化行为策略,实现预定目标。自主能力意味着智能体可减少预设程序,例如在智能投顾领域,能根据市场趋势与个人偏好主动提供建议;交互能力使其能与用户自然对话,提升体验,如在客服领域通过自然语言处理技术沟通,完成信息查询、预订等服务;学习能力则让智能体自我进化,如在智能营销中根据用户行为模式不断调整推荐策略。
过去十年,阿里云深度参与中国金融行业信息化与数字化进程。在智能化浪潮中,阿里云围绕算力、数据、算法为金融客户提供一揽子方案:算力层面,除提供专有云环境下普算智算一体化的异构资源管理与运维方案,还提供满足合规与安全要求的金融云及公共云资源弹性方案;数据层面,升级原有数据中台方案,实现Data+AI双向赋能;算法层面,为金融客户提供全模态、全尺寸、广开源的基础模型,以及一站式大模型应用开发平台“通义点金”。
未来,阿里云将持续加强与金融客户共研、与合作伙伴共建,推动金融行业大模型应用的技术创新,通过深度理解金融行业特性与需求,助力金融机构更高效、更智能地服务实体经济。
(此文刊发于《金融电子化》2024年11月上半月刊)
