在金枢玄鉴智能应用平台初期面临答非所问、回答不准确及胡编乱造等问题。为此,我们针对业务需求建立专门知识数据集,减少大模型混淆。同时,在Agent构造中,对关键节点采用工程化手段(如SQL、代码)处理,降低AI幻觉干扰。
金融监管知识和数据在时间有效性、连续性等逻辑关系梳理上存在难点,构建适合大语言模型使用的数据集颇具挑战。中软融鑫结合知识特点,综合使用Markdown、JSON、图表等格式组织数据,构建内在逻辑。
指令集是大语言模型在金融监管领域发挥作用的关键,但设计高效指令集需大量测试与验证。中软融鑫凭借近30年业务积累和对大语言模型的深刻理解,设计出适用于金融监管场景的提示词指令体系。
本层核心功能是获取知识与数据的原始资料,分为非结构化数据(如文档)和结构化/半结构化数据两类。系统支持自动与手动方式,灵活链接文件系统、SVN、GIT、对象存储、数据库及API接口,确保全面捕获数据。金枢玄鉴智能应用平台依托融鑫历史存储的丰富监管数据,包括银行业法律法规、监管发文要求、业务解读等非结构化数据,以及接口规范、指标定义等结构化数据,构成平台知识体系的基础。
基于高质量金融监管标注数据,通过系统性微调通用大模型,形成领域专用模型。核心环节为数据集的科学划分:训练集利用海量标注数据驱动模型学习监管规则与业务逻辑,完成参数优化;测试集验证模型对未知数据的解析能力与泛化性能。双数据集协同机制确保模型既能精准捕捉监管特征,又能在真实场景中稳定输出,最终为金融监管提供融合领域知识的高效智能决策支持,显著提升复杂任务执行效率与准确性。
金融监管智能化转型依托三大工程化技术:API标准化接口打通系统对接,MCP组件平台提升开发效率,JS/Python沙箱隔离执行环境防范风险。针对金融数据高敏、合规严苛及场景复杂特性,我们构建了融合大语言模型NLP能力的智能开发框架,将语义解析能力与传统工程化工具(API服务集成、MCP资源调度、代码沙箱安全机制)深度结合,形成兼顾智能决策与安全防控的解决方案,满足精准化监管需求。
我们已经通用大语言模型微调后得到的金融监管领域大语言模型为基石,搭建契合金融监管特点与需求的大语言模型智能体系。针对不同应用场景,精心构建并优化相关提示词,充分释放大语言模型的潜力,最大程度减少模型幻觉问题的出现。与此同时,我们借助API、MCP以及Python等技术手段,将大语言模型与传统信息系统处理能力相融合,从而提升智能体响应的及时性与结果的准确性。
平台支持与文件系统、SVN等常见文件存储方式的链接,同时可从数据库、EXCEL等环境中提取数据结构、基础数据,通过简单配置即可实现机构内外知识体系的高效整合。平台基于数据特征自动执行标注与结构化拆解,生成适配大语言模型训练的高质量数据集,同时支持对接金融机构内部多元数据系统,将智能分析能力渗透至全业务场景。
平台内置了大量金融监管知识及信息,涵盖监管政策类、报送相关接口规范(报文、指标等)及发文要求类以及各类模型及算法(风险分析、合规识别、数据分析)并完成结构化标注与关联。平台支持通过大语言模型与RAG、Agent技术快速构建智能体应用,同时提供标注数据动态更新服务,保障监管信息时效性。
平台依托于收集并标注的各类监管知识,为用户提供监管相关的知识服务,包括监管规范知识,涵盖业务规范、操作流程、管理要求等,便于实时查询业务合规要点与风险点;监管报送知识,涵盖1104、大集中、金数等相关报送的报送要求、接口规范、采集口径等。同时也建立了多个监管报送辅助智能体,包括异动分析、报送数据血缘分析及数据追溯等智能体。
基于EAST、金数、利率、1104、大集中等接口信息及表结构、口径说明、指标体系等基础数据,结合业务分析模型与算法案例,利用大模型开发平台设计分析流程(分析识别用户意图→构建分析SQL→链接数据库获取数据→构造显示逻辑(表格/图表/分析报告),构建了业务分析智能体,涵盖财务、经营、客户等分析场景。
平台整合EAST、金数、利率等接口信息、表结构、口径说明、指标体系等基础数据及风险分析模型与算法案例,利用大模型开发平台设计分析流程(分析识别用户意图→构建基础数据SQL→链接数据库获取数据→构建风险分析算法→结合数据计算风险分析结果→构造显示逻辑(表格/图表/分析报告),构建了风险分析智能体,涵盖信用、流动性、市场等风险分析场景。
平台整合EAST、金数、利率等接口信息,表结构、口径说明、指标体系等基础数据,结合监管法规、历史罚单与合规识别规则模型,利用大语言模型构建违规点发现逻辑,通过大模型开发平台设计分析流程,分析发现逻辑生成数据获取SQL→链接数据库获取数据→分析违规原因→反馈分析结果,用户确认后可将逻辑纳入合规模型进行日常监控。
平台整合EAST、金数、利率等接口信息,表结构、口径说明、指标体系等基础数据,结合数据标准、检核规则和监管数据质量要求,构建数据质量检核规则,链接数据库检查并反馈问题,生成分析报告。主要类型包括数据一致性检核、连续性检核,质量分析,血缘及追溯智能体等。
自公司成立以来,我们的业务分析团队便与监管机构及众多金融机构保持着长期且稳定的沟通机制。团队紧密跟踪监管业务及机构业务的变化,迅速分析并解读相关信息。凭借对监管要求与机构业务关系的深刻理解,我们能够快速更新知识链路,确保信息的时效性和准确性。
中软融鑫与金融监管机构有着悠久的信息化建设合作历史,对各类监管规范有着深入的理解与解读,并在此基础上构建了全面的监管知识体系。同时,与数千家金融机构合作,参与其信息化建设,掌握产品、流程、规范等核心业务知识,为针对金融监管行业的大语言模型微调创造了基础。最终形成了金融监管行业的微调模型。
基于对业务逻辑的深刻理解,我们综合运用图数据库、向量数据库以及JavaScropt、JAVA、Python等的工程化手段建立符合需要的MCP服务及各类执行工具补充大模型在具体操作执行方面的不足,同时增强针对垂直领域相对精准的业务要求。同时结合RAG技术、提示词工程充分发挥大模型能力。
平台支持文件、SVN、GIT、数据库、API等多种方式获取数据,自动识别文件类型并解析为逻辑数据集。平台管理应用场景及提示词,完善指令体系,支持API管理,支持程序运行安全沙盒,方便用户嵌入和调用AI流程及Agent各环节并编写处理程序用户可以在线完成知识库、AI助手、AI流程及Agent的配置和管理。
平台以监管知识、数据为基础构建了监管知识类、业务分析类、风险分析类、合规分析类及数据治理类六大类智能体应用。以此为基础,用户可以参考已有的知识、数据管理方法及智能体的构建逻辑,将智能体应用能力拓展到机构内部知识类及数据分析类相关的各类应用场景。