第一层:金融世界(What)
这不是简单的价格曲线模拟。系统内部维护了一个完整的金融生态:数字资产、债券类资产、加密资产、AMM 资金池、借贷池、期货、期权、永续合约、结构化产品、清算机制、治理投票、监管规则、风险指标和 MEV 博弈。每个资产都有链上状态,每笔交易都有账本记录,每次清算都有触发条件。
Emergent FinSwarm 是一个可运行的、AI 驱动的多智能体金融生态系统实验平台。它将一个完整的金融市场——包括资产发行、现货与衍生品交易、自动化做市、抵押借贷、清算、监管合规、治理投票、MEV 博弈以及风险管理——放入本地可控的实验环境中,由 57 个具有独立身份、资产、策略和记忆的 AI Agent 在其中自主运行、交互、竞争、合作与进化。
Emergent FinSwarm 是一个可运行的、AI 驱动的多智能体金融生态系统实验平台。它将一个完整的金融市场——包括资产发行、现货与衍生品交易、自动化做市、抵押借贷、清算、监管合规、治理投票、MEV 博弈以及风险管理——放入本地可控的实验环境中,由 57 个具有独立身份、资产、策略和记忆的 AI Agent 在其中自主运行、交互、竞争、合作与进化。
项目的核心科学问题只有一个:当大量 AI 同时参与一个复杂金融系统时,会发生什么?
这不仅仅是一个学术问题。随着大语言模型(LLM)、强化学习(RL)和自主 Agent 技术的高速发展,AI 正在从辅助工具变为金融市场的直接参与者。理解并预测这种转变对市场稳定性、风险传染、监管有效性和系统性风险的影响,已经成为全球金融监管机构、中央银行和顶级金融机构的紧迫课题。
Emergent FinSwarm 根据目前全球公开资料显示,唯一能够在一个端到端可运行环境中同时覆盖以下维度的实验平台:
2026 年的今天,全球金融市场正处于一个百年一遇的转折点。有三个独立但相互加速的趋势正在汇聚:
趋势一:AI 能力已经越过"可信赖决策"的门槛。 GPT、Claude、DeepSeek 等大模型在金融推理任务上的表现已经达到甚至超过人类专业分析师的水平。在标准化的金融资格考试(CFA Level I/II)中,最新模型的通过率已经超过 90%。在量化交易策略的生成和评估中,LLM 已经展现出独立发现市场模式的能力。关键的是,这不再是"AI 辅助人类决策"的渐进式改进,而是"AI 可以独立做出高质量金融决策"的阶跃式变化。这意味着我们必须开始认真对待一个全新的问题:当一个金融市场中有大量 AI 同时在独立决策时,系统的集体行为会是什么样子?
趋势二:链上金融从边缘走向主流。 2025-2026 年,全球最大的资产管理公司(贝莱德、富达)、投资银行(高盛、摩根大通)和支付网络(Visa、Mastercard)都在大规模推进链上金融基础设施。数字资产市场规模持续扩大。香港金管局的数码港元(e-HKD)试点、虚拟资产交易平台发牌制度的完善,标志着香港正在系统性地将链上金融纳入主流监管框架。这意味着一件事:未来的金融市场将在链上运行,而 AI 将是这些市场的主要参与者。我们需要一个能同时模拟链上基础设施和 AI 决策行为的实验环境。
趋势三:全球监管机构迫切需要科学工具来理解 AI 金融风险。 IOSCO(国际证监会组织)、FSB(金融稳定理事会)、BIS(国际清算银行)在 2025-2026 年密集发布了关于 AI 在金融中使用的指导文件和风险警告。但所有监管机构都面临同一个尴尬的问题:他们知道需要监管 AI,但缺乏评估 AI 系统性影响的科学工具。传统的压力测试框架设计用于评估人类驱动的市场,无法捕捉 AI Agent 之间的高速博弈、策略传染和涌现行为。
可以将 Emergent FinSwarm 理解为一个三明治结构的三层系统:
第一层:金融世界(What)
这不是简单的价格曲线模拟。系统内部维护了一个完整的金融生态:数字资产、债券类资产、加密资产、AMM 资金池、借贷池、期货、期权、永续合约、结构化产品、清算机制、治理投票、监管规则、风险指标和 MEV 博弈。每个资产都有链上状态,每笔交易都有账本记录,每次清算都有触发条件。
第二层:AI 角色(Who)
系统中有 57 个 AI Agent,覆盖 54 种不同的金融角色。它们不是脚本,不是固定规则的机器人。每个 Agent 拥有独立身份、资产组合、策略参数、历史记忆和自我改进能力。它们会观察市场、做出决策、执行动作、记录结果,并在长期运行中不断进化。
第三层:研究与进化(Why)
系统持续记录交易、决策、价格、风险、异常事件和 Agent 表现,利用这些数据检测涌现行为(羊群效应、泡沫、闪崩、流动性螺旋、策略趋同、信息级联),并通过进化引擎将检测结果反馈给 Agent 种群,驱动策略的持续改进。
| 维度 | 传统金融模拟 | 主流 Agent 仿真(如 ABIDES) | Emergent FinSwarm |
|---|---|---|---|
| 资产复杂度 | 单一或少数资产 | 多种资产 | 现货+衍生品+借贷+AMM+RWA |
| Agent 数量 | 几个到几十个 | 数十到数百 | 57(可扩展至数百) |
| Agent 智能 | 固定规则 | 规则+简单RL | LLM+RL+Hybrid+ReAct |
| 账本/合约 | 内存变量 | 无或简化 | DAML合约+Canton/LocalLedger |
| 风险系统 | 无或简单 | 基础 | VaR/CVaR/CoVaR+压力测试+传染 |
| 监管/治理 | 无 | 无 | 动态规则簿+合规检查+治理投票 |
| MEV 博弈 | 无 | 无 | Mempool+三明治+尾随+搜索者 |
| 自我进化 | 无 | 无 | 种群进化+物种形成+共演化+课程 |
| 涌现检测 | 无 | 无 | 7类实时检测+进化信号反馈 |
| 数据体系 | CSV导出 | 有限 | TimescaleDB+Redis+Parquet+Grafana |
在深入技术细节之前,有必要阐述指导整个系统设计的核心哲学。Emergent FinSwarm 的设计遵循四个基本原则:
原则一:真实性优于简洁性。 传统的金融模拟为了数学上的可处理性,通常会做出大量简化假设——完全理性、完全信息、无交易成本、无监管约束。这些简化使模型在数学上优美,但在现实世界中几乎毫无预测力。Emergent FinSwarm 反其道而行之:我们刻意保留真实金融系统中的"脏乱差"——信息不对称、交易摩擦、监管约束、MEV 博弈、行为偏差——因为我们相信,只有在足够真实的生态中,AI 的行为才具有外推到现实世界的价值。
原则二:涌现优于设计。 我们不预设市场应该如何运行。我们定义个体 Agent 的行为规则和能力边界,然后让系统自由演化。系统层面出现的行为——无论是健康的竞争均衡还是危险的泡沫崩溃——都不是我们刻意设计的结果,而是多 Agent 交互的自然产物。这种"自底向上"的方法论是复杂系统科学的核心范式。
原则三:可复现性是不可妥协的科学底线。 每一个实验都可以通过固定随机种子完全复现。每一次 Agent 决策、每一笔交易、每一次风险事件都被完整记录和可审计。这确保了基于 Emergent FinSwarm 的研究成果经得起同行评审的检验。
原则四:开放架构,渐进演化。 系统的每一个组件——从 LLM Provider 到账本后端,从 Agent 策略到监管规则——都被设计为可插拔、可替换的接口。这确保了系统能够随着 AI 和区块链技术的快速演进持续升级,而不会被任何一个技术选型锁定。
系统底层采用双模式账本架构,兼顾开发效率与生产级能力。这是 Emergent FinSwarm 区别于绝大多数 AI 金融模拟项目的根本技术特征——我们不是在内存数组里改数字,而是在真实的区块链账本上执行原子化交易。
LocalLedger(默认模式):一个本地持久化的区块链账本实现,包含区块哈希链、Merkle root 验证、交易签名、自动出块、磁盘恢复和余额/合约状态重放。这使得开发者无需启动完整 Canton 节点即可进行快速实验。
Canton Network(生产模式):基于 Digital Asset 的 Canton Network,配置 6 个独立 Participant 节点(基础设施、市场、交易、借贷、衍生品、监管),通过全局同步器(Global Synchronizer)实现跨参与方的原子性结算。Canton 的核心价值在于其"按需披露"(Selective Disclosure)隐私机制——每个参与方只能看到自己有权访问的交易信息,同时整个交易流程仍能被正确执行和审计。
DAML 智能合约:22 个 DAML 源文件,67 个合约模板(template),覆盖 8 大模块:
| 模块 | 合约覆盖 |
|---|---|
| Token | 数字资产发行、RWA 代币化 |
| Exchange | AMM 自动做市、订单簿、结算、交易撮合 |
| Lending | 抵押品管理、借贷池、清算触发与执行 |
| Derivatives | 期货合约、期权合约、中央对手方清算 |
| Identity | 去中心化身份(DID)、KYC 验证 |
| Compliance | 反洗钱(AML)、审计追踪、监管执法 |
| Governance | 提案创建与投票、参数治理 |
| Oracle | 价格预言机喂价与聚合 |
Canton Network 并非普通的区块链。它由 Digital Asset 公司(前摩根大通高管 Blythe Masters 创立)设计,是目前全球唯一被多家全球系统重要性银行(G-SIBs)在真实业务中采用的机构级分布式账本。Goldman Sachs、BNY Mellon、Deutsche Börse、ASX(澳大利亚证券交易所)和香港交易所(HKEX)都在 Canton 上运行或测试过核心金融应用。
Canton 的独特架构解决了传统区块链在金融场景中的三个根本矛盾:
矛盾一:透明性与隐私性。 传统公链(如以太坊)要求所有交易数据对所有节点可见——这对金融机构来说完全不可接受(交易策略、客户数据和头寸信息是核心商业机密)。传统联盟链(如 Fabric)虽然支持通道隐私,但通道间的资产转移非常复杂。Canton 的"按需披露"机制实现了细粒度的隐私:每一方只能看到与自身权利义务相关的交易信息,全局同步器只处理交易元数据和排序,永不见交易内容。这使得在统一网络上实现跨机构原子结算成为可能,同时完全保护商业隐私。
矛盾二:全局共识与性能。 传统区块链要求全局共识,导致吞吐量受限于最慢的节点。Canton 的架构中,每笔交易只涉及直接相关方的子网共识——大部分交易可以在不涉及全局同步器的情况下完成。这使 Canton 的理论吞吐量可以达到每秒数十万笔交易量级,满足机构交易对延迟和吞吐量的严格要求。
矛盾三:资产锁定与跨应用互操作。 在传统区块链上,资产通常被锁定在单个智能合约中,跨合约操作需要复杂的"批准-转移-调用"流程。在 DAML/Canton 上,资产的"权利"和"义务"在合约层面被精确建模。一个资产可以同时参与多个合约——例如,一笔抵押品可以同时作为借贷协议的抵押物和衍生品交易保证金——而无需将资产物理转移。这种"权利建模"范式是 Canton 最被低估但最有价值的特性。
为什么这对 Emergent FinSwarm 至关重要? 因为我们的核心科学问题——"当大量 AI 在金融系统中交互时会发生什么"——只有在真实的制度环境中才有意义。如果 AI 在一个没有隐私约束、没有合规要求、没有真实合约约束的简化环境中运行,其行为模式将与真实世界完全不同。Canton 提供的机构级隐私和 DAML 提供的精确权利义务建模,使 Emergent FinSwarm 中的 AI Agent 行为更接近未来真实金融系统中的 AI 行为。
这是 Emergent FinSwarm 作为"AI 原生"金融平台的核心差异化能力。传统金融模拟的参与者是固定规则的脚本;Emergent FinSwarm 的参与者是能够感知、推理、学习和进化的 AI 实体。
每个 Agent 在每个 tick(时间刻度)经历完整的 OODA 循环:
Observe(观察)→ Decide(决策)→ Execute(执行)→ Record(记录)→ Improve(进化)
| 生态层级 | Agent 数量 | 代表性角色 |
|---|---|---|
| 资金来源层 | 5 | 散户投资者、机构投资者、风险资本、财政管理者 |
| 基础设施层 | 10 | RWA 发行方、预言机、DID 验证者、支付处理 |
| 市场结构层 | 11 | 一级交易商(×3)、AMM 池、流动性提供者、收益聚合器、跨链桥 |
| 交易策略层 | 16 | 现货/衍生品交易员、HFT、套利者、AI 交易员、对冲基金、巨鲸、跟单者 |
| 借贷生态层 | 8 | 借贷协议、抵押品管理、清算人、保险协议、评级机构、闪电贷攻击者 |
| 衍生品层 | 6 | 期货交易所、CCP、期权做市商、永续合约交易员、结构化产品 |
| 监管与治理层 | 6 | 监管节点、合规官、风险委员会、治理参与者、治理攻击者、投票经纪人 |
| MEV 层 | 4 | 三明治攻击者、尾随套利者、搜索者、区块构建者 |
| 架构 | 描述 | 状态 |
|---|---|---|
| LLM(当前默认) | 基于大语言模型,支持 ReAct 推理循环(思考→工具调用→观察→决策) | 57/57 Agent 默认启用 |
| RL | 基于 PPO/SAC 强化学习,支持 Stable-Baselines3 | 代码就绪,可切换 |
| Rule-Based | 基于规则的确定性策略 | 代码就绪,作为 fallback |
| Hybrid | LLM + RL + Rule 混合策略 | 代码就绪,可切换 |
这是当前系统最前沿的能力之一。LLM Agent 不仅是被动的"输入→输出"模式。系统实现了完整的 ReAct(Reasoning + Acting) 循环——这个概念源自 Google DeepMind 和 Stanford 的前沿研究,代表了 LLM Agent 领域的最高水平:
这个机制使 AI Agent 的决策不再是"盲猜",而是基于充分信息的多步推理。ReAct 循环代表了当前 LLM Agent 架构的最前沿水平——它由 Google DeepMind 在 2022 年提出,已被 Anthropic、OpenAI 和 Meta 等顶级 AI 实验室广泛采用。Emergent FinSwarm 是全球少数将 ReAct 架构应用于金融多 Agent 博弈环境的系统。
9 种内置工具的深度说明:
| 工具名称 | 功能 | 金融意义 |
|---|---|---|
query_pool_depth |
查询 AMM 资金池的实时深度和当前价格 | 模拟交易员查看市场深度,判断大额交易的价格影响 |
simulate_swap_impact |
在不实际执行的情况下模拟交易的价格滑点 | 模拟机构的交易成本分析(TCA),决定是否拆分大单 |
get_lending_rates |
查询当前借贷市场的利率和资金利用率 | 模拟套利者比较借贷成本与交易收益,发现跨市场机会 |
get_my_positions |
查询自身所有仓位和资产明细 | 模拟机构的持仓管理,计算风险敞口 |
get_price_feeds |
查询所有资产的跨预言机价格 | 模拟套利者检测价格偏离,发现跨池套利机会 |
calculate_position_var |
计算当前仓位的 95%/99% VaR | 模拟机构风控部门的日常风险度量 |
get_system_stats |
查询系统聚合统计(TVL、总利用率等) | 模拟宏观分析师判断市场整体健康状况 |
get_active_rules |
查询当前活跃的监管规则列表 | 模拟合规部门检查交易是否在监管框架内 |
check_action_compliance |
预检具体动作是否违反监管规则 | 模拟交易前的合规审批流程 |
价格模型是任何金融模拟的心脏。如果价格行为不真实,所有基于其上的 Agent 决策和风险分析都是空中楼阁。系统采用 RSJD(Regime-Switching Jump-Diffusion)+ GARCH(1,1) 价格模型,替代传统的几何布朗运动(GBM)。该模型支持:
转变矩阵示例(牛市 → 震荡 3%,牛市 → 危机 0.5%;危机 → 牛市 1%,危机持续性 80%)使价格行为更接近真实金融市场。
如果说价格模型是系统的心脏,风险引擎就是系统的免疫系统。它不是装饰性的附加模块,而是深度嵌入 Agent 决策和系统监控的核心组件。我们的风险系统设计借鉴了巴塞尔协议 III 和国际证监会组织(IOSCO)的最新监管框架:
| 风险能力 | 实现 |
|---|---|
| VaR(风险价值) | 95% 和 99% 置信水平 |
| CVaR(条件风险价值) | 尾部期望损失 |
| CoVaR(条件在险价值) | 某 Agent 对系统的边际风险贡献 |
| 多因子压力测试 | 价格冲击 + 流动性冲击 + 利率冲击同时施加 |
| 级联传染模拟 | 爆仓→强制卖出→价格下跌→更多爆仓的链式传播 |
| 实时风险敞口监控 | 每个 Agent 的杠杆率、集中度、保证金覆盖率 |
这是 Emergent FinSwarm 最具前瞻性的模块之一。在真实世界中,金融市场从来不是在真空中运行的——监管规则、合规要求、治理机制共同构成了市场运行的制度基础设施。Emergent FinSwarm 将这些制度要素内化到实验环境中,使得研究者不仅可以研究 AI 在自由市场中的行为,还可以研究 AI 在受监管市场中的策略性适应。动态监管规则簿(RuleBook)支持规则的完整生命周期管理:
本章是 Emergent FinSwarm 区别于其他所有已知同类项目的最核心部分。
系统的进化引擎实现了真正的进化计算,而非简单的参数微调:
策略基因组(StrategyGenome):每个 Agent 的策略被编码为一个可进化的基因组,包含策略参数、prompt 模板、few-shot 示例、决策规则和 7 个可进化超参数(风险容忍度、探索率、置信度阈值、仓位规模因子、动量权重、均值回归权重、机制敏感度)。
遗传算子:
物种形成(Speciation):防止策略趋同。行为相似的基因组被归入同一物种,物种内部竞争适应度。物种若连续 15 代无进步则灭绝,确保计算资源不被无效策略消耗。
进化引擎的灵感来源包括 DeepMind 的 Population-Based Training(PBT)、OpenAI 的 Evolution Strategies(ES)以及 Anthropic 的 Constitutional AI 自我改进思路。但与其灵感来源不同,Emergent FinSwarm 的进化引擎是在一个真实的多 Agent 博弈环境中运行的——这意味着适应度函数不是人工设计的静态指标,而是由其他 56 个也在同时进化的 Agent 动态定义的。这种"共同适应度景观"(Co-adaptive Fitness Landscape)使得进化过程更加接近真实生态系统中的自然选择,而非人工育种。
金融市场不是孤立优化的——做市商的进化会影响交易员,交易员的进化又反过来影响做市商。这就是生物学中的"红皇后效应"(Red Queen Effect),源自动物行为学家 Leigh Van Valen 的经典理论:在生态系统中,物种必须不断进化仅仅是为了维持其现有的适应度,因为其竞争对手和天敌也在不断进化。金融市场中的红皇后效应同样真实——当一个做市商优化了其定价算法后,套利者的利润空间被压缩,迫使套利者升级策略;套利者的升级又反过来侵蚀做市商的利润。
系统维护了 54 种角色间的生态关系矩阵,编码了互利(+1)、竞争(-1)、偏利(+0.5)和无关(0)四种关系。例如:
共演化协调器在每个进化周期执行以下操作:
Agent 不是一启动就面对最复杂的市场。系统实现了 6 级渐进式课程:
| 等级 | 名称 | 环境特征 | 毕业标准 |
|---|---|---|---|
| 1 | 基础操作 | 平稳市场,低波动 | Sharpe > 0.3 |
| 2 | 趋势跟踪 | 温和单边趋势 | Sharpe > 0.5 |
| 3 | 区间交易 | 周期性震荡 | Sharpe > 0.8 |
| 4 | 高波动应对 | 高波动,低流动性 | Sharpe > 1.0 |
| 5 | 极端事件 | 黑天鹅频发 | Sharpe > 0.5(容忍降低) |
| 6 | 完全对抗 | 面对其他进化后 Agent | 持续正收益 |
Agent 在当前等级达标后自动升级,表现持续恶化时自动降级重新巩固。这确保了进化过程是稳健的、可累积的。
涌现(Emergence)是复杂系统科学中最重要的概念之一——系统层面出现个体层面不存在的行为。Emergent FinSwarm 内置了 7 类涌现行为的实时检测:
| 涌现类型 | 检测方法 | 进化信号 |
|---|---|---|
| 羊群效应 | Agent 行为方向一致性超过阈值 | 奖励逆向策略 |
| 泡沫形成 | 价格偏离基本面 + 正反馈循环 | 奖励回避泡沫策略 |
| 闪崩 | 极短时间内价格崩溃和恢复 | 奖励风控策略 |
| 流动性螺旋 | 去杠杆→价格下跌→更多去杠杆循环 | 奖励保守仓位策略 |
| 策略趋同 | 策略多样性指数下降 | 全局加大变异率 |
| 信息级联 | 忽略私有信息跟随公共信号 | 奖励独立判断策略 |
| 治理俘获 | 少数 Agent 获取不成比例的治理权 | 触发治理规则修正 |
每种涌现类型检测到后,不仅记录事件,更生成进化引擎的调节信号,形成"检测→反馈→进化→再检测"的闭环。
为何涌现检测如此重要?因为金融史上最重大的危机——从 2008 年全球金融危机到 2010 年闪电崩盘(Flash Crash),从 2020 年 3 月的国债市场流动性蒸发到 2022 年英国养老金危机——其本质都是涌现事件。在每一次危机中,个体机构的行为在微观层面是"理性的"(去杠杆、对冲风险、满足保证金要求),但在宏观层面汇聚成了灾难性的系统崩溃。传统的金融风险模型——无论是 VaR、压力测试还是网络模型——都无法有效捕捉这种涌现动态,因为它们本质上是静态的或基于线性假设的。Emergent FinSwarm 的涌现检测器是第一个将复杂系统科学的理论洞见转化为可运行的、实时工作的工程系统,能够在系统崩溃发生之前检测到早期预警信号。
系统内置 Prompt 优化器,基于 Agent 的历史表现自动迭代其 LLM prompt:
这个机制的深远意义在于:它使得 Agent 不仅是"用 LLM 做决策",而是"学会如何更好地用 LLM 做决策"。在传统方法中,prompt 是由人类工程师手工设计的。在 Emergent FinSwarm 中,prompt 本身成为进化对象。一个意外但合理的推论是:系统可能会进化出人类工程师从未想到过的 prompt 策略——这既是机遇(发现新的有效沟通方式),也是需要警惕的风险(进化出不可解释或不可控的 prompt 模式)。
系统支持 Agent 间的自我对弈(Self-Play)机制:
进化过程中积累的知识不会丢失。系统实现了三种知识保留机制:
Emergent FinSwarm 还与一个独立的 AI 自主研究系统(autoresearch)进行了深度整合。这个系统的工作方式极其简洁但强大:一个 AI Agent 反复修改自己的训练代码,每次修改后运行 5 分钟训练,看效果好坏——好了就保留,坏了就回退。如此往复,一晚上可以完成上百轮自主迭代。
与 FinSwarm 的整合分三个深度层级:
第一层(浅层整合,已实现):将 autoresearch 的"试-评-留-弃"循环应用于 LLM Agent 的 Prompt 自动优化。系统自动生成 prompt 变体,在模拟环境中评估效果,保留优质变体、淘汰低效变体。
第二层(中层整合,设计中):利用 autoresearch 的代码改写能力,自动搜索 RL Agent 的最优神经网络架构。当前 RL Agent 使用固定的 CNN+GRU+Attention 架构,但最优架构可能因市场状态而异。autoresearch 可以自动尝试不同的架构组合(Transformer+MLP、纯 Attention 等)并基于实盘表现选择最优方案。
第三层(深层整合,远期规划):在 Emergent FinSwarm 自身产生的链上交易数据上进行持续预训练,打造一个"金融原生"的专用小语言模型。这个模型将不再依赖通用 DeepSeek API,而是深度理解 FinSwarm 生态特有的合约、资产、清算规则和 Agent 行为模式。autoresearch 负责自动优化预训练的超参数、数据配比和微调策略。
这是 Emergent FinSwarm 最重要的战略定位,也是我们团队的核心能力壁垒所在。本节将详细阐述:为什么 Emergent FinSwarm 是打造下一代进化金融大模型的唯一可行路径。
当前所有主流大语言模型——无论是 GPT、Claude、DeepSeek 还是 Qwen——在金融决策任务上都面临一个相同的根本性问题:它们是在互联网文本上训练的通用模型,而非在金融市场微观行为数据上训练的专用模型。
具体表现为三个层次的能力缺失:
第一层:知识缺失。 通用模型知道"AMM 是什么",但它不知道在 tick 8000 时 oETH/oUSD 池的 k 值因为一次闪电贷攻击暴跌了 40% 后,做市商应该如何调整报价策略。通用模型知道"风险对冲"的概念,但它不理解在特定的 DAML 合约约束下(例如抵押品同时被借贷协议和衍生品保证金复用),风险传染的精确路径是什么。这种"概念知识"与"情境知识"之间的鸿沟,是通用模型永远无法通过扩大语料库来跨越的——因为这类情境数据根本不存在于公开互联网上。
第二层:行为缺失。 通用模型从未真正参与过金融市场。它从未感受到"我的仓位正在被清算"的压力,从未经历过"一笔大单砸下去价格滑了 3%"的挫败,从未在"遵守监管规则"和"追求最大利润"之间做过艰难的权衡。金融决策不仅仅是知识的运用,更是经验、直觉和风险偏好的综合体现。没有在真实(模拟)市场中的百万次交互,AI 就不可能形成真正的金融判断力。
第三层:进化缺失。 通用模型是静态的——训练完成后,它的能力就固定了。但金融市场是动态的——今天的有效策略明天可能就失效了,今天的监管规则明天可能就被修改了,今天的市场结构明天可能就被新的协议颠覆了。一个能够在金融市场中长期保持竞争力的 AI,必须具备持续进化的能力——而这正是通用模型最缺乏的。
Emergent FinSwarm 为上述三个问题提供了系统性的解决方案。它不是简单地在现有模型上"调调 prompt",而是构建了一套完整的数据飞轮机制,使系统能够持续产生高质量的结构化训练数据,为微调和训练金融专用大模型提供独一无二的原料。
第一层飞轮:行为数据生成
系统每运行一个 tick,57 个 Agent 就会产生 57 条完整的决策记录。每条记录包含:
运行 10,000 tick 后,系统将积累 57 × 10,000 = 570,000 条完整的、有标注的金融决策数据。这不是简单的价格序列或交易记录,而是包含"观察→推理→决策→结果"完整闭环的高质量数据。
类比来说:OpenAI 训练 GPT-4 时使用了互联网上的文本——这些文本告诉你"人们写了什么"。而 Emergent FinSwarm 产生的数据告诉你"AI 在金融市场上做了什么,为什么要这样做,结果是什么"。这是两种完全不同层级的数据。前者是静态知识的记录,后者是动态决策行为的记录。对于训练一个能在金融市场中做决策的 AI 来说,后者的价值是前者的千百倍。
第二层飞轮:进化反馈数据
系统的进化引擎在每个进化周期中评估所有 Agent 的策略表现,筛选出优胜策略,淘汰劣质策略。这个过程产生了第二种独特的数据:策略的优劣排序数据——哪些决策模式是好的,哪些是坏的,在什么市场条件下好,在什么条件下坏。
具体来说,进化引擎记录的每个 StrategyGenome 都包含:
这类数据对于训练大模型的"价值判断"能力至关重要。通用模型通过 RLHF(基于人类反馈的强化学习)来学习"什么是好的回答"。但人类的反馈只能告诉模型"这个回答看起来好不好"——人类无法告诉模型"这个交易决策在牛市中是否最优"。Emergent FinSwarm 的进化反馈数据则提供了客观的、量化的、情境化的优劣判断。这是训练真正懂金融的 AI 的核心原料。
第三层飞轮:涌现事件数据
系统的涌现检测器记录了泡沫形成、闪崩、流动性螺旋、羊群效应等极端但关键的市场事件。这些事件在真实市场中极为罕见(可能几年才发生一次),因此真实市场数据中相关样本极少。但在 Emergent FinSwarm 中,我们可以通过调节市场参数和 Agent 配置来主动"制造"这些事件,从而积累大量高质量的极端事件训练样本。
这具有巨大的训练价值。当前的 AI 模型在"正常情况"下表现尚可,但在"异常情况"下往往表现糟糕——因为它们没有见过足够多的异常样本。Emergent FinSwarm 的涌现数据飞轮使训练 AI 应对黑天鹅事件成为可能。
全球公开资料范围内,没有任何其他平台或数据源能提供同等级别的训练数据:
| 数据源 | 金融决策数据 | 多Agent博弈 | 进化反馈 | 涌现事件 | 结构化标注 |
|---|---|---|---|---|---|
| 真实交易所数据 | ✅ 价格/量 | ❌ 只有结果不见过程 | ❌ | 极稀少 | ❌ 需人工标注 |
| 学术模拟 | ❌ 简化规则 | 有限 | ❌ | ❌ | 有限 |
| 回测平台 | ❌ 单策略 | ❌ | ❌ | ❌ | ❌ |
| 互联网文本 | ❌ 非决策数据 | ❌ | ❌ | ❌ | ❌ |
| Emergent FinSwarm | ✅ 完整OODA | ✅ 57 Agent | ✅ 多种群 | ✅ 7类可制造 | ✅ 全自动 |
这个表的含义非常清晰:对于训练下一代金融 AI 来说,Emergent FinSwarm 产生的训练数据是全球独一无二的战略资源。
Emergent FinSwarm 数据飞轮的最终目标不是"积累更多数据",而是训练出我们自己的进化金融大模型。具体路径如下:
第一步:监督微调(SFT,Supervised Fine-Tuning)
利用系统积累的高质量决策数据,对开源基座模型(如 DeepSeek、Qwen、Llama)进行指令微调。训练数据格式为:
[系统提示] 你是一个{角色},当前市场状态为{market_state}...
[用户输入] 当前tick={t},价格={p},持仓={positions},请做出决策
[模型输出] 推理过程:{reasoning},决策:{actions},置信度:{confidence}
数十万条这样的高质量"情境-推理-决策"三元组,可以让模型学会在特定金融情境下做出专业级的推理和决策。这不同于简单的"教模型金融知识"——而是让模型通过模仿专家行为来学习金融判断力。
第二步:偏好对齐(DPO/RLHF)
利用进化引擎产生的策略优劣排序数据,对模型进行偏好对齐训练。训练目标是让模型学会区分"好决策"和"坏决策",并在不同市场条件下自适应地调整风险偏好和策略风格。
这一步至关重要:它使模型不只是"会做交易",而是"会做好交易"。就像人类交易员需要多年的盈亏经验才能形成可靠的判断力一样,AI 模型需要通过大量带标注的决策反馈才能形成稳健的决策能力。
第三步:持续预训练(Continual Pre-training)
在积累了足够多的领域数据后,可以对模型进行金融领域的持续预训练。这意味着不只是微调模型的输出层,而是让模型在金融领域的语料上重新学习语言表示。
Emergent FinSwarm 产生的独特语料包括:DAML 合约代码及注释、Agent 角色描述和策略定义、监管规则的形式化表达、市场事件的叙事描述(Narrator 模块自动生成)。这些语料让模型从根本上理解金融领域的语义空间。
第四步:强化学习自博弈(RL Self-Play)
这是进化金融大模型的最终形态。在此阶段,模型不再依赖人类标注或静态数据,而是通过与环境(Emergent FinSwarm)的持续交互和自我对弈来提升能力。每次决策的结果自动成为新的训练信号,模型在不断"实践-反馈-改进"的循环中持续进化。
这类似于 AlphaGo 的训练方式——但目标不是赢得棋盘游戏,而是在复杂的金融市场中持续获得超额收益、同时控制风险、保持合规。这就是"进化金融大模型"的本质:一个能够像生物物种一样,在金融生态系统中自主适应、持续进化的 AI。
以上讨论的路径一(模拟数据训练)是 Emergent FinSwarm 当前已在进行的工作。但我们的战略眼光不止于此。我们正在同步启动第二条更具颠覆性的训练数据路径:接入真实世界的区块链数据进行大模型训练。
这绝非锦上添花。模拟数据提供的是"可控的实验环境",而真实区块链数据提供的是"不可伪造的市场真相"。两者结合,将产生全球独一无二的训练数据资产。
模拟数据无论多么精细,始终面临一个根本性的"真实性上限"——它是由模型生成的。模拟市场中的价格行为、Agent 决策、风险事件,虽然基于精心设计的数学模型(RSJD+GARCH),但本质上仍然是人类假设的产物。这在某些方面是优势(可控、可复现、可制造极端场景),但在训练一个需要在真实市场中工作的 AI 时,存在两个无法回避的缺陷:
缺陷一:统计指纹的差异。 真实金融市场的数据具有极其复杂的统计特性——多分形波动率、长记忆性、非线性依赖结构、体制转换的非马尔可夫性——这些特性是任何数学模型都无法完美复现的。用模拟数据训练的模型,可能会学到模拟世界特有的"统计假象",而在真实市场中表现不佳。只有用真实市场数据训练,模型才能真正学到真实市场的统计规律。
缺陷二:人类行为的不可模拟性。 Emergent FinSwarm 的 Agent 是 AI 驱动的,但当前全球真实金融市场的绝大多数参与者仍然是人——以及人编写的算法。人类交易者的行为包含恐惧、贪婪、从众、过度自信、锚定效应等非理性因素,这些因素的分布和交互方式极难被 AI 模型准确模拟。真实区块链上的每一笔交易都承载着真实人类的真实决策——有其独特的动机、约束和信息环境。这些"人性的指纹"是任何模拟都无法替代的训练信号。
缺陷三:制度与监管的复杂性。 真实市场的运行不仅取决于数学和经济学,还取决于具体的法律制度、监管实践、市场惯例和政治环境。这些"软性基础设施"在模拟中几乎不可能完整复现,但它们在真实市场数据中是隐式编码的——每一笔交易都在特定的制度约束下发生。
区块链提供了金融数据采集的范式革命。与传统金融数据(如交易所行情、SEC filings)相比,区块链数据具有几个无与伦比的优势:
优势一:全量而非抽样。 以太坊、Solana 等公链上的每一笔交易、每一次合约调用、每一次清算都是公开可查的。不存在"我们只看到了 10% 的交易"的问题——你看的是 100%。这为训练大模型提供了前所未有的数据完整性。
优势二:结构化而非非结构化。 区块链交易天然是结构化的——每条交易都有明确的发送方、接收方、金额、Gas 价格、合约调用参数、事件日志。相比于从新闻、财报、分析师报告中提取金融信息(需要复杂的 NLP 和信息抽取),区块链数据几乎可以直接作为训练样本使用。
优势三:可验证而非需信任。 区块链数据不需要信任任何中介——数据的真实性由密码学保证。你不需要相信某个交易所上报的交易量是真实的,你可以在链上直接验证。对于训练 AI 模型来说,这意味着训练数据的质量有数学保证,而非依赖数据提供商的信誉。
优势四:跨协议、跨市场、跨链的全景视图。 同一个地址可能在 Uniswap 上做交易、在 Aave 上借贷、在 GMX 上做杠杆——所有这些行为都记录在链上,可以关联到同一个实体。这种"全景视图"是传统金融数据完全无法提供的。对于训练一个真正理解 DeFi 生态的大模型来说,这种跨协议的关联数据是无价之宝。
我们规划的"真实区块链数据训练管线"涵盖以下主要数据源:
第一类:去中心化交易所(DEX)交易数据
| 数据源 | 链 | 数据内容 | 训练价值 |
|---|---|---|---|
| Uniswap V3/V4 | Ethereum | 每笔 Swap、LP 添加/移除、价格 tick 变化 | 全球最大 DEX,AMM 行为的真实样本 |
| PancakeSwap | BNB Chain | 同上 + 永续合约交易 | 零售交易者行为的集中体现 |
| Raydium / Orca | Solana | 高频交易、MEV、三明治攻击 | 极端速度下的市场微观结构 |
| Curve | Ethereum | 多资产交换、低滑点交易 | 大额交易的价格影响真实样本 |
| Hyperliquid | 自有链 | 永续合约、订单簿 | 链上订单簿交易的最真实样本 |
每笔 DEX 交易都是天然的"情境-决策-结果"三元组:
第二类:借贷协议数据
| 数据源 | 链 | 数据内容 | 训练价值 |
|---|---|---|---|
| Aave V3 | Ethereum + 多条 L2 | 存/借/还/清算全周期 | 真实清算事件——最珍贵的风险数据 |
| Compound V3 | Ethereum | 抵押率变化、利率模型 | 机构级借贷行为 |
| Morpho | Ethereum | 点对点借贷匹配 | 新型借贷范式的真实交互 |
借贷协议的清算事件具有极特殊的训练价值。一次清算事件记录了:抵押品价值下跌 → 健康因子跌破阈值 → 清算人介入 → 抵押品被拍卖 → 借款被偿还的完整链条。这种"风险传染"数据在传统金融中几乎不可能以结构化方式获取。
第三类:MEV 与交易排序数据
| 数据源 | 数据内容 | 训练价值 |
|---|---|---|
| EigenPhi / Flashbots | 三明治攻击、套利、清算竞争 | 真实 MEV 博弈的策略模式 |
| 区块构建者竞价 | Builder 出价、交易排序策略 | 区块空间市场的演化 |
| 跨链 MEV | 跨链套利、跨域清算 | 多市场联动的最真实体现 |
MEV 数据对于训练 AI 的"博弈意识"至关重要。在模拟环境中,我们可以设计 MEV Agent 来制造攻击。但在真实区块链上,我们能看到真实攻击者使用的真实策略、真实 Gas 竞价、真实利润——以及被攻击者的真实损失。这种"攻防博弈"的真实记录是训练金融安全 AI 的最高质量数据。
第四类:跨链桥与互操作协议数据
| 数据源 | 数据内容 | 训练价值 |
|---|---|---|
| LayerZero / Wormhole | 跨链消息、资产桥接 | 跨链风险传染路径 |
| 跨链流动性协议 | 跨链资产流动、套利行为 | 多链生态的关联性分析 |
第五类:衍生品与结构化产品数据
| 数据源 | 数据内容 | 训练价值 |
|---|---|---|
| GMX / Synthetix | 永续合约资金费率、清算 | 链上衍生品市场的价格发现 |
| Opyn / Lyra | 期权链上交易、行权 | 链上期权定价偏差 |
| Pendle / Spectra | 利率衍生品、收益代币化 | 固定收益市场的链上演化 |
将原始区块链数据转化为大模型训练数据需要一套完整的工程管线。我们的设计如下:
第一步:全量数据摄取
部署专用区块链索引节点(Archive Node),对目标链进行全量历史数据回放。使用 The Graph、SubQuery 或自研索引器提取每一笔 DeFi 相关交易。预计初期需要处理的数据规模:以太坊主网约 20 亿+ 笔交易(含内部交易),Solana 约 3000 亿+ 笔交易。
第二步:实体识别与行为聚类
利用链上身份识别技术(如 ENS 反向解析、跨协议地址聚类、CEX 充值地址标记),将独立地址聚合为"实体"。识别每个实体的行为模式:是做市商?套利者?散户?巨鲸?MEV 搜索者?这将产生与 Emergent FinSwarm 内部 54 种角色的自然映射——使真实数据可以直接对接我们的角色体系。
第三步:情境化标注
为每笔交易补充"情境上下文":交易前后的市场状态(价格、深度、波动率)、相关实体的近期行为、链上发生的并发事件。这使得孤立的交易记录升级为有上下文的"决策情境",与 Emergent FinSwarm 的 OODA 数据格式对齐。
第四步:质量评分与过滤
并非所有链上交易都是"好决策"。许多交易是套利机器人的自动执行、MEV 攻击、或者简单的人为失误。我们开发了一套基于事后结果的质量评分体系:
只有通过质量评分的交易才会进入训练集。
第五步:隐私保护与合规清洗
在将真实区块链数据用于模型训练之前,必须进行严格的隐私保护和合规清洗:
单一路径的训练数据各有优劣势。真正的突破来自于两者的融合:
| 维度 | 模拟数据(路径一) | 真实链上数据(路径二) | 融合后的超级训练集 |
|---|---|---|---|
| 数据量 | 可控(运行即产生) | 海量(历史+实时) | 无限 + 无限 |
| 标注质量 | 完美标注(全量 OODA) | 需工程化标注 | 高质量 + 海量 |
| 极端事件 | 可主动制造 | 稀少但真实 | 全频谱覆盖 |
| 统计真实性 | 受限于模型假设 | 完全真实 | 交叉验证 |
| 反事实推理 | 可做(修改参数重跑) | 不可做 | 假说检验能力 |
| 人类行为 | AI 行为为主 | 真实人类行为 | AI+人类全覆盖 |
| 隐私合规 | 天然合规 | 需清洗 | 双合规保障 |
融合策略的核心思想是"模拟数据教结构,真实数据教现实":
启动真实区块链数据路径后,我们的竞争壁垒将发生质的飞跃:
壁垒一:数据量的指数级优势。 仅以太坊主网每天就产生约 100 万笔交易,DeFi 相关交易约 10-20 万笔。按每月 30 天计算,仅真实链上数据每月就可积累约 300-600 万条交易记录。加上 Emergent FinSwarm 模拟环境同期产生的 500 万条 OODA 决策数据,我们的月均数据产量将达到千万级。这是任何单一数据源都无法比拟的。
壁垒二:数据质量的交叉验证。 模拟数据的问题在于"可能不真实",真实数据的问题在于"标注不完全"。两者结合后,可以用模拟数据来训练标注模型,然后用训练好的标注模型来自动标注真实数据——形成"模拟→标注→真实→验证→改进模拟"的增强闭环。
壁垒三:时间窗口的先发锁定。 区块链历史数据是公开的,但"已处理、已标注、已对齐的历史数据"不是。从头开始搭建完整的数据摄取、清洗、标注和融合管线需要 6-12 个月的工程投入。我们越早开始,后来者追赶的难度就越大。
壁垒四:合规经验的先发优势。 如何使用真实链上数据进行 AI 训练而不侵犯隐私、不违反数据保护法规——这是一个全球范围内的法律灰色地带。我们正在建立的方法论(脱敏、聚合、合规清洗)将成为行业的事实标准,构成后来者的合规壁垒。
真实区块链数据路径不是远期规划——我们已经在行动:
| 里程碑 | 状态 | 预计时间 |
|---|---|---|
| Ethereum Archive Node 部署 | 筹备中 | 2026 Q3 |
| Uniswap V3 全量历史数据摄取 | 筹备中 | 2026 Q3 |
| Aave V3 清算事件数据集 | 筹备中 | 2026 Q3 |
| 地址聚类与实体识别管线 | 设计中 | 2026 Q4 |
| 情境化自动标注引擎 V1 | 设计中 | 2026 Q4 |
| 模拟+真实数据融合训练管线 | 设计启动 | 2027 Q1 |
| 首个双轨训练模型(FinSwarm-FinLLM-Hybrid) | 计划中 | 2027 Q2 |
Emergent FinSwarm 赋予我们团队的核心竞争力,不是"会调用 API",而是以下四层递进能力:
第一层能力:数据壁垒(双轨制)。 随着系统持续运行,我们积累的金融行为数据将形成不可复制的先发优势。后来者可以复制我们的代码,但无法复制我们的数据——就像任何人都可以搭建一个搜索引擎的架构,但没有人能复制 Google 二十年的搜索日志。更重要的是,我们的数据壁垒是双轨的:模拟数据提供完美标注的决策行为,真实链上数据提供不可伪造的市场真相。两者的融合产生了任何单一来源都无法企及的训练数据质量。
第二层能力:模型壁垒。 基于双轨独有数据训练的金融专用模型,将在金融决策任务上展现通用模型无法企及的性能。这个模型是我们团队的"核武器"——可以用于自营交易、策略咨询、风险管理和监管科技等多个商业方向。
第三层能力:方法论壁垒。 比数据和模型更重要的是,我们掌握了一套完整的"如何训练进化金融 AI"的方法论。这套方法论涵盖了模拟数据生成、真实链上数据摄取与清洗、双轨数据融合、质量评估、训练策略、进化框架和部署运维的全流程。掌握了方法论,我们就可以在不同市场、不同资产类别、不同监管环境中快速复制成功。
第四层能力:双轨融合壁垒。 这是全球独一无二的能力——同时掌握"模拟金融世界的数据生成"和"真实区块链世界的数据摄取",并知道如何将两者融合为超级训练集。目前全球没有任何一个团队同时拥有这两项能力。AI 实验室(如 OpenAI、Anthropic)不懂区块链数据和金融微观结构;区块链数据公司(如 Dune、Nansen)不懂大模型训练;金融模拟团队(如 ABIDES)没有真实链上数据管线。我们占据的正是这三个圈的交集。
这正是我们向业界展示的最核心实力——我们不是在做一个"调用 ChatGPT 的金融聊天机器人"。我们是在构建一个能够自我数据生成、自我进化、最终产出金融专用大模型的完整技术体系。
这是 Emergent FinSwarm 所有技术创新背后的核心哲学问题,也是当前全球 AI 金融领域最深刻但最少被公开讨论的根本矛盾。任何试图将大语言模型应用于金融决策的团队,都必须直面这个问题。
大语言模型(LLM)和量化金融模型是两种本质不同的数学对象。不理解这个区别,就注定在 AI 金融的路上走偏。
语言模型做什么:给定一个 token 序列 $x_1, x_2, ..., x_n$,预测下一个 token $x_{n+1}$ 的条件概率分布 $P(x_{n+1} | x_1, ..., x_n)$。LLM 的"推理能力"本质上是对人类推理文本的统计模仿——它见过足够多的推理语料,学会了推理的文本形式。当它输出"Sharpe ratio 为 2.3"时,不是因为它在做数学计算,而是因为它在训练过程中见过大量类似格式的文本,推断出在这个上下文中"2.3"是一个合理的 token 序列。
量化金融模型做什么:给定精确的输入参数 $\theta$,通过确定的数学函数 $f(\theta)$ 输出唯一的精确结果。$f$ 可能很复杂(随机微分方程、蒙特卡洛模拟、凸优化),但它是一个数学上良定义的映射:同样的输入必然产生同样的输出,而且这个输出是可以独立验证的。
这两者之间的鸿沟不是"技术还不够好"的问题——是类别不同的问题。就像你不能期望一个钢琴家自动成为优秀的建筑师,你不能期望一个语言模型自动成为精确的金融计算引擎。即使 MoE(Mixture of Experts)架构让模型在特定领域更专业,它仍然是一个"更好的语言模型",而不是"变成数学计算模型"。
为什么这个矛盾在金融领域特别致命:
金融决策有一条不可逾越的底线——可审计的数学正确性。在以下场景中,"看起来合理"是不够的,必须"数学上正确":
在这些场景中,LLM 的"概率性推理"不仅是无用的——它是危险的。
面对上述矛盾,目前行业中有三种常见但都是错误的做法:
错误做法一:让 LLM 直接计算金融指标。 直接把市场价格、仓位数据喂给 LLM,让它"计算 VaR"或"评估风险"。LLM 会输出一个看起来非常专业的答案——里面可能有正确的公式、合理的推理、漂亮的表述——但数字很可能是错的。因为它没有真正执行数学运算,只是在模仿人类写分析报告的样子。更不能接受的是,同一个问题换一种问法,LLM 可能给出完全不同的结果——这在金融合规性上是不可接受的。
错误做法二:完全放弃 LLM,只用传统量化模型。 这条路确实保证了数学正确性,但放弃了 LLM 最大的优势——对复杂、模糊、多变的金融环境的深度理解能力。传统量化模型在"已知的已知"领域表现优异(如 Black-Scholes 定价),但在面对从未见过的市场结构、新型金融产品、监管规则变化时完全束手无策。它们没有"判断力"——只会按照人类预设的规则执行。
错误做法三:认为 MoE 或更大的模型能解决这个问题。 这是最危险的误解。MoE 架构让模型在特定领域更专业,但它不改变模型的本质——它仍然是一个语言模型,而不是数学引擎。一个 1000 亿参数的 MoE 模型和一个 10 亿参数的稠密模型,在"2+3"的计算精度上没有本质区别——它们都是在做 token 预测,不是在做算术。更大的模型能输出更流畅、更专业的推理文本,但不会自动获得数学确定性。
Emergent FinSwarm 的设计哲学从根本上解决了这个矛盾。我们的核心洞见是:不要让 LLM 做它不该做的事,也不要让数学模型做它做不了的事。把两者放在同一个系统中,各司其职,用结果来校准。
第一层:计算层(确定性数学引擎)
所有需要精确数学计算的任务,全部由确定性算法完成,LLM 绝不参与计算:
| 计算任务 | 执行引擎 | 数学保证 |
|---|---|---|
| 价格生成 | RSJD + GARCH(1,1) 随机过程 | 确定的随机种子 → 可复现的价格路径 |
| 风险度量(VaR/CVaR/CoVaR) | scipy 统计函数 + 历史模拟法 | 数学上精确,独立可验证 |
| AMM 定价与滑点 | 恒定乘积公式 $x \cdot y = k$ | 代数精确,无近似 |
| 清算触发 | 健康因子 = 抵押品价值 / 借款价值 | 阈值比较,布尔逻辑 |
| 保证金计算 | 各协议预设的保证金公式 | 确定函数计算 |
| 合规检查 | 规则簿的布尔逻辑 | 合法/不合法,二元判定 |
这一层的所有输出都具有以下特性:数学确定性、可复现性、可审计性、独立可验证性。
第二层:推理层(LLM 战略判断引擎)
LLM 在这一层只做一件事:基于第一层提供的精确计算结果,做出策略性判断。
LLM 可以调用的 9 个 ReAct 工具全部是对第一层计算结果的查询接口。LLM 的工作流程是:
观察市场状态
↓
调用工具获取精确计算结果(价格、VaR、深度、利率、合规状态)
↓
基于精确数据做出策略判断:
- "当前 VaR 超标 30%,需要减仓对冲"
- "池子深度不足,大单应拆分为 5 笔执行"
- "利率差为 2.3%,跨池套利有利可图"
↓
输出决策(动作类型 + 参数)
↓
决策执行 → 回到第一层进行精确计算(实际成交价、新仓位、新风险指标)
关键设计原则:LLM 输出的是"做什么"和"为什么"(策略判断),数学引擎输出的是"精确值是多少"(计算验证)。两者通过工具接口解耦,永不混合。
第三层:校准层(进化结果验证引擎)
这是 Emergent FinSwarm 最独特的创新。即使 LLM 只做策略判断、不做数学计算,它的判断仍然可能出错——可能在应该加仓时选择了观望,可能在高风险环境中过于激进。
第三层解决的就是这个问题:用实际盈亏来评判 LLM 的判断质量。
进化引擎在每个进化周期中:
这一层的核心贡献是:将 LLM 的无监督推理,接入了一个有监督的数学验证系统。 LLM 可以自由地做策略判断,但它的每一次判断都会产生一个客观的、数学上可验证的结果。这个结果成为 LLM 进化的唯一标准——不是人类标注员的偏好,不是文本的流畅度,而是冷酷的 P&L。
三层分离架构的真正威力不在于每一层单独的作用,而在于三层之间的协同效应:
协同效应一:安全分离。 LLM 永远不会接触原始数学计算,因此 LLM 的幻觉(Hallucination)永远不会直接导致计算错误。最坏情况下,LLM 做出一个错误的策略判断(如在熊市中加仓),但执行这一判断时使用的所有数值计算仍然精确——损失是策略判断层面的,而非计算错误层面的。策略错误可以事后分析、归因和改进;计算错误一旦发生就无法追踪。
协同效应二:可审计性。 每一个金融决策都可以被完整拆解为三部分:计算层输出(精确数值,可独立复现)、推理层输出(LLM 的策略判断和理由,完整保留)、校准层输出(该决策的实际结果和进化反馈)。这意味着任何一个决策——无论是盈利还是亏损——都可以被完全追溯和审计。这在监管合规上是革命性的能力。
协同效应三:持续改进。 三层之间形成了两个反馈循环:
短期循环让 LLM 在同一次运行中自我修正,长期循环让 LLM 在多次运行中持续进化。
三层分离架构的终极目标不是让 LLM 变得"更像数学",也不是让数学模型变得"更智能"。终极目标是创造一种全新的 AI 形态——融合型金融 AI(Fused Financial AI):
这类似于人类顶级交易员的思维模式——他们不会在脑子里解随机微分方程(那是量化分析师的工具),但他们知道在什么市场条件下应该用什么策略,什么时候应该激进,什么时候应该保守,什么时候应该求助量化模型做精确计算。他们的"判断力"来自多年盈亏经验的积累,而不是对数学公式的记忆。
Emergent FinSwarm 的三层架构,是将这种人类顶级交易员的"判断力 + 计算力"双重能力,首次工程化地实现在 AI 系统中。
三层架构的提出,不仅是 Emergent FinSwarm 的技术方案,更为整个行业提出了一个新的评判标准。
当前行业对"AI 金融"的评判大多停留在表面——模型多大、推理多流畅、回答多专业。但这些都不是金融 AI 真正需要的品质。我们提出的新标准是:
| 传统评判标准(错误) | Emergent FinSwarm 标准(正确) |
|---|---|
| LLM 回答是否专业流畅? | 决策的实际 P&L 是否为正? |
| LLM 是否展示了金融知识? | 决策在同样情境下是否可复现? |
| LLM 的推理是否有说服力? | 决策的全链路是否可审计? |
| 模型参数有多少? | 风控指标(Sharpe/回撤/VaR)是否达标? |
| 是否支持最新的 LLM? | 所有数值计算是否数学上精确? |
这种评判标准的转变是行业走向成熟的必经之路。Emergent FinSwarm 不仅是按照这个标准构建的系统,更是能够按照这个标准去训练和验证 AI 模型的平台。
| 层级 | 技术 | 说明 |
|---|---|---|
| AI/ML | Python 3.11+, PyTorch, Stable-Baselines3, OpenAI API | LLM 推理 + RL 训练 |
| AI/ML 训练 | Transformers, PEFT (LoRA/QLoRA), TRL (SFT/DPO), DeepSpeed, Accelerate, bitsandbytes | 大模型微调与训练全栈 |
| 区块链 | Canton Network, DAML 2.10.3 | 隐私保护账本 + 智能合约 |
| 数据 | TimescaleDB, Redis, Parquet, Polars, PyArrow | 时序存储 + 缓存 + 批处理 |
| API | FastAPI, Uvicorn, WebSocket | 实时数据推送 |
| UI | PySide6 (Qt), Jinja2, PyQtGraph | 桌面端 + Web 控制台 |
| 分析 | NumPy, SciPy, NetworkX, Pandas, Matplotlib, Plotly | 统计分析 + 网络分析 + 可视化 |
| 监控 | Grafana, Prometheus | 实时系统监控 |
| 容器化 | Docker Compose | 一键部署全栈服务 |
| 实验管理 | MLflow | 模型版本管理与实验对比 |
| LLM 微调 | Transformers, PEFT, LoRA, TRL, DeepSpeed | 金融专用模型定制 |
| 维度 | 当前规模 |
|---|---|
| Python 源码 | src/finswarm 下 186 个 .py 文件 |
| Agent 角色实现 | 54 个角色实现文件 |
| DAML 合约 | 22 个源文件,67 个 Template |
| OpenClaw 扩展包 | 29 个 Extension Package |
| 事件类型 | 42 种 EventType |
| 动作类型 | 18 种 ActionType |
| CLI 注册角色 | 54 种 |
| 数据库表 | 8 张 Hypertable + 连续聚合视图 |
系统支持 10,000 tick 的持续运行(tick 间隔 100ms),每 1,000 tick 触发自我提升,每 2,000 tick 触发完整进化循环。LLM 策略默认对接 DeepSeek API,同时支持任意 OpenAI 兼容接口(包括本地部署的 vLLM、Ollama 等)。
2025-2026 年,全球金融科技正在经历一场深刻的结构性转变。以下趋势共同构成了 Emergent FinSwarm 的战略背景:
趋势一:从"AI 辅助决策"到"AI 自主决策"
过去五年,AI 在金融领域的角色主要是辅助——提供分析、生成报告、识别模式。但 2025 年以来,以 GPT-4o、Claude 4、DeepSeek-V3、Qwen3 为代表的新一代大模型已经展现出接近于专业交易员的分析和推理能力。多家对冲基金和自营交易公司已开始实验性地让 AI 直接下达交易指令。从"AI 建议,人类决策"到"AI 决策,人类监督"的范式转变正在加速。
趋势二:多 Agent 系统的崛起
单 Agent 系统的天花板已经显现。真实金融市场不是单一个体的博弈,而是数百万参与者同时行动的复杂系统。理解多 Agent 环境下的均衡、博弈、传染和涌现,是下一代金融 AI 必须跨越的门槛。2025 年下半年以来,Multi-Agent RL、Agentic Workflow、Swarm Intelligence 已成为 AI 研究的最热门方向。
趋势三:监管科技(RegTech)的紧迫需求
全球监管机构——从 SEC、ESMA 到香港证监会(SFC)——正在加紧研究 AI 对金融市场稳定性的影响。2025 年,IOSCO(国际证监会组织)发布了关于 AI 在金融市场中使用的最终报告,明确要求金融机构对 AI 系统的行为进行"可解释、可审计、可复现"的测试。但目前全球范围内缺乏可满足这一要求的实验平台。
趋势四:RWA 代币化与链上金融的加速
贝莱德(BlackRock)、摩根大通(JPMorgan)、高盛(Goldman Sachs)等顶级机构正在大规模推进现实世界资产(RWA)的代币化。Canton Network 作为机构级隐私账本,已被多家全球系统重要性银行采用。链上金融不再是加密货币的边缘实验,而是全球金融基础设施的下一代标准。
趋势五:香港作为全球虚拟资产中心的战略定位
香港特区政府和香港金融管理局(HKMA)已将虚拟资产和金融科技作为核心战略方向。虚拟资产交易平台发牌制度持续完善,数码港元(e-HKD)试点进入第二阶段。香港的科创生态正在积极布局金融科技基础设施。
在上述五大趋势的交汇点上,Emergent FinSwarm 具有独特的战略定位:
| 趋势 | Emergent FinSwarm 的契合点 |
|---|---|
| AI 自主决策 | 57 个 LLM Agent 在 ReAct 循环下自主决策,是研究 AI 交易行为的最完整实验环境 |
| 多 Agent 系统 | 54 种角色的全生态博弈,覆盖做市、套利、借贷、清算、监管、MEV |
| RegTech 需求 | 动态监管规则 + 合规预检 + 完整审计追踪,可直接服务于监管沙盒 |
| RWA 代币化 | DAML 合约原生支持 RWA 发行、托管和交易 |
| 全球金融市场转型 | Canton Network 技术适配全球顶级金融机构的下一代市场基础设施 |
这是本文件最重要的章节。Emergent FinSwarm 的价值不仅在于它是一个技术上令人印象深刻的项目,更在于它有能力解决金融行业当前面临的最深层、最紧迫的问题。我们将从多个维度详细阐述 Emergent FinSwarm 如何推动整个金融行业的发展。
在展开具体分析之前,我们想先阐明一个核心论点:金融行业的下一个十年将由 AI 与市场微观结构的深度交互来定义。 理解这种交互——预测它、测量它、规制它——需要一种全新类型的工具。这种工具必须同时具备金融市场的复杂性、AI 的智能性和科学实验的可控性。Emergent FinSwarm 就是为了填补这个空白而构建的。
目前,金融学术界在研究市场微观结构、系统性风险和 Agent 行为时面临一个根本性困境——我们称之为"金融研究的测量困境":真实市场数据虽然丰富,但无法进行受控实验(你不能让 2008 年重来一遍来测试另一种监管政策的效果);而理论模型虽然可以进行推演,但往往过度简化,脱离实际。
Emergent FinSwarm 提供了第三条路径:一个足够复杂、足够真实、但又完全可控和可复现的实验环境。研究者可以:
这相当于为金融研究提供了一个"风洞实验室"——就像航空工程师在风洞中测试飞机设计一样,金融研究者可以在 Emergent FinSwarm 中测试市场设计、监管政策和交易策略。这个类比不仅仅是修辞。航空工业在有了风洞之后,从"试飞-坠毁-修改"的试错模式转变为"设计-模拟-优化-试飞"的系统工程模式。我们相信,Emergent FinSwarm 可以为金融行业带来同样的范式转变。
具体而言,以下研究方向将因 Emergent FinSwarm 的出现而获得全新的实验手段:
这些研究方向在 Emergent FinSwarm 出现之前,要么因为缺乏实验工具而无法开展,要么只能依赖高度简化的数学模型进行研究。Emergent FinSwarm 的独特价值在于,它为这些研究提供了统一的、可复现的、足够复杂的实验基础设施。
涌现行为——即系统层面出现个体层面不存在的集体行为——是金融危机的核心机制。2008 年全球金融危机的本质是一次大规模的涌现事件:个体机构的理性行为(去杠杆、抛售资产)在系统层面汇聚成了灾难性的正反馈循环。
Emergent FinSwarm 是目前全球少有的能够系统性地研究金融涌现行为的实验平台。其 7 类涌现检测器(羊群、泡沫、闪崩、流动性螺旋、策略趋同、信息级联、治理俘获)为研究者提供了标准化的涌现行为度量工具。
目前,AI 研究者通常不了解金融市场微观结构,金融研究者通常不了解最新的 AI 技术。Emergent FinSwarm 作为一个跨学科平台,可以成为两个领域的研究者对话和协作的共同语言。
传统监管沙盒让金融科技公司在受控环境中测试新产品。Emergent FinSwarm 提供了"沙盒中的沙盒"——在完全虚拟的环境中模拟数千种场景,包括极端压力情景。
监管机构可以利用 Emergent FinSwarm:
目前,各国监管机构在制定 AI 金融监管政策时面临一个核心难题:缺乏实证数据。我们称之为"监管滞后困境"——技术发展速度远超监管框架的更新速度,等监管机构搞清楚某个技术的风险时,市场已经进入了下一个阶段。Emergent FinSwarm 可以为以下问题提供基于实验的科学证据:
Emergent FinSwarm 的涌现检测器和进化系统可以为这些问题的回答提供前所未有的实验支持。具体来说:
这些研究结果不仅限于学术发表。它们可以直接转化为监管政策的科学依据、金融机构风控体系的升级方案、以及金融科技产品的安全设计标准。Emergent FinSwarm 使得"在沙盒中先验证,再到市场中实施"成为 AI 金融时代的标准操作流程。
历史回测(Backtesting)是当前金融行业评估交易策略的标准方法。但历史回测有一个众所周知的致命缺陷:它假设策略本身不影响市场。在真实市场中,你的每一笔交易都会影响价格,价格变化会影响其他参与者的行为,其他参与者的行为又会影响你的后续交易。这种反馈循环在历史回测中完全缺失。
Emergent FinSwarm 的多 Agent 博弈环境从根本上解决了这个问题。
当前,金融机构在部署新的算法交易策略时,通常只进行历史回测。但历史回测有一个根本性缺陷:它假设市场对其他参与者的反应是静态的。在现实中,你的策略会影响市场,市场的变化又会影响你的策略——这正是 Emergent FinSwarm 的多 Agent 博弈环境所模拟的。
金融机构可以利用 Emergent FinSwarm:
Emergent FinSwarm 的级联传染模拟能力对金融机构的风险管理具有直接价值:
在部署新的金融产品(如新型衍生品、结构化产品)之前,可以先在 Emergent FinSwarm 中模拟其对市场生态的影响:
目前,AI 金融 Agent 领域缺乏公认的评估基准。Emergent FinSwarm 可以成为行业的标准化测试平台:
搭建一个包含账本、合约、Agent、风险系统的完整金融实验环境需要极高的技术和资源投入。Emergent FinSwarm 作为一个开源平台,可以大幅降低学术界和创业公司进入这个领域的门槛。
Emergent FinSwarm 的统一数据格式和标准化接口使得不同机构的研究结果可以直接比较和复现,促进整个行业的知识积累和协作。
Emergent FinSwarm 的设计从一开始就是面向全球的。系统的技术架构——从 Canton Network 的机构级隐私账本到多语言 LLM 推理引擎——天然支持跨市场、跨司法管辖区的部署。以下从全球市场、监管科技、人才培养和数字资产创新四个维度阐述其战略价值。
全球顶级金融机构——从华尔街对冲基金到欧洲资产管理公司,从亚洲量化交易团队到中东主权基金——都面临同一个紧迫需求:如何在 AI 驱动的金融市场中安全地测试和验证新的交易策略。Emergent FinSwarm 提供的多 Agent 对抗性测试环境,可以让机构在部署真实资金之前,在数十个 AI 对手的博弈中充分验证策略的稳健性。
具体而言,Emergent FinSwarm 的全球市场适配能力体现在:
从经济角度看,全球 RegTech(监管科技)市场预计在 2030 年将达到 600 亿美元规模,AI 金融风控市场预计超过 200 亿美元。Emergent FinSwarm 所代表的基础设施层是这些上层应用的基础——就像操作系统对于应用软件的关系一样。掌握了基础平台,就掌握了生态的话语权。
全球主要监管机构——从美国的 SEC、CFTC 到欧洲的 ESMA、亚洲的 SFC 和 MAS——都在加速推进 AI 金融监管框架。Emergent FinSwarm 可以作为全球监管科技的通用实验平台,帮助不同司法管辖区的监管机构在安全环境中测试 AI 对市场稳定性的影响。
Emergent FinSwarm 的开源架构和标准化数据格式使其天然适合全球高校和研究机构的教学与科研用途。从 Stanford 的金融工程课程到欧洲的量化金融硕士项目,学生可以在统一的实验平台上设计和测试 AI 金融策略。
全球主要经济体正在系统性推进数字资产监管框架的建立。Emergent FinSwarm 的资产发行和交易模块可以直接支持数字资产相关的研究和政策模拟:
这些研究不仅具有学术价值,更可以直接服务于全球金融监管机构的政策制定过程。
虽然 Emergent FinSwarm 当前定位为研究和实验平台,但从更长远的视角来看,这类"金融风洞"技术将对全球经济治理产生深远影响:
影响一:从"危机应对"到"危机预防"。 2008 年全球金融危机后,各国投入巨资建立了宏观审慎监管框架,但这些框架本质上是"向后看"的——它们基于历史数据进行压力测试,无法预见到历史中从未出现过的风险模式。Emergent FinSwarm 类平台使得"向前看"的系统性风险分析成为可能:模拟未来可能出现的市场结构、AI 参与者和交易模式,提前识别新的脆弱性。这是金融监管方法论的一次根本性升级。
影响二:从"国家监管"到"算法监管"。 随着金融市场的运行速度越来越快(高频交易已达微秒级),人类监管者的反应速度已经远远跟不上。未来必然需要"算法监管者"——能够实时监控市场行为、自动检测异常模式、并在风险升级前自动采取干预措施的 AI 系统。Emergent FinSwarm 为开发、测试和训练这种算法监管者提供了理想的虚拟环境。
影响三:从"被动合规"到"嵌入式合规"。 DAML 智能合约的一个核心特性是"权利与义务的内嵌"——合规规则不是外部施加的约束,而是合约本身的固有属性。在 Emergent FinSwarm 中,我们已经实现了合规预检机制(Agent 执行动作前自动检查合规性)。这种"嵌入式合规"(Embedded Compliance)模式有望成为未来链上金融的标准范式,从根本上改变监管的执行方式——从"事后惩罚"变为"事前预防"。
影响四:从"国家竞争"到"标准竞争"。 在全球 AI 金融监管的竞争中,谁能率先建立被广泛接受的测试标准和实验方法论,谁就能在未来的国际规则制定中占据主导地位。Emergent FinSwarm 有潜力成为这一国际标准竞赛中的重要参与者。
某对冲基金开发了一套基于 LLM 的自主交易策略。在部署到真实市场之前,他们将策略接入 Emergent FinSwarm,在包含 56 个不同类型的 AI 对手的环境中运行 10,000 tick(模拟约 100 个交易日),观察:
某监管机构考虑将杠杆上限从 10 倍降低到 5 倍,以遏制过度投机。在实施前,他们利用 Emergent FinSwarm:
某金融科技公司计划推出一种新型结构化产品。在监管审批前,他们利用 Emergent FinSwarm:
某香港高校的金融科技硕士项目将 Emergent FinSwarm 纳入课程:
以下路线图围绕一个核心目标展开:从"调用通用 LLM API"进化到"拥有自主训练、持续进化的金融专用大模型"。这是我们团队最核心的战略方向。
本阶段的核心任务是打好地基——积累高质量训练数据,搭建训练基础设施。
| 目标 | 具体指标 | 当前状态 |
|---|---|---|
| Agent 规模扩展 | 从 57 个扩展到 200+ Agent,覆盖超 100 种金融角色 | 57 Agent / 54 角色 |
| 持续运行 | 7×24 小时无人值守运行,月产 500 万+ 条决策数据 | 手动启动,有限时长 |
| 场景多样性 | 覆盖 6 级课程的全部难度 + 20+ 种组合压力场景 | 基础运行 |
| 数据质量控制 | 自动评估每条决策数据的质量分(PnL/合规/多样性) | 原始记录 |
关键举措:
| 目标 | 具体指标 |
|---|---|
| 多 Provider 支持 | 原生集成 DeepSeek、Qwen、GPT-4o、Claude 四大主流 API |
| 本地推理 | 部署 vLLM 或 Ollama,支持本地运行开源模型(Qwen-72B、DeepSeek-67B) |
| 推理成本优化 | 对高频但简单的决策使用本地小模型,复杂推理使用云端大模型 |
| A/B 框架 | 同一角色同时使用不同 LLM 进行决策,自动对比和记录效果差异 |
关键价值:多 Provider 支持的 A/B 对比将产生一种极其珍贵的训练数据——"同一情境下,不同模型的决策差异及效果对比"。这类数据对后续的偏好对齐训练(DPO)至关重要。
| 目标 | 具体指标 |
|---|---|
| GPU 算力 | 获取或租用至少 4×A100(80GB)或 8×H20 级别 GPU 集群 |
| 训练框架 | 完成 DeepSpeed + TRL + PEFT 的训练管线搭建和验证 |
| 基座模型选型 | 对 DeepSeek-V2、Qwen2.5、Llama-3 在金融任务上进行系统评估 |
| 实验管理 | 部署 MLflow 或 W&B,全量追踪每次训练实验的超参、数据和结果 |
| 目标 | 具体指标 |
|---|---|
| 多 LLM A/B 测试 | 同一角色下不同 LLM 的决策效果对比,积累对比数据 |
| RL 策略启用 | 为 10+ 角色默认启用 RL 策略,与 LLM 策略形成互补 |
| 涌现场景库 | 系统性制造并记录 50+ 种涌现事件场景(泡沫、闪崩、螺旋等) |
| Gradio 演示界面 | 构建可视化 Demo,可向科学园展示 Agent 实时决策过程 |
本阶段同步启动真实区块链数据路径的基础设施建设。这是 Emergent FinSwarm 从"纯模拟引擎"升级为"模拟+真实双轨数据引擎"的关键一步。
| 目标 | 具体指标 | 优先级 |
|---|---|---|
| Ethereum Archive Node | 部署全量存档节点,完成历史数据同步 | P0 |
| Uniswap V3 全量数据 | 摄取自创世以来所有 Swap/Mint/Burn 事件 | P0 |
| Aave V3 清算事件集 | 提取全部清算事件及关联地址的借贷历史 | P0 |
| DEX 交易标注引擎 V1 | 自动化标注每笔 DEX 交易的情境(池子状态、MEV 检测) | P1 |
| 地址实体聚类 | 实现跨协议的地址关联和实体身份推断 | P1 |
| Solana 数据摄取 | 部署 Solana RPC 节点,摄取 Raydium/Orca 等 DEX 数据 | P1 |
| 合规清洗管线 | 建立数据脱敏、地址过滤、隐私保护的自动化流程 | P0 |
| 存储基础设施 | 搭建可扩展的链上数据仓库(预计初期 5-10 TB) | P0 |
预期产出:
关键工程挑战与应对:
本阶段是核心突破期——使用第一阶段积累的模拟数据和真实链上数据,完成首个双轨训练的金融专用大模型。
本阶段需要制备至少 50 万至 100 万条高质量训练样本。数据来源涵盖路径一(模拟)和路径二(真实链上)双轨:
| 数据类型 | 预计数量 | 来源 | 路径 |
|---|---|---|---|
| 单Agent决策数据 | 500,000+ | 200 Agent × 多种市场场景的 OODA 记录 | 路径一 |
| 真实DEX交易数据 | 2,000,000+ | Uniswap/Curve/PancakeSwap 等真实交易 | 路径二 ★ |
| 真实清算事件 | 15,000+ | Aave/Compound 真实清算全周期 | 路径二 ★ |
| 多Agent交互序列 | 50,000+ | Agent 间链式交互的完整上下文 | 路径一 |
| 涌现事件处理 | 20,000+ | 系统制造的极端事件场景下的决策 | 路径一 |
| MEV 真实攻击样本 | 10,000+ | EigenPhi/Flashbots 真实三明治/套利 | 路径二 ★ |
| 跨协议行为序列 | 30,000+ | 同一地址在多个 DeFi 协议间的关联行为 | 路径二 ★ |
| 监管合规决策 | 30,000+ | 受监管环境下的合规决策记录 | |
| 角色专业知识 | 10,000+ | 每种角色的领域知识和策略说明 |
数据质量要求:
| 目标 | 具体指标 |
|---|---|
| 基座模型 | 选择第一阶段评估确定的最优开源基座模型 |
| 训练方法 | LoRA/QLoRA 高效微调(降低 GPU 需求,加快迭代速度) |
| 训练规模 | 50万-100万条 SFT 样本,3-5 个 epoch |
| 评估基准 | 建立 FinSwarm-Bench:涵盖收益、风控、合规、涌现应对 4 维度 |
评估维度设计:
| 维度 | 指标 | 对比基线 |
|---|---|---|
| 收益能力 | Sharpe Ratio, 累计收益 | vs 通用 DeepSeek API |
| 风险控制 | 最大回撤, VaR 命中率 | vs 通用 GPT-4o |
| 合规性 | 违规率, 监管规则遵循度 | vs 原始规则型 Agent |
| 极端应对 | 危机模式下存活率 | vs 人类回测基准 |
| 推理效率 | 单次决策延迟, Token 消耗 | vs API 调用成本 |
SFT 模型完成初版训练后,将其部署回 Emergent FinSwarm 环境中运行。模型在实际运行中产生的新的决策数据将被回收至训练数据集,形成"训练→部署→收集数据→再训练"的持续改进闭环。预期 3-5 轮迭代后,模型在 FinSwarm-Bench 上的综合得分应显著超越通用大模型 API。
利用进化引擎积累的策略优劣排序数据,对 SFT 模型进行 DPO(Direct Preference Optimization)训练。
| 目标 | 具体指标 |
|---|---|
| 偏好数据 | 从进化引擎中提取 10 万+ 对"好决策 vs 坏决策"对比样本 |
| 训练方法 | DPO(无需训练 reward model,更稳定高效) |
| 对齐目标 | 模型学会偏好高 Sharpe + 低回撤 + 高合规的决策模式 |
| 能力验证 | 在 FinSwarm 环境中进行 A/B 测试:DPO 后 vs DPO 前 |
DPO 训练的特殊价值:SFT 教会模型"怎么做",DPO 教会模型"做什么更好"。在金融场景中,后者比前者更重要——因为金融市场中没有绝对正确的答案,只有相对更优的选择。DPO 使得模型具备了在不确定环境下做出"更好"决策的能力,而不是机械地模仿训练数据。
| 目标 | 具体指标 |
|---|---|
| 角色覆盖 | 单一模型支持 50+ 种角色的决策(通过角色 prompt 切换) |
| 跨角色迁移 | 验证模型在未见过的角色上能否做出合理决策 |
| 角色特性保持 | 确保模型在不同角色下的决策风格有明显差异(做市商 ≠ 套利者) |
引入真实金融市场的历史数据(港股、美股、加密货币),与 Emergent FinSwarm 的模拟数据进行混合训练。目标是在保持模型对链上金融生态深度理解的同时,增强其对真实市场价格模式的感知能力。
这是进化金融大模型的终极形态——模型不再依赖外部通用基座,而是拥有自己的金融领域预训练基础。
| 目标 | 具体指标 |
|---|---|
| 预训练语料 | Emergent FinSwarm 产生的全部数据 + DAML 合约代码 + 真实金融文本 |
| 预训练规模 | 10 亿+ Token 金融领域专有语料 |
| 训练方法 | Continual Pre-training on开源基座(如 DeepSeek-V2 base) |
| 产出 | FinSwarm-FinLLM-Base:金融领域基础模型 |
为什么需要持续预训练? SFT 和 DPO 只是调整模型的"输出风格"和"偏好方向"。要让模型从根本上理解金融领域的语义——例如 DAML 合约的"权利-义务"模型、AMM 的"恒定乘积"不变量、清算机制的"健康因子"概念——需要在预训练阶段就让模型浸入金融领域的语料。持续预训练改变的是模型的"世界观",而不仅仅是"表达方式"。
| 目标 | 具体指标 |
|---|---|
| 训练范式 | 模型 vs 模型自博弈(Self-Play),类似 AlphaGo 的训练方式 |
| 奖励信号 | 从 Emergent FinSwarm 环境中自动获取(PnL + 风险 + 合规) |
| 训练规模 | 百万级自博弈对局 |
| 产出 | FinSwarm-FinLLM-RL:具备自主进化能力的金融决策模型 |
自博弈的价值:在自博弈训练中,模型的对手是它自己(或它之前的版本)。这意味着训练难度的提升是自动的、渐进的、与模型能力同步增长的。模型永远不会"通关",因为对手也在变强。这创造了持续进化的永动机。
| 目标 | 具体指标 |
|---|---|
| 模型蒸馏 | 将大规模 FinLLM 的能力蒸馏到可本地部署的小模型(7B-13B) |
| 推理优化 | 使用 vLLM + TensorRT-LLM 实现低延迟推理(< 100ms/决策) |
| 边缘部署 | 支持在单张 RTX 4090 或 Mac Studio 上运行金融专用模型 |
将训练好的进化金融大模型以 API 形式提供给外部机构:
将 Emergent FinSwarm 的数据集和评估基准(FinSwarm-Bench)公开发布,建立学术和产业合作生态:
基于 FinSwarm 的监管沙盒能力,为香港及全球监管机构提供:
完成从 LocalLedger 到 Canton Network 真实节点模式的全面迁移,使 Emergent FinSwarm 成为 Canton 生态中的标准 AI 测试平台。与 HKEX(香港交易所)等 Canton 生态成员建立合作关系。
| 维度 | Emergent FinSwarm | ABIDES (Stanford) | Gauntlet | Chaos Labs |
|---|---|---|---|---|
| Agent 数量 | 57(可扩展至200+) | 可配置 | N/A | N/A |
| AI 决策引擎 | LLM+RL+Hybrid+Rule | 规则+简单RL | 规则 | 规则 |
| 链上账本 | ✅ Canton+DAML | ❌ | ❌ | ❌ |
| 隐私保护 | ✅ 按需披露 | ❌ | ❌ | ❌ |
| 监管系统 | ✅ 动态规则+合规检查 | ❌ | ❌ | ❌ |
| 进化系统 | ✅ 种群+共演化+课程 | ❌ | ❌ | ❌ |
| 涌现检测 | ✅ 7类 | ❌ | ❌ | ❌ |
| MEV 博弈 | ✅ 完整 | ❌ | ❌ | ❌ |
| LLM训练数据飞轮 | ✅ 双轨(模拟+真实链上) | ❌ | ❌ | ❌ |
| 真实链上数据摄取 | ✅ 筹备中(Ethereum/Solana/DEX/Lending) | ❌ | ❌ | ❌ |
| 开源 | ✅ | ✅ | ❌ | ❌ |
Emergent FinSwarm 的背后是一支扎根量化金融多年的技术团队。本节概述团队的核心积累、产业背景和学术支持网络。
团队核心成员 3 人,自 2017 年起深耕量化金融领域,横跨传统金融量化、加密货币做市、衍生品定价、高频交易系统和 AI 策略研发等多个方向。近十年的持续实战,使团队积累了从策略研究到系统投产的完整工程能力。
团队已自主设计并投产的大规模系统中,有多套已投入实战的 AI Agent 系统:
系统采用创新的**"LLM 计算 + 本地验证 + LLM 决策"三层流水线架构**:
计算层 —— DeepSeek 模型对 15 大类 100+ 个量化因子(涵盖动量、价值、波动率、高频微观结构、ML 衍生因子、行为金融因子、统计套利因子、跨资产因子等)进行智能赋权和复合计算。LLM 不只是在"选因子",而是在理解市场叙事的基础上动态调整因子权重和组合方式。
验证层 —— 本地确定性代码对 LLM 的计算结果进行数学验证。若 LLM 输出与本地公式计算结果偏差超过容差阈值(1%),系统自动触发重算机制(最多 2 次)。这一层的存在确保了"LLM 的创造性"不会导致"计算的错误性"——与我们 Emergent FinSwarm 三层架构中的"计算-推理分离"哲学一脉相承。
决策层 —— 验证通过后,DeepSeek 基于精确的因子计算结果、当前市场微观结构(订单流、资金流向、大单分布)和历史策略表现,生成最终交易信号。信号包含方向、仓位比例、止损位和置信度评级(高/中/低三档,低置信度自动拒绝交易)。
系统的另一核心创新是算法自挖掘引擎(Algorithm Miner):自动扫描 Agent 在历史分析中生成的策略代码,识别其中的 ML 模型(RandomForest、XGBoost、LightGBM、LSTM、Transformer、PPO、DQN 等 10+ 种),提取策略逻辑,归档至知识库,并追踪各算法在不同市场状态下的表现。这使系统具备了"从自己的历史决策中学习什么算法在什么条件下有效"的元认知能力。
订单流与资金流向实时分析 —— 接入实时交易数据流(REST 历史回放 + WebSocket 实时推送),计算买卖压力指标(BuyVolume / SellVolume / Imbalance / CumulativeDelta / VWAP),识别大单并量化大单贡献率。所有计算在本地确定性完成,LLM 负责对计算结果进行叙事层面的解读和模式识别。
AI 驱动的资金流向分析 —— 基于 DeepSeek 模型,结合订单流数据、链上数据和市场微观结构,生成结构化的资金流向分析报告。系统内置交互式 Dash 可视化面板,支持多时间框架、多交易对的实时监控。
机制标签与策略适用性判断 —— 系统会自动为检测到的市场模式贴上"机制标签"(趋势型 / 均值回复型 / 波动控制型),并基于标签判断当前市场状态对不同策略类型的适用性。这与 Emergent FinSwarm 课程学习引擎中的"环境分级"思想是同源的——都来自于团队对"策略不能在任何环境下硬打"的实战认知。
这是一套基于 CrewAI 多 Agent 协作架构的智能止损决策系统,核心理念是将止损从"被动触发规则"升级为"多维度、多轮次、预测性的 AI 决策"。系统已集成至团队的 BayesScalp MonteTrade 量化交易主系统。
多 Agent 协作架构 —— 5 个专业 Agent 按轮次协作:
| Agent 角色 | 职责 | 权重 |
|---|---|---|
| 数据分析 Agent | 市场特征提取、异常数据点识别 | 15% |
| 风险评估 Agent | ATR 波动率分析、风险敞口评估 | 25% |
| 趋势判断 Agent | 贝叶斯概率 + 动量分析、趋势/震荡判定 | 20% |
| 仓位评估 Agent | 杠杆率、资金管理角度评估止损紧迫性 | 20% |
| 决策整合 Agent | 综合前四轮分析结果,生成最终止损建议 | 20% |
每个 Agent 的输出作为下一个 Agent 的输入上下文,经过 3-5 轮深度分析后,通过加权共识机制生成最终决策。
预测性止损引擎 —— 系统内置前瞻性预测模块,不仅分析历史和当前状态,更对未来进行量化预测:
均值回归分析引擎 —— 在做出"立即止损"决策之前,系统先进行均值回归分析(Z-Score、布林带偏离度、历史回归概率与平均回归时间),判断当前价格是否处于"极端偏离但大概率回归"的状态。若回归概率高于阈值,系统建议"等待回归"而非"盲目止损"。这是将行为金融学中"处置效应"的陷阱转化为系统性风险收益分析的关键创新。
自学习闭环 —— 每次交易完成后,系统自动对比预测结果与实际走势,更新模型参数,持续提升预测准确率。
除上述三套 AI Agent 系统外,团队还拥有以下已投产的量化金融系统:
以上全部系统均已在实际生产环境中经过长期验证,但因涉及机密与策略逻辑,仅支持线下单独演示,不在互联网公开。正是这些系统的实战经验,为 Emergent FinSwarm 的设计提供了不可或缺的工程基础和领域洞察——我们不是在凭空设计一个"理想化"的金融实验平台,而是将多年实战中积累的对市场微观结构、策略博弈和系统性风险的深刻理解,系统化地注入了这个平台。
Emergent FinSwarm 的研发过程得到了多位资深业界人士和学术机构的支持与指导:
Douglas 先生 —— 香港联交所上市公司 eBroker 集团董事会主席,同时担任香港人工智能及创新协会副会长。Douglas 先生在全球顶尖金融科技和 AI 领域拥有深厚的产业经验和行业视野,为团队的金融产品设计、合规路径和商业化方向提供了关键指导。
Jimmy 先生 —— 香港大学客座讲师,在金融工程和量化方法领域具有丰富的研究与教学经验,为系统的模型设计和方法论框架提供了宝贵的学术视角。
此外,以下学术机构在不同阶段、不同程度上给予了团队重要的技术指导和理论支持:
团队走过的路径决定了 Emergent FinSwarm 的独特基因:
我们首先是交易者和系统建造者,然后才是研究者。 这与从学术论文出发做模拟系统的团队有本质区别。我们亲手建造过在实盘中运行的系统,深知真实市场中的摩擦、边界条件和"理论上可行但工程上行不通"的陷阱。这种"实战优先"的思维方式贯穿了 Emergent FinSwarm 的每一个设计决策——从为什么选择 Canton Network 的隐私架构,到为什么坚持 LLM 与数学引擎的严格分离,都根植于我们在真实市场中的血泪教训。
我们跨越了量化金融和 AI 两个领域。 传统量化团队不懂大模型,AI 团队不懂金融微观结构。团队的核心成员在两者之间架起了桥梁——我们既理解 SABR 模型、波动率曲面和 Greeks 的计算,也理解 Transformer 架构、RLHF 对齐和 LoRA 微调。这种跨领域的能力使得 Emergent FinSwarm 不会成为一个"量化团队勉强接入 LLM API"的拼凑品,而是一个从底层架构就为融合两类智能而设计的系统。
我们有真实的产业出口。 Emergent FinSwarm 不是空中楼阁,团队拥有将研究成果转化为实际产品和服务的清晰路径。无论是为金融机构提供 AI 策略验证服务、为监管机构提供系统性风险模拟工具,还是为自身的量化交易体系训练专用模型,商业落地路径都是清晰的、可执行的。
Emergent FinSwarm 不是一个概念验证或学术论文的附属产物。它是一个已经可以完整运行的、包含 186 个源文件、57 个 AI Agent、22 个 DAML 智能合约模块的复杂系统工程。更重要的是,它回答了一个全球金融行业当前最紧迫但尚未被充分回答的问题:当 AI 不再是金融市场的旁观者,而是直接参与者时,我们需要什么样的工具来理解、预测和规制这个新时代?
我们相信,正如风洞实验室对航空工业的贡献一样,Emergent FinSwarm 这样的"金融风洞"将成为 AI 时代的金融基础设施。它不仅服务于学术研究,更将直接支持监管决策、金融机构的风险管理和金融科技产品的安全创新。
全球金融市场正在经历从传统中心化基础设施向分布式、AI 原生基础设施的深刻转型。Emergent FinSwarm 服务于全球,致力于成为这个转型过程中不可或缺的技术基础设施。
Emergent FinSwarm —— 不只是模拟金融,而是为 AI 时代的金融构建一个可理解、可预测、可治理的未来。
联系与展示
如需现场演示、技术交流或合作探讨,欢迎联系项目团队。