找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2341

积分

0

好友

309

主题
发表于 2 小时前 | 查看: 2| 回复: 0

过去两年,生成式 AI 快速进入金融行业。大型金融机构开始尝试利用大模型阅读财报、整理研究报告、辅助投资决策,并希望借助 AI 提升研究效率。但在真实业务流程中,金融机构很快发现一个核心限制:

当任务变得复杂、数据规模变大时,AI 系统的“记忆能力”和可靠性仍然难以满足机构级需求。

一家成立仅四年的创业公司 Samaya AI 正在尝试解决这一问题。公司获得了 Nvidia 风投部门 NVentures 的支持,并构建了一套面向金融数据分析的 AI 基础设施,希望让 AI 可以在 大规模金融数据集上稳定运行复杂分析流程

这背后对应的是金融 AI 的一个关键挑战:当 AI 不再只是回答单个问题,而是需要在数百家公司、成千上万份文档中持续执行分析时,传统的大模型架构开始暴露出明显瓶颈。

Samaya AI 品牌 Logo

金融AI的规模化难题

随着 AI 在金融研究中的应用不断扩大,问题逐渐从“模型能力”转向“系统规模”。

在简单任务中,大模型可以通过提示词快速生成答案。但当分析流程涉及多步骤推理、长时间工作流以及大量文档检索时,模型出现错误的概率会迅速上升。每一次新的指令、上下文扩展以及多轮交互,都可能引入新的不确定性。模型可能误读文档内容,也可能给出缺乏证据支持的结论,而早期步骤中的错误还会在后续推理中不断放大。

因此,对于金融机构来说,选择哪一个模型已经不是唯一的重点。

更重要的问题是如何在受监管的环境中控制模型行为,并让整个分析流程保持可验证和可追溯。

这一问题在投资组合分析场景中尤为明显。例如,当研究团队需要扫描整个财报季的公司披露、对数百家公司执行同一研究框架,或在多年研究资料中寻找关键信息时,单一模型往往难以稳定完成任务。

Samaya AI 在上个月推出了一套新的系统架构——Agent Control Plane。这一系统可以理解为 AI 代理的调度与控制层,它负责管理代理如何调用工具、控制信息如何流入模型,并将复杂分析任务拆分为多个可验证的步骤,而不是依赖一次性提示完成全部推理。

这一架构的目标是让跨越长时间、涉及大量数据的金融分析流程达到机构级可靠性。

在发布该系统的同时,Samaya 也宣布获得新的投资,投资方包括 NVenturesDatabricks Ventures。此前公司已经完成 4350 万美元 A 轮融资,由 New Enterprise Associates(NEA) 领投,投资人还包括 Eric Schmidt、Yann LeCun、Two Sigma 联合创始人 David Siegel,以及 Goldman Sachs 前 CTO Marty Chavez

Samaya AI 的创始 AI 负责人 Ashwin Paranjape 表示,在金融分析场景中,AI 系统需要同时满足三个核心指标:准确性(accuracy)、全面性(comprehensiveness)以及可追溯性(attribution)。传统的 RAG(Retrieval-Augmented Generation)方法在小规模数据集上能够提供较高准确率,但当分析范围扩大到整个行业或财报季时,系统往往难以保证对所有证据的覆盖。

“RAG 在数据规模较小时可以保证准确性,但如果希望覆盖大量数据,就需要不同的技术路径。” —— Ashwin Paranjape

为什么大上下文窗口仍然会遗漏关键信息?

很多人认为,大模型只要拥有更大的上下文窗口,就能解决长文档分析问题。但研究表明情况并非如此。

2023 年,Ashwin Paranjape 参与发表了一篇论文 《Lost in the Middle》。这项研究发现,大模型在处理长文本时,对信息的关注并不均匀。模型往往更容易利用文档开头和结尾的内容,而位于中间部分的信息更容易被忽略。

即便上下文窗口扩大到 100,000 token 甚至更高,模型仍然可能遗漏关键证据。这意味着单纯扩大上下文规模,并不能解决金融研究中的信息覆盖问题。

为了提高文档检索效率,Samaya AI 构建了一套 多阶段检索管线(multi-stage retrieval pipeline)。在这一架构中,小型定制模型首先扫描大规模文档库,筛选出潜在相关段落;随后更大的模型对候选内容进行进一步评估和过滤;最终推理模型只需要处理已经高度压缩的信息集合。

通过这种分层筛选方式,模型可以在保持证据覆盖的同时减少需要处理的上下文规模。Samaya 表示,公司在成立后的第一年几乎全部投入到这一检索基础设施的建设中。

基于这套系统,Samaya 推出了一款金融研究问答平台,并已经进入大型金融机构的生产环境。目前该系统在全球最大的银行之一内部部署,超过 10,000 名专业人士正在使用。公司公开确认的客户包括 Morgan Stanley,应用场景覆盖 Research、Sales & Trading 以及 Investment Banking 等部门。

随着使用范围扩大,客户提出了新的需求:希望在整个投资组合范围内重复执行同一分析框架。这也让 AI 系统需要具备更复杂的任务管理能力。

AI发展的真正瓶颈是评估体系

当 AI 开始在投资组合层面运行分析时,系统需要规划多步骤任务、管理大量工具调用,并在长时间工作流中持续跟踪中间结果。某些分析流程甚至可能持续 10 分钟到 3 小时,期间需要调用 100 多种工具 完成数据检索、分析与整理。

负责协调这些流程的正是 Samaya 所构建的 Agent Control Plane。它类似于 AI 代理的操作系统,用于调度任务、管理工具以及跟踪分析进度。

在系统开发过程中,Samaya AI 发现最大的挑战并不是编写新的 AI 功能,而是 如何验证系统更新是否真正提升了性能

“AI 让写代码变得很容易,但真正的瓶颈是能否对这些改变保持信心。” —— Ashwin Paranjape

公司透露,大约 一半的工程资源都投入在评估系统的建设上。这些测试体系会模拟真实金融工作流,判断模型更新后是否提升了分析质量或影响结果稳定性。

在金融数据环境中,AI 代理需要协调数百次查询请求、跟踪中间结果,并在最终生成答案时确认所有结论都能够追溯到原始证据。Samaya 将这一过程比作软件开发中的 Unit Test(单元测试)。只有当每一个阶段的结果都通过验证,系统才会进入下一步。对于开发者社区来说,如何在复杂的人工智能系统中设计和实施有效的评估与软件测试策略,是一个值得深入探讨的领域。

Paranjape 用一句话形容这种挑战:

“有翅膀和螺旋桨,并不代表它真的能飞。”

另一个长期困扰 AI 代理的问题是“记忆”。目前很多 AI 系统在执行任务时几乎没有历史状态,它们更像是一位每天早晨刚走进办公室的新分析师,对昨天的工作没有任何记忆。

这种模式在一次性查询任务中问题不大,但在金融研究场景中,分析师往往会反复研究同一家公司、行业以及数据指标。如果 AI 无法积累历史知识,就难以形成持续的研究能力。

Samaya AI 希望构建一种更接近“学徒”的系统,让 AI 在长期使用过程中逐渐积累对用户、数据和研究对象的理解。

结语

随着金融行业开始大规模引入 AI,技术竞争正在从模型能力转向系统架构。投资组合级别的金融分析需要 AI 能够规划任务、管理工具并持续追踪中间结果,这对系统编排能力提出了更高要求。

仅仅扩大上下文窗口无法解决金融 AI 的规模问题。真正关键的是一套能够管理任务流程、控制信息输入并持续验证结果的基础设施。

Samaya AI 正在尝试构建这样一层平台。如果这一模式得到更广泛验证,未来金融 AI 的技术栈可能会逐渐形成新的结构:基础模型、检索系统、代理调度层以及评估体系 共同构成完整的智能分析平台。在这样的架构之上,AI 才有可能承担起机构级金融研究与智能 & 数据 & 云支撑的分析任务。




上一篇:2024年OpenClaw部署平台盘点:从本地桌面端到云端服务器一站式方案
下一篇:终身学习者如何用reminds AI卡片笔记构建知识复利系统
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-15 04:06 , Processed in 0.462266 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表