找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1508

积分

0

好友

198

主题
发表于 昨天 07:44 | 查看: 7| 回复: 0

企业人工智能的落地,正面临一个根本性的转变:核心挑战已从模型的获取,转向了数据的治理与统一。对于旨在自主行动的 Agentic AI 而言,其决策所依赖的“记忆”(Memory)——涵盖合同、日志、事件和指标——构成了这项技术从实验走向运营的关键基础设施。将记忆视为与网络、存储同等重要的基础架构来建设,是释放AI系统连贯性与规模化潜力的前提。

内存记忆作为基础设施

记忆为智能体提供了寻找事实、传递上下文、记录决策依据的稳定方式。从这个视角看,记忆成为了数据架构中不可或缺的一流属性。一个合格的记忆基础设施必须像构建共享、可靠的网络或存储系统一样严谨,具备治理能力。唯有建立在这样的基础之上,庞大的人工智能技术栈才能停止内部消耗,作为一个有机的整体协同运作。

那么,如何构建这样的基础设施?我们必须首先直面当前碎片化数据生态系统带来的问题,并理解为何 分布式SQL 为实现记忆驱动AI所需的一致性和规模提供了可行的路径。

碎片化数据生态系统

企业数据形态多样,从严格结构化的交易记录,到松散组织的文档,再到实时产生的事件流。每种数据类型都有其独特的价值和局限,但它们必须被整合成一个连贯的基底,智能体才能在其中持续、可靠地运作。

结构化数据

结构化数据(包括事实、交易和元数据)将Agentic AI锚定在可靠、可审计且精确的真相之上。尽管目前只占企业数据总量的约20%¹,它在训练机器学习模型、保障分类、回归和预测准确性方面却发挥着决定性作用。它明确的格式为智能体的推理提供了清晰的基石,其功能如同不可变的数字律法,对触发行动、确保合规和维持AI决策一致性至关重要²。

非结构化数据

非结构化数据(涵盖文档、对话、日志、图像等)承载了组织内绝大部分的隐性知识。如果说结构化数据提供的是“是什么”,那么非结构化数据则蕴含了“为什么”的细微差别——例如语气、意图和上下文。通过语义嵌入和检索系统有效地处理这些数据,对于智能体解决歧义、弥合信息缺口、根据微妙的现实情况调整决策至关重要。

时间连续性

时间连续性使Agentic AI能够随着时间推移进行回忆、适应和行动。这主要通过三种机制实现:

  • 情景记忆:使智能体能够存储和检索特定的过去事件,增强决策、规划和个性化能力,类似于人类记忆。
  • 状态跟踪:在对话轮次或操作步骤间保持连续性,确保即使会话中断或切换,智能体也能保留其目标和上下文。
  • 时间敏感性检索:能够过滤知识,优先呈现最新且相关的信息,最小化对过时信息的依赖。

然而,情景记忆也带来了新的风险,例如不可预测性、敏感知识留存和潜在操纵向量,这些都是研究人员正积极研究以指导安全部署的课题³。

结构化、非结构化和时间序列数据共同构成了Agentic AI的原材料。但它们之间的差异,也反映在存储它们的系统中:关系数据库存放结构化事实,内容仓库管理文档,向量存储处理嵌入,专用管道应对时间敏感事件。这些系统独立演化,各自为政,优化的是特定负载而非跨领域的“记忆”。当智能体需要在三者之间流畅推理时,结果往往不是无缝的智能,而是暴露出各种故障点的摩擦。

碎片化内存堆栈的常见故障模式

正是那些赋予Agentic AI系统强大能力(多模态知识流、迭代推理、自适应编排)的特性,也同时创造了新的脆弱性。记忆碎片化、推理因负载而变慢、运维受限于不成熟的工具链——这些不是单个组件的漏洞,而是当智能依赖于多个实时协同部件时产生的系统性张力。

Agentic AI中的延迟陷阱

多跳推理(计划、检索、行动、反思的循环)是Agentic AI的核心,但也带来了显著的延迟代价。每个循环增加的延迟可能超过传统流水线的速度。当记忆横跨向量存储、SQL数据库和缓存等多个系统时,问题会加剧,昂贵的系统间切换和不一致的结果随之而来。开发者常尝试用自适应循环、级联模型或激进缓存⁴等技术来缓解,但这只是在已经复杂的架构上叠加更多的“胶水”代码,使得系统长期来看愈发脆弱。

遗留系统的扩展限制

单体数据库、本地服务器等遗留系统,难以应对推理驱动工作负载的独特波动性。传统基础设施为可预测的查询和批处理设计,而Agentic AI可能因一个触发事件突然需要查询数千条记录并进行实时语义连接,随后又迅速归于平静。这种弹性需求是传统非弹性架构的噩梦,迫使企业在吞吐量(速度)和新鲜度(准确性)之间做出痛苦的妥协。

运营复杂性:编排脆弱性,监控盲区

运行Agentic AI之所以困难,是因为管理其的生态系统仍不成熟。与拥有K8s等成熟编排框架的微服务不同,智能体系统缺乏类似的“Kubernetes for agents”⁵,且现有部署、监控工具分散且实验性强。追踪一个智能体的决策路径变得异常困难,因为其推理路径是动态且非确定性的。运维脆弱性也令人担忧,单个服务超时可能引发连锁故障。此外,监控盲区使得“推理漂移”、幻觉率上升等微妙问题难以被及早发现。

至此,问题已清晰:Agentic AI的成功,将更多取决于能否构建出支持持续记忆、统一多样检索形式并适应推理负载波动的数据架构,而不仅仅是模型本身的能力。

分布式SQL的理由

传统基础设施的局限呼唤一个新的基础,它不应受限于僵化的事务模型、碎片化的检索流水线或脆弱的扩展假设。分布式SQL 成为解决这些问题的有力候选。它将关系数据库久经考验的优势(如SQL接口、ACID事务)扩展到分布式、多模态环境中。

分布式SQL数据库在跨多个节点(通常地理分布)分布数据和计算的同时,仍通过单一SQL接口提供服务,并利用共识协议(如Raft)保障数据的强一致性和高可用性。这使其兼具传统关系数据库的可靠性与云原生系统的弹性。

面对CAP定理的权衡,分布式SQL通常优先保证一致性(C),这对于依赖同步记忆和连贯状态进行协调推理的Agentic AI至关重要。同时,它也提供了根据应用需求调整策略的灵活性。

统一检索基金会

事务性数据系统与语义检索系统的长期分离正成为Agentic AI的瓶颈。虽然分布式SQL本身不提供向量搜索,但越来越多的平台正通过原生集成或扩展来支持这一能力。这使得事务准确性与语义相似性搜索能在同一个基础层上并肩工作,从根本上消除了跨系统协调的延迟和不一致。

SQL的声明式能力用于代理检索

SQL的声明式特性是其强大之处。分布式SQL将这一范式带入Agentic时代,使智能体能够使用统一的语法进行复杂的事务查询和(在集成向量搜索后)语义检索。这种结合让企业能复用现有的治理、工具和专业知识,同时解锁新的AI原生能力。智能体既能进行精准的过滤、连接和聚合,又能对意义和上下文进行推理。

弹性

Agentic AI工作负载天生具有波动性。分布式SQL 系统通过跨节点集群的水平伸缩来应对需求的突然激增或回落。这种弹性确保了即使在推理驱动的突发负载下,检索性能也能保持稳定,让组织能够支持大量智能体并发工作,而无需牺牲速度或可靠性。

有了Agentic应用,分布式SQL获胜

现代AI应用能够自主规划、编码、生成内容、测试并与其他代理协调。它们的行为更像不断进化、适应和迭代的“活系统”。这对底层数据层提出了前所未有的要求,而这正是分布式SQL的优势所在。

Agentic系统很少单打独斗。一个请求可能触发数十上百个智能体并行工作,各自维护中间状态或创建任务“实验分支”。分布式SQL系统可以按需创建轻量级、隔离的数据环境,其云原生、解耦的架构使得数据库或逻辑集群能几乎瞬时出现或消失,完美匹配了智能体动态、机会主义的行为模式。

此外,Agentic应用会持续重塑数据模式(Schema)。现代分布式SQL平台支持在线模式演进、元数据目录和数据状态快照分支,为智能体提供了一个安全的“实验室”,允许它们分叉数据环境、运行实验、评估结果并合并变更。

面对Agentic系统混沌、突发的负载模式,分布式SQL的计算层可以平滑地伸缩,吸收需求洪峰并在节点间重新分配工作,将不可预测性转化为可管理的常态。其内置的精细计量和成本遥测能力,甚至能让智能体根据经济反馈进行自我调节和优化。

基础设施作为实现更多工作的平台

基础设施提供了基石,但仅有基石无法建成大厦。记忆系统、分布式SQL 和统一检索层为连贯性、规模和韧性创造了条件,但它们需要被有效的应用模式所驱动,才能将潜力转化为真正的智能生产力。正如道路需要路线规划和导航才能实现通行,记忆基础设施也需要精心设计的模式来引导智能体感知、推理、行动和学习。这正是我们下一章将要探讨的核心:如何构建这些模式,让Agentic AI在为其专门设计的基础设施上充分发挥潜能。


参考文献

  1. Edge Delta Team, “What Percentage of Data Is Unstructured? 3 Must-Know Statistics”, Edge Delta (blog), March 6, 2024.
  2. David Kucher, “AI for Structured Data: Building Production-Ready Agents”, Alation (blog), June 4, 2025.
  3. Chad DeChant, “Episodic Memory in AI Agents Poses Risks that Should Be Studied and Mitigated”, arXiv (preprint), January 20, 2025, arXiv:2501.11739.
  4. Deekshith Marla, “Navigating the Trade-Offs: Latency, Cost, and Performance in Agentic Systems”, Arya.ai (blog), July 4, 2025.
  5. Clément Stenac, “The LLM Mesh: A Common Backbone for Generative AI Applications”, Dataiku (blog), September 23, 2023.



上一篇:SparkyLinux 8.2 发布:基于Debian的轻量级发行版迎来稳定强化更新
下一篇:FlowPrefill:算子级抢占解耦调度粒度,提升LLM服务吞吐5.6倍并满足严格SLO
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-23 10:24 , Processed in 0.748706 second(s), 38 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表