Tiger Data(TimescaleDB背后的公司)近日发布了Agentic Postgres,这是一个专为AI智能体和开发者设计的基于Postgres的数据库。它在Postgres的基础上,集成了快速分叉(fast forking)、MCP服务器、原生的BM25和向量搜索功能,并提供了一个用于终端访问的CLI工具。
Agentic Postgres内置的MCP服务器使得智能体和开发者可以通过高级提示词与数据库交互。例如,用户可以输入:“我想创建一个个人助手应用。请在Tiger上创建一个免费服务。然后根据Postgres最佳实践,描述你将创建的数据库模式。”
Tiger Data表示,他们已经将十多年的Postgres经验提炼为一套内置的主提示词,涵盖了模式设计、查询调优、数据迁移、原生全文及语义搜索等多个方面。
全文搜索和语义搜索由两个Postgres插件提供支持:一是现有插件pgvectorscale的改进版本,它提供了更高的索引吞吐量、更好的召回率以及大规模下的更低延迟;另一个是新插件pg_textsearch,它实现了用于现代关键词排序搜索的BM25算法,并针对混合AI工作流进行了优化。目前,pg_textsearch在内存中运行以确保最高速度,其基于磁盘的操作支持正在开发中。
据Tiger Data的CTO介绍,Agentic Postgres的核心基础是“流体存储(Fluid Storage)”系统:
这是一个为弹性、迭代和安全性而构建的新型分布式存储系统,包含一个事务性分布式块存储、支持血缘关系的存储代理以及一个用户空间块设备驱动程序,并采用了与Postgres协调的版本化写时复制和应用一致性快照。
得益于Fluid Storage,Agentic Postgres能够对真实生产数据进行快速、零拷贝的分叉。这使得创建即时环境、在沙箱环境中安全地进行实验,以及直接在真实数据上运行智能体循环成为可能。例如,Tiger Data表示,一个智能体可以在几秒钟内启动一个拥有生产数据完整副本的隔离环境,并测试创建新索引是否会提升性能。
Tiger Data强调,对于智能体软件而言,关键不仅是效率,更是“流动性”,即数据库能够即时伸缩、分叉和收缩的真正弹性能力。在一个典型的智能体工作流中,智能体需要自主创建、修改和部署代码,运行迁移,对结果进行基准测试,然后拆除所有环境。要高效完成这些,整个过程必须在数秒内完成。Tiger Data认为,现有的数据库服务(如Amazon EBS)无法满足这种性能要求,它们在复制数据库时引入更高的延迟,并且在缩减规模或调整大小时存在限制。
“当我们开始为内部和客户用例探索智能体时,我们清楚地认识到,今天的云基础设施需要被重新构思。”
Level Up Coding的创始人兼软件工程师Nikki Siapno在X.com上指出,AI正在改变开发者对数据库的需求:
“它们现在需要在一个地方同时处理时间、语义和记忆。传统系统并非为此而建。……Tiger Data的Agentic Postgres将时间、语义和记忆融合在了一起。”
她承认,你可以“拼凑”多个插件或专门的数据库来满足智能体记忆、大规模时序数据、向量搜索与嵌入、语义检索等需求,但这“只会增加复杂性”。
其他专门针对智能体软件的数据库服务包括Firebolt(兼容Postgres,针对高并发和亚秒级查询延迟的分析工作负载进行了优化),以及Weaviate和Qdrant(它们支持高维向量存储、相似性搜索和元数据过滤)。
开发者可以注册试用Agentic Postgres的免费层级,该层级提供对可分叉数据库、混合搜索、记忆API以及带宽和性能有限的MCP集成的访问。
|