向量数据库架构图示例

以下向量数据库示例展示了同样的写入 / 查询 / 索引模型如何随部署选择变化——托管服务、自托管引擎、混合检索，以及大规模下的横向分片。

真实案例

使用场景: 想要向量检索但不想运维基础设施的开发者

应用调用托管 API 进行 upsert 和查询

索引、存储和扩缩容由服务商处理

支持元数据过滤与向量相似度并用

Embedding 模型在应用里运行，不在数据库里

命名空间在一个索引内隔离租户

这样组织的原因: 托管向量数据库是最快的上线路径——图表最简单，因为索引、存储和扩缩容收拢进一个服务商框里，你只需负责 Embedding 步骤。

使用场景: 希望向量与现有关系数据放在一起的团队

向量通过 pgvector 扩展存入 Postgres

同一数据库同时保存关系行和它们的 Embedding

在向量列上建 ANN 索引（IVFFlat 或 HNSW）

SQL WHERE 子句兼作元数据过滤

只需备份、保护和运维一个数据库

这样组织的原因: 当向量本应与现有数据在一起时，用 pgvector 自托管更优——图表把向量存储折进你的主数据库，无需单独系统去同步，代价是自己管理 ANN 调优。

使用场景: 纯向量检索漏掉精确词条的团队

查询同时打到 ANN 索引和关键词索引

稠密（Embedding）+ 稀疏（BM25）结果融合

倒数排名融合（RRF）合并两个排名

元数据过滤在融合前应用

单次响应结合语义匹配和词法匹配

这样组织的原因: 混合检索在 ANN 索引旁加一个关键词索引——图表展示两条检索路径汇聚到一个融合步骤，这是抓住纯 Embedding 漏掉的精确词条（编码、名称）的方式。

使用场景: 向量达数十亿、超出单节点的团队

向量分区到多个分片

路由器把查询并行扇出到所有分片

每个分片在自己的分区上做 ANN 检索

结果合并并重排成全局 Top-K

每个分片配副本以保可用性

这样组织的原因: 超出单节点内存后分片不可避免——图表加入路由器和合并步骤，因为在数十亿向量规模下，架构既关乎 ANN 索引本身，也同样关乎 scatter-gather。

回到模板页，直接替换成你的课程主题、章节和复习重点，就可以继续使用这套结构。