AI 应用架构图模板

设计包含 RAG、LLM、Agent 工具和可观测性的端到端 AI 应用架构。

模板亮点

LLM + 编排层（LangChain/LlamaIndex）+ 对话记忆
RAG 管道：Embedding、向量数据库、检索器和重排序
工具调用层、语义缓存、安全护栏和可观测性

这个模板适合做什么

AI 应用架构图让 LLM 驱动系统的各个组件如何协作一目了然。本模板覆盖生产级 RAG + Agent 系统的完整技术栈：基于 LangChain/LlamaIndex 的编排层、LLM 提供商、用于语义检索的向量数据库、提升精度的重排序器、函数调用工具层、对话记忆、数据摄入管道、语义缓存、安全护栏和可观测平台。适合用于技术评审、系统文档或向干系人解释 AI 产品的工作原理。

适用场景

在 LLM 驱动的聊天机器人上线前，整理完整的系统架构文档。
向产品干系人解释 RAG 与微调的权衡：指出修改不同方案时受影响的组件。
规划新文档语料库的数据摄入流程。
通过追踪完整请求路径，定位延迟瓶颈。
审查安全边界：用户输入在哪里触碰了外部 API 或代码执行环境。
通过走图带新 ML 工程师理解检索、重排序和 LLM 调用的串联方式。

使用步骤

1从用户和应用层开始，定义交互界面（聊天 UI、API、Slack Bot）。
2在中间放置编排器，它负责协调 LLM 调用和工具使用。
3将 LLM 提供商和对话记忆连接到编排器。
4绘制 RAG 管道：Embedding 模型 → 向量数据库 → 检索器 → 重排序器。
5添加工具调用层，列出 Agent 可以调用的外部服务。
6添加数据摄入管道，展示文档如何被分块、向量化和索引。
7在边缘添加横切关注点：语义缓存、安全护栏和可观测性。

简单示例

基于 RAG 的客服聊天机器人

用户 → 聊天 UI → 编排器（LangChain）

编排器 → GPT-4（LLM）+ 记忆（Redis）

编排器 → 检索器 → 重排序器 → 向量数据库（Pinecone）

编排器 → 工具：搜索 API、工单系统、升级处理

摄入：文档/PDF → 分块 → Embedding → Pinecone

护栏过滤有害输出；Langfuse 追踪每次 LLM 调用

在线开始编辑

在 CodePic 中打开模板后，替换示例节点，就能很快整理成自己的学习导图。

使用此 AI 架构图模板查看示例

查看示例： /templates/ai-pipeline/examples