AI 应用架构图模板
设计包含 RAG、LLM、Agent 工具和可观测性的端到端 AI 应用架构。
使用此模板模板亮点
- LLM + 编排层(LangChain/LlamaIndex)+ 对话记忆
- RAG 管道:Embedding、向量数据库、检索器和重排序
- 工具调用层、语义缓存、安全护栏和可观测性
这个模板适合做什么
AI 应用架构图让 LLM 驱动系统的各个组件如何协作一目了然。本模板覆盖生产级 RAG + Agent 系统的完整技术栈:基于 LangChain/LlamaIndex 的编排层、LLM 提供商、用于语义检索的向量数据库、提升精度的重排序器、函数调用工具层、对话记忆、数据摄入管道、语义缓存、安全护栏和可观测平台。适合用于技术评审、系统文档或向干系人解释 AI 产品的工作原理。
适用场景
- 在 LLM 驱动的聊天机器人上线前,整理完整的系统架构文档。
- 向产品干系人解释 RAG 与微调的权衡:指出修改不同方案时受影响的组件。
- 规划新文档语料库的数据摄入流程。
- 通过追踪完整请求路径,定位延迟瓶颈。
- 审查安全边界:用户输入在哪里触碰了外部 API 或代码执行环境。
- 通过走图带新 ML 工程师理解检索、重排序和 LLM 调用的串联方式。
使用步骤
- 1从用户和应用层开始,定义交互界面(聊天 UI、API、Slack Bot)。
- 2在中间放置编排器,它负责协调 LLM 调用和工具使用。
- 3将 LLM 提供商和对话记忆连接到编排器。
- 4绘制 RAG 管道:Embedding 模型 → 向量数据库 → 检索器 → 重排序器。
- 5添加工具调用层,列出 Agent 可以调用的外部服务。
- 6添加数据摄入管道,展示文档如何被分块、向量化和索引。
- 7在边缘添加横切关注点:语义缓存、安全护栏和可观测性。
简单示例
基于 RAG 的客服聊天机器人
用户 → 聊天 UI → 编排器(LangChain)
编排器 → GPT-4(LLM)+ 记忆(Redis)
编排器 → 检索器 → 重排序器 → 向量数据库(Pinecone)
编排器 → 工具:搜索 API、工单系统、升级处理
摄入:文档/PDF → 分块 → Embedding → Pinecone
护栏过滤有害输出;Langfuse 追踪每次 LLM 调用
在线开始编辑
在 CodePic 中打开模板后,替换示例节点,就能很快整理成自己的学习导图。


