使用n8n搭建生产级别的知识库问答系统
本文研究一下基于 n8n (https://docs.n8n.io/) 搭建一个生产级别的知识库问答系统(通常称为 RAG - Retrieval Augmented Generation)。这个过程需要考虑数据的持续导入(Ingestion)、向量化质量、检索准确度以及会话记忆。官方参考教程见这里。
为了实现生产级别,需要将系统拆分为两个独立的核心工作流(Workflows):
1. 数据入库工作流 (ETL Pipeline): 负责将文档(PDF, 文本, 网页)读取、清洗、分块(Chunking)、向量化并存入向量数据库。
2. 问答检索工作流 (QA Chat Pipelin