n8n AI评估工作流:文档相关性评估模板 | 向量存储 | OpenAI
n8n工作流,AI评估,文档相关性,向量存储,OpenAI,检索增强生成,RAG,自动化测试

这是一个用于n8n评估功能的模板。评估是一种通过运行包含不同输入的测试数据集来获得AI工作流性能可靠性的技术。

通过为每个输入计算一个指标(分数),您可以看到工作流在哪些地方表现良好,哪些地方表现不佳。

工作原理

此模板展示了如何计算工作流评估指标:检索文档相关性(即从向量存储中检索的信息是否与问题相关)。

工作流接收一个问题,并检查为回答该问题而检索的信息是否相关。

要运行此工作流,您需要将文档插入向量数据存储中,以便代理可以检索它们来回答问题。您可以通过运行工作流的顶部部分一次来完成此操作。

主要工作流程如下:

我们使用评估触发器读取数据集
它与常规触发器并行连接,以便可以从任一触发器启动工作流。更多信息
我们确保代理输出其使用的工具列表数据
如果我们正在评估(即执行从评估触发器开始),我们使用AI计算相关性指标,比较检索到的文档与问题
我们将此信息作为指标传递回n8n
如果我们不进行评估,我们避免计算指标以降低成本

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。