
## 工作流概述
这是一个基于n8n的A/B分割测试工作流,专门用于测试不同AI代理提示词的效果。该工作流结合了Supabase数据库、OpenAI语言模型和PostgreSQL聊天记忆功能,实现了智能的会话管理和提示词分配。
## 工作流功能
### 主要功能
– **会话管理**: 使用Supabase存储和管理聊天会话信息
– **随机分配**: 为每个新会话随机分配基准提示词或替代提示词
– **A/B测试**: 测试两种不同提示词在相同条件下的表现差异
– **记忆保持**: 使用PostgreSQL保持聊天历史记录,确保会话连贯性
### 技术实现
1. **消息接收**: 通过聊天触发器节点接收用户消息
2. **会话检查**: 查询Supabase数据库检查会话是否存在
3. **提示词分配**: 如果会话不存在,随机分配提示词路径
4. **AI处理**: 使用AI代理节点和OpenAI模型生成响应
5. **记忆存储**: 在PostgreSQL中保存聊天历史
## 节点配置
### 核心节点
– **When chat message received**: 聊天消息触发器
– **Check If Session Exists**: Supabase会话检查
– **If Session Does Exist**: 条件判断节点
– **Assign Path To Session**: 会话路径分配
– **Define Path Values**: 定义基准和替代提示词值
– **Get Correct Prompt**: 获取正确提示词
– **AI Agent**: AI代理处理节点
– **OpenAI Chat Model**: OpenAI聊天模型
– **Postgres Chat Memory**: PostgreSQL聊天记忆
## 设置步骤
### 前置要求
1. 在Supabase中创建名为**split_test_sessions**的表,包含**session_id**(text)和**show_alternative**(bool)列
2. 配置Supabase、OpenAI和PostgreSQL凭据
3. 修改**Define Path Values**节点设置基准和替代提示词值
### 测试流程
1. 激活工作流
2. 通过n8n内置聊天发送消息进行测试
3. 使用不同聊天会话测试两种提示词的效果
## 定制化建议
### 扩展功能
– 测试不同的LLM设置参数(如温度)
– 添加两种替代提示词效果的测量方法
– 集成更多分析工具来评估性能指标
### 应用场景
– AI聊天机器人优化
– 提示词工程测试
– 用户体验研究
– 产品功能A/B测试

评论(0)