
Agent Decisioner是一个动态的、AI驱动的路由系统,能够根据用户查询的内容和目的自动选择最合适的大型语言模型(LLM)来响应。
该工作流通过智能路由查询到最适合的模型,确保动态优化的AI响应。
## 优势
🔁 自动模型路由:
自动为任务选择最佳模型,提高响应效率和相关性。
🎯 资源优化使用:
通过将简单查询路由到轻量级模型,避免过度使用像GPT-4这样的昂贵模型。
📚 模型感知推理:
使用关于模型能力(如推理、编码、网络搜索)的详细元数据进行智能选择。
📥 模块化和可扩展:
易于与其他工具集成,或通过添加更多模型或自定义决策逻辑进行扩展。
👨💻 适用于RAG和多代理系统:
可以作为更复杂代理框架或检索增强生成(RAG)管道的大脑。
## 工作原理
聊天触发器:当用户发送消息时,工作流启动,触发路由代理。
模型选择:AI代理分析查询并从可用选项中选择最适合的模型(例如,Claude 3.7 Sonnet用于编码,Perplexity/Sonar用于网络搜索,GPT-4o Mini用于推理)。
结构化输出:代理返回包含用户提示和所选模型的JSON响应。
执行:所选模型处理查询并生成响应,确保任务的最佳性能。
## 设置步骤
配置节点:
– 聊天触发器:设置webhook以接收用户消息。
– 路由代理(AI代理):定义包含模型优势和JSON输出规则的系统消息。
– OpenRouter聊天模型:连接到OpenRouter以访问模型。
– 结构化输出解析器:确保验证JSON响应格式(提示+模型)。
– 执行代理(AI代理1):配置其将提示转发到所选模型。
连接节点:
– 将聊天触发器连接到路由代理。
– 将OpenRouter聊天模型和输出解析器连接到路由代理。
– 将解析的JSON路由到执行代理,该代理通过OpenRouter聊天模型1使用所选模型。
凭据:
– 确保两个聊天模型节点的OpenRouter API凭据正确设置。
测试和部署:
– 激活工作流并使用示例查询进行测试以验证模型选择逻辑。
– 如果需要更好的准确性,调整路由规则。
## 可用模型
该工作流支持以下模型:
– perplexity/sonar(内置网络搜索功能)
– openai/gpt-4o-mini(成本效益高的推理模型)
– anthropic/claude-3.7-sonnet(编码任务专家)
– meta-llama/llama-3-70b-instruct(编程和技术问题解决)
– google/gemini-2.5-pro-preview(多模态能力)
– qwen/qwen-qwq-32b(推理和问题解决)
– openai/codex-mini(代码生成)
– openai/o1-pro(复杂推理)

评论(0)