使用Qdrant、MistralAI和OpenAI构建税务代码助手 - n8n图像嵌入工作流
n8n工作流,图像嵌入,向量搜索,OpenAI视觉模型,图像处理,AI助手,税务代码助手

此n8n模板演示了一种图像嵌入方法,用于构建快速图像上下文搜索。应用场景包括个人照片库、产品推荐或视频片段搜索。

工作原理
通过Google Drive将照片导入工作流。
通过编辑图像节点处理照片以提取颜色信息。此信息构成我们用于识别图像的语义元数据的一部分。
照片还通过视觉能力模型处理,该模型分析图像并返回带有语义关键词的简短描述。
关于图像的这两部分信息与图像的元数据结合,形成描述图像的文档。
然后将此文档作为文本嵌入插入到我们的向量存储中,该嵌入与我们的图像相关联。
从这里,用户可以像查询任何文档一样查询向量存储,并返回相关的图像引用和/或链接。
要求
Google账户从Google Drive下载图像文件。
OpenAI账户用于视觉AI和嵌入模型。
自定义此工作流

文本摘要只是生成图像嵌入的众多技术之一。如果结果不令人满意,有专门的图像嵌入模型,如Google的vertex AI多模态嵌入。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。