
## 工作流概述
这个n8n工作流是一个智能书籍扫描器,能够自动分析图书书脊图像,提取可读的标题和作者信息,并通过Google Books API进行验证,最终返回标准化的图书列表。
## 工作流程详解
### 1. 输入接收与标准化
– **Webhook节点**:接收前端传入的包含图像URL的JSON数据
– **Set节点(Input normalized)**:标准化输入数据,提取图像URL字段
### 2. 图像分析与文本提取
– **OpenAI节点(Analyze image)**:使用GPT-4o-mini模型分析书脊图像
– 严格指令:只返回清晰可读的标题和作者信息,不进行猜测
– 输出标准JSON格式:`{“books”:[{“title”:”string”,”author”:”string|null”}]}`
### 3. 数据分割处理
– **Code节点(Item list split)**:
– 解析OpenAI返回的JSON数据
– 将书籍列表分割为单个项目
– 处理作者信息,提取主要作者用于搜索
– 去除JSON代码块标记
### 4. 图书信息验证
– **HTTP Request节点(Title validation)**:
– 调用Google Books API进行标题验证
– 使用`intitle:”书名”`和`inauthor:”作者”`进行精确搜索
– 限制结果数量为5条,按相关性排序
### 5. 数据标准化
– **Set节点(Data normalized)**:
– 使用Google Books API返回的标准化数据
– 如果API无结果,则保留原始识别数据
– 统一作者信息格式
### 6. 数据聚合与去重
– **Code节点(Reaggregates list)**:
– 重新聚合书籍列表
– 基于标题进行去重处理
– 生成最终的标准化书籍列表
### 7. 响应返回
– **Respond to Webhook节点**:
– 返回标准JSON格式的书籍列表
– 设置正确的HTTP响应头和状态码
## 技术特点
– **多模态AI集成**:结合计算机视觉和自然语言处理
– **数据验证机制**:通过权威API验证识别结果
– **容错处理**:完善的错误处理和数据回退机制
– **标准化输出**:统一的JSON数据格式
## 应用场景
– 图书馆自动化管理
– 个人书籍收藏数字化
– 图书零售商库存管理
– 学术研究文献整理

评论(0)