
## 概述
这个n8n工作流能够自动解析发票、传感器日志或结构化PDF/图像(包括扫描文档或CSV文件),使用OCR和AI技术提取关键字段如总额、日期和客户/供应商信息,并将结构化输出写入Google Sheets。
## 适用人群
– 财务或运营团队自动化发票处理
– SaaS平台解析上传的报告或文档
– 需要无代码后端进行PDF/图像/CSV文档解析的用户
– AI驱动的数据捕获管道
## 工作原理
1. **Webhook触发器**接收文件上传(/uploadDoc)
2. **Switch节点**检查文件类型:
– 如果是图像 → 使用Tesseract OCR
– 如果是PDF → 使用PDF解析器
– 如果是CSV → 直接提取
3. 提取的文本传递给:
– Google Gemini或Gemini Flash AI模型
– 提示提取字段如invoice_id、total、customer_name等
– JSON字符串被解析和清理
4. 使用appendOrUpdate将数据追加到Google Sheets
## 设置方法
1. 创建包含以下列的Google Sheet:
invoice_id, invoice_date, due_date, customer_name, vendor_name, subtotal, tax_total, total, currency
2. 连接:
– Google Sheets OAuth
– Google Gemini(PaLM API密钥)用于LLM解析
3. 部署webhook端点:/uploadDoc
4. 上传示例文件(PDF、图像、CSV)进行测试
5. 在Invoice Data节点中检查和映射Sheet列
## 技术要求
| 工具 | 用途 |
|——|——|
| n8n | 自动化框架 |
| Google Sheets | 存储结构化输出 |
| Tesseract OCR | 扫描图像文本提取 |
| Google Gemini | 自然语言解析 |
## 自定义选项
– 使用结构化提示添加行项目提取
– 更改提示以提取传感器读数、日志类型或自定义键
– 添加对其他文件类型的支持(例如XLSX、DOCX)
– 添加成功/失败的Slack/电子邮件通知
– 如果偏好,可以将Gemini替换为OpenAI或Hugging Face
## 附加功能
– 将上传的文件保存到Google Drive或S3
– 为安全上传添加身份验证
– 使用图表/仪表板节点可视化提取的数据
– 与计费/会计软件集成
## 使用案例示例
| 场景 | 执行结果 |
|——|———-|
| 发票上传(PDF) | 将总额、客户、税务数据提取到Google Sheet |
| 扫描收据(图像) | OCR + LLM提取结构化数据 |
| 日志文件(CSV) | 解析并将日志条目记录到Sheets |
## 常见故障排除
| 问题 | 可能原因 | 解决方案 |
|——|———-|———-|
| Webhook未触发 | URL或方法不匹配 | 使用正确的POST URL /uploadDoc |
| 文本为空 | OCR失败 | 检查图像质量或Tesseract配置 |
| Gemini模型未返回JSON | 提示格式问题 | 确保提示以有效的JSON模式结束 |
| Sheet未更新 | 无效的Sheet ID或标签页 | 双重检查Sheet凭据和标签页名称 |
## 需要帮助?
– 需要帮助微调Gemini提示以获得更好的字段准确性?
– 想要提取完整表格、多页发票或将PDF转换为JSON行?
我们的WeblineIndia自动化团队可以帮助您将其扩展为完整的文档自动化管道。

评论(0)