基于Vision API和LLM的自动化发票收集与数据提取工作流 | n8n工作流 | Google Sheets集成
n8n工作流,发票自动化,Google Vision API,LLM数据处理,Google Sheets集成,Telegram通知,OCR技术,AI数据提取

## 基于Vision API和LLM的自动化发票收集与数据提取工作流

这个工作流自动化了收集上传发票、使用**Google Vision API**提取文本,以及通过LLM处理提取的文本以生成结构化数据的整个过程,包含关键交易详情如**日期、凭证号、交易详情、供应商和交易金额**。
最终数据保存到**Google Sheets**并实时发送通知到**Telegram**。

## ✨ 主要功能
– **发票上传表单**
用户可以通过提供的表单上传发票图片。
– **Google Drive集成**
文件存储在指定的Google Drive文件夹中,并提供可共享的预览链接。
– **通过Google Vision API进行OCR**
使用`TEXT_DETECTION`将发票图片转换为文本。
– **通过LLM进行数据结构化**
使用LLM模型解析和结构化数据。
– **结构化输出解析器**
确保具有所需列的一致输出。
– **数据清理**
清理和格式化没有货币符号的数值。
– **Google Sheets同步**
在Google Sheets中追加或更新交易数据(通过文件ID匹配)。
**模板:** [Google Sheets](https://docs.google.com/spreadsheets/d/1HMzQtFK9T-GDxGFSD7ErW_QLlq-PvCvoFASiHGG2fGM/edit?gid=0#gid=0)
– **Telegram通知**
直接将交易摘要发送到Telegram聊天/群组。

## 🔐 所需凭证
– **Google Vision API密钥** → 用于OCR处理。
– **OpenRouter API密钥** → 用于访问Gemini Flash LLM。
– **Google Drive OAuth2** → 用于上传和下载发票文件。
– **Google Sheets OAuth2** → 用于写入或更新电子表格数据。
– **Telegram机器人令牌** → 用于向Telegram发送通知。
– **Telegram聊天ID** → 目标聊天/群组用于通知。

## 🎁 优势
– **完全自动化**从发票上传到结构化报告。
– **节省时间**通过消除手动交易数据输入。
– **实时集成**与Google Sheets用于报告和审计。
– **即时通知**通过Telegram用于快速交易监控。
– **重复预防**使用文件ID作为匹配键。
– **灵活**适用于会计、财务或行政团队。

## 工作流节点详解

### 1. 表单触发 (On form submission)
– 当用户提交”上传采购发票”表单时触发工作流
– 从表单接收文件上传

### 2. Google Drive文件上传 (Upload file)
– 将接收的文件上传到指定的Google Drive文件夹
– 生成文件ID用于后续处理

### 3. Google Drive文件下载 (Download file)
– 使用文件ID从Google Drive下载文件
– 准备文件进行OCR处理

### 4. 代码转换 (Code)
– 将下载的发票文件转换为Base64格式
– 为Vision API准备图像数据

### 5. 设置Vision API (Set Vision API)
– 将Google Vision API密钥添加到工作流数据中
– 配置API访问凭证

### 6. HTTP请求 (HTTP Request)
– 将Base64编码的图像发送到Google Vision API
– 使用TEXT_DETECTION功能进行OCR处理

### 7. 基础LLM链 (Basic LLM Chain)
– 处理OCR提取的文本
– 使用LLM解析和结构化发票数据
– 提取关键字段:日期、凭证号、交易详情、供应商、金额

### 8. OpenRouter聊天模型 (OpenRouter Chat Model)
– 使用Google Gemini Flash LLM模型
– 执行自然语言理解和数据提取

### 9. 结构化输出解析器 (Structured Output Parser)
– 强制LLM输出符合预定义的JSON模式
– 确保数据格式一致性

### 10. 数据清理代码 (Code1)
– 清理和规范化数值字段
– 移除货币符号和格式化数字

### 11. Google Sheets操作 (Append or update row in sheet)
– 将提取的数据写入Google Sheets
– 使用文件ID作为唯一标识符防止重复
– 支持追加新行或更新现有行

### 12. Telegram消息发送 (Send a text message)
– 向指定Telegram聊天发送交易摘要
– 提供实时通知功能

## 技术架构

这个工作流展示了现代AI驱动的自动化解决方案,结合了:
– **OCR技术**:Google Vision API提供准确的文本提取
– **AI处理**:Gemini Flash LLM进行智能数据解析
– **云存储**:Google Drive用于文件管理
– **数据同步**:Google Sheets用于结构化存储
– **实时通知**:Telegram用于即时提醒

## 应用场景

这个工作流特别适用于:
– 财务和会计团队的发票处理自动化
– 中小企业的费用管理
– 行政部门的采购流程优化
– 任何需要从图像发票中提取结构化数据的场景

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。