
## 工作流概述
这个工作流利用DocSumo API自动化从发票或类似文档中提取结构化数据。用户可以通过n8n表单触发器上传PDF文件,然后将其发送到DocSumo进行处理和结构化解析。工作流获取关键文档元数据和所有行项目,重建每个发票行并合并标题和项目详细信息,最后将所有结果导出为Excel文件。
## 工作原理
1. **表单触发**:用户使用集成的n8n表单触发器上传PDF文档
2. **API调用**:工作流通过REST API安全地将文档发送到DocSumo
3. **数据处理**:上传后,检查并获取解析后的文档结果
4. **数据提取**:提取标题信息和表格行项目,映射到结构化记录中
5. **输出生成**:完整结果导出为Excel (.xls) 文件
## 设置步骤
### DocSumo账户
– 注册并从DocSumo获取API密钥
### n8n凭证管理
– 将DocSumo API密钥添加为HTTP头凭证(切勿在工作流中硬编码密钥)
### 工作流配置
– 在HTTP Request节点中,将身份验证设置为保存的DocSumo凭证
– 根据需要更新请求中的文件类型或文档类型(例如:”type”: “invoice”)
### 测试
– 启用工作流并使用内置表单上传示例发票进行提取
## 功能特点
– 支持通过n8n内置表单或API/webhook扩展上传PDF
– 使用安全凭证直接将文件发送到DocSumo进行文档数据提取
– 提取发票级元数据(编号、日期、供应商、总计)和完整的行项目表格
– 将所有数据整合在易于使用的Excel格式中,便于下载或集成
– 模块化节点结构,易于扩展以进行进一步自动化
## 先决条件
– 启用API访问的DocSumo账户
– 具有表单、HTTP Request、Code和Excel/Convert to File节点的n8n实例
– 在n8n凭证管理器中存储有效的DocSumo API密钥
## 应用场景
| 场景 | 优势 |
|——|——|
| 发票自动化 | 快速提取行项目和元数据 |
| 收据处理 | 解析和数字化业务收据 |
| 批量账单导入 | 批量处理账单进行分析 |
## 注意事项
– **凭证安全**:不要将API密钥直接存储在HTTP Request节点中;始终使用n8n凭证管理器
– **便签说明**:工作流包含设置、输入、API调用、提取和输出步骤的便签,以帮助模板用户
– **自定义列**:您可以根据需要通过编辑Code节点来自定义标题或行项目提取

评论(0)