
## 工作流概述
这个n8n模板展示了如何使用Foxit的Extraction API从上传的文档中提取信息,然后利用Diffbot的API将文本转换为文档中提到的组织列表并创建摘要。
## 工作原理
### 1. 文档监听与下载
– 监听Google Drive文件夹中的新文件
– 当有新文件添加时,自动下载文件内容
### 2. 文档上传与文本提取
– 将文档上传到Foxit平台
– 调用Extract API获取文档的文本内容
– 轮询API检查任务状态,完成后获取提取的文本
### 3. 内容分析与实体识别
– 将提取的文本发送到Diffbot API
– 获取文档中提到的实体列表和内容摘要
– 使用代码步骤过滤返回的实体,只保留组织类型且置信度高的结果
### 4. 结果整理与邮件发送
– 使用另一个代码步骤从前面的数据生成HTML字符串
– 通过GMail节点发送包含分析结果的邮件
## 技术需求
– Google账户(用于Google Drive和GMail)
– Foxit开发者账户(https://developer-api.foxit.com)
– Diffbot开发者账户(https://app.diffbot.com/get-started)
## 后续扩展
– 当前工作流假设PDF输入,但Foxit提供将Office文档转换为PDF的API,可以在调用Extract API之前添加此流程
– Diffbot返回大量信息,可以在邮件中使用更多数据
– 除了发送邮件,还可以按组织将文档分类到新文件夹中

评论(0)