基于Mistral AI的Telegram OCR文件识别n8n工作流 | Webhook + AI集成
n8n工作流,Telegram OCR,Mistral AI,光学字符识别,文件处理,Webhook集成,AI自动化

这个n8n模板提供了一个完整的解决方案,用于直接在Telegram中进行图像和PDF文件的光学字符识别(OCR)。

用户只需将PNG、JPEG或PDF文档发送到您的Telegram机器人,工作流就会处理它们,使用Mistral OCR提取文本,并将内容作为可下载的Markdown(.md)文本文件返回。

## 主要功能和工作原理:

* **通过Telegram轻松OCR**:用户向机器人发送文件,系统自动检测文件类型(PNG、JPEG或PDF)。
* **文件大小验证**:工作流强制执行**25 MB文件大小限制**,符合Telegram Bot API限制,确保平稳运行。
* **Mistral驱动的识别**:利用**Mistral OCR**,模板准确提取各种文档类型的文本。
* **Markdown输出**:识别的文本自动转换为干净的Markdown(.md)文本文件,便于编辑、存储或进一步处理。
* **安全文件交付**:处理后的Markdown文件通过Telegram发送回用户。为此,工作流巧妙地使用**对自身的GET请求**(充当文件下载代理)。此生成的链接允许Telegram直接获取.md文件。**请注意:此下载功能要求工作流处于”Active”状态。**
* **可选白名单安全**:通过**可选的白名单功能**增强机器人的安全性。您可以配置特定的Telegram用户ID来限制访问,确保只有授权用户才能与您的机器人交互。
* **简化的Webhook管理**:模板包含专用的实用程序流,用于方便地管理Telegram机器人的webhook(适用于开发和生产环境)。

此模板非常适合在移动中数字化文档、从扫描文件中提取文本或将基于图像的内容转换为多功能、可搜索的文本。

## 开始使用

要启动这个强大的OCR机器人,请按照以下两个主要步骤操作:

1. **设置您的Telegram机器人**:首先,您需要配置您的Telegram机器人及其webhook。按照**Telegram机器人Webhook设置**部分中的详细说明创建机器人,获取其API令牌,并设置必要的webhook URL。

2. **配置机器人设置**:接下来,您需要为机器人定义关键操作参数。转到**设置配置**部分,并根据您的偏好填充变量,包括白名单访问选项。

## 工作流节点分析

此工作流包含以下主要节点类型:
– **Webhook**:处理来自Telegram的传入请求
– **Set**:配置机器人设置和白名单参数
– **Switch**:根据消息类型和事件类型路由处理逻辑
– **Telegram**:与Telegram API交互,发送消息和文件
– **Code**:执行自定义JavaScript逻辑,包括文件分类和白名单检查
– **If**:条件判断,包括文件大小验证和白名单状态检查
– **HTTP Request**:调用Mistral OCR API进行文本识别
– **Convert to File**:将提取的文本转换为Markdown文件
– **Manual Trigger**:手动触发webhook设置流程
– **Sticky Note**:提供文档和说明

## 技术特点

– 支持PNG、JPEG和PDF文件格式
– 自动文件类型检测
– 20MB文件大小限制
– Mistral AI OCR集成
– Markdown格式输出
– 可选用户白名单
– 完整的webhook管理工具

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。