
# WhatsApp AI个人助手工作流 – 多模态消息智能处理系统
## 工作流概述
这是一个功能强大的WhatsApp AI个人助手自动化工作流,能够智能处理用户通过WhatsApp发送的各种格式消息,包括文本、语音、图片和PDF文档,并通过AI助手提供智能响应和执行任务。
## 核心功能模块
### 1. 消息接收与分类阶段
– **WhatsApp Trigger**:接收来自WhatsApp的消息
– **Input type**:智能分类消息类型(文本、语音、图片、文档)
– **Switch节点**:根据消息类型路由到相应处理流程
### 2. 内容处理阶段
#### 文本消息处理
– **Set节点**:直接提取文本内容
– 无需转换,直接传递给AI助手处理
#### 语音消息处理
– **Get Audio Url**:获取音频文件URL
– **Download Audio**:下载音频文件
– **Transcribe Audio**:使用OpenAI Whisper进行语音转文字
– **Set节点**:格式化转录内容
#### 图片消息处理
– **Get Image Url**:获取图片URL
– **Download Image**:下载图片文件
– **Analyze Image**:使用GPT-4O-mini进行图片内容分析
– **Set节点**:生成详细图片描述(法语)
#### PDF文档处理
– **Only PDF File**:验证文件格式(仅支持PDF)
– **Get File Url**:获取文档URL
– **Download File**:下载PDF文件
– **Extract from File**:提取PDF文本内容
– **Set节点**:格式化文档内容
### 3. AI助手处理阶段
#### 核心AI组件
– **Agent personnel**:个人助手代理
– **Anthropic Chat Model**:使用Claude Sonnet 4语言模型
– **Postgres Chat Memory**:PostgreSQL聊天记忆存储
#### 可用工具集
– **SerpAPI**:互联网搜索
– **Calculator**:数学计算
– **BDD mails**:Airtable邮件数据库查询
– **Ajouter un mail**:Airtable添加联系人
– **Search mails**:Gmail邮件搜索
– **Send a mail**:发送Gmail邮件
– **Create event Google Calendar**:创建Google日历事件
– **Get many events in Google Calendar**:查询Google日历事件
– **Search drive**:Google Drive文档搜索
– **MP Discord**:Discord私信发送
### 4. 响应交付阶段
#### 响应格式判断
– **From audio to audio?**:判断是否需要音频回复
#### 文本响应
– **Send message**:通过WhatsApp发送文本回复
#### 音频响应
– **Generate Audio Response**:使用OpenAI TTS生成语音
– **Fix mimeType for Audio**:修复音频MIME类型兼容性
– **Send audio**:通过WhatsApp发送语音回复
## 技术特点
### 多模态处理能力
– 支持文本、语音、图片、PDF四种输入格式
– 自动格式转换和内容提取
– 智能路由和错误处理
### 集成生态系统
– 与多个第三方服务深度集成
– 支持邮件、日历、云存储、即时通讯等
– 统一的AI助手接口
### 智能记忆系统
– PostgreSQL持久化聊天记忆
– 跨会话上下文保持
– 个性化用户体验
## 应用场景
### 个人生产力助手
– 日程管理:创建和查询日历事件
– 邮件管理:搜索和发送邮件
– 文档处理:PDF内容提取和分析
– 信息查询:互联网搜索和计算
### 企业自动化
– 客户关系管理:联系人数据库维护
– 团队协作:Discord通知和沟通
– 文档管理:Google Drive集成
– 多平台消息处理
### 多语言支持
– 法语图片描述
– 多语言语音转录
– 国际化工具集成
## 配置要求
### 必需凭证
– WhatsApp API凭证
– OpenAI API密钥
– Anthropic API密钥
– PostgreSQL数据库
– Airtable访问令牌
– Google OAuth2凭证
– SerpAPI密钥
– Discord Bot令牌
### 推荐配置
– 高可用性部署
– 错误处理和重试机制
– 生产环境监控
– 定期备份和更新
这个工作流展示了n8n在构建复杂多模态AI助手系统方面的强大能力,为企业级自动化解决方案提供了完整的技术框架。

评论(0)