
这个模板提供了一个简单而强大的后端,用于为任何应用程序添加语音转文本功能。它创建一个专用的webhook,接收音频文件,使用OpenAI的gpt-4o-mini模型进行转录,并返回干净的文本。
## 适用人群
**开发者**:通过从现有前端或后端代码调用此webhook,快速为应用程序添加转录功能。
**无代码/低代码构建者**:使用工作流中找到的示例代码,将功能性音频录制器和转录服务嵌入到项目中。
**API爱好者**:一个精简、实用的示例,展示如何使用n8n将OpenAI等服务包装到自己的安全且可扩展的API端点中。
## 解决的问题
– **提供现成的API**:立即为您提供一个安全的webhook来处理音频文件上传和转录处理,无需任何服务器设置
– **解耦前端与后端**:您的应用程序只需要知道一个简单的webhook URL,允许您在n8n中更改后端逻辑而无需修改应用程序代码
– **提供清晰的实现模式**:包含的示例代码提供了如何从浏览器发送音频文件并处理响应的有效演示——您可以在任何框架中复制的模式
## 工作原理
该解决方案通过在您的应用程序(客户端)和n8n工作流(后端)之间定义清晰的API契约来工作。
**客户端技术**:
– 您的应用程序界面录制或选择音频文件
– 然后向n8n webhook URL发出POST请求,将音频文件作为multipart/form-data发送
– 等待webhook的响应,解析JSON主体,并提取Transcript键的值
**n8n工作流(后端)**:
– Webhook节点捕获传入的POST请求并获取音频文件
– HTTP Request节点将此文件发送到OpenAI API
– Set节点从API响应中隔离转录文本
– Respond to Webhook节点向您的应用程序发送干净的JSON对象({“Transcript”: “您的文本…”})
## 设置步骤
**配置n8n工作流**:
1. 在Transcribe with OpenAI节点中,添加您的OpenAI API凭据
2. 激活工作流以启用端点
3. 点击Webhook节点上的”Copy”按钮获取唯一的Production Webhook URL
**与前端集成**:
1. 在工作流中,找到标有”Example Frontend Code Below”的便签
2. 从下面的便签中复制完整的HTML
3. **重要**:在刚刚复制的代码中,找到行`const WEBHOOK_URL = ‘YOUR WEBHOOK URL’;`并将占位符替换为来自n8n的Production Webhook URL
4. 将代码保存为HTML文件并在浏览器中打开以进行测试
## 扩展功能
– **保存转录**:添加Airtable或Google Sheets节点以记录通过工作流的每个转录
– **错误处理**:增强工作流以捕获来自OpenAI API的潜在错误,并用清晰的错误消息进行响应
– **分析转录**:在转录步骤后添加Language Model节点,以在发送响应之前总结文本、分类其情感或提取关键实体

评论(0)