使用Kokoro TTS和n8n创建本地语音生成工作流

使用Kokoro TTS和n8n创建免费本地语音生成工作流 - 文本转语音解决方案 — Kokoro TTS,n8n工作流,文本转语音,本地语音生成,AI语音合成,免费TTS,Python集成

免责声明

Execute Command节点仅在自托管（本地）n8n实例中受支持。

介绍

KOKORO TTS – Kokoro TTS是一个紧凑而强大的文本转语音模型，目前在Hugging Face和GitHub上可用。尽管其规模适中——在不到100小时的音频上训练——但它提供了令人印象深刻的结果，在Hugging Face的TTS排行榜上始终名列前茅。与较大的系统不同，Kokoro TTS具有在本地运行的优势，即使在无GPU的设备上也能运行，使其适用于广泛的用户。

谁将从这个集成中受益？

这对视频博主、TikTok用户很有用，并且还将能够创建免费的语音聊天机器人。目前，TTS模型大多是付费的，但这个集成将允许完全免费的语音生成。可能性仅受您的想象力限制。

注意

不幸的是，我们无法通过浏览器URL（GET/POST）与KOKORO API交互，但我们可以通过n8n运行Python脚本并将任何变量传递给它。

在教程中，使用了D盘，但您可以为任何路径重写此内容，包括C盘。

步骤1

您需要安装Python。链接
此外，从GitHub下载并解压缩Kokoro的便携版本。

在KOKORO文件夹中创建一个名为voicegen.py的文件：（C:\KOKORO）。如您所见，输出路径为：（D:\output.mp3）。

import sys
import shutil
from gradio_client import Client

# 为stdout设置UTF-8编码
sys.stdout.reconfigure(encoding=’utf-8′)

# 从命令行获取参数
text = sys.argv[1] # 第一个参数：输入文本
voice = sys.argv[2] # 第二个参数：语音
speed = float(sys.argv[3]) # 第三个参数：速度（转换为浮点数）

print(f”接收到的文本：{text}”)
print(f”语音：{voice}”)
print(f”速度：{speed}”)

# 连接到本地Gradio服务器
client = Client(“http://localhost:7860/”)

# 使用API生成语音
result = client.predict(
text=text,
voice=voice,
speed=speed,
api_name=”/generate_speech”
)

# 定义输出路径
output_path = r”D:\output.mp3″

# 移动生成的文件
shutil.move(result[1], output_path)

# 打印输出路径
print(output_path)

步骤2

转到n8n并创建以下工作流。

步骤3

编辑字段模块。

{
“voice”: “af_sarah”,
“text”: “Hello world!”
}

步骤4

我们将需要一个带有命令的Execute Command模块：python

C:\KOKORO\voicegen.py “{{ $json.text }}” “{{ $json.voice }}” 1

步骤5

脚本已经在工作，但要收听它，您可以连接一个带有生成的MP3文件路径的Binary模块

D:/output.mp3

步骤6

单击”Text workflow”并享受结果。

有比ChatGPT更多的语音和口音，而且是免费的。

附注

如果您需要，我的博客上有详细的教程。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

使用Kokoro TTS和n8n创建本地语音生成工作流

评论(0)

提示：请文明发言取消回复

近期文章

近期评论

使用Kokoro TTS和n8n创建本地语音生成工作流

评论(0)

提示：请文明发言 取消回复

相关文章

Pipedrive Tool MCP Server – 完整的CRM自动化工作流

AI宠物店助手：集成GPT-4o、Google日历与WhatsApp/Instagram/Facebook

将PostgreSQL表转换为CSV文件

Google Drive权限审计工作流：自动检测和报告过度开放的文件权限

近期文章

近期评论

提示：请文明发言取消回复