EasyVoice – 小说转语音 AI 解决方案
媒体影音
EasyVoice – 小说转语音 AI 解决方案
🔥 热度:117

API部署

DeepSeek 导航网:EasyVoice 是一个开源的文本、小说智能转语音解决方案,旨在帮助用户轻松将文本内容转换为高质量的语音输出。

功能特色

  • 超长小说一键转换:支持处理大型文本文件,轻松将超长小说转换为语音
  • 多角色配音:支持多种语言、性别和角色特性的语音,为不同角色赋予独特声音
  • 语音试听:生成前可试听语音效果,确保最终结果符合预期
  • 自定义设置:支持自定义语速、音调,以及接入自定义大模型和 TTS 服务
  • AI 推荐:通过 AI 智能推荐最适合的语音配置,省心又贴心。
  • 试听功能:生成前可试听效果,确保每一句都如你所愿!

快速开始

1. 通过 docker 运行
# 极简运行,你可以通过 -e 指定环境变量
docker run -d -p 3000:3000 -v $(pwd)/audio:/app/audio cosincox/easyvoice:latest

or 将仓库克隆到本地,使用 Docker Compose 一键运行!

docker-compose up -d
2. 本地运行项目(请先确保已安装 Node.js 环境)
# 开启/安装 pnpm
corepack enable
# 或者使用 npm 安装 pnpm
npm install -g pnpm

# 克隆仓库
git clone git@github.com:cosin2077/easyVoice.git
cd easyVoice
# 安装依赖
pnpm i -r

# 开发模式
pnpm dev:root

# 生产模式
pnpm build:root
pnpm start:root
3. 生成的音频、字幕保存位置
  • Docker 部署: 保存在挂载的 audio 目录下
  • Node.js 运行保存在 ./packages/backend/audio 目录下

环境变量

变量名默认值描述
PORT3000服务端口
OPENAI_BASE_URLhttps://api.openai.com/v1OpenAI 兼容 API 地址
OPENAI_API_KEY-OpenAI API Key
MODEL_NAME-使用的模型名称
RATE_LIMIT_WINDOW1速率限制窗口大小(分钟)
RATE_LIMIT10速率限制次数
EDGE_API_LIMIT3Edge-TTS API 并发数

相关问题

  • Q: 如何配置 OpenAI 相关信息?

  • A: 在 .env 文件中添加 OPENAI_API_KEY=your_api_key OPENAI_BASE_URL=openai_compatible_base_url MODEL_NAME=openai_model_name,你可以用任何 openai compatible 的 API 地址和模型名称,例如 https://openrouter.ai/api/v1/ 和 deepseek

  • Q: 为什么我的 AI 配音效果不好?

  • A: AI 推荐配音是通过大模型来决定不同的段落的配音参数,大模型的能力直接影响配音结果,你可以尝试更换不同的大模型,或者是用 Edge-TTS 选择固定的声音配音。

  • Q: 速度太慢?

  • A: AI 推荐配音需要把输入的文本分段、然后让 AI 分析、推荐每一分段的配音参数,最后再生成音频、拼接。速度会比直接用 Edge-TTS 慢。你可以更换相应更快的大模型,或者尝试调节 Edge-TTS 的并发参数:EDGE_API_LIMIT 为更大的值(10 以下),注意并发太高可能会有限制。

下载地址

相关推荐