Video Subtitle Master – 批量为视频生成字幕
媒体影音
Video Subtitle Master – 批量为视频生成字幕

APIWINmacOSLinux

DeepSeek 导航网:Video Subtitle Master 批量为视频生成字幕,并可将字幕翻译成其它语言。这是在之前的一个开源项目 VideoSubtitleGenerator 的基础上,制作成的一个客户端工具,以方便更多朋友们的使用。

关于 CUDA 的支持

因为本人使用的是苹果芯片,缺少 window CUDA 的开发环境,对于 CUDA 的支持,开发测试都存在较多场景无法兼顾的情况。

  • 目前提供了 CUDA 11.8.0 和 12.4.1 版本的编译,是通过 github action 自动编译的,可能存在环境的兼容问题
  • 要启用 CUDA ,需要确定自己的电脑支持 CUDA, 并安装了 CUDA toolkit. CUDA download
  • CUDA toolkit 的版本理论上是向后兼容,请根据你显卡支持的版本,选择合适的 11.8.0 或者 12.4.1 版本

关于 Core ML 的支持

从 1.20.0 版本开始,在苹果芯片上,支持使用 Core ML 加速语音识别。如果是苹果芯片,请下载 mac arm64 版本的 release 包。将会自动启动 Core ML 加速。

特性

它保留了之前 VideoSubtitleGenerator 这个命令行工具的全部特性,并新增了以下功能:

  • 图形用户界面,操作更加便捷
  • 源语言字幕文件和目标语言字幕文件放在视频同目录下,方便播放时任意挂载字幕文件
  • 批量处理视频/音频/字幕文件
  • 支持视频/音频生成字幕
  • 支持对生成的字幕,或者导入的字幕进行翻译
  • 支持多种翻译服务:
    • 火山引擎翻译
    • 百度翻译
    • DeepLX 翻译 (批量翻译容易存在被限流的情况)
    • 本地模型 Ollama 翻译
    • 支持 OpenAI 风格 API 翻译,如 deepseekazure 等
  • 自定义字幕文件名,方便兼容不同的播放器挂载字幕识别
  • 自定义翻译后的字幕文件内容,支持纯翻译结果或原字幕+翻译结果
  • 项目集成 whisper.cpp,对 Apple Silicon 进行了优化,有较快的生成速度
  • 项目集成了 fluent-ffmpeg,无须单独安装 ffmpeg
  • 支持运行本地安装的 whisper 命令
  • 支持选择模型下载源(国内镜像源或官方源)
  • 支持自定义并发任务数量

翻译服务

本项目支持多种翻译服务,包括百度翻译、火山引擎翻译、DeepLX、Ollama 本地模型以及 OpenAI 风格的 API 。使用这些服务需要相应的 API 密钥或配置。

对于百度翻译、火山引擎等服务的 API 申请方法,可以参考 https://bobtranslate.com/service/ ,感谢 Bob 这款优秀的软件提供的信息。

项目地址

相关导航