妙幕 / SmartSub – AI 字幕生成与翻译解决方案
媒体影音
妙幕 / SmartSub – AI 字幕生成与翻译解决方案
🔥 热度:9

APIWINmacOS

DeepSeek 导航网:妙幕(SmartSub)是一款强大的音视频字幕生成与多语言翻译工具,支持多种格式,本地化处理,并提供丰富的自定义选项。支持多种翻译服务,包括百度翻译、火山引擎翻译、DeepLX、Ollama 本地模型、 DeepSeek(申请 DeepSeek API)以及 OpenAI 风格的 API ,以及提供 Windows、macOS 客户端下载。

功能特色

  • 本地化处理:无需上传视频,保护隐私的同时拥有更快的处理速度。 在您的设备上完成全部字幕生成和翻译过程。
  • 多语言翻译:支持多种翻译服务,包括火山引擎、百度翻译、DeepLX、 微软翻译、Ollama 本地模型及 OpenAI 风格 API 等。
  • 硬件加速:支持 NVIDIA CUDA(Windows/Linux)和 Apple Core ML(macOS M 系列芯片) 硬件加速,大幅提升处理速度。
  • 批量处理:支持批量处理多个视频/音频文件,自动生成字幕。 也可对生成或导入的字幕进行批量翻译。
  • 自定义配置:自定义字幕文件名,兼容不同播放器的字幕识别; 支持纯翻译结果或原字幕+翻译结果的多种格式。
  • 多模型支持:支持多种 whisper 模型,从轻量级的 tiny 到高精度的 large 系列, 平衡准确性与资源消耗。

模型的选择

从视频或者音频里面,生成字幕文件,需要使用到 whisper 的模型。 whisper 的模型有多种,不同的模型,生成字幕的准确性不同,处理速度也不同。

  • 模型越大,准确性越高,对显卡要求也高,处理速度越慢
  • 低端设备或者显卡,推荐 tiny 或者 base 系列的模型,准确性虽然不如 large 系列,但是处理速度快,占用显存小
  • 普通电脑设备,建议从 small 或者 base 开始,平衡精度与资源消耗
  • 对于高性能显卡/工作站,推荐使用 large 系列的模型,准确性高
  • 如果原始音视频是英文,推荐使用带 en 的模型,专为英语优化,减少多语言干扰
  • 如果在乎模型大小,可以考虑使用 q5 或者 q8 系列的模型,相对于非量化版本,牺牲少量精度换取更小体积

下载地址

相关推荐