faster-whisper 模型下载,适用于 stt 项目 和 “pyvideotrans视频翻译配音”项目的faster-whisper模式使用,openai-whisper模型请往下拉
small 415MBsmall 百度网盘small.en 415MB
large-v1 百度网盘large-v1 huggingface
large-v2 huggingfacelarge-v2 百度网盘
large-v3 huggingfacelarge-v3 百度网盘
distil-whisper-medium.en 671MBdistil-medium百度网盘
distil-whisper-large-v2 1.27Gdistil-large-v2 百度网盘
distil-whisper-large-v3 1.3Gdistil-whisper-large-v3百度网盘
下载后解压,将压缩包内的"models--Systran--faster-xx"文件夹复制到models目录内,解压复制后 models 目录下文件夹列表如下
压缩包内容
正确放置后的 models 目录下的文件夹列表
openai-whisper模型下载,仅适用于“pyvideotrans视频翻译配音软件”的 openai-whisper模式模型 下载使用
下载后将pt文件放到软件目录下的models文件夹内
FunASR中文模型下载
百度网盘下载(含语音识别、标点恢复、降噪模型):https://pan.baidu.com/s/1v5wagiid6-K7GX9Pif4reA?pwd=y2ef
Huggingface(墙外下载地址): https://huggingface.co/spaces/mortimerme/s4/resolve/main/FunASR-Chinese-models.7z?download=true
下载后解压会看到3个文件夹
iic、damo、.__temp
,将他们复制到视频翻译软件的models/hub
文件夹内,覆盖
cuBLASxx.dll和cudnn下载
如果遇到 "cublasxxx.dll不存在"或启用cuda加速后闪退问题,请下载该文件,然后将里面的dll文件复制到 C:/Windows/System32 目录下 或者 软件根目录下即exe所在目录下
任意文件夹地址栏输入cmd
打开黑窗口,输入命令nvcc -V
查看当前CUDA版本
CUDA11.x版本点击此处下载 https://github.com/jianchang512/stt/releases/download/0.0/cuBLAS.and.cuDNN_CUDA11_win_v4.7z
CUDA12.x版本点击此处下载 https://github.com/jianchang512/stt/releases/download/0.0/cuBLAS.and.cuDNN_CUDA12_win_v1.7z
uvr5模型下载
下载后解压,得到一个 uvr5_weights
文件夹,将该文件夹复制到视频翻译配音软件根目录下。
ffmpeg.exe 下载
如果是windows系统,并且提示找不到 ffmpeg 命令,可下载下面这2个文件,放到软件根目录下或软件根目录下的ffmpeg文件夹内
https://github.com/jianchang512/stt/releases/download/0.0/ffmpeg.exe
https://github.com/jianchang512/stt/releases/download/0.0/ffprobe.exe