视频翻译软件的核心原理是:根据视频中的说话声音识别出文字,然后将文字翻译为目标语言文字,再将翻译后的文字进行配音,最后将配音、文字嵌入视频。
可以看到第一步就是从视频中的说话声识别出文字,识别精确度直接影响到后续翻译和配音。
使用Google识别时需注意
- 需要填写网络代理,不然无法连接
- Google的语音识别功能不强,无法区分和返回标点符号。
- 适合背景音干净、人声清晰准确的音频识别
使用方法
软件界面中从模式下拉框里选择 GoogleSpeech 即可。选择该项时,无需再选择模型和分割方式。
优缺点
优点:无需下载模型、节省系统资源、使用简单
缺点:需要代理、效果略差
代理问题
在使用Google Gemini等服务时,由于众所周知的原因,必须使用代理,一般形式为 http://127.0.0.1:数字端口号
,如果你已确定使用了系统代理,并在浏览器里可以访问,但不知道怎么填写网络代理地址,那么执行如下命令,确认是否正确启用了系统代理。
按住 Windows键 + R键
,在弹出的运行窗口中输入 ms-settings:network-proxy
,然后点击确定
如果弹出的设置面板类似下图,说明已正确设置了系统代理,可以无需在软件中填写“网络代理地址”