deepgram.com 语音识别api使用
在 v2.92后,新增了 deepgram.com 的语音识别api支持,这是一个国外AI服务,注册即赠送200美元额度,足够用一段时间了。
- 打开网址 https://deepgram.com/ ,注册登录进入控制台 https://console.deepgram.com/
- 登录后在控制台点击大大的绿色“Create API Key”
点击后弹出如下图
第一个文本框内随意写几个英文字母,然后再点击底部“”。接下来会显示 SK,记得复制,如下图
- 打开 菜单--语音识别设置--Deepgram 窗口
API Key: 在API Key中填写上一步复制的key
静默时长: 可保持默认 200,即200ms,如果待识别的视频语速较快可适当降低到150,如果较慢,静音较多,可适当调大到500、 800。
- 注意: Deepgram平台对中文支持不佳,不论是直接使用Deepgram整理后返回的字幕,还是按字级时间戳重新断句,都缺少标点符号,导致字幕分割不理想,为优化,以增加使用 阿里中文标点恢复模型重新进行断句划分,请在软件界面中选中“中文重新断句”