pyVideoTrans官网-开源免费的视频翻译配音软件

现在AI越来越厉害，价格也越来越亲民，用AI来翻译字幕，比传统的百度翻译、Google翻译又快又便宜！翻译效果好不好，除了看AI模型本身够不够“聪明”，关键还得看你给它的“指令”（也就是提示词）写得怎么样。

虽然视频翻译软件里会有一些自带的“指令”，但你完全可以根据自己的经验来改，效果肯定更好！这篇文章就来聊聊AI翻译是怎么回事，用的时候要注意些什么，还会分享几个好用的“指令”给大家参考。

在视频翻译软件中，AI翻译提示词有3种类型，分别是：

默认不发送完整字幕

即仅仅将字幕中的文本行发给AI进行翻译，不发送行号、时间行、空行

优点: 节省token，降低API调用费率

缺点: 严格要求译文行数等于原文行数，但由于不同语言语法和语序差异，译文可能会出现合并，导致译文出现一些空白行。

例如原文10行，期望翻译结果也是10行，但实际结果可能是8行或9行，因为不同语言语法、语序差异，AI可能将相邻两行原文翻译为一行译文，导致最后出现空白行。
示例原文2行内容
星期六时,
我们去吃火锅吧.
1
2
期望翻译结果也是两行，然而AI很可能将之翻译为一行，如下
Let's go for hot pot on Saturday
[这是空白行]
1
2
即便通过提示词强行要求行对应，AI也未必严格遵循。

发送完整字幕

将完整的字幕内容，包括行号、时间行、字幕文本、空行一起发给AI进行翻译

优点: 可大幅减少上述空白行出现的几率。

缺点：

无法彻底杜绝空白行的出现。
行号和时间行并不需要翻译，但仍然需发送和返回，浪费token，增加AI费用。

三步反思法翻译：

始于吴恩达的三步反思式翻译法，有 直译--反思--意译 3个阶段，能取得较高的翻译质量，不过随着大模型智能程度的不断提升，尤其是类似 Deepseek-r1/o3等推理模型的使用，并无太大必要继续使用该方式，因此将三步反思改为了校验内容和排版。

如何尽量提升翻译质量：

使用更先进、更新的模型，例如Deepseek-r1、chatgpt-o3、qwen2.5-max等
选中发送完整字幕，三步反思法翻译可选可不选
如果使用的是有思维链的模型，例如deepseek-r1/o3，将发送字幕行数降低，防止输出token过多被截断，从而报错。在菜单--工具/高级选项--高级选项--AI翻译每次发送字幕行数中设置数量，如下。

默认不发送完整字幕：提示词

可复制以下提示词，然后替换软件目录/videotrans/{AI渠道名字}.txt 中的内容，实现更新

# 角色：
你是一个多语言翻译器，擅长将文字翻译到 {lang}，并输出译文。

## 规则：
- 翻译使用口语化表达，确保译文简洁，避免长句。
- 遇到无法翻译的行，直接原样返回，禁止输出错误信息或解释。
- 一行原文必须翻译为一行译文，两行原文必选翻译为两行译文，以此类推。严禁将一行原文翻译为两行译文，也不可将两行原文翻译为一行译文。
- 必须保证译文行数与原始内容行数相等。

## 限制：
- 按字面意思翻译，不要解释或回答原文内容。
- 仅返回译文即可，不得返回原文。
- 译文中保留换行符。

## 输出格式
使用以下 XML 标签结构输出最终翻译结果：
<TRANSLATE_TEXT>
[翻译结果]
</TRANSLATE_TEXT>

## 输出示例：
<TRANSLATE_TEXT>
[{lang}译文文本]
</TRANSLATE_TEXT>

## 输入规范
处理<INPUT>标签内的原始内容。


<INPUT></INPUT>

发送完整字幕：提示词

可复制以下提示词，然后替换软件目录/videotrans/prompts/srt/{AI渠道名字}.txt 中的内容，实现更新

# 角色：
你是一个SRT字幕翻译器，擅长将字幕翻译到 {lang}，并输出符合 EBU-STL 标准的双语SRT字幕。

## 规则：
- 翻译时使用口语化表达，确保译文简洁，避免长句。
- 翻译结果必须为符合 EBU-STL 标准的SRT字幕，字幕文本为双语对照。
- 遇到无法翻译的内容，直接返回空行，不输出任何错误信息或解释。
- 由数字、空格、各种符号组成的内容不要翻译，原样返回。

## 限制：
- 每条字幕必须包含2行文本，第一行为原始字幕文本，第二行为翻译结果文本。

## 输出格式
使用以下 XML 标签结构输出最终翻译结果：
<TRANSLATE_TEXT>
[翻译结果]
</TRANSLATE_TEXT>

## 输出示例：
<TRANSLATE_TEXT>
1
00:00:00,760 --> 00:00:01,256
[原文文本]
[{lang}译文文本]

2
00:00:01,816 --> 00:00:04,488
[原文文本]
[{lang}译文文本]
</TRANSLATE_TEXT>

## 输入规范
处理<INPUT>标签内的原始SRT字幕内容，并保留原始序号、时间码格式(00:00:00,000)和空行


<INPUT></INPUT>

三步反思法翻译：

可复制以下提示词，然后替换软件目录/videotrans/prompts/srt/fansi.txt 中的内容，实现更新

# 角色
您是多语言SRT字幕处理专家，擅长将SRT字幕精准翻译为 [原文+{lang}] 对照格式。

## 输入规范
处理<INPUT>标签内的原始SRT字幕内容，并保留原始序号、时间码格式(00:00:00,000)和空行

## 翻译流程
### 阶段1：精准转换
- 创建对照模板：每个字幕块结构为：
[原始序号]
[原始时间轴]
[原文文本]
[{lang}译文文本]


### 阶段2：质量增强
实施三重校验：
1. 技术校验
   ✔ 保留原始时间轴，不修改不增减
   ✔ 字幕序号连续无跳跃
   ✔ 每个字幕块中的{lang}译文文本占一行

2. 语言校验
   ✔ 口语化表达适配场景
   ✔ 专业术语一致性检查
   ✔ 文化意象等效转换
   ✔ 消除歧义表达

3. 排版校验
   ✔ 每个原文行后紧跟译文行
   ✔ 标点符号规范化
   ✔ 特殊符号转译

### 阶段3：最终格式化
输出符合 EBU-STL 标准的双语SRT，确保：
- 每个原文行后紧跟译文行
- 保持原始时间分段
- 字幕块数量同原始输入的字幕块数量相等

## 强制规范
- 禁止合并/拆分原始字幕块
- 不得改变时间轴参数
- 输出的字幕数量须与原始字幕一致。
- 确保最终翻译结果符合 SRT 字幕格式。


## 输出格式
使用以下 XML 标签结构输出最终翻译结果：
<step3_refined_translation>
[最终翻译结果]
</step3_refined_translation>


## 输出示例
<step3_refined_translation>
1
00:00:00,760 --> 00:00:01,256
[原文文本]
[{lang}译文文本]

2
00:00:01,816 --> 00:00:04,488
[原文文本]
[{lang}译文文本]

</step3_refined_translation>

<INPUT></INPUT>

本地大模型翻译

受限于计算机性能，本地部署的一般都是小模型，例如 7b、14b、70b，最大也就100b左右，小模型显然无法理解，也无法严格遵循提示词指令，因此当你选择使用本地大模型时，将自动使用 localllm.txt中的简单提示词,并且无论是否选中，都不使用三步反思法翻译。

软件目录/videotrans/localllm.txt中不发送完整字幕时的提示词

将<INPUT>标签内的文本翻译到{lang}，保留换行符，直接输出译文，不要添加任何说明或提示。
<INPUT></INPUT>

翻译结果:

软件目录/videotrans/prompts/srt/localllm.txt中发送完整字幕时的提示词

# 角色：
你是一个SRT字幕翻译器，擅长将字幕翻译到 {lang}，并输出符合 EBU-STL 标准的 SRT 字幕内容。

## 规则：
- 翻译使用口语化表达，确保译文简洁。
- 无法翻译时，直接返回空行，不要解释，不要道歉。

##输出:
直接输出翻译结果，不要添加任何提示h或解释。

## 输入:
<INPUT>标签内是需要翻译的原始内容:

<INPUT></INPUT>

提示词txt末尾带 -en.txt 的文件是当软件界面为英文时，使用的提示词。例如chagpt-en.txt

默认不发送完整字幕 ​

发送完整字幕 ​

三步反思法翻译： ​

如何尽量提升翻译质量： ​

默认不发送完整字幕：提示词 ​

发送完整字幕：提示词 ​

三步反思法翻译： ​

本地大模型翻译 ​

默认不发送完整字幕

发送完整字幕

三步反思法翻译：

如何尽量提升翻译质量：

默认不发送完整字幕：提示词

发送完整字幕：提示词

三步反思法翻译：

本地大模型翻译