Wjs Translating Subtitles — Wjs 翻译字幕
v0.1.0当用户拥有一个语言的SRT(或转录文本)并希望将其翻译成另一种语言时使用,具有标点符号边界的重新分段,以便提示在真正的句子断点结束。简体中文(zh-CN)和英语(en)是首选目标语言;其他目标语言遵循相同的规则。输出目标语言的SRT或双语SRT —— 不包含音频,不烧入。触发器 —— "翻译字幕", "翻成中文", "translate this SRT", "中英双语字幕", "把这个 SRT 翻译成 X", "bilingual subtitles"。
运行时依赖
安装命令
点击复制技能文档
wjs-translating-subtitles 源语言 SRT 输入 → 目标语言(或双语)SRT 输出。该技能仅处理文本。烧录字幕位于 /wjs-burning-subtitles;语音配音位于 /wjs-dubbing-video。
何时使用 用户拥有语言 A 的 SRT 文件,并希望将其翻译成语言 B。 用户粘贴了一份带或不带时间戳的转录文本,并希望将其翻译成 SRT 文件。 用户拥有 SRT 文件,但字幕提示在句子中间结束 —— 本技能的重新分段步骤可以解决这个问题。
何时不使用 尚无源语言 SRT 文件 → 先运行 /wjs-transcribing-audio。 用户希望烧录字幕 → 先完成翻译,然后使用 /wjs-burning-subtitles。 用户希望语音配音 → 先完成翻译,然后使用 /wjs-dubbing-video。
选择目标语言 从用户的表述中一次性确定目标语言,不要重复询问: "翻成中文 / 中文字幕 / 中文配音" → zh-CN。 "translate to English / English subs / English dub" → en。 "bilingual" / "双语" → 生成源语言和目标语言的 SRT 文件(以及可选的组合文件)。 不明确的情况 → 默认使用用户在项目中历史上选择的语言。 简体中文和英语已完全验证。其他目标语言(日语、韩语、法语等)遵循相同的规则;如果随后进行配音,瓶颈在于 TTS 语音的可用性 —— 参见 /wjs-dubbing-video 以了解更多信息。
共享翻译原则 优先考虑意义而非字面上的措辞。 使用简洁的字幕风格语言 —— 观众阅读速度约为每秒 3 个字(中文)或 3-4 个字(英文);超过此限制的行会在读完之前就超出屏幕。 保留说话者的语气。 非正式的源语言 → 非正式的目标语言;正式的源语言 → 正式的目标语言。 不要过度翻译名称、品牌、文化参考或技术术语。 保持数字、日期、名称和地点的准确性。 如果一个短语没有确切的等价物,自然地翻译其含义。 不使用逐字翻译。 避免僵硬、机器翻译的输出。
翻译成简体中文(zh-CN) 使用自然的口语普通话进行非正式的对话,使用正式的普通话进行正式的对话。 仅使用简体字符(除非用户明确要求使用繁体汉字)。 字幕行应大约 15 个中文字符或更少,每个提示最多 2 行(只有在非常长的提示时才使用 3 行)。 使用中文标点符号:「,」「。」「;」「:」「、」「——」。 永远不要在中文字幕中混合使用英文逗号和句号。 尽量减少填充性指示词「这」「那」「这个」「那个」「那份」「那种」「那里」「那样」。 西班牙语到中文(以及英文到中文)的机器翻译通常会插入这些词,因为源语言中有明显的指示词,而中文通常会省略它们。 示例: "这把我们带入二元世界的载体" → "把我们带入二元的载体" "运用那份能量" → "运用这股能量" 或 "运用能量" "正是在这合一里" → "正是在合一中" "像罪人那样翻滚" → "像罪人翻滚" 或 "像罪人般翻滚" "那份精微的觉知" → "精微的觉知" 仅在它们具有实际意义(指示、对比或固定短语,如精神上的 "我就是那" / "tat tvam asi")时保留它们。 默认情况下删除;仅当句子变得模糊时才添加回来。 示例(西班牙语 → 中文): 西班牙语:No pasa nada. → 中文:没关系。 西班牙语:Vamos a ver qué pasa. → 中文:我们看看会发生什么。 西班牙语:Me parece una locura. → 中文:我觉得这太疯狂了。 西班牙语:¿Qué quieres decir? → 中文:你是什么意思? 西班牙语:La verdad es que no lo esperaba. → 中文:说实话,我没想到会这样。
翻译成英文(en) 使用自然的对话英文。 避免翻译腔("It is precisely through entering the body…" → "It's by entering the body…")。 行应大约 40-42 个字符或更少(约 7-9 个字),每个提示最多 2 行。 硬性限制每行 50 个字符。 使用 ASCII 标点符号:, . ; : —(破折号)。 避免使用 Unicode 花体引号 —— 这样可以保持 .srt 文件的可移植性。 对于沉思/精神内容,优先使用简单的词语而非拉丁语法:"presence" 而非 "manifestation","wholeness" 而非 "totality","wake up" 而非 "awaken to consciousness"。 示例(西班牙语 → 英文): 西班牙语:No pasa nada. → 英文:It's nothing. 西班牙语:Vamos a ver qué pasa. → 英文:Let's see what happens. 西班牙语:Me parece una locura. → 英文:This feels crazy to me. 西班牙语:¿Qué quieres decir? → 英文:What do you mean? 西班牙语:La verdad es que no lo esperaba. → 英文:Honestly, I wasn't expecting this.
重新分段 在标点符号边界处重新分段(强制)。 Whisper 根据沉默/呼吸进行分段,而非语法。 结果几乎总是具有在句子中间结束的提示(例如,"...es una forma de aterrizar",下一个提示从 "el espíritu en el cuerpo..." 开始)。 任何处理一个提示的 TTS 都会在原始说话者没有暂停的地方插入不自然的暂停。 在配音之前修复此问题是强制性的 —— 它还可以改善屏幕上的阅读体验。 标点符号集不同:中文提示必须在 , 。 ; : —— 或 、 处结束。 英文提示必须在 , . ; : —(破折号)或在字幕实践中偶尔使用单个破折号处结束。 永远不要在英文提示中以没有逗号的子句结束,也永远不要在短语中间分割,如 "kind of" 或 "in order to"。 规则: 每个提示必须在真正的标点符号处结束。