高质量翻译模式
高质量翻译模式是 Saber Translator 最有代表性的差异化功能之一。它使用**多模态 AI 模型(VLM)**直接理解漫画图片,让模型在看到画面的前提下完成翻译,因此相比普通翻译模式,结果通常更自然、更连贯,也更容易贴合人物语气和剧情上下文。
核心原理
高质量翻译与普通翻译的关键区别在于输入内容不同:
- 普通翻译:主要把 OCR 识别出的文字发送给模型
- 高质量翻译:把图片 + 原文文本一起发送给多模态模型
因此,高质量翻译更容易做到:
- 理解角色表情、动作和场景氛围
- 判断多人对话中的说话关系
- 结合视觉上下文消除歧义
- 保持多页之间的剧情和语气连贯性
与普通翻译的区别
| 对比项 | 普通翻译 | 高质量翻译 |
|---|---|---|
| 输入内容 | 主要是文字 | 图片 + 文字 |
| 模型类型 | 文本模型 | 多模态视觉模型 |
| 处理方式 | 单页 / 批量文本翻译 | 批量上下文识图翻译 |
| 翻译质量 | 标准 | 更高 |
| 处理速度 | 较快 | 较慢 |
| 成本 | 较低 | 较高 |
使用方法
步骤一:配置多模态模型

高质量翻译必须使用支持图片输入的多模态模型(详见 模型类型说明):
- 打开翻译页顶部设置
- 进入“高质量翻译”配置页签
- 选择支持视觉能力的服务商和模型
- 填写 API Key(参考 如何获取 API Key)
注意
如果模型不支持图片输入,高质量翻译将无法正常运行。
步骤二:准备图片或章节

您可以:
- 直接在翻译页上传图片,使用快速翻译模式
- 从书架系统进入章节,使用书架模式
如果您从书架模式进入:
- 可自动加载历史会话
- 可使用术语表/禁翻表
- 更适合长篇或需要持续维护的项目
步骤三:选择“高质量翻译”操作模式
在翻译页左侧底部的操作模式中选择“高质量翻译”。
此时可配合以下能力一起使用:
- 指定翻译页码:只处理部分页面
- 记住操作模式:下次进入时保留上次选择
- 书籍约束:在书架模式下让术语表和禁翻表一并参与流程
步骤四:启动高质量翻译

点击启动按钮后,系统通常会按以下顺序执行:
- 文字检测:识别当前页面中的文本区域
- 文字消除 / 背景准备:为后续渲染准备干净底图
- OCR 识别:整理原文文本
- 分批打包:按批量大小把多页图片和文本一起发送给多模态模型
- AI 识图翻译:模型结合画面和文本生成译文
- 结果回填与重渲染:把译文渲染回对应图片
提示
高质量翻译并不是“只把图片直接扔给模型”。在前后仍会结合检测、OCR、渲染等流程,因此前置设置同样会影响最终效果。
高级选项
批量大小
控制每次发送给 AI 的图片数量:
- 较小值(1-2):更稳定,适合复杂页面
- 较大值(3-5):更高效,适合对话较简单的章节
会话重置频率
控制何时重置 AI 对话上下文:
- 设置为 N 表示每 N 个批次重置一次
- 适当重置可避免上下文过长影响稳定性
流式输出
开启后:
- 可减少长请求超时的风险
- 可在运行过程中看到模型持续返回内容
- 更适合长章节或响应较慢的服务商
取消思考
对于支持推理的模型:
- 开启后会尽量跳过思考过程
- 可加快速度并降低额外消耗
- 如果服务商或模型不支持该参数,应关闭此选项
强制 JSON 输出
确保 AI 返回格式正确的结构化结果:
- 提高解析成功率
- 能减少格式跑偏导致的失败
- 需要服务商支持相应能力
使用场景
适合使用高质量翻译
- 重要作品:希望尽量接近精翻效果
- 复杂场景:需要结合画面才能判断语气和含义
- 多人对话:需要更强的上下文理解
- 角色关系明确的长篇:更看重前后连贯性
更适合使用普通翻译
- 快速预览剧情
- 日常简单对话
- 成本敏感
- 想先做一版初稿,后续再校对或编辑
使用建议
与书架模式配合
如果是正式项目,推荐优先从书架章节进入,再使用高质量翻译:
- 便于保存进度
- 可以让术语表、禁翻表参与翻译
- 更适合后续继续 AI 校对和编辑
推荐流程
text
书架章节 → 高质量翻译 → AI 校对(可选)→ 编辑模式微调 → 完成什么时候先少量测试
建议先用几页测试以下内容:
- 模型是否真的支持视觉输入
- 批量大小是否合适
- 是否需要开启流式输出
- 提示词和术语约束是否满足预期
确认效果后再跑整章,通常更稳。
