常见问题
通用排查:按 F12 打开浏览器开发者工具,切换到“网络”(Network)查看请求的 Response 详情,绝大多数报错都能在此定位。
翻译结果为空、仅显示原文、null 怎么办?
常见原因:
- 配置错误:API Key 未生效,或翻译接口参数填写不完整;
- 额度/速率受限:账号 Credits 已耗尽,或速率过高被接口暂时限制;
- 缓存命中原文:缓存中过往的原文被直接返回;
- 网络受限:所选接口(如 OpenAI、Gemini、Claude 等)在当前地区受限,或代理/网络异常导致请求失败。
✅ 排查顺序:
- 核对 API Key 与接口设置;
- 查看账户额度、速率限制及 429 报错;
- 关闭或清空翻译缓存后重试;
- 确认网络环境支持所用接口。
- 打开浏览器开发者工具并查看接口返回:按 F12(或 Ctrl+Shift+I)→ 切到 Network/网络 → 重新点一次“翻译” → 点开最新的翻译请求,查看 Status(如 401/429/5xx)和 Response/Preview 里的报错信息。
若只少量语句未译,可直接再次点击“翻译”;缓存会跳过已完成内容,不会重复扣费。
本地模型提示跨域或连不上?
使用 Ollama、LM Studio 等本地模型时,常见失败原因是浏览器 CORS 或广告拦截:
- 先临时关闭广告/隐私扩展并刷新;
- 根据 翻译接口指南 启用本地服务的 CORS(如设置
OLLAMA_ORIGINS=*、在 LM Studio 勾选 Enable CORS); - 若仍失败,检查端口占用,并在 Network 面板查看返回状态码。公司/校园网络还需确认防火墙未拦截本地端口。
用 Ollama 跑 translategemma 模型,速度很慢/漏译怎么办?
多半是把 translategemma 当成普通 LLM 来配置了:选了「Custom (OpenAI-compatible)」+ 填 translategemma-4b-it 之类的模型名。这条路径走的是带批次/上下文标记的 LLM 通用流程,14B 以下的小模型很难稳定还原 prompt 里的结构,容易漏行、跑得也慢。
✅ 正确做法:在服务下拉里直接选「TranslateGemma」,它走的是专门的逐行调用,匹配 Gemma 翻译模型的输入输出格式,对本地小模型最稳定。详见 翻译接口指南 → TranslateGemma。
翻译速度为什么慢?
最快的提速办法:把"并发行数"调大——在当前服务默认值的基础上加 50%-100%,遇到 429 报错立即调小。其他建议:
- 开缓存:相同内容不会重复翻译(默认已开)
- 开上下文:仅 AI 模型——连贯性更好,吞吐更高
- 用更快的服务:免费 GTX 比本地小模型快得多;付费 DeepL 比 Claude Opus 快得多
- 本地小模型(<14B)反而要关上下文:开启"上下文感知翻译"会让本地模型频繁漏行;关掉后改成逐行并发,反而又快又稳
各服务默认并发不同,详见 功能说明 → 并发行数。
翻译失败会自动重试吗?哪些错误不重试?
会重试。网络抖动、429 限流、5xx 服务端错误会按"重试次数"自动重试。失败的行会回填原文(不留空),结果区顶部出现红色面板可以一键重试。
以下错误不会自动重试——重试改变不了结果:
- API Key 错(401 / 403):先去设置里改 Key
- 超时:调大"超时(秒)",或换更快的服务
- 文本太长(context length exceeded):拆文件,或降低"上下文行数"
- token 截断(max_tokens reached):拆文件,或关掉 maxTokens 上限
完整机制见 功能说明 → 失败行重发。
AI 翻译质量不理想怎么办?
- 先恢复默认:在“翻译设置”中重置,再用小段文本复测;
- 再调温度:
- 0~0.3:术语严谨、需要稳定;
- 0.4~0.7:通用场景;
- 0.8~1.0:允许意译/更有创造性。
- 开启上下文关联翻译,提升对话连贯性。
大多数 70B+ 在线主流模型的基础翻译能力没问题,输出异常通常与温度或提示词设置有关。
为什么要用第三方接口访问 DeepL?
DeepL 官方禁止直接在网页里调用 API,因此需要一个中转通道代发请求。该通道仅用于转发,不会记录你的数据;如需极致稳定性,可自行搭建专属代理。
API Key 会被保存吗?
不会。API Key 与所有设置都只存储在本地浏览器,任何服务器都无法读取。
为什么默认不启用 GTX Web?
GTX Web 会给共享服务带来较大压力,所以默认关闭。若在本地自用,可手动开启;开启全局代理或网络不稳时可能导致请求异常。

