工程发布于 2026-01-22·约 7 分钟阅读

TranslateFlux：构建一个私密的离线通用翻译器

关于翻译时延、质量，以及让小模型在感受上贴近大型云模型的工程技巧。

问题

云翻译很优秀、很快、免费——直到你在飞机上、在没有漫游的他国、在不允许把音频带出场地的医院，或者你只是不太想把对话流式上传给第三方。

TranslateFlux 是我们的回答：一个完全端侧的翻译器，覆盖文本、语音、图像，专攻人们真正需要的语种。

1–3B 参数、采用 MoE 风格或蒸馏的翻译模型，在 4-bit 量化下，对前 50 个语种对的质量上限已经惊人地接近云端在位者。剩余差距在长篇、高上下文翻译——那种需要前文 2-3 段做支撑的——我们可以用对你自己历史翻译的检索来补上大半。

两个工程技巧能让小模型"感觉很大"：

语音翻译的预算是从话音终止到响应起始 600 ms。我们的拆分：

总和：紧，但已交互。主观上 600 ms 的间隙像一个稍有礼貌的人——云翻译加上网络之后，常常也低不到 350 ms。

这份坦率是 TranslateFlux 想给你的感觉的一部分。

想第一时间收到这样的更新？

没有邮件平台，没有追踪。每次产品发布，我们只发一封邮件。