エンジニアリング2026-01-22公開·7分で読めます

TranslateFlux：プライベートでオフラインなユニバーサル翻訳機を作る

翻訳レイテンシと品質、そして小さなモデルを大きなクラウドモデルと競争力ある体験にするエンジニアリングのトリック。

課題

クラウド翻訳は優秀で速く無料だ——飛行機内、ローミングのない外国、音声の持ち出しが違反となる病院、あるいは単に会話を第三者にストリームしたくない人にとって以外は。

TranslateFluxはその答えだ：テキスト・音声・画像を、人々が実際に必要とする言語でカバーする、完全オンデバイスの翻訳機。

1〜3Bパラメータ、MoEスタイルあるいは蒸留した翻訳モデルを4ビット量子化で動かすと、上位50言語ペアでは品質上限がクラウド既存勢に驚くほど近い。残るギャップは長文・高文脈翻訳——前段2〜3パラグラフの支えが要るような——だが、自分の過去翻訳に対する検索で大部分は埋まる。

小モデルを「大きく感じさせる」エンジニアリング技：

音声翻訳では、発話終了から応答開始まで600 msが予算。内訳：

計：タイトだがインタラクティブ。主観的に600 msの間は少し礼儀正しい人くらい——クラウド翻訳もネット込みでは350 msを下回ることは稀。

その正直さも、TranslateFluxの体験の一部だ。

このような更新をメールで受け取りたいですか？

ニュースレターサービスもトラッキングもありません。リリースごとに 1 通だけお届けします。