エンジニアリング2026-01-18公開·8分で読めます
CodeFlux:あなたのリポジトリを尊重するオフラインのペアプログラマー
ローカルで動く7BクラスのコードモデルとプロジェクトアウェアなRetrieval。「大きい・文脈なし」より「小さい・適切な文脈」が勝つ理由。
主張
7BクラスのコードモデルをローカルでINSTじ、リポジトリの適切なスライスを文脈として与えると、あなたのコードベースを何も知らないフロンティア級のクラウドモデルより役に立つ。
これはベンチマークスコアの主張ではない。「あなたが実際に受け入れる補完」についての主張だ。CodeFluxはこの主張の上に建てられている。
アーキテクチャ
3つのオンデバイス・コンポーネントが連携する:
- モデル。 量子化された7Bコードモデル(Qwen-2.5-Coder、DeepSeek-Coder-V2-Lite、StarCoder2派生を評価;プラットフォームごとに出荷可能な最速の4ビット変種)。Apple siliconはMLX、PC/LinuxはLlama.cpp、Windows ARMはONNX Runtime。
- リポジトリインデックス。 リポジトリのローカルベクトルインデックス、ファイル保存時に更新。3粒度で埋め込み:ファイル、シンボル、行範囲。インデックスはリポジトリ内
.codeflux/の単一SQLiteファイル。 - Retrievalレイヤ。 あなたが打つと、周辺コード、ファイルのimport、近くのシンボルを見て、top-Kの最関連他ファイルを引き、プロンプトに繋ぎ、走る。
なぜコードはローカルか
- リポジトリはあなたが持つ中で最も機微なもの。それを全部見るに値するモデルは、あなたのマシン内で動くものだけだ。
- あなたのコードはこのモデルが得る最もイディオマティックな入力でもある。クラウドモデルはGitHub平均スタイルに正規化される;あなたのリポに条件付けられたローカルモデルは、あなたに馴染むコードを書く。
- インラインコンプリーションのレイテンシは数百ミリ秒のオーダで効く。クラウド往復は、キーストロークごとに払う税金だ。
CodeFluxが今やること
- キャンセル可能なインラインコンプリーション。 打ち続けると飛行中の推論はキャンセル&再開。モデルがエディタをブロックしない。
- リポ根拠の対話。 「authミドルウェアはどこ?」と聞くと、関連ファイルを取得してから答える——行番号を引用して。
- 選択範囲の編集。 関数をハイライトしてリファクタを依頼、通常のレビュー体験としてdiffが出る。適用・破棄・編集が可能。
- オンデマンドのテスト。 「このファイルのテストを生成して」で、プロジェクト既存のテストフレームワークに沿った候補テストファイルが出る、importは正しく解決される。
CodeFluxがやらないこと
- 自律エージェントなし。 あなたのリポでレビューなしに動作する長時間coding agentは持たない。信頼性がそれに値したら再考する。
- 何を聞いたか/何を提案したかのテレメトリなし。 一切なし。デベロッパーツールで最も抗いがたい誘惑、そして私たちが最も拒否すると決めたもの。
- どの機能もクラウドに依存しない。 ネット切断でも何ひとつ低下しない。
正直な限界
- 7Bコードモデルは最難関の推論重リファクタでは前沿200B+モデルに及ばない。匿名化したスニペットを、あなたが選ぶクラウドモデルに送るワンタップのエスケープを用意する。プロバイダの選択、匿名化設定はあなた。
- 巨大monorepoでは初回インデックスが遅い。マシン別キャッシュを持ち、git-ignoreされた
.codeflux/レイアウトを出荷して再オープンを瞬時にする。
CodeFluxはリーダーボード1位のモデルではない。あなたのコード上で「採用率」が最も高いモデルだ——本当にあなたのコードを読んだから。