工程发布于 2026-01-18·约 8 分钟阅读

CodeFlux：尊重你仓库的离线结对编程伙伴

一个 7B 量级的代码模型本地运行，配上项目感知的检索。为什么\"小模型 + 合适上下文\"会胜过\"大模型 + 无上下文\"。

论点

一个 7B 量级的代码模型，本地运行，并被喂入你仓库里恰当的那一片作为上下文，比一个对你代码库一无所知的前沿云模型更有用。

这不是关于跑分的主张。这是关于"你真的会接受的补全"的主张。CodeFlux 建立在这条论点之上。

三个端侧组件协同工作：

模型。 一个量化的 7B 代码模型（我们评估 Qwen-2.5-Coder、DeepSeek-Coder-V2-Lite 与 StarCoder2 衍生模型；选每个平台上能交付的最快 4-bit 版本）。Apple silicon 上用 MLX，PC/Linux 用 llama.cpp，Windows ARM 用 ONNX Runtime。
仓库索引。 仓库的本地向量索引，文件保存时刷新。我们用三个粒度做嵌入：文件、符号、行区间。索引是仓库里 .codeflux/ 下的单个 SQLite 文件。
检索层。 你打字时，我们看周围代码、文件导入、附近符号，拉取 top-K 最相关的其它文件，拼进提示词，开干。

一个 7B 代码模型，在最难的高强度推理重构上比不过前沿 200B+ 模型。我们给你一键 escape：把一段脱敏的片段发给你选择的云模型。由你决定厂商、由你决定脱敏配置。
在超大 monorepo 上首次索引慢。我们做一个按机器缓存，发布一个 git-ignore 的 .codeflux/ 布局，让二次打开瞬间完成。

CodeFlux 不是榜单第一的模型。它是在你的代码上"被采纳率"最高的模型——因为它真的读过你的代码。

想第一时间收到这样的更新？

没有邮件平台，没有追踪。每次产品发布，我们只发一封邮件。