IngenieríaPublicado el 2026-01-18·8 min de lectura

CodeFlux: un programador par offline que respeta tu repositorio

Un modelo de código clase 7B corriendo localmente con retrieval consciente del proyecto. Por qué un modelo más pequeño con el contexto correcto vence a uno más grande sin él.

La tesis

Un modelo de código clase 7B, corriendo localmente y con la rebanada correcta de tu repositorio como contexto, es más útil que un modelo cloud de frontera que no tiene idea de cómo luce tu código.

No es una afirmación sobre puntajes de benchmark. Es una afirmación sobre completions que de hecho aceptas. CodeFlux está construido sobre esa tesis.

Arquitectura

Tres componentes on-device cooperando:

El modelo. Un modelo de código 7B cuantizado (evaluamos Qwen-2.5-Coder, DeepSeek-Coder-V2-Lite y derivados de StarCoder2; la variante 4-bit más rápida que podamos enviar para cada plataforma). Inferencia vía MLX en Apple silicon, llama.cpp en PC y Linux, ONNX Runtime en Windows ARM.
Un índice del repo. Un índice vectorial local de tu repositorio, refrescado al guardar. Embebimos en tres granularidades: archivo, símbolo, rango de líneas. El índice es un único archivo SQLite dentro de .codeflux/ en tu repo.
Una capa de retrieval. Cuando escribes, miramos el código alrededor, los imports del archivo, los símbolos cercanos; traemos los top-K otros archivos más relevantes; los empalmamos en el prompt; vamos.

Por qué local para código

Tu repo es lo más sensible que posees. El único modelo que debería ver todo es uno corriendo dentro de tu máquina.
Tu código es además el input más idiomático que el modelo recibirá. Los modelos cloud normalizan hacia el estilo medio de GitHub; un modelo local condicionado a tu repo escribe código que encaja.
La latencia en completion inline importa a nivel de pocos cientos de milisegundos. Un round-trip a la nube es un impuesto que pagas en cada tecla.

Lo que CodeFlux hace hoy

Completion inline con cancelación: mientras sigues escribiendo, las inferencias en vuelo se cancelan y reinician. El modelo nunca bloquea el editor.
Chat basado en el repo. Pregunta "¿dónde está el middleware de auth?" y CodeFlux retrieve los archivos relevantes y responde — citando números de línea.
Ediciones sobre selección. Resalta una función, pide refactor, y aparece el diff como una experiencia normal de review. Aplica, descarta o edita.
Tests on-demand. "Genera tests para este archivo" produce un archivo candidato en el framework de testing existente, con imports correctamente resueltos.

Lo que CodeFlux no hace

Sin agentes autónomos. No hay un agente de coding largo que tome acciones en tu repo sin tu revisión. Reconsideraremos cuando la confiabilidad lo merezca.
Sin telemetría sobre lo que preguntas o lo que sugerimos. Ninguna. La tentación más dura en una herramienta de dev, y la que más comprometidos estamos a rechazar.
Sin dependencia de la nube en ninguna feature. Una caída de red no degrada nada.

Limitaciones honestas

Un modelo de código 7B no igualará a uno frontera de 200B+ en los refactors más pesados de razonamiento. Te damos una escotilla de un toque para enviar un snippet redactado a un modelo cloud de tu elección. Tu decisión, tu proveedor, tus settings de redacción.
Indexar monorepos muy grandes es lento la primera vez. Mantenemos cache por máquina y enviamos un layout .codeflux/ ignorado por git para que las reaperturas sean instantáneas.

CodeFlux no es el modelo con el puntaje más alto del leaderboard. Es el modelo con la tasa más alta de completion-aceptado en tu código, porque realmente ha leído tu código.

Recibe nuevos artículos

Te avisaremos cuando publiquemos algo nuevo.

CodeFlux: un programador par offline que respeta tu repositorio

La tesis

Arquitectura

Por qué local para código

Lo que CodeFlux hace hoy

Lo que CodeFlux no hace

Limitaciones honestas

Artículos relacionados

Por qué apostamos la empresa por la IA en el dispositivo

Diseñando Flux Engine: un único runtime para todos los productos

WhisperFlux preview: voz, hablantes y resúmenes — todo local