In Entwicklung

VisionFlux

Multimodales visuelles Verständnis — vollständig auf deinem Gerät.

Richte die Kamera auf alles — ein Dokument, eine fremdsprachige Speisekarte, ein komplexes Diagramm — und VisionFlux beschreibt, fasst zusammen oder übersetzt es, ohne ein einziges Pixel hochzuladen.

Dokumenten-Scan
Reale Q&A
Barrierefreie Beschreibung
Feldforschung

Benachrichtigen Alle Produkte ansehen

Local VLM
Quantized vision encoder
PaddleOCR-class engine

Sei einer der Ersten, die das Nächste testen.

Abonniere unseren Newsletter für Releases, technische Tiefenanalysen und Early Access.