In Entwicklung

VisionFlux

Multimodales visuelles Verständnis — vollständig auf deinem Gerät.

Richte die Kamera auf alles — ein Dokument, eine fremdsprachige Speisekarte, ein komplexes Diagramm — und VisionFlux beschreibt, fasst zusammen oder übersetzt es, ohne ein einziges Pixel hochzuladen.

  • Dokumenten-Scan
  • Reale Q&A
  • Barrierefreie Beschreibung
  • Feldforschung
  • Local VLM
  • Quantized vision encoder
  • PaddleOCR-class engine

Sei einer der Ersten, die das Nächste testen.

Abonniere unseren Newsletter für Releases, technische Tiefenanalysen und Early Access.