In Entwicklung
VisionFlux
Multimodales visuelles Verständnis — vollständig auf deinem Gerät.
Richte die Kamera auf alles — ein Dokument, eine fremdsprachige Speisekarte, ein komplexes Diagramm — und VisionFlux beschreibt, fasst zusammen oder übersetzt es, ohne ein einziges Pixel hochzuladen.
- Dokumenten-Scan
- Reale Q&A
- Barrierefreie Beschreibung
- Feldforschung
- Local VLM
- Quantized vision encoder
- PaddleOCR-class engine
Sei einer der Ersten, die das Nächste testen.
Abonniere unseren Newsletter für Releases, technische Tiefenanalysen und Early Access.