Em desenvolvimento
VisionFlux
Compreensão visual multimodal — totalmente no seu dispositivo.
Aponte a câmera para qualquer coisa — um documento, um cardápio em língua estrangeira, um diagrama complexo — e o VisionFlux descreve, resume ou traduz sem enviar um único pixel.
- Digitalização de documentos
- Q&A do mundo real
- Narração de acessibilidade
- Pesquisa de campo
- Local VLM
- Quantized vision encoder
- PaddleOCR-class engine
Seja o primeiro a experimentar o que vem por aí.
Assine nossa newsletter para lançamentos, análises técnicas e acesso antecipado.