開発中

VisionFlux

マルチモーダルな視覚理解——完全にあなたのデバイス上で。

カメラを何にでも向けてください——文書、外国語メニュー、複雑な図——VisionFluxはピクセル1つアップロードせずに説明・要約・翻訳します。

  • 文書スキャン
  • 現実世界のQ&A
  • アクセシビリティ解説
  • フィールドリサーチ
  • Local VLM
  • Quantized vision encoder
  • PaddleOCR-class engine

次のリリースを 誰よりも早く。

ニュースレターで最新情報、技術記事、早期アクセスをお届けします。