研发中

VisionFlux

多模态视觉理解——完全在你的设备上。

把摄像头对准任何东西——一页文档、一份外文菜单、一张复杂示意图——VisionFlux 描述、摘要或翻译它,连一个像素都不上传。

  • 文档扫描
  • 现实问答
  • 无障碍解说
  • 田野研究
  • Local VLM
  • Quantized vision encoder
  • PaddleOCR-class engine

抢先体验 我们的下一款产品。

加入我们的发布名单,第一时间获取产品上线、技术深度文章与抢先体验资格。