返回产品列表

研发中

VisionFlux

多模态视觉理解——完全在你的设备上。

把摄像头对准任何东西——一页文档、一份外文菜单、一张复杂示意图——VisionFlux 描述、摘要或翻译它，连一个像素都不上传。

文档扫描
现实问答
无障碍解说
田野研究

发布提醒查看全部产品

Local VLM
Quantized vision encoder
PaddleOCR-class engine

抢先体验我们的下一款产品。

加入我们的发布名单，第一时间获取产品上线、技术深度文章与抢先体验资格。