交互式演示

通过实时摄像头输入体验 FastVLM 的视觉能力。此演示提供即时的视觉理解和字幕生成。

FastVLM 实时摄像头演示

此演示通过实时摄像头访问直接在您的浏览器中运行 FastVLM,实现实时视觉理解和字幕生成。

关于此演示

这个交互式演示展示了 FastVLM 使用您设备摄像头的实时视觉语言能力。模型处理实时视频流以提供即时的视觉理解和字幕生成。演示需要摄像头访问权限才能正常工作。演示使用 WebGPU 进行加速推理,确保流畅的实时性能。

需要摄像头访问权限

此演示需要访问您设备的摄像头以进行实时视频字幕生成。请在提示时允许摄像头权限。

摄像头问题故障排除

  • 检查浏览器设置中是否阻止了摄像头权限
  • 尝试刷新页面并在提示时允许访问
  • 确保没有其他应用程序正在使用您的摄像头
  • 如果问题持续存在,请尝试使用不同的浏览器或设备
  • 确保您的设备有可正常工作的摄像头