Découvrez les capacités de vision en temps réel de FastVLM avec entrée caméra en direct. Cette démo fournit une compréhension visuelle instantanée et un sous-titrage.
Cette démo exécute FastVLM directement dans votre navigateur avec accès caméra en direct pour la compréhension visuelle et le sous-titrage en temps réel.
Cette démo interactive présente les capacités vision-langage en temps réel de FastVLM utilisant la caméra de votre appareil. Le modèle traite le flux vidéo en direct pour fournir une compréhension visuelle instantanée et un sous-titrage. L'accès à la caméra est requis pour que la démo fonctionne correctement. La démo utilise WebGPU pour l'inférence accélérée, garantissant des performances fluides en temps réel.
Cette démo nécessite l'accès à la caméra de votre appareil pour le sous-titrage vidéo en direct. Veuillez autoriser les permissions caméra lorsque demandé.