ライブカメラ入力で FastVLM のリアルタイムビジョン機能を体験してください。このデモは即座の視覚理解とキャプション生成を提供します。
このデモはリアルタイムの視覚理解とキャプション生成のためにライブカメラアクセスでブラウザで直接 FastVLM を実行します。
このインタラクティブデモは、デバイスのカメラを使用した FastVLM のリアルタイムビジョン言語機能を紹介します。モデルはライブビデオフィードを処理して即座の視覚理解とキャプション生成を提供します。デモが正常に機能するにはカメラアクセスが必要です。デモは WebGPU を使用して推論を高速化し、スムーズなリアルタイムパフォーマンスを保証します。
このデモはライブビデオキャプション生成のためにデバイスのカメラへのアクセスが必要です。プロンプトが表示されたらカメラ権限を許可してください。