透過即時攝影機輸入體驗 FastVLM 的視覺能力。此演示提供即時的視覺理解和字幕生成。
此演示透過即時攝影機存取直接在您的瀏覽器中執行 FastVLM,實現即時視覺理解和字幕生成。
這個互動式演示展示了 FastVLM 使用您裝置攝影機的即時視覺語言能力。模型處理即時視訊串流以提供即時的視覺理解和字幕生成。演示需要攝影機存取權限才能正常運作。演示使用 WebGPU 進行加速推理,確保流暢的即時效能。
此演示需要存取您裝置的攝影機以進行即時視訊字幕生成。請在提示時允許攝影機權限。