라이브 카메라 입력으로 FastVLM의 실시간 비전 기능을 체험해보세요. 이 데모는 즉각적인 시각적 이해와 캡션 생성을 제공합니다.
이 데모는 실시간 시각적 이해와 캡션 생성을 위해 라이브 카메라 액세스로 브라우저에서 직접 FastVLM을 실행합니다.
이 인터랙티브 데모는 기기의 카메라를 사용한 FastVLM의 실시간 비전-언어 기능을 보여줍니다. 모델은 라이브 비디오 피드를 처리하여 즉각적인 시각적 이해와 캡션 생성을 제공합니다. 데모가 제대로 작동하려면 카메라 액세스가 필요합니다. 데모는 WebGPU를 사용하여 추론을 가속화하고 부드러운 실시간 성능을 보장합니다.
이 데모는 라이브 비디오 캡션 생성을 위해 기기의 카메라에 대한 액세스가 필요합니다. 프롬프트가 표시되면 카메라 권한을 허용해 주세요.