smol-256 / test_handler_local.py
swarecito's picture
Upload folder using huggingface_hub
0666409 verified
import base64
import os
import sys
# Ajoutez le chemin du dossier parent pour que Python puisse trouver handler.py
sys.path.insert(0, os.path.abspath(os.path.join(os.path.dirname(__file__))))
from handler import EndpointHandler # Assurez-vous que handler.py est dans le même dossier ou dans le PYTHONPATH
# --- Configuration pour le test local ---
# Le chemin vers le modèle n'est pas utilisé par notre handler car il charge le modèle par son ID
# Mais l'EndpointHandler attend un argument `path`.
# Pour le test local, on peut passer une chaîne vide ou un point.
MODEL_PATH_FOR_HANDLER = "."
# Chemin vers votre vidéo de test
# Assurez-vous que ce chemin est correct par rapport à l'endroit où vous exécutez ce script
VIDEO_FILE_PATH = "../../static/video-test.mp4" # Ajustez ce chemin si nécessaire
# --- Initialisation du handler ---
print("Initialisation du EndpointHandler...")
# Pour le test local, le token n'est pas nécessaire car le modèle est chargé depuis le Hub public.
# Si votre modèle était privé, vous devriez définir os.environ["HUGGING_FACE_HUB_TOKEN"] = "votre_token"
handler = EndpointHandler(path=MODEL_PATH_FOR_HANDLER)
print("EndpointHandler initialisé.")
# --- Préparation du payload (simule l'entrée de l'API) ---
print(f"Lecture de la vidéo de test: {VIDEO_FILE_PATH}")
try:
with open(VIDEO_FILE_PATH, "rb") as f:
video_bytes = f.read()
encoded_video = base64.b64encode(video_bytes).decode("utf-8")
except FileNotFoundError:
print(f"Erreur: Le fichier vidéo {VIDEO_FILE_PATH} n'a pas été trouvé.")
exit()
# Le payload doit correspondre à ce que votre handler.__call__ attend
# C'est-à-dire un dictionnaire avec une clé "inputs" qui contient une liste de messages
# et le contenu vidéo encodé en base64 sous la clé "data".
payload = {
"inputs": [
{
"role": "user",
"content": [
{"type": "text", "text": "Describe this video in detail"},
{"type": "video", "data": encoded_video} # Ici, on passe la vidéo encodée
]
}
],
"parameters": {
"max_new_tokens": 128 # Paramètres d'inférence optionnels
}
}
# --- Exécution de l'inférence ---
print("Lancement de l'inférence locale (cela peut prendre du temps)...")
try:
result = handler(payload)
print("\n--- Résultat de l'inférence ---")
print(result)
except Exception as e:
print(f"\nErreur lors de l'inférence: {e}")