alvarobartt
/

Magma-8B

Image-Text-to-Text

text-generation

Model card Files Files and versions

alvarobartt HF Staff commited on May 8

Commit

cb5f6e9

·

verified ·

1 Parent(s): 0aea239

Update handler.py

Files changed (1) hide show

handler.py +4 -1

handler.py CHANGED Viewed

@@ -70,7 +70,8 @@ class EndpointHandler:
         inputs = self.processor(images=images, texts=prompt, return_tensors="pt")
         inputs["pixel_values"] = inputs["pixel_values"].unsqueeze(0)
         inputs["image_sizes"] = inputs["image_sizes"].unsqueeze(0)
-        inputs.to("cuda").to(torch.bfloat16)
         generation_args = {
             "max_new_tokens": data.get("max_new_tokens", data.get("max_tokens", 128)),
@@ -82,7 +83,9 @@ class EndpointHandler:
         logger.info(f"Running text generation with the following {generation_args=}")
         with torch.inference_mode():
             generate_ids = self.model.generate(**inputs, **generation_args)
         logger.info(f"Generated {generate_ids=}")
         generate_ids = generate_ids[:, inputs["input_ids"].shape[-1] :]

         inputs = self.processor(images=images, texts=prompt, return_tensors="pt")
         inputs["pixel_values"] = inputs["pixel_values"].unsqueeze(0)
         inputs["image_sizes"] = inputs["image_sizes"].unsqueeze(0)
+        inputs = inputs.to("cuda").to(torch.bfloat16)
+        logger.info(f"Inputs contains {inputs=}")
         generation_args = {
             "max_new_tokens": data.get("max_new_tokens", data.get("max_tokens", 128)),
         logger.info(f"Running text generation with the following {generation_args=}")
         with torch.inference_mode():
+            logger.info(f"Inputs contains {inputs['input_ids']=}")
             generate_ids = self.model.generate(**inputs, **generation_args)
+            logger.info(f"Generate IDs contains {generate_ids=}")
         logger.info(f"Generated {generate_ids=}")
         generate_ids = generate_ids[:, inputs["input_ids"].shape[-1] :]