Qwen
/

Qwen3-Embedding-0.6B

@@ -157,7 +157,8 @@ batch_dict = tokenizer(
     return_tensors="pt",
 )
 batch_dict.to(model.device)
-outputs = model(**batch_dict)
 embeddings = last_token_pool(outputs.last_hidden_state, batch_dict['attention_mask'])
 # normalize embeddings

     return_tensors="pt",
 )
 batch_dict.to(model.device)
+with torch.no_grad():
+    outputs = model(**batch_dict)
 embeddings = last_token_pool(outputs.last_hidden_state, batch_dict['attention_mask'])
 # normalize embeddings