BAAI
/

bge-large-en-v1.5

@@ -2909,6 +2909,13 @@ async def main():
 asyncio.run(main())
 ```
 ### Usage for Reranker
 Different from embedding model, reranker uses question and document as input and directly output similarity instead of embedding.

 asyncio.run(main())
 ```
+for a docker based deployment with infinity:
+```bash
+docker run --gpus all -v $PWD/data:/app/.cache -e HF_TOKEN=$HF_TOKEN -p "7997":"7997" \
+michaelf34/infinity:0.0.68 \
+v2 --model-id BAAI/bge-large-en-v1.5 --revision "main" --dtype float16 --batch-size 32 --engine torch --port 7997
+```
 ### Usage for Reranker
 Different from embedding model, reranker uses question and document as input and directly output similarity instead of embedding.