rmtlabs
/

my-kai-model

aferrmt commited on Aug 13

Commit

fc5f491

1 Parent(s): 9b2dfd6

0.5 Adding Docker file and docker compose

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -4,17 +4,21 @@ WORKDIR /app
 RUN apt-get update && apt-get install -y eatmydata && eatmydata apt-get install -y --no-install-recommends build-essential
-# Install Python dependencies
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt
-# Copy application files
 COPY . .
-# Set environment variables
-ENV MODEL_PATH="./kai-model-7.2B-Q4_0.gguf"
-ENV GUARDRAILS_PATH="./config"
 EXPOSE 8000
 CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]

 RUN apt-get update && apt-get install -y eatmydata && eatmydata apt-get install -y --no-install-recommends build-essential
+# Install Python deps first (better caching)
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt
+# Copy app code
 COPY . .
+# Default envs (can override at runtime)
+ENV OPENAI_API_KEY=sk-no-key-needed
+# If you’ll use docker-compose with a llama.cpp service named "llama":
+ENV OPENAI_API_BASE=http://llama:8001/v1
+# Expose FastAPI port
 EXPOSE 8000
+# Run server
 CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]

docker-compose.yml CHANGED Viewed

@@ -1,46 +1,28 @@
-# docker-compose.yml
 services:
-  api:
-    image: kai-api
-    ports:
-      - "8000:8000"
-    command: uvicorn main:app --host 0.0.0.0
-  n8n:
-    image: n8nio/n8n:1.101.1
     ports:
-      - "5678:5678"
-    depends_on:
-      - api
-    environment:
-      - N8N_SECURE_COOKIE=false
-      - N8N_PROTOCOL=http
-      - N8N_ENFORCE_SETTINGS_FILE_PERMISSIONS=false
-      - DB_POSTGRESDB_PASSWORD=dbpass
-      - N8N_OWNER_EMAIL=[email protected]
-      - N8N_OWNER_PASSWORD=yourStrongPassword
-      - N8N_ENCRYPTION_KEY=yourEncryptionKey
-  openweb:
-    image: ghcr.io/open-webui/open-webui:main
-    container_name: open-webui
     ports:
-      - "3000:8080"
-    volumes:
-      - openwebui_data:/app/backend/data
     environment:
-    # Disable multi-user login (optional)
-      - WEBUI_AUTH=False
-      # If you want Open WebUI to hit your FastAPI or n8n endpoints,
-      # you can point it here, e.g.:
-      # - API_BASE_URL=http://fastapi:8000
     depends_on:
-      - api
-      - n8n
-volumes:
-  openwebui_data:
-networks:
-  default:
-    driver: bridge

+version: '3.8'
 services:
+  llama:
+    image: ghcr.io/ggerganov/llama.cpp:server
+    container_name: llama_server
     ports:
+      - "8001:8001"
+    volumes:
+      - ./models:/models:ro
+    command: >
+      --model /models/kai-model-7.2B-Q4_0.gguf
+      --alias kai-model:latest
+      --host 0.0.0.0
+      --port 8001
+      --n_ctx 4096
+      --n_threads 4
+  fastapi:
+    build: .
+    container_name: kai_fastapi
     ports:
+      - "8000:8000"
     environment:
+      OPENAI_API_BASE: "http://llama:8001/v1"
+      OPENAI_API_KEY: "sk-no-key-needed"
     depends_on:
+      - llama