Text Generation
Transformers
Safetensors
English
Spanish
mistral
mistral-7b
lora
sigma-rules
cybersecurity
text-classification
explainability
english
spanish
conversational
text-generation-inference
Instructions to use daba0118/mistral-7b-instruct-v0.1-rules-sigma with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use daba0118/mistral-7b-instruct-v0.1-rules-sigma with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="daba0118/mistral-7b-instruct-v0.1-rules-sigma") messages = [ {"role": "user", "content": "Who are you?"}, ] pipe(messages)# Load model directly from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("daba0118/mistral-7b-instruct-v0.1-rules-sigma") model = AutoModelForCausalLM.from_pretrained("daba0118/mistral-7b-instruct-v0.1-rules-sigma") messages = [ {"role": "user", "content": "Who are you?"}, ] inputs = tokenizer.apply_chat_template( messages, add_generation_prompt=True, tokenize=True, return_dict=True, return_tensors="pt", ).to(model.device) outputs = model.generate(**inputs, max_new_tokens=40) print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:])) - Notebooks
- Google Colab
- Kaggle
- Local Apps
- vLLM
How to use daba0118/mistral-7b-instruct-v0.1-rules-sigma with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "daba0118/mistral-7b-instruct-v0.1-rules-sigma" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "daba0118/mistral-7b-instruct-v0.1-rules-sigma", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker
docker model run hf.co/daba0118/mistral-7b-instruct-v0.1-rules-sigma
- SGLang
How to use daba0118/mistral-7b-instruct-v0.1-rules-sigma with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "daba0118/mistral-7b-instruct-v0.1-rules-sigma" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "daba0118/mistral-7b-instruct-v0.1-rules-sigma", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "daba0118/mistral-7b-instruct-v0.1-rules-sigma" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "daba0118/mistral-7b-instruct-v0.1-rules-sigma", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }' - Docker Model Runner
How to use daba0118/mistral-7b-instruct-v0.1-rules-sigma with Docker Model Runner:
docker model run hf.co/daba0118/mistral-7b-instruct-v0.1-rules-sigma
Mistral‑7B‑Instruct‑v0.1 — Sigma Rules Classifier & Explainer
Modelo especializado en clasificar y explicar eventos de ciberseguridad según reglas Sigma, entrenado mediante LoRA y fusionado en pesos completos para despliegue directo.
Model Details
Model Description
- Developed by: Alejandro (daba0118)
- Model type: Causal Language Model (LLM)
- Languages: Español, Inglés (con foco en terminología técnica de ciberseguridad)
- License: Apache 2.0 (heredada del modelo base)
- Finetuned from model: mistralai/Mistral‑7B‑Instruct‑v0.1
Model Sources
- Repository: daba0118/mistral-7b-instruct-v0.1-rules-sigma
Uses
Direct Use
- Clasificación de eventos de logs según reglas Sigma.
- Generación de explicaciones técnicas para analistas SOC.
- Integración en pipelines de detección y respuesta.
Downstream Use
- Entrenamiento adicional con reglas Sigma personalizadas.
- Adaptación a otros marcos de detección (YARA, Suricata).
Out-of-Scope Use
- Uso como chatbot generalista sin restricciones.
- Generación de contenido no relacionado con ciberseguridad.
Bias, Risks, and Limitations
- Puede generar falsos positivos si el evento no coincide con una regla Sigma conocida.
- No sustituye la validación humana en entornos críticos.
- Riesgo de alucinaciones fuera del dominio de entrenamiento.
Recommendations
Usar siempre como apoyo a un analista humano y validar las salidas antes de tomar acciones críticas.
How to Get Started with the Model
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
model_id = "daba0118/mistral-7b-instruct-v0.1-rules-sigma"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", torch_dtype="auto")
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
prompt = "[INST] Clasifica y explica el evento según reglas Sigma.\n\nEvento: {...} [/INST]"
print(pipe(prompt, max_new_tokens=150, do_sample=False, repetition_penalty=1.1)[0]["generated_text"])
## Training Details
### Training Data
El dataset utilizado para el fine‑tuning proviene de [Dataset Entrenamiento Reglas Sigma en Kaggle](https://www.kaggle.com/datasets/diegoboh/dataset-entrenamiento-reglassigma/data).
Fue construido a partir de reglas Sigma en formato YAML extraídas de un software de análisis de vulnerabilidades.
Estas reglas se procesaron y adaptaron para generar ejemplos de eventos etiquetados con su correspondiente *Regla, **Severidad* y *Explicación*.
El conjunto final incluye tanto ejemplos reales como sintéticos para cubrir una amplia gama de patrones de ataque y comportamientos maliciosos.
### Training Procedure
- *Base model:* mistralai/Mistral‑7B‑Instruct‑v0.1
- *Método:* Fine‑tuning con LoRA y posterior fusión de pesos (merge_and_unload)
- *Hardware:* NVIDIA Tesla P100 (16 GB VRAM) en Kaggle
- *Duración:* ~9 horas (incluyendo merge y subida al Hub)
- *Precisión:* bfloat16
- *Batch size:* 64 (acumulado con gradiente)
- *Learning rate:* 2e‑4
- *Epochs:* 3
### Hyperparameters
- LoRA rank: 16
- LoRA alpha: 32
- Target modules: capas de atención y proyección del modelo base
- Downloads last month
- -
Model tree for daba0118/mistral-7b-instruct-v0.1-rules-sigma
Base model
mistralai/Mistral-7B-v0.1 Finetuned
mistralai/Mistral-7B-Instruct-v0.1