README.md · mcnckc/llm-course-hw3-tinyllama-qlora at main

metadata

library_name: transformers
datasets:
  - cardiffnlp/tweet_eval
language:
  - en
metrics:
  - f1
base_model:
  - TinyLlama/TinyLlama-1.1B-Chat-v1.0
pipeline_tag: text-classification

Модель TinyLlama/TinyLlama-1.1B-Chat-v1.0 дообученная на датасете cardiffnlp/tweet_eval, задача классификации сентимента твита, вывести одно из трех слов - negative, neutral, positive.

Дообучение

Модель дообучалась при помощи QLoRA.

Ранг LoRA = 8
QLoRA применялась ко всем весам attention, Q, K, V, O
load_in_4bit=True
bnb_4bit_quant_type="nf4"
bnb_4bit_compute_dtype=torch.float16
lora_alpha=4
lora_dropout=0.0
bias="none"
task_type="CAUSAL_LM"
num_train_epochs=1
per_device_train_batch_size=32
gradient_accumulation_steps=1
warmup_steps=100
group_by_length=True
lr_scheduler_type="cosine"
fp16=True
learning_rate=2e-4
weight_decay=1e-3

Метрика на валидации

F1=0.18