mcnckc's picture
Update README.md
ca5a4c3 verified
metadata
library_name: transformers
datasets:
  - cardiffnlp/tweet_eval
language:
  - en
metrics:
  - f1
base_model:
  - TinyLlama/TinyLlama-1.1B-Chat-v1.0
pipeline_tag: text-classification

Модель TinyLlama/TinyLlama-1.1B-Chat-v1.0 дообученная на датасете cardiffnlp/tweet_eval, задача классификации сентимента твита, вывести одно из трех слов - negative, neutral, positive.

Дообучение

Модель дообучалась при помощи QLoRA.

  • Ранг LoRA = 8
  • QLoRA применялась ко всем весам attention, Q, K, V, O
  • load_in_4bit=True
  • bnb_4bit_quant_type="nf4"
  • bnb_4bit_compute_dtype=torch.float16
  • lora_alpha=4
  • lora_dropout=0.0
  • bias="none"
  • task_type="CAUSAL_LM"
  • num_train_epochs=1
  • per_device_train_batch_size=32
  • gradient_accumulation_steps=1
  • warmup_steps=100
  • group_by_length=True
  • lr_scheduler_type="cosine"
  • fp16=True
  • learning_rate=2e-4
  • weight_decay=1e-3

Метрика на валидации

F1=0.18

image/png