metadata
library_name: transformers
datasets:
- cardiffnlp/tweet_eval
language:
- en
metrics:
- f1
base_model:
- TinyLlama/TinyLlama-1.1B-Chat-v1.0
pipeline_tag: text-classification
Модель TinyLlama/TinyLlama-1.1B-Chat-v1.0
дообученная на датасете cardiffnlp/tweet_eval
, задача классификации сентимента твита, вывести одно из трех слов -
negative
, neutral
, positive
.
Дообучение
Модель дообучалась при помощи QLoRA.
- Ранг LoRA =
8
- QLoRA применялась ко всем весам attention, Q, K, V, O
load_in_4bit=True
bnb_4bit_quant_type="nf4"
bnb_4bit_compute_dtype=torch.float16
lora_alpha=4
lora_dropout=0.0
bias="none"
task_type="CAUSAL_LM"
num_train_epochs=1
per_device_train_batch_size=32
gradient_accumulation_steps=1
warmup_steps=100
group_by_length=True
lr_scheduler_type="cosine"
fp16=True
learning_rate=2e-4
weight_decay=1e-3
Метрика на валидации
F1=0.18