args and setup.

Files changed (6) hide show

args.json ADDED Viewed

+{
+    "model": "gpt2",
+    "dataset": "wikitext",
+    "subset": "wikitext-103-v1",
+    "output_dir": "output",
+    "num_epochs": 20,
+    "num_tokens": 100000000,
+    "window_size": 256,
+    "batch_size": 64,
+    "learning_rate": 1e-05,
+    "warmup_steps": 3000,
+    "scheduler": "cosine",
+    "weight_decay": 0.1,
+    "random_seed": 42,
+    "eval_steps": 1000,
+    "patience": 5,
+    "id": "26e50955232e9b5c"
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

special_tokens_map.json ADDED Viewed

+{
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "add_prefix_space": false,
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "model_max_length": 1024,
+  "name_or_path": "gpt2",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": "<|endoftext|>"
+}

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff