ydshieh
/

flax-vision-encoder-decoder-vit-gpt2-coco-en

Model card Files Files and versions

xet

Community

ydshieh commited on Dec 15, 2021

Commit

283180e

1 Parent(s): cb2b435

more general

Browse files

Files changed (1) hide show

run_image_captioning_flax.py +6 -6

run_image_captioning_flax.py CHANGED Viewed

@@ -633,6 +633,8 @@ def main():
         return tokenizer
     # Preprocessing the datasets.
     # We need to tokenize inputs and targets.
     if training_args.do_train:
@@ -688,8 +690,6 @@ def main():
     # Setting padding="max_length" as we need fixed length inputs for jitted functions
     def tokenization_fn(examples, max_target_length):
-        tokenizer = get_tokenizer()
         captions = []
         for caption in examples[caption_column]:
                 captions.append(caption.lower() + ' ' + tokenizer.eos_token)
@@ -834,7 +834,7 @@ def main():
         num_test_examples = len(predict_dataset)
         test_steps = num_test_examples // eval_batch_size + int(num_test_examples % eval_batch_size > 0)
-    def get_batch_iter(rng, ds, block_size, batch_size, shuffle=False, drop_last_batch=False, split=""):
         if not block_size:
             block_size = len(ds)
@@ -871,7 +871,7 @@ def main():
                 remove_columns=[image_column],
                 load_from_cache_file=not data_args.overwrite_cache,
                 features=features,
-                keep_in_memory=True,
                 desc=f"Running feature extraction on {names[split]} dataset".replace("  ", " "),
             )
             _ds = _ds.with_format("numpy")
@@ -1095,7 +1095,7 @@ def main():
         preds = []
         labels = []
-        batches = get_batch_iter(rng, dataset, block_size=block_size, batch_size=eval_batch_size, shuffle=False, split=name)
         steps = len(dataset) // eval_batch_size + int(len(dataset) % eval_batch_size > 0)
         for _ in tqdm(range(steps), desc=f"{'Predicting' if name == 'test' else 'Evaluating'}...", position=2, leave=False):
             # Model forward
@@ -1197,7 +1197,7 @@ def main():
             train_metrics = []
-            train_batches = get_batch_iter(input_rng, train_dataset, block_size=block_size, batch_size=train_batch_size, shuffle=True, drop_last_batch=training_args.dataloader_drop_last, split="train")
             # train
             for (batch_idx, _) in enumerate(tqdm(range(steps_per_epoch), desc="Training...", position=1, leave=False)):

         return tokenizer
+    tokenizer = get_tokenizer()
     # Preprocessing the datasets.
     # We need to tokenize inputs and targets.
     if training_args.do_train:
     # Setting padding="max_length" as we need fixed length inputs for jitted functions
     def tokenization_fn(examples, max_target_length):
         captions = []
         for caption in examples[caption_column]:
                 captions.append(caption.lower() + ' ' + tokenizer.eos_token)
         num_test_examples = len(predict_dataset)
         test_steps = num_test_examples // eval_batch_size + int(num_test_examples % eval_batch_size > 0)
+    def get_batch_iter(rng, ds, block_size, batch_size, shuffle=False, drop_last_batch=False, keep_in_memory=False, split=""):
         if not block_size:
             block_size = len(ds)
                 remove_columns=[image_column],
                 load_from_cache_file=not data_args.overwrite_cache,
                 features=features,
+                keep_in_memory=keep_in_memory,
                 desc=f"Running feature extraction on {names[split]} dataset".replace("  ", " "),
             )
             _ds = _ds.with_format("numpy")
         preds = []
         labels = []
+        batches = get_batch_iter(rng, dataset, block_size=block_size, batch_size=eval_batch_size, keep_in_memory=False, shuffle=False, split=name)
         steps = len(dataset) // eval_batch_size + int(len(dataset) % eval_batch_size > 0)
         for _ in tqdm(range(steps), desc=f"{'Predicting' if name == 'test' else 'Evaluating'}...", position=2, leave=False):
             # Model forward
             train_metrics = []
+            train_batches = get_batch_iter(input_rng, train_dataset, block_size=block_size, batch_size=train_batch_size, keep_in_memory=True, shuffle=True, drop_last_batch=training_args.dataloader_drop_last, split="train")
             # train
             for (batch_idx, _) in enumerate(tqdm(range(steps_per_epoch), desc="Training...", position=1, leave=False)):