ydshieh
/

flax-vision-encoder-decoder-vit-gpt2-coco-en

Model card Files Files and versions

ydshieh commited on Dec 14, 2021

Commit

4450aac

·

1 Parent(s): 8f31d11

fix

Files changed (1) hide show

run_image_captioning_flax.py +3 -3

run_image_captioning_flax.py CHANGED Viewed

@@ -794,7 +794,7 @@ def main():
             batched=True,
             num_proc=data_args.preprocessing_num_workers,
             # kept image paths
-            remove_columns=column_names.remove(image_column),
             load_from_cache_file=not data_args.overwrite_cache,
             desc=f"Running tokenizer on train dataset",
             fn_kwargs={"max_target_length": data_args.max_target_length},
@@ -813,7 +813,7 @@ def main():
             batched=True,
             num_proc=data_args.preprocessing_num_workers,
             # kept image paths
-            remove_columns=column_names.remove(image_column),
             load_from_cache_file=not data_args.overwrite_cache,
             desc=f"Running tokenizer on validation dataset",
             fn_kwargs={"max_target_length": data_args.val_max_target_length},
@@ -832,7 +832,7 @@ def main():
             batched=True,
             num_proc=data_args.preprocessing_num_workers,
             # kept image paths
-            remove_columns=column_names.remove(image_column),
             load_from_cache_file=not data_args.overwrite_cache,
             desc=f"Running tokenizer on prediction dataset",
             fn_kwargs={"max_target_length": data_args.val_max_target_length},

             batched=True,
             num_proc=data_args.preprocessing_num_workers,
             # kept image paths
+            remove_columns=[x for x in column_names if x != image_column],
             load_from_cache_file=not data_args.overwrite_cache,
             desc=f"Running tokenizer on train dataset",
             fn_kwargs={"max_target_length": data_args.max_target_length},
             batched=True,
             num_proc=data_args.preprocessing_num_workers,
             # kept image paths
+            remove_columns=[x for x in column_names if x != image_column],
             load_from_cache_file=not data_args.overwrite_cache,
             desc=f"Running tokenizer on validation dataset",
             fn_kwargs={"max_target_length": data_args.val_max_target_length},
             batched=True,
             num_proc=data_args.preprocessing_num_workers,
             # kept image paths
+            remove_columns=[x for x in column_names if x != image_column],
             load_from_cache_file=not data_args.overwrite_cache,
             desc=f"Running tokenizer on prediction dataset",
             fn_kwargs={"max_target_length": data_args.val_max_target_length},