ydshieh
/

flax-vision-encoder-decoder-vit-gpt2-coco-en

ydshieh commited on Dec 25, 2021

Commit

15ecbe8

1 Parent(s): f2e4555

update 8

Files changed (1) hide show

run_image_captioning_flax_reduced.py CHANGED Viewed

@@ -503,6 +503,9 @@ def main():
         raise ValueError(
             "Decoder Config: Either a pretrained config or a model location for decoder is required."
         )
     # GPT2 only has bos/eos token but not decoder_start/pad token
     if decoder_config.decoder_start_token_id is None:
@@ -520,7 +523,7 @@ def main():
         encoder_dtype=getattr(jnp, model_args.dtype),
         decoder_dtype=getattr(jnp, model_args.dtype),
     )
-    # Necessary for Flax's generate()
     model.config.decoder_start_token_id = decoder_config.decoder_start_token_id
     if model_args.feature_extractor_name:

         raise ValueError(
             "Decoder Config: Either a pretrained config or a model location for decoder is required."
         )
+    # necessary for `from_encoder_decoder_pretrained` when `decoder_config` is passed
+    decoder_config.is_decoder = True
+    decoder_config.add_cross_attention = True
     # GPT2 only has bos/eos token but not decoder_start/pad token
     if decoder_config.decoder_start_token_id is None:
         encoder_dtype=getattr(jnp, model_args.dtype),
         decoder_dtype=getattr(jnp, model_args.dtype),
     )
+    # necessary to make Flax's generate() work
     model.config.decoder_start_token_id = decoder_config.decoder_start_token_id
     if model_args.feature_extractor_name: