Update hf_model.py (#3)

Browse files

- Update hf_model.py (ce5e3c04a04e544fd6832d83ad371d4d1c7d89a5)

Co-authored-by: Andreas Koukounas <[email protected]>

Files changed (1) hide show

hf_model.py +0 -128

hf_model.py CHANGED Viewed

@@ -295,131 +295,3 @@ class HFTextEncoder(nn.Module):
     def init_parameters(self):
         pass
-"""
-HF vision model
-"""
-class HFVisionEncoder(nn.Module):
-    output_tokens: torch.jit.Final[bool]
-    def __init__(
-        self,
-        model_name_or_path: str,
-        image_size: int,
-        output_dim: int,
-        config: PretrainedConfig = None,
-        pool_type: str = 'tok',
-        proj_type: Optional[str] = None,
-        proj_bias: bool = False,
-        attn_drop: float = 0.0,
-        hidden_drop: float = 0.0,
-        drop_path: Optional[float] = None,
-        pretrained: bool = True,
-        output_tokens: bool = False,
-        trust_remote_code: bool = False,
-    ):
-        super().__init__()
-        self.output_tokens = output_tokens
-        self.output_dim = output_dim
-        self.image_size = (image_size, image_size)
-        if config is None:
-            self.config = AutoConfig.from_pretrained(
-                model_name_or_path,
-                trust_remote_code=trust_remote_code,
-                hidden_dropout_prob=hidden_drop,
-                attention_probs_dropout_prob=attn_drop,
-                drop_path_rate=drop_path,
-            )
-            create_func, model_args = (
-                (AutoModel.from_pretrained, model_name_or_path)
-                if pretrained
-                else (AutoModel.from_config, self.config)
-            )
-            self.transformer = create_func(
-                model_args,
-                trust_remote_code=trust_remote_code,
-                hidden_dropout_prob=hidden_drop,
-                attention_probs_dropout_prob=attn_drop,
-            )
-        else:
-            self.config = config
-            self.transformer = AutoModel.from_config(config)
-        if 'dinov2' in model_name_or_path:
-            self.transformer.embeddings.mask_token.requires_grad = False
-        assert pool_type in ('tok', 'avg', 'none')
-        self.pool_type = pool_type
-        d_model = self.config.hidden_size
-        if (d_model == output_dim) and (proj_type is None):  # do we always need a proj?
-            self.proj = nn.Identity()
-        elif proj_type == 'linear':
-            self.proj = nn.Linear(d_model, output_dim, bias=proj_bias)
-        elif proj_type == 'mlp':
-            hidden_size = (d_model + output_dim) // 2
-            self.proj = nn.Sequential(
-                nn.Linear(d_model, hidden_size, bias=proj_bias),
-                nn.GELU(),
-                nn.Linear(hidden_size, output_dim, bias=proj_bias),
-            )
-    def _global_pool(self, x: torch.Tensor) -> Tuple[torch.Tensor, torch.Tensor]:
-        if self.pool_type == 'avg':
-            pooled, tokens = x[:, 1:].mean(dim=1), x[:, 1:]
-        elif self.pool_type == 'tok':
-            pooled, tokens = x[:, 0], x[:, 1:]
-        else:
-            pooled = tokens = x
-        return pooled, tokens
-    def forward(self, x: torch.Tensor):
-        # returns a tuple of (final hidden states, token pooled outputs)
-        x = self.transformer(x)[0]
-        pooled, tokens = self._global_pool(x)
-        projected = self.proj(pooled)
-        return projected
-    def lock(self, unlocked_layers: int = 0, freeze_bn_stats: bool = True):
-        if not unlocked_layers:  # full freezing
-            for n, p in self.transformer.named_parameters():
-                p.requires_grad = (
-                    (not freeze_bn_stats) if 'LayerNorm' in n.split('.') else False
-                )
-            return
-        # TODO: make it work if unlocked_layers !=0
-        encoder = (
-            self.transformer.encoder
-            if hasattr(self.transformer, 'encoder')
-            else self.transformer
-        )
-        layer_list = getattr(
-            encoder, _HF_ARCH_DICT[self.config.model_type]['config_names']['layer_attr']
-        )
-        print(f'Unlocking {unlocked_layers}/{len(layer_list) + 1} layers of hf model')
-        embeddings = getattr(
-            self.transformer,
-            _HF_ARCH_DICT[self.config.model_type]['config_names'][
-                'token_embeddings_attr'
-            ],
-        )
-        modules = [embeddings, *layer_list][:-unlocked_layers]
-        # freeze layers
-        for module in modules:
-            for n, p in module.named_parameters():
-                p.requires_grad = (
-                    (not freeze_bn_stats) if 'LayerNorm' in n.split('.') else False
-                )
-    @torch.jit.ignore
-    def set_grad_checkpointing(self, *_, **__):
-        self.transformer.gradient_checkpointing_enable()
-    def init_parameters(self):
-        pass


295	def init_parameters(self):
296	pass
297