nomic-ai
/

nomic-embed-text-v1-ablated

Sentence Similarity

sentence-transformers

feature-extraction

text-embeddings-inference

Model card Files Files and versions

zpn commited on Jan 31, 2024

Commit

14af554

·

verified ·

1 Parent(s): f2e494a

Update modeling_hf_nomic_bert.py

Files changed (1) hide show

modeling_hf_nomic_bert.py +7 -3

modeling_hf_nomic_bert.py CHANGED Viewed

@@ -16,7 +16,7 @@ from einops import rearrange, repeat
 from transformers import GPT2Config, PreTrainedModel
 from transformers.models.bert.modeling_bert import (
     BaseModelOutputWithPoolingAndCrossAttentions,
-    BertForPreTrainingOutput,
     SequenceClassifierOutput
 )
@@ -323,6 +323,8 @@ class NomicBertPreTrainedModel(PreTrainedModel):
         rotary_scaling_factor = kwargs.pop("rotary_scaling_factor", None)
         if rotary_scaling_factor:
             config.rotary_scaling_factor = rotary_scaling_factor
         if config.n_positions <= 0 and config.rotary_emb_fraction > 0:
             config.n_positions = 2048
         if num_labels:
@@ -1145,9 +1147,11 @@ class NomicBertForPreTraining(NomicBertPreTrainedModel):
             )
             total_loss = masked_lm_loss.float()
-        return BertForPreTrainingOutput(
             loss=total_loss,
-            prediction_logits=prediction_scores,
         )

 from transformers import GPT2Config, PreTrainedModel
 from transformers.models.bert.modeling_bert import (
     BaseModelOutputWithPoolingAndCrossAttentions,
+    MaskedLMOutput,
     SequenceClassifierOutput
 )
         rotary_scaling_factor = kwargs.pop("rotary_scaling_factor", None)
         if rotary_scaling_factor:
             config.rotary_scaling_factor = rotary_scaling_factor
+        else:
+            config.rotary_scaling_factor = None
         if config.n_positions <= 0 and config.rotary_emb_fraction > 0:
             config.n_positions = 2048
         if num_labels:
             )
             total_loss = masked_lm_loss.float()
+        return MaskedLMOutput(
             loss=total_loss,
+            logits=prediction_scores,
+            hidden_states=outputs.hidden_states,
+            attentions=None,
         )