asmud
/

nomic-embed-indonesian

@@ -125,6 +125,26 @@ model-index:
 This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [nomic-ai/nomic-embed-text-v1.5](https://huggingface.co/nomic-ai/nomic-embed-text-v1.5) specifically for **Indonesian language** text embedding tasks. It maps Indonesian sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
 ## 🇮🇩 **Specialized for Indonesian Language**
 This model is optimized for Indonesian text understanding across multiple domains including:
@@ -175,12 +195,14 @@ First install the Sentence Transformers library:
 pip install -U sentence-transformers
 ```
 Then you can load this model and run inference.
 ```python
 from sentence_transformers import SentenceTransformer
 # Download from the 🤗 Hub
-model = SentenceTransformer("asmud/nomic-embed-indonesian")
 # Run inference with Indonesian text
 sentences = [
     'search_query: Apa itu kecerdasan buatan?',

 This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [nomic-ai/nomic-embed-text-v1.5](https://huggingface.co/nomic-ai/nomic-embed-text-v1.5) specifically for **Indonesian language** text embedding tasks. It maps Indonesian sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
+## 🚀 Quick Start
+```python
+from sentence_transformers import SentenceTransformer
+# Load the model (requires trust_remote_code=True)
+model = SentenceTransformer("asmud/nomic-embed-indonesian", trust_remote_code=True)
+# Indonesian text examples
+texts = [
+    "search_query: Apa itu kecerdasan buatan?",
+    "search_document: Kecerdasan buatan adalah teknologi yang memungkinkan mesin belajar",
+    "classification: Produk ini sangat berkualitas (sentimen: positif)"
+]
+# Generate embeddings
+embeddings = model.encode(texts)
+print(f"Embedding shape: {embeddings.shape}")  # (3, 768)
+```
 ## 🇮🇩 **Specialized for Indonesian Language**
 This model is optimized for Indonesian text understanding across multiple domains including:
 pip install -U sentence-transformers
 ```
+⚠️ **Important**: This model requires `trust_remote_code=True` due to custom model architecture.
 Then you can load this model and run inference.
 ```python
 from sentence_transformers import SentenceTransformer
 # Download from the 🤗 Hub
+model = SentenceTransformer("asmud/nomic-embed-indonesian", trust_remote_code=True)
 # Run inference with Indonesian text
 sentences = [
     'search_query: Apa itu kecerdasan buatan?',

SETUP.md CHANGED Viewed

@@ -74,7 +74,7 @@ After uploading, verify the model works:
 from sentence_transformers import SentenceTransformer
 # Load the uploaded model
-model = SentenceTransformer("asmud/nomic-embed-indonesian")
 # Test Indonesian text
 texts = [

 from sentence_transformers import SentenceTransformer
 # Load the uploaded model
+model = SentenceTransformer("asmud/nomic-embed-indonesian", trust_remote_code=True)
 # Test Indonesian text
 texts = [

USAGE_EXAMPLES.md CHANGED Viewed

@@ -7,7 +7,7 @@ from sentence_transformers import SentenceTransformer
 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
-model = SentenceTransformer("asmud/nomic-embed-indonesian")
 # Indonesian search example
 query = "search_query: Bagaimana cara memasak rendang?"

 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
+model = SentenceTransformer("asmud/nomic-embed-indonesian", trust_remote_code=True)
 # Indonesian search example
 query = "search_query: Bagaimana cara memasak rendang?"