melique
/

query-classifier

Text Classification

sequence-classification

intent-classification

Model card Files Files and versions

query-classifier / README.md

melique's picture

Update README.md

4019227 verified 5 months ago

|

2.18 kB

	---
	library_name: transformers
	language:
	- tr
	base_model:
	- dbmdz/bert-base-turkish-uncased

	tags:
	- text-classification
	- sequence-classification
	- transformers
	- turkish
	- intent-classification
	datasets:
	- custom
	metrics:
	- accuracy
	- f1
	- precision
	- recall
	---

	# 🔍 Query Classifier: Turkish BERT Model

	Bu model, Türkçe sorguları "keyword" ve "semantic" olmak üzere iki sınıfa ayırmak amacıyla eğitilmiş bir `BERT` tabanlı sıralı sınıflandırma (sequence classification) modelidir. Model, kısa metinlerin veya arama sorgularının niyetini (intent) belirlemede kullanılabilir.

	## 🧾 Kullanım Senaryosu

	Kullanıcıdan gelen bir sorgunun anahtar kelime temelli mi, yoksa daha geniş anlamsal bağlam içeren bir yapı mı taşıdığını tespit etmek için kullanılır. Bu sayede sorgular farklı işleme stratejilerine yönlendirilebilir.

	## 🧠 Model Detayları

	- Model mimarisi: BERT (`dbmdz/bert-base-turkish-uncased`)
	- Eğitim verisi: Özel olarak etiketlenmiş 2 sınıflı sorgu veri kümesi
	- Etiketler:
	- `keyword`: Daha çok başlık veya kısa anahtar ifadeler (örneğin: Gece Gelen, Episode 9)
	- `semantic`: Daha açıklayıcı veya anlam yüklü ifadeler (örneğin: 2020 yılı dram filmleri, Bilimkurgu filmleri)

	## 📊 Eğitim Parametreleri

	\| Parametre \| Değer \|
	\|------------------------\|-----------------------\|
	\| Öğrenme oranı \| 1e-5 \|
	\| Epoch \| 5 \|
	\| Batch size \| 16 \|
	\| Dropout oranları \| 0.3 (attention & hidden) \|
	\| Değerlendirme metriği \| F1 \|
	\| Early stopping \| 2 adım sabitlik \|

	## 📈 Model Başarımı

	Test kümesi üzerinde elde edilen sonuçlar:

	```text
	precision recall f1-score support

	keyword 0.97 0.95 0.96 552
	semantic 0.71 0.81 0.76 86

	accuracy 0.93 638
	macro avg 0.84 0.88 0.86 638
	weighted avg 0.93 0.93 0.93 638