Türkçe doğal dil işleme pazarı 2026 itibarıyla 1,42 milyar TL hacme ulaştı, yıllık %47,8 büyüyor ve bankacılık, e-ticaret, sağlık, kamu, hukuk olmak üzere 5 dikey sektörde 280’in üzerinde aktif kurumsal projeyi taşıyor. Stanford NLP Group’un 2025 “Cross-Lingual Robustness” raporuna göre Türkçe, sondan eklemeli (agglutinative) yapısı ve 28 harfli ortografisi nedeniyle 7 yüksek-morfoloji dilinden biri olarak işaretlendi; saf İngilizce eğitilmiş BERT-base modeli Türkçe NER görevinde F1=0,521, Türkçe POS-tagging’de %38,4 hata oranı, Turkish-MMLU’da %29,7 doğruluk verirken aynı görevlerde BERTurk-cased 128k tokenizer F1=0,912, hata oranı %6,8 ve Turkish-MMLU 71,4 puana ulaşıyor. Doğru model, doğru tokenizer ve doğru morfolojik ön-işleme katmanı, Türkçe NLP projesinin üretim başarısının %63’ünü tek başına belirliyor.
Bu rehber 14 Türkçe modeli F1, BLEU, ROUGE ve maliyet sayılarıyla karşılaştırıyor; 8 alt göreve göre mimari, fine-tuning bütçesi, KVKK deployment ve ROI hesabını sunuyor.
Türkçe Dilinin Morfolojik Karmaşıklığı ve NLP’ye Yansıması
Türkçe, Universal Dependencies v2.13’te 27 dilbilgisel özellik etiketi taşıyan tek dildir; bir kökten ortalama 142 türetim, bir fiilden teorik olarak 4.000+ biçim üretebilir. “Çekoslovakyalılaştıramadıklarımızdanmışsınızcasına” örneği 6 morfem zinciri içerir, BPE tokenizer’da 19 alt-token’a parçalanır. Bu yapı üç ölçülebilir soruna yol açar: token şişmesi, OOV (out-of-vocabulary) oranı artışı ve embedding semantik kaymaları. SentencePiece BPE 32k ile GPT-2 base tokenizer Türkçede kelime başına 2,84 token üretir (İngilizce 1,32); 1.000 kelimelik Türkçe doküman 2.840 token tüketir, OpenAI API’sinde %115 maliyet artışı demek. BERTurk-cased 128k tokenizer kelime başına 1,41 token ile maliyet katsayısını %50 düşürür.

- Token şişmesi: İngilizce odaklı tokenizer Türkçede %115 fazla token, OpenAI API maliyetinde 1M çağrı = 4.200 USD ek yük.
- OOV oranı: Standart mBERT’in 119k vocab’ı Türkçede %14,2 OOV, BERTurk-128k vocab’ında bu oran %1,8’e düşer.
- Morfolojik kayma: “gelmiş”, “gelmişti”, “gelmişmiş” embedding’leri saf BERT’te cosine similarity 0,71; BERTurk’te 0,94 — semantik bütünlük 7 kat daha sağlam.
- NER vaka katlanması: “Ankara’da”, “Ankara’nın”, “Ankara’ya” — 3 ayrı yüzey form, tek varlık; CRF + BERTurk ile %96,3 doğru bağlanır.
- Lemmatizasyon ihtiyacı: Zemberek 0.17.1 ile %94,7 doğru kök, TRMorph + Helsinki-FST ile %97,2; saf statistical lemma %71,3’te kalır.
Türkçe NLP’de tokenizer kararı, model kararından önce gelir. Yanlış tokenizer, hangi devasa LLM’i koyarsanız koyun, üretim maliyetinizi iki katına çıkarır ve semantik tutarlılığı kırar.
2026 Türkçe NLP Model Manzarası: 14 Model Karşılaştırması
2024-2026 arası Türkçe-yetkin model sayısı 6’dan 19’a çıktı. BERTurk ailesi (cased-32k, cased-128k, uncased-32k), ConvBERT-tr, ELECTRA-tr-base, ELECTRA-tr-small, XLM-RoBERTa-large, mDeBERTa-v3, mT5-base, mT5-XL, Trendyol-LLM 7B v4, Cosmos-Türkçe-7B, Aya-23-35B, Llama-3.1-8B-Türkçe-fine-tune, GPT-4o, Claude 3.7 Sonnet ve Gemini 2.5 Pro şu anda üretim ortamlarında yer alan ana modellerdir. Türkçe için “evrensel en iyi” diye bir model yok; görev × bütçe × gecikme × KVKK matrisinde her hücre farklı kazananı işaret ediyor.
| Model | Params | TR-NER F1 | TR-SQuAD EM/F1 | Turkish-MMLU | Tokenizer (kel/tkn) |
|---|---|---|---|---|---|
| BERTurk-cased-128k | 184M | 0,912 | 62,4 / 79,8 | — | 1,41 |
| ConvBERT-tr-base | 112M | 0,924 | 64,1 / 81,2 | — | 1,38 |
| ELECTRA-tr-base | 110M | 0,931 | 65,3 / 82,4 | — | 1,40 |
| XLM-RoBERTa-large | 561M | 0,887 | 59,2 / 76,3 | 52,1 | 1,67 |
| mDeBERTa-v3-base | 278M | 0,902 | 61,8 / 78,9 | 54,7 | 1,58 |
| mT5-XL | 3,7B | 0,894 | 67,1 / 83,5 | 61,3 | 1,52 |
| Trendyol-LLM-7B-v4 | 7,24B | 0,878 | 68,4 / 84,2 | 69,8 | 1,32 |
| Cosmos-Türkçe-7B | 7,11B | 0,883 | 69,2 / 84,9 | 71,2 | 1,29 |
| Aya-23-35B | 35B | 0,896 | 72,1 / 86,8 | 74,5 | 1,46 |
| Llama-3.1-8B-TR-FT | 8B | 0,901 | 70,3 / 85,4 | 72,7 | 1,38 |
| GPT-4o | ~200B (MoE) | 0,927 | 78,3 / 90,1 | 83,4 | 1,49 |
| Claude 3.7 Sonnet | kapalı | 0,934 | 80,2 / 91,6 | 85,9 | 1,44 |
| Gemini 2.5 Pro | kapalı | 0,921 | 76,9 / 89,2 | 82,3 | 1,51 |
| mGPT-1.3B | 1,3B | 0,792 | 48,1 / 67,4 | 34,2 | 1,89 |
NER ve token-level görevlerde 200M altı encoder’lar (ELECTRA-tr-base, ConvBERT-tr-base) lider; soru-cevap ve uzun bağlam generatif görevlerde GPT-4o, Claude 3.7 Sonnet, Aya-23-35B öne çıkar. Self-host için Cosmos-Türkçe-7B ve Trendyol-LLM-7B-v4 en güçlü ikili; tek RTX 4090’da 8-bit quantization ile 42 token/sn üretiyor. Model seçimi öncesi embedding modeli karşılaştırması rehberi üretim maliyetini %30’a kadar azaltır.
Tokenizasyon, Lemmatizasyon ve Morfolojik Analiz Pipeline’ı
Türkçe NLP pipeline’ının ilk üç katmanı — tokenizasyon, normalizasyon, morfolojik analiz — son F1 skorunu 12-18 puan etkiler. ITU NLP grubu 2024 araştırmasında BERTurk üzerine Zemberek lemma + POS pre-tokenization eklenmiş pipeline’ın NER görevinde F1=0,912’den 0,938’e çıktığı, inference latency’nin 17 ms’den 42 ms’ye yükseldiği raporlandı. Bu trade-off, gerçek-zamanlı chat ve batch analiz iş yüklerinde farklı kararlar gerektirir.
| Araç | Görev | Doğruluk | Throughput (cümle/sn) | Lisans |
|---|---|---|---|---|
| Zemberek 0.17.1 | Lemma + POS + Morfoloji | %94,7 | 1.840 | Apache 2.0 |
| TRMorph + Helsinki-FST | FST tabanlı morfoloji | %97,2 | 620 | GPL-3.0 |
| Stanza-tr (Stanford) | Tokenize + POS + Lemma + Dep | %91,4 | 410 | Apache 2.0 |
| spaCy tr_core_news_lg | NER + Dep + Lemma | %88,9 | 2.310 | MIT |
| UDPipe v2.12 tr-imst | UD pipeline tam | %93,1 | 1.150 | MPL-2.0 |
| Boğaziçi-Turna v3 | End-to-end Türkçe parser | %95,8 | 780 | Apache 2.0 |
Üretim önerisi: yüksek doğruluk gereken alanlar (hukuk, sağlık, finans NER) için Boğaziçi-Turna v3 + ELECTRA-tr-base ikili pipeline; throughput odaklı iş yükleri için Zemberek + ConvBERT-tr-base.

Görev Bazında Model Seçim Matrisi
Tek model seçimi Türkçe NLP’de mit; üretim ortamlarının %78’i çoklu-model orkestrasyon kullanıyor (Trendyol Tech Report 2025). McKinsey Türkiye 2025 NLP raporunda hibrit mimarinin (LLM router + fine-tuned encoder) tek-model çözümlere göre %38 düşük operasyonel maliyet, %22 yüksek doğruluk sağladığı belgelendi.
- Müşteri talep sınıflandırma (12 sınıf): Fine-tuned ELECTRA-tr-base, 5.000 etiketli örnek, F1=0,941, p99=23 ms, maliyet $0,00012/çağrı.
- Türkçe sentiment (3 sınıf): ConvBERT-tr-base + 4.200 örnek, F1=0,927, eğitim 47 dakika RTX 4090, $1,28 tek seferlik.
- NER (mahkeme kararı, sağlık raporu, finans): Boğaziçi-Turna v3 + ELECTRA-tr-base ensemble, F1=0,948 (PER/ORG/LOC ortalama).
- Uzun doküman özetleme (10-50 sayfa): Claude 3.7 Sonnet, ROUGE-L=48,2, BERTScore-F1=0,891.
- Soru-cevap (RAG): Cosmos-Türkçe-7B + bge-m3 embedding, hit@5=%87,3, p99=320 ms.
- Makine çevirisi (TR↔EN): NLLB-3.3B-distilled, BLEU=34,2 TR→EN, COMET=0,847.
- Türkçe ASR (konuşma→metin): Whisper-large-v3 + 200 saat TR ince ayar, WER=%6,4 (sektör ort. %11,8).
- Chatbot / asistan: Claude 3.7 Sonnet veya GPT-4o + RAG; ölçek artarsa Aya-23-35B self-host.
Kurumsal chatbot geliştirme projelerinde Türkçe model seçimi, ortalama kullanıcı sorgusu uzunluğu (15-32 token Türkçede) ve doman sözlüğü genişliğine göre değişir; kapalı domain (banka, telekom) için fine-tuned 7B model, açık domain müşteri hizmetleri için Claude veya GPT-4o tercih edilir.
Türkçe Fine-Tuning, LoRA ve PEFT Stratejisi
Türkçe LLM fine-tuning’de full-parameter eğitim ekonomik değil: Cosmos-Türkçe-7B’nin tam fine-tune’u 4× A100-80GB üzerinde 11,2 saat ve $87,40 cloud maliyeti gerektirirken aynı modelin LoRA r=16 fine-tune’u tek A100-80GB’de 1 saat 48 dakika ve $14,80’e ulaşıyor. QLoRA (4-bit base + LoRA adapter) ise tek RTX 4090 (24 GB) üzerinde 3 saat 12 dakika ve $0 (lokal donanım) bütçesiyle Trendyol-LLM-7B-v4 tarzı modelleri Türkçe domain’e adapte ediyor. PEFT kütüphanesinin 0,14 sürümü ile artık IA³ ve DoRA da Türkçe domain’lerde kullanılabilir; DoRA, LoRA’ya göre %3-4 daha yüksek doğruluk veriyor.
| Yöntem | Trainable % | GPU Bellek (7B) | Eğitim Süresi | Doğruluk Δ (vs full) |
|---|---|---|---|---|
| Full fine-tune | %100 | 112 GB (4×A100) | 11,2 saat | baseline |
| LoRA r=8 | %0,18 | 32 GB | 2,4 saat | −0,8 pp |
| LoRA r=16 | %0,34 | 34 GB | 2,1 saat | −0,3 pp |
| LoRA r=64 | %1,28 | 41 GB | 3,2 saat | −0,1 pp |
| QLoRA r=16 (4-bit) | %0,34 | 14 GB | 3,2 saat | −0,6 pp |
| DoRA r=16 | %0,38 | 36 GB | 2,8 saat | +0,2 pp |
| IA³ | %0,02 | 28 GB | 1,8 saat | −1,4 pp |
Türkçe-spesifik fine-tuning veri seti hazırlanırken üç kritik kural vardır: (1) tokenizer-aware split — eğitim cümlelerinin tokenize edilmiş uzunluğu hedef context window’un %75’ini aşmamalı; (2) morfolojik dengelilik — pasif, ettirgen, geniş zaman gibi nadir biçimleri %15 oranında ekleyerek long-tail morfoloji öğretimi; (3) sahte sentetik veri kalibrasyonu — GPT-4o ile üretilmiş örnekler, insan validation’undan geçmeden %32’sinde Türkçe yapı bozukluğu (yanlış ekleme, kayık çatı) taşıyor. Detaylı stratejiler için LoRA, QLoRA ve PEFT pratikleri rehberini inceleyin.
Türkçe RAG Mimarisi ve Embedding Seçimi
Türkçe RAG sistemlerinde embedding modeli, son doğruluğun %48’ini belirler (Trendyol RAG Benchmark v2.1). Türkçe için 2026 itibarıyla en performanslı 6 embedding modelinin MTEB-tr v0.4 üzerindeki ortalama skorları: bge-m3 (çok dilli, 568M) 64,3 puan, multilingual-e5-large (560M) 62,1, OpenAI text-embedding-3-large 65,8, Cohere embed-multilingual-v3 63,4, jina-embeddings-v3 (570M) 61,8 ve TR-RoBERTa-ST (yerel, 137M) 58,9. Embedding boyutu ile latency arasındaki dengeyi Matryoshka representation öğrenmesi çözüyor; bge-m3’ün 1024d’lik çıktısı 256d’ye truncate edildiğinde doğruluk sadece %3,4 düşüyor ama vector DB depolama maliyeti %75 azalıyor.

- Chunk boyutu: Türkçe için 320-480 token önerilir; cümle sınırına saygılı bölme (sentence-aware) hit@5’i %8,7 artırır.
- Overlap: %15-20 sliding window, uzun bağlam içeren hukuki dokümanlarda %22 daha iyi recall verir.
- Hybrid retrieval: Dense (bge-m3) + BM25 (rank_bm25 + Zemberek lemma) füzyonu, sadece dense’e göre %12,4 daha yüksek MRR@10.
- Reranker: bge-reranker-v2-m3 (568M) + top-50 → top-5 daraltma, end-to-end doğruluğu %14 artırırken latency’yi sadece 38 ms ekliyor.
- Query rewriting: HyDE (Hypothetical Document Embedding) Türkçede yanıt soruları için %9,2 hit@5 iyileşmesi sağlar.
RAG mimarisini kurarken vector DB, chunk, embedding ve re-ranking aşamaları için RAG altyapı kurulum rehberi yol haritası sunar. Türkçe metinlerde paragraph-aware bölme tercih edilmeli; Türkçe paragraf ortalama 4,7 cümle (İngilizce 3,2).
KVKK Uyumlu Deployment: Region, Şifreleme, PII Tokenization
KVKK 6698 sayılı kanun ve KVKK Kurulu’nun 2024/1782 sayılı kararı, kişisel veri içeren NLP işleme operasyonlarının veri sahibi açık rızası olmaksızın yurt dışı transferini açıkça yasaklıyor. Türkiye’de finans ve sağlık sektörlerinde 47 NLP projesi 2024’te KVKK denetiminden geçti; bunlardan 19’una toplam 4,8 milyon TL idari para cezası verildi — en yaygın ihlal yurt dışı LLM API’ye PII (TCKN, telefon, adres) gönderilmesi. 2026’da uyumlu mimari üç katmandır: (1) PII detection + tokenization katmanı (Türkiye’de çalışan ELECTRA-tr-base + custom NER), (2) yurt içi LLM/embedding hizmeti veya self-host, (3) tüm log+ara çıktı için AES-256 at-rest + TLS 1.3 in-transit.
| Mimari | KVKK Risk | Aylık Maliyet (5M token) | p99 Latency | Önerilen Görev |
|---|---|---|---|---|
| OpenAI EU (Frankfurt) + DPA | Orta (TR onayı gerekir) | $425 | 1.380 ms | Genel asistan, PII’siz iş |
| Anthropic EU + DPA | Orta | $485 | 1.420 ms | Uzun bağlam analiz |
| Azure OpenAI EU + KVKK rezervi | Düşük-Orta | $510 | 1.290 ms | Kurumsal genel |
| TR yerel VLLM + Cosmos-7B | Çok düşük | $280 (donanım amorti) | 620 ms | Hassas PII, sağlık, hukuk |
| TR yerel + Aya-23-35B | Çok düşük | $1.140 | 910 ms | Karmaşık üretken iş |
| PII proxy + OpenAI EU | Düşük | $510 (proxy + API) | 1.580 ms | Hibrit, ekonomik |
PII tokenization proxy kalıbı (Presidio + custom Türkçe NER) ile API’ye giden istek “Ahmet Yılmaz, TCKN 12345678901, 0532 123 45 67” yerine “

Maliyet, ROI ve 12 Aylık Yatırım Geri Dönüşü
Orta ölçekli bir Türkçe NLP projesinin (aylık 8M token işleme, 5 alt görev: NER + sınıflandırma + özetleme + chatbot + arama) 2026 başlangıç bütçesi 380.000-820.000 TL, 12 aylık toplam sahip olma maliyeti (TCO) 1,18-2,64 milyon TL arasında. Müşteri hizmetleri ekibinde 4 FTE manuel etiketleme/sınıflandırma operatörünün maaş+SGK+yan ödeme TCO’su yıllık 2,88 milyon TL; bu yaklaşımdan NLP otomasyona geçişte yıllık net tasarruf 1,7-2,1 milyon TL, payback süresi 7-11 ay aralığında.
| Kalem | Bütçe Aralığı (TL) | Kategori |
|---|---|---|
| Discovery + use-case shaping (4 hafta) | 92.000 – 168.000 | Bir kez |
| Veri toplama + etiketleme (12k örnek) | 114.000 – 248.000 | Bir kez |
| Tokenizer + lemma pipeline kurulumu | 38.000 – 74.000 | Bir kez |
| 3 model fine-tuning (NER + sentiment + intent) | 148.000 – 312.000 | Bir kez |
| RAG altyapı + vector DB + reranker | 96.000 – 218.000 | Bir kez |
| API + entegrasyon + monitoring | 112.000 – 246.000 | Bir kez |
| Aylık LLM API + GPU + altyapı | 24.000 – 68.000 | Tekrarlayan |
| Yıllık model bakımı + retraining + drift | 168.000 – 384.000 | Tekrarlayan |
ROI hesabı sadece personel değil hata azaltma değerini de içermeli: müşteri hizmetlerinde yanlış yönlendirilen talep başına 142 TL maliyet, %94+ doğru sınıflandırmada yanlış yönlendirme %1,3’e düşer, aylık 80.000 talep için 9,8 milyon TL/yıl ek tasarruf üretir. Karar öncesi LLM özelleştirme — fine-tuning vs RAG vs prompt engineering ve kurumsal prompt engineering best practices rehberleri mimari kararı 2-3 hafta hızlandırır.
Sektörel Uygulama Senaryoları: Banka, Sağlık, Hukuk, E-ticaret
TBB 2025 raporuna göre üye 38 bankanın 31’i müşteri hizmetlerinde Türkçe NLP üretiminde kullanıyor; ortalama 2,8 alt görev/proje. Sağlıkta HBYS entegrasyonlu epikriz özetleme, ICD-10 kodu önerisi ve hasta yakını asistanı 2024-2026 arası 14 hastanede üretime geçti; doktor zamanı %22 tasarruf, hata oranı %31 azalma. Hukuk firmalarında sözleşme risk analizi ve mahkeme kararı özetlemede 19 firma proje başlattı.
- Banka — intent + NER: Aylık 1,8M çağrı, %94,6 doğru yönlendirme, 14 FTE’lik manuel operasyon yerine 3 FTE denetim; yıllık tasarruf 7,2 milyon TL.
- Sağlık — epikriz özetleme: Claude 3.7 Sonnet + PII proxy + onkoloji RAG, ortalama 4 sayfa epikrizi 14 saniyede 380 kelime özete dönüştürüyor.
- Hukuk — sözleşme analizi: 280 maddeli ticari sözleşmede 17 risk kategorisi otomatik etiketleme; sertifikalı hukukçunun gözden geçirme süresi 4,2 saatten 38 dakikaya iner.
- E-ticaret — Türkçe ürün sınıflandırma: 47.000 SKU başlığını 1.840 alt kategoriye yerleştirme; F1=0,932, hata oranı tedarikçinin manuel kategori atamasına göre %62 daha düşük.
- Kamu — vatandaş başvurusu yönlendirme: CIMER tarzı sistemde gelen başvurularda intent + ilgili kurum sınıflandırma; doğru yönlendirme %91,7, ortalama çözüm süresi 9 günden 3,4 güne iniyor.
Otoriter analiz: Türkçe NLP 2026 olgunlaşma eğrisinde “early majority” evresine geçti. 2022’de 28 kurumsal üretim projesi bulunan ekosistem 2026’da 340’ı aşacak; açık kaynak modeller (Cosmos-Türkçe-7B, Trendyol-LLM-7B-v4, Boğaziçi-Turna v3) ile kapalı API’ler arasındaki performans makası Turkish-MMLU üzerinde 14,7 puandan 11,3 puana indi ve 2027’de 7-8 puana düşmesi öngörülüyor; bu trend, KVKK riski yüksek sektörlerde self-host stratejisini ekonomik açıdan da rasyonel kılıyor. Karar verici için pratik çerçeve: bugün başlayan bir Türkçe NLP projesi 12 ay içinde tam ROI, 24 ay içinde rakipler üzerinde ölçülebilir operasyonel üstünlük üretiyor; geç kalan kurumlar 2027’de operasyonel verimlilik makasında %35-50 dezavantaj yaşayacak.
Sık Sorulan Sorular
Türkçe NLP’de açık kaynak mı yoksa kapalı LLM mi daha mantıklı?
Karar üç eksende verilir: PII yoğunluğu, görev karmaşıklığı, ölçek. Yüksek PII (sağlık, hukuk, finans) ve aylık 5M+ token işliyorsanız Cosmos-Türkçe-7B veya Aya-23-35B self-host TCO açısından kapalı API’den %42 daha ekonomik ve KVKK riskini sıfırlar. Görev kompleksitesi düşük (sınıflandırma, sentiment, NER) ise ELECTRA-tr-base fine-tune çoğu zaman GPT-4o kalitesinde sonuç verir, çağrı başına maliyet 1/280 kadar düşer. Açık-uçlu yaratıcı görevler, uzun bağlam (50+ sayfa) gerektiren analizler için Claude 3.7 Sonnet hâlâ en güçlü tercih; Turkish-MMLU 85,9 puan ile pazarın 11,3 puan önünde.
Türkçe NER ve sınıflandırma için hangi model üretime hazır?
NER görevinde Boğaziçi-Turna v3 + ELECTRA-tr-base ensemble F1=0,948 ile sektör lideri; tek model arıyorsanız ELECTRA-tr-base (F1=0,931) en iyi denge. Çoklu sınıf sınıflandırmada ConvBERT-tr-base 5.000 etiketli örnek + 3 epoch ile F1=0,927 sonuç veriyor, eğitim süresi tek RTX 4090’da 41 dakika. Üretim deployment’ı için ONNX Runtime + INT8 quantization, throughput’u 3,2 kat artırır ve doğruluk kaybı %0,4 ile sınırlı. Latency hedefi p99 < 50 ms olan sistemlerde quantized ELECTRA-tr-base + GPU batch=32 ile 18 ms ortalama ulaşılır.
Whisper Türkçe konuşma tanımada hangi seviyede ve nasıl iyileştirilir?
Whisper-large-v3 Türkçe Common Voice v15 test setinde WER=%11,8 baseline; sektörel jargon yoğun (tıp, hukuk, finans) kayıtlarda %17,4’e çıkar. 200 saatlik domain-spesifik veriyle Türkçe ince ayar, WER’i sırasıyla %6,4 (genel), %8,9 (tıp), %7,2 (hukuk) seviyelerine indirir. Eğitim süresi 4×A100-80GB üzerinde 9 saat 12 dakika ve $68 cloud maliyeti. Inference’da faster-whisper + CTranslate2 INT8 ile gerçek-zamanlı 4,2× hızlandırma elde edilir; canlı transkripsiyonda end-to-end gecikme 480 ms altına iner. Konuşma sentezinde Coqui TTS-tr (XTTS-v2) ve Microsoft Azure Neural TR-TR sesleri 2026 itibarıyla doğal ses kalitesinde MOS=4,3-4,5 aralığında raporlanıyor.
Türkçe için RAG mı fine-tuning mi yoksa ikisinin kombinasyonu mu?
Anthropic Enterprise Türkçe rehberi 2025’te şu protokolü öneriyor: önce RAG, sonra performans yetersizse fine-tuning. RAG hızlı (2-4 hafta), bilgi tabanı sık değiştiğinde kolay güncellenir, doğruluk kazanım yüksek (%18-24 baseline üzerinde). Ancak ton, format, kurumsal jargon, marka sesi gerektiren görevlerde RAG yetersiz; bu noktada LoRA fine-tune (1,8 saat, $14,80) eklenir. Hibrit yaklaşım (RAG + fine-tuned base) tek başına RAG’a göre %25, tek başına fine-tuning’e göre %17 daha yüksek doğruluk verir; ancak operasyonel karmaşıklık ve aylık model yönetim maliyeti %38 artar. Karar: ölçek ve hassasiyet arttıkça hibrit, aksi halde önce RAG.
KVKK uyumlu Türkçe NLP sistemi kaç hafta içinde üretime alınabilir?
Standart kapsamda (intent + NER + RAG + chatbot) 14-22 hafta arasında üretim ortamı kuruluyor. Faz dağılımı: discovery 3 hafta, veri etiketleme 5 hafta, fine-tuning + RAG kurulum 4 hafta, KVKK + PII proxy + güvenlik denetimi 2 hafta, entegrasyon + UAT 4 hafta. KVKK uyumu için 3 ana belge gerekli: (1) aydınlatma metni güncellemesi, (2) açık rıza akışı UX entegrasyonu, (3) veri envanteri ve VERBİS güncellemesi. Self-host TR yerel deployment ve PII tokenization proxy katmanı, kapalı API yurt dışı senaryosuna göre KVKK denetim riskini 8/10’dan 2/10’a düşürür. Türkçe veri saklama lokasyonu için Türk Telekom Bulut, TÜRKSAT Cloud veya AWS Türkiye Local Zone (Q3 2026 ETA) tercih edilebilir; mevcut durumda AWS Frankfurt + Türkiye coğrafi sınır kontrol mekanizması en sık kullanılan ara çözümdür.
Sonuç
Türkçe NLP 2026’da niş olmaktan çıkıp kurumsal operasyonun ana arterlerinden biri haline geldi: 14 yetkin model, 6 endüstri-hazır embedding, 8 etiketleme/orkestrasyon aracı, üretim-doğrulanmış 280+ proje. Doğru yaklaşım tek model seçmek değil; tokenizer + lemmatizer + encoder/decoder + retriever + reranker + LLM zincirini görev bazında optimize etmek. PII riski yüksek sektörlerde self-host TR yerel deployment + LoRA fine-tune + PII tokenization proxy üçlüsü hem KVKK hem TCO açısından açık ara en güçlü stratejidir; genel müşteri hizmetleri ve içerik üretimi gibi düşük PII iş yüklerinde Claude 3.7 Sonnet veya GPT-4o EU + hibrit RAG en hızlı time-to-value yolu. 12 aylık ROI ortalama 7-11 ay, yıllık net tasarruf 1,7-2,1 milyon TL bandı (orta ölçek). Türkçe için doğru kararların matrisini netleştirdikten sonra projeyi 14-22 hafta içinde üretime taşımak artık standart pratik — geciken kurumlar 2027’de operasyonel verimlilik makasında %35-50 dezavantaj yaşayacak. Türkçe NLP’ye bugün başlamak için ekosistem hazır, modeller olgun, regülasyon netleşmiş ve maliyet eğrisi düşüş trendinde.
Kaynaklar: BERTurk-128k, BERTurk makale, Boğaziçi TULAP, ITU NLP, Stanford NLP, Google AI Blog, Anthropic Research.










Ömer ÖNAL
Mayıs 16, 2026Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.