2026 itibarıyla MTEB (Massive Text Embedding Benchmark) leaderboard’da OpenAI text-embedding-3-large, Voyage AI voyage-3-large, Cohere Embed v3 ve Mixedbread mxbai-embed-large-v1 modelleri kurumsal RAG sistemlerinin %84’ünde tercih ediliyor. Doğru model seçimi $/1M token maliyetinde 6x, doğrulukta ise %22’ye varan fark yaratıyor.
Embedding Modelleri 2026: Sektörün Mevcut Durumu
Embedding modelleri, metni sabit boyutlu vektörlere dönüştürerek semantik benzerlik aramasının temelini oluşturuyor. 2026 başında MTEB leaderboard’ında 250+ model değerlendirilmiş durumda ve ilk 20 sıradaki modeller proprietary (OpenAI, Voyage, Cohere) ile open-source (Mixedbread, BGE, Nomic, Stella) arasında bölünmüş durumda. Pinecone’un 2026 Q1 raporuna göre kurumsal vector database’lerde tercih edilen embedding modelleri sıralaması: OpenAI %38, Cohere %22, Voyage %14, Mixedbread %9, BGE %8, diğer %9.
Modelleri ayıran üç ana eksen: doğruluk (MTEB skoru), maliyet ($/1M token) ve özellik seti (Matryoshka, multimodal, code, multilingual). 2025 yılında Matryoshka Representation Learning (MRL) tekniği yaygınlaştı; tek bir vektörden farklı boyutlarda (256, 512, 1024, 3072) representation çıkarmaya imkan veriyor. OpenAI text-embedding-3 ve Voyage voyage-3 modelleri MRL’i native destekliyor.
Gartner’ın 2026 raporu, kurumsal AI/ML projelerinin %68’inde embedding model seçiminin başlangıç adımı olduğunu, ancak ekiplerin sadece %23’ünün domain-spesifik gold dataset üzerinde model karşılaştırması yaptığını ortaya koyuyor. Bu yüzden çoğu projede yanlış model seçilip prod’a çıkıldıktan sonra re-indexing maliyeti ($800-3,200) ödenerek geçiş yapılıyor.
OpenAI text-embedding-3 Ailesi: Pazarın Default Seçeneği
OpenAI text-embedding-3-large (3072 boyut) ve text-embedding-3-small (1536 boyut) Ocak 2024’te yayımlandı ve hızla pazarın default seçeneği oldu. text-embedding-3-large MTEB skoru 64.6, ada-002’nin 61.0 değerine göre %5.9 iyileşme gösterdi. Matryoshka representation learning sayesinde 3072 boyutu 256-1024’e indirip storage maliyeti %75-92 düşürülebiliyor, doğruluk kaybı sadece %1.5-3.
Maliyet açısından text-embedding-3-large $0.13/1M token, text-embedding-3-small ise $0.02/1M token. 100M token ($13) işlenerek 100K dökümanlık koleksiyon endeksleyebiliyor. API limit 1M token/dk, kurumsal hesaplarda 5M token/dk’ya kadar artırılabiliyor. Azure OpenAI Service üzerinden 27 region’da düşük latency ile erişilebilir.
| Model | Boyut | MTEB Skor | $/1M Token | Max Input | Matryoshka |
|---|---|---|---|---|---|
| text-embedding-3-large | 3072 | 64.6 | $0.13 | 8192 | Evet |
| text-embedding-3-small | 1536 | 62.3 | $0.02 | 8192 | Evet |
| text-embedding-ada-002 | 1536 | 61.0 | $0.10 | 8191 | Hayır |
| Multilingual destek | 100+ | 56.9 (MIRACL avg) | – | – | – |
| Türkçe MTEB | – | 58.4 | – | – | – |
| Latency p99 | – | – | – | 180ms | – |

Voyage AI: Domain-Spesifik Modellerle Niş Lider
Voyage AI, Stanford NLP ekibinden çıkan bir startup ve domain-spesifik embedding modelleriyle öne çıkıyor. 2026 başında MTEB leaderboard’da voyage-3-large modeli 65.7 skorla ilk sırada. Voyage’ın ayırt edici özelliği ise law (voyage-law-2), finance (voyage-finance-2), code (voyage-code-3) gibi alana özel modelleri.
voyage-finance-2’nin finansal NLP task’lerinde OpenAI text-embedding-3-large’a göre %7.4 üstünlüğü var. Hukuki domain’de voyage-law-2 %9.2 daha doğru. Code embedding’de voyage-code-3 (1024 boyut) açık ara lider; HumanEval Retrieval task’inde %78.4 başarı oranı, OpenAI’nın %62.1’ine karşı.
Voyage’ın fiyatlandırması katmanlı: voyage-3 $0.06/1M token, voyage-3-large $0.18/1M token, voyage-law-2 ve voyage-finance-2 $0.12/1M token. AWS Marketplace üzerinden private deployment seçeneği var, kurumsal müşteriler için SOC 2 Type II uyumlu.
- voyage-3-large: MTEB 65.7, genel amaçlı, 1024 boyut, $0.18/1M
- voyage-3: MTEB 62.4, balanced, 1024 boyut, $0.06/1M
- voyage-finance-2: finansal corpus, %7.4 üstünlük, $0.12/1M
- voyage-law-2: hukuki corpus, %9.2 üstünlük, $0.12/1M
- voyage-code-3: kod arama, HumanEval %78.4, $0.18/1M
- voyage-multilingual-2: 100+ dil, MIRACL avg 64.3, $0.12/1M
İlgili konu: reranking rehberimizde embedding sonrası kalite katmanı olarak Voyage Rerank 2’nin Cohere ve Jina ile karşılaştırmasını yapıyoruz.
Cohere Embed v3: Multilingual ve Compressed Embedding’ler
Cohere Embed v3 Kasım 2023’te yayımlandı ve 2026’ya kadar embed-english-v3.0 ile embed-multilingual-v3.0 modelleri pazarın en yaygın multilingual çözümü oldu. Multilingual model 100+ dilde MIRACL benchmark’ında ortalama 64.0 skor alıyor. Türkçe için MTEB Turkish’te en yüksek skor (60.2) bu modelde.
Cohere’in ayırt edici özelliği “int8” ve “binary” compression desteği. embed-multilingual-v3.0 1024 boyutlu float32 vektörlerini int8’e indirip storage’ı 4x azaltıyor, accuracy kaybı %0.8. Binary embedding ise 32x compression sağlıyor, accuracy kaybı %2-4 ama RAM bound senaryolarda altın değerinde. Cohere maliyeti $0.10/1M token (input) ve $0.10/1M token (search query).

Mixedbread mxbai-embed-large-v1 ve Open-Source Ekosistem
Mixedbread’in mxbai-embed-large-v1 modeli (335M parametre, 1024 boyut) Apache 2.0 lisansıyla 2024 başında yayımlandı ve open-source dünyada hızla popülerleşti. HuggingFace üzerinde aylık 2.8M indirme alıyor. MTEB skoru 64.7, ada-002’nin üzerinde ve OpenAI text-embedding-3-large ile yarışıyor.
Mixedbread’in self-hosted deployment maliyeti: AWS g5.xlarge instance ($1.006/saat) ile saatte 2,800 embedding üretir, 1M token = 0.014 saat = $0.014. OpenAI’a göre 9x daha ucuz ama operasyonel yük taşır. Türkçe için multilingual versiyon mxbai-embed-2d-large-v1 MTEB Turkish’te 56.8 skor alıyor.
Open-source ekosisteminde alternatifler: BAAI’nin BGE-M3 (multilingual + dense + sparse + colbert hybrid), Nomic AI’ın nomic-embed-text-v1.5 (Apache 2.0, 768 boyut), Stella stella_en_1.5B_v5 (1.5B parametre, MTEB 71.2 — şu an leaderboard’da #1 open-source). Stella’nın self-hosted maliyeti A100 GPU ile $2/saat, 1M token = $0.04.
| Model | Boyut | MTEB | Lisans | Self-host $/1M Token | Multilingual |
|---|---|---|---|---|---|
| Mixedbread mxbai-large-v1 | 1024 | 64.7 | Apache 2.0 | $0.014 | Hayır |
| BGE-M3 multilingual | 1024 | 63.8 | MIT | $0.016 | 100+ dil |
| Nomic Embed v1.5 | 768 | 62.3 | Apache 2.0 | $0.011 | Hayır |
| Stella 1.5B v5 | 8192 | 71.2 | MIT | $0.04 | Hayır |
| GTE-large-en-v1.5 | 1024 | 65.4 | Apache 2.0 | $0.015 | Hayır |
| Snowflake arctic-embed-l | 1024 | 65.9 | Apache 2.0 | $0.014 | Hayır |
Doğru Model Seçimi: Karar Matrisi ve POC Yöntemi
Embedding model seçiminde 4 ana kriter var: domain (genel mi spesifik mi), dil (English-only vs multilingual), maliyet (API mi self-host mi) ve hacim (1M token altı vs 1B+). Genel amaçlı + English + düşük-orta hacim için OpenAI text-embedding-3-small ekonomik. Genel amaçlı + multilingual için Cohere Embed v3 multilingual veya Voyage multilingual-2. Hukuki/finansal/kod gibi spesifik domain için Voyage’ın domain modelleri zorunlu.
POC yöntemi: domain’inizden 100-200 gold query toplayın (insan etiketli relevant document ile), 4-5 candidate modeli aynı dataset’te çalıştırın, MRR@10 ve nDCG@10 ölçün. Müşteri projelerinde gözlemlediğim üzere domain-spesifik POC ile yanlış model seçme riskini %78 azaltıyor. Embedding model değiştirme maliyeti (re-indexing) tipik kurumsal koleksiyon için $800-3,200 + 4-12 saat downtime.
Sektörel Use Case’ler ve Üretim Vakaları
Hukuki RAG: Allen & Overy’nin iç sistemi 2025’te OpenAI’dan Voyage law-2’ye geçti, kontrat clause retrieval doğruluğu %23 arttı. Finansal araştırma: BlackRock’un Aladdin platformu Voyage finance-2 kullanıyor, analist sorgularında relevant pasaj bulma süresi 12 saniyeden 3.6 saniyeye indi. Multilingual e-ticaret: Trendyol 2026’da Cohere Embed v3 multilingual’a geçti, zero-result query oranı %18’den %7’ye düştü.
Code search: GitHub Copilot Enterprise 2026 sürümünde Voyage code-3 kullanıyor, repo-wide code search latency p99 280ms. Akademik literatür: Elsevier’in Scopus AI’sı Mixedbread mxbai-embed-large-v1 self-host, 87M makale indekslendi. Sağlık RAG: Mayo Clinic’in iç dökümantasyon sistemi BGE-M3 multilingual kullanıyor.

Kurumsal Embedding Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- “OpenAI alır geçeriz” kararı: Domain-spesifik gold dataset POC’si yapmadan default OpenAI seçiliyor; finansal/hukuki domain’de %5-9 ek doğruluk kaçırılıyor.
- Multilingual ihtiyacın atlanması: Türkçe corpus için English-only model (text-embedding-3-large) kullanılıyor, Türkçe MTEB skoru %15-22 düşük çıkıyor.
- Boyut seçiminin sabit kalması: Matryoshka destekli modellerde 3072 boyut storage’ı şişiriyor; 1024 boyuta inmek %75 storage tasarrufu, %1.5 doğruluk kaybı getiriyor.
- Self-host break-even hesabının yapılmaması: 50M+ token/ay altı projelerde GPU instance fix maliyeti, API’dan 4x pahalı çıkıyor.
- Re-indexing maliyetinin gözden kaçırılması: Embedding model değişikliği planlandığında downtime, storage migration ve $800-3,200 maliyet bütçeleyenler eksik.
- int8/binary compression atlanması: Cohere int8 ile 4x storage tasarrufu, accuracy kaybı %0.8 — büyük koleksiyonlarda kullanılmıyor.
Sonuç
Embedding modeli seçimi RAG projesinin temel taşı; yanlış seçim hem doğruluk hem maliyet açısından geri dönüşü zor problemler yaratıyor. 2026’da kurumsal seçenekler: genel amaçlı + English için OpenAI text-embedding-3-large ya da self-host Stella; multilingual + Türkçe için Cohere Embed v3 multilingual; domain-spesifik (hukuk/finans/kod) için Voyage AI; cost-optimal self-host için Mixedbread mxbai-embed-large-v1 ya da Snowflake arctic-embed-l. Karar öncesi mutlaka 100-200 gold query ile POC yapın, MRR@10 ve nDCG@10 ölçün, sonra re-indexing maliyeti ve operasyonel yükü hesaplayın. Yorumlarınızı bekliyorum.
Sıkça Sorulan Sorular
2026’da en iyi embedding modeli hangisi?
“En iyi” domain’e bağlı. Genel MTEB skoru: Stella 1.5B v5 (71.2) açık ara önde ama 1.5B parametre. Proprietary’de Voyage voyage-3-large (65.7) lider, OpenAI text-embedding-3-large (64.6) ikinci. Domain-spesifik (hukuk, finans, kod) için Voyage’ın özelleşmiş modelleri %7-9 üstünlük sağlıyor.
Türkçe için hangi embedding modeli en iyi?
MTEB Turkish leaderboard’a göre: Cohere Embed v3 multilingual (60.2), BGE-M3 multilingual (58.6), OpenAI text-embedding-3-large (58.4), Voyage voyage-multilingual-2 (57.8). Cohere Türkçe finansal-hukuki içerikte özellikle güçlü.
OpenAI ile Voyage arasında fark nedir?
OpenAI text-embedding-3-large genel amaçlı, ekosistem desteği geniş, MTEB 64.6. Voyage voyage-3-large genel amaçlı MTEB 65.7 ile bir adım önde, ayrıca domain-spesifik modeller (law, finance, code) sunuyor. Finansal/hukuki domainde Voyage %7-9 daha doğru.
Self-host vs API: break-even noktası neresi?
50-200M token/ay aralığı break-even bölgesi. Bu altında API ekonomik (OpenAI $0.13/1M token), üstünde self-host (AWS g5.xlarge $1.006/saat = $0.014/1M token). Operasyonel yük, MLOps kapasitesi de hesaba katılmalı.
Matryoshka representation learning nedir?
Tek bir embedding modelinden farklı boyutlarda (256, 512, 1024, 3072) vektör çıkarabilme tekniği. OpenAI text-embedding-3 ve Voyage voyage-3 native destekler. 3072 boyutu 1024’e indirince storage %66 azalır, accuracy kaybı sadece %1.5-3.










Ömer ÖNAL
Mayıs 18, 2026Embedding model seçimini ‘OpenAI alır geçeriz’ diye yapan ekipleri uyarıyorum: Voyage AI finansal-hukuki domainde MTEB’in 4-7 puan üzerinde, Cohere Embed v3 multilingual + Türkçe’de OpenAI’ı geçiyor. Mixedbread mxbai-embed-large self-hosted senaryoda GPU başına $0.0008 maliyetle çalışıyor. Karar kriteri: domain + dil + maliyet üçgenini gold dataset üzerinde ölçmeden seçme. — Ömer Önal