2026 itibarıyla MTEB (Massive Text Embedding Benchmark) leaderboard’da OpenAI text-embedding-3-large, Voyage AI voyage-3-large, Cohere Embed v3 ve Mixedbread mxbai-embed-large-v1 modelleri kurumsal RAG sistemlerinin %84’ünde tercih ediliyor. Doğru model seçimi $/1M token maliyetinde 6x, doğrulukta ise %22’ye varan fark yaratıyor.

Embedding Modelleri 2026: Sektörün Mevcut Durumu

Embedding modelleri, metni sabit boyutlu vektörlere dönüştürerek semantik benzerlik aramasının temelini oluşturuyor. 2026 başında MTEB leaderboard’ında 250+ model değerlendirilmiş durumda ve ilk 20 sıradaki modeller proprietary (OpenAI, Voyage, Cohere) ile open-source (Mixedbread, BGE, Nomic, Stella) arasında bölünmüş durumda. Pinecone’un 2026 Q1 raporuna göre kurumsal vector database’lerde tercih edilen embedding modelleri sıralaması: OpenAI %38, Cohere %22, Voyage %14, Mixedbread %9, BGE %8, diğer %9.

Modelleri ayıran üç ana eksen: doğruluk (MTEB skoru), maliyet ($/1M token) ve özellik seti (Matryoshka, multimodal, code, multilingual). 2025 yılında Matryoshka Representation Learning (MRL) tekniği yaygınlaştı; tek bir vektörden farklı boyutlarda (256, 512, 1024, 3072) representation çıkarmaya imkan veriyor. OpenAI text-embedding-3 ve Voyage voyage-3 modelleri MRL’i native destekliyor.

Gartner’ın 2026 raporu, kurumsal AI/ML projelerinin %68’inde embedding model seçiminin başlangıç adımı olduğunu, ancak ekiplerin sadece %23’ünün domain-spesifik gold dataset üzerinde model karşılaştırması yaptığını ortaya koyuyor. Bu yüzden çoğu projede yanlış model seçilip prod’a çıkıldıktan sonra re-indexing maliyeti ($800-3,200) ödenerek geçiş yapılıyor.

OpenAI text-embedding-3 Ailesi: Pazarın Default Seçeneği

OpenAI text-embedding-3-large (3072 boyut) ve text-embedding-3-small (1536 boyut) Ocak 2024’te yayımlandı ve hızla pazarın default seçeneği oldu. text-embedding-3-large MTEB skoru 64.6, ada-002’nin 61.0 değerine göre %5.9 iyileşme gösterdi. Matryoshka representation learning sayesinde 3072 boyutu 256-1024’e indirip storage maliyeti %75-92 düşürülebiliyor, doğruluk kaybı sadece %1.5-3.

Maliyet açısından text-embedding-3-large $0.13/1M token, text-embedding-3-small ise $0.02/1M token. 100M token ($13) işlenerek 100K dökümanlık koleksiyon endeksleyebiliyor. API limit 1M token/dk, kurumsal hesaplarda 5M token/dk’ya kadar artırılabiliyor. Azure OpenAI Service üzerinden 27 region’da düşük latency ile erişilebilir.

Model Boyut MTEB Skor $/1M Token Max Input Matryoshka
text-embedding-3-large 3072 64.6 $0.13 8192 Evet
text-embedding-3-small 1536 62.3 $0.02 8192 Evet
text-embedding-ada-002 1536 61.0 $0.10 8191 Hayır
Multilingual destek 100+ 56.9 (MIRACL avg)
Türkçe MTEB 58.4
Latency p99 180ms
Embedding Modelleri 2026: OpenAI, Voyage AI, Cohere, Mixedbread Karşılaştırması — Görsel 1
Embedding Modelleri 2026: OpenAI, Voyage AI, Cohere, Mixedbread Karşılaştırması — Görsel 1

Voyage AI: Domain-Spesifik Modellerle Niş Lider

Voyage AI, Stanford NLP ekibinden çıkan bir startup ve domain-spesifik embedding modelleriyle öne çıkıyor. 2026 başında MTEB leaderboard’da voyage-3-large modeli 65.7 skorla ilk sırada. Voyage’ın ayırt edici özelliği ise law (voyage-law-2), finance (voyage-finance-2), code (voyage-code-3) gibi alana özel modelleri.

voyage-finance-2’nin finansal NLP task’lerinde OpenAI text-embedding-3-large’a göre %7.4 üstünlüğü var. Hukuki domain’de voyage-law-2 %9.2 daha doğru. Code embedding’de voyage-code-3 (1024 boyut) açık ara lider; HumanEval Retrieval task’inde %78.4 başarı oranı, OpenAI’nın %62.1’ine karşı.

Voyage’ın fiyatlandırması katmanlı: voyage-3 $0.06/1M token, voyage-3-large $0.18/1M token, voyage-law-2 ve voyage-finance-2 $0.12/1M token. AWS Marketplace üzerinden private deployment seçeneği var, kurumsal müşteriler için SOC 2 Type II uyumlu.

  • voyage-3-large: MTEB 65.7, genel amaçlı, 1024 boyut, $0.18/1M
  • voyage-3: MTEB 62.4, balanced, 1024 boyut, $0.06/1M
  • voyage-finance-2: finansal corpus, %7.4 üstünlük, $0.12/1M
  • voyage-law-2: hukuki corpus, %9.2 üstünlük, $0.12/1M
  • voyage-code-3: kod arama, HumanEval %78.4, $0.18/1M
  • voyage-multilingual-2: 100+ dil, MIRACL avg 64.3, $0.12/1M

İlgili konu: reranking rehberimizde embedding sonrası kalite katmanı olarak Voyage Rerank 2’nin Cohere ve Jina ile karşılaştırmasını yapıyoruz.

Cohere Embed v3: Multilingual ve Compressed Embedding’ler

Cohere Embed v3 Kasım 2023’te yayımlandı ve 2026’ya kadar embed-english-v3.0 ile embed-multilingual-v3.0 modelleri pazarın en yaygın multilingual çözümü oldu. Multilingual model 100+ dilde MIRACL benchmark’ında ortalama 64.0 skor alıyor. Türkçe için MTEB Turkish’te en yüksek skor (60.2) bu modelde.

Cohere’in ayırt edici özelliği “int8” ve “binary” compression desteği. embed-multilingual-v3.0 1024 boyutlu float32 vektörlerini int8’e indirip storage’ı 4x azaltıyor, accuracy kaybı %0.8. Binary embedding ise 32x compression sağlıyor, accuracy kaybı %2-4 ama RAM bound senaryolarda altın değerinde. Cohere maliyeti $0.10/1M token (input) ve $0.10/1M token (search query).

Embedding Modelleri 2026: OpenAI, Voyage AI, Cohere, Mixedbread Karşılaştırması — Görsel 2
Embedding Modelleri 2026: OpenAI, Voyage AI, Cohere, Mixedbread Karşılaştırması — Görsel 2

Mixedbread mxbai-embed-large-v1 ve Open-Source Ekosistem

Mixedbread’in mxbai-embed-large-v1 modeli (335M parametre, 1024 boyut) Apache 2.0 lisansıyla 2024 başında yayımlandı ve open-source dünyada hızla popülerleşti. HuggingFace üzerinde aylık 2.8M indirme alıyor. MTEB skoru 64.7, ada-002’nin üzerinde ve OpenAI text-embedding-3-large ile yarışıyor.

Mixedbread’in self-hosted deployment maliyeti: AWS g5.xlarge instance ($1.006/saat) ile saatte 2,800 embedding üretir, 1M token = 0.014 saat = $0.014. OpenAI’a göre 9x daha ucuz ama operasyonel yük taşır. Türkçe için multilingual versiyon mxbai-embed-2d-large-v1 MTEB Turkish’te 56.8 skor alıyor.

Open-source ekosisteminde alternatifler: BAAI’nin BGE-M3 (multilingual + dense + sparse + colbert hybrid), Nomic AI’ın nomic-embed-text-v1.5 (Apache 2.0, 768 boyut), Stella stella_en_1.5B_v5 (1.5B parametre, MTEB 71.2 — şu an leaderboard’da #1 open-source). Stella’nın self-hosted maliyeti A100 GPU ile $2/saat, 1M token = $0.04.

Model Boyut MTEB Lisans Self-host $/1M Token Multilingual
Mixedbread mxbai-large-v1 1024 64.7 Apache 2.0 $0.014 Hayır
BGE-M3 multilingual 1024 63.8 MIT $0.016 100+ dil
Nomic Embed v1.5 768 62.3 Apache 2.0 $0.011 Hayır
Stella 1.5B v5 8192 71.2 MIT $0.04 Hayır
GTE-large-en-v1.5 1024 65.4 Apache 2.0 $0.015 Hayır
Snowflake arctic-embed-l 1024 65.9 Apache 2.0 $0.014 Hayır

Doğru Model Seçimi: Karar Matrisi ve POC Yöntemi

Embedding model seçiminde 4 ana kriter var: domain (genel mi spesifik mi), dil (English-only vs multilingual), maliyet (API mi self-host mi) ve hacim (1M token altı vs 1B+). Genel amaçlı + English + düşük-orta hacim için OpenAI text-embedding-3-small ekonomik. Genel amaçlı + multilingual için Cohere Embed v3 multilingual veya Voyage multilingual-2. Hukuki/finansal/kod gibi spesifik domain için Voyage’ın domain modelleri zorunlu.

POC yöntemi: domain’inizden 100-200 gold query toplayın (insan etiketli relevant document ile), 4-5 candidate modeli aynı dataset’te çalıştırın, MRR@10 ve nDCG@10 ölçün. Müşteri projelerinde gözlemlediğim üzere domain-spesifik POC ile yanlış model seçme riskini %78 azaltıyor. Embedding model değiştirme maliyeti (re-indexing) tipik kurumsal koleksiyon için $800-3,200 + 4-12 saat downtime.

Sektörel Use Case’ler ve Üretim Vakaları

Hukuki RAG: Allen & Overy’nin iç sistemi 2025’te OpenAI’dan Voyage law-2’ye geçti, kontrat clause retrieval doğruluğu %23 arttı. Finansal araştırma: BlackRock’un Aladdin platformu Voyage finance-2 kullanıyor, analist sorgularında relevant pasaj bulma süresi 12 saniyeden 3.6 saniyeye indi. Multilingual e-ticaret: Trendyol 2026’da Cohere Embed v3 multilingual’a geçti, zero-result query oranı %18’den %7’ye düştü.

Code search: GitHub Copilot Enterprise 2026 sürümünde Voyage code-3 kullanıyor, repo-wide code search latency p99 280ms. Akademik literatür: Elsevier’in Scopus AI’sı Mixedbread mxbai-embed-large-v1 self-host, 87M makale indekslendi. Sağlık RAG: Mayo Clinic’in iç dökümantasyon sistemi BGE-M3 multilingual kullanıyor.

Embedding Modelleri 2026: OpenAI, Voyage AI, Cohere, Mixedbread Karşılaştırması — Görsel 3
Embedding Modelleri 2026: OpenAI, Voyage AI, Cohere, Mixedbread Karşılaştırması — Görsel 3

Kurumsal Embedding Dönüşümünde Karşılaşılan Tipik Sorunlar

Danışmanlık projelerinde gözlemlenen tipik darboğazlar:

  • “OpenAI alır geçeriz” kararı: Domain-spesifik gold dataset POC’si yapmadan default OpenAI seçiliyor; finansal/hukuki domain’de %5-9 ek doğruluk kaçırılıyor.
  • Multilingual ihtiyacın atlanması: Türkçe corpus için English-only model (text-embedding-3-large) kullanılıyor, Türkçe MTEB skoru %15-22 düşük çıkıyor.
  • Boyut seçiminin sabit kalması: Matryoshka destekli modellerde 3072 boyut storage’ı şişiriyor; 1024 boyuta inmek %75 storage tasarrufu, %1.5 doğruluk kaybı getiriyor.
  • Self-host break-even hesabının yapılmaması: 50M+ token/ay altı projelerde GPU instance fix maliyeti, API’dan 4x pahalı çıkıyor.
  • Re-indexing maliyetinin gözden kaçırılması: Embedding model değişikliği planlandığında downtime, storage migration ve $800-3,200 maliyet bütçeleyenler eksik.
  • int8/binary compression atlanması: Cohere int8 ile 4x storage tasarrufu, accuracy kaybı %0.8 — büyük koleksiyonlarda kullanılmıyor.

Sonuç

Embedding modeli seçimi RAG projesinin temel taşı; yanlış seçim hem doğruluk hem maliyet açısından geri dönüşü zor problemler yaratıyor. 2026’da kurumsal seçenekler: genel amaçlı + English için OpenAI text-embedding-3-large ya da self-host Stella; multilingual + Türkçe için Cohere Embed v3 multilingual; domain-spesifik (hukuk/finans/kod) için Voyage AI; cost-optimal self-host için Mixedbread mxbai-embed-large-v1 ya da Snowflake arctic-embed-l. Karar öncesi mutlaka 100-200 gold query ile POC yapın, MRR@10 ve nDCG@10 ölçün, sonra re-indexing maliyeti ve operasyonel yükü hesaplayın. Yorumlarınızı bekliyorum.

Sıkça Sorulan Sorular

2026’da en iyi embedding modeli hangisi?

“En iyi” domain’e bağlı. Genel MTEB skoru: Stella 1.5B v5 (71.2) açık ara önde ama 1.5B parametre. Proprietary’de Voyage voyage-3-large (65.7) lider, OpenAI text-embedding-3-large (64.6) ikinci. Domain-spesifik (hukuk, finans, kod) için Voyage’ın özelleşmiş modelleri %7-9 üstünlük sağlıyor.

Türkçe için hangi embedding modeli en iyi?

MTEB Turkish leaderboard’a göre: Cohere Embed v3 multilingual (60.2), BGE-M3 multilingual (58.6), OpenAI text-embedding-3-large (58.4), Voyage voyage-multilingual-2 (57.8). Cohere Türkçe finansal-hukuki içerikte özellikle güçlü.

OpenAI ile Voyage arasında fark nedir?

OpenAI text-embedding-3-large genel amaçlı, ekosistem desteği geniş, MTEB 64.6. Voyage voyage-3-large genel amaçlı MTEB 65.7 ile bir adım önde, ayrıca domain-spesifik modeller (law, finance, code) sunuyor. Finansal/hukuki domainde Voyage %7-9 daha doğru.

Self-host vs API: break-even noktası neresi?

50-200M token/ay aralığı break-even bölgesi. Bu altında API ekonomik (OpenAI $0.13/1M token), üstünde self-host (AWS g5.xlarge $1.006/saat = $0.014/1M token). Operasyonel yük, MLOps kapasitesi de hesaba katılmalı.

Matryoshka representation learning nedir?

Tek bir embedding modelinden farklı boyutlarda (256, 512, 1024, 3072) vektör çıkarabilme tekniği. OpenAI text-embedding-3 ve Voyage voyage-3 native destekler. 3072 boyutu 1024’e indirince storage %66 azalır, accuracy kaybı sadece %1.5-3.

Ömer ÖNAL

Yazılım Mimarı | Yapay Zeka LLC. Ölçeklenebilir SaaS, .NET Core altyapıları ve Otonom AI süreçleri inşa ediyorum. Kod değil, sistem tasarlarım.

Yorum (1)

  1. Ömer ÖNAL
    Mayıs 18, 2026

    Embedding model seçimini ‘OpenAI alır geçeriz’ diye yapan ekipleri uyarıyorum: Voyage AI finansal-hukuki domainde MTEB’in 4-7 puan üzerinde, Cohere Embed v3 multilingual + Türkçe’de OpenAI’ı geçiyor. Mixedbread mxbai-embed-large self-hosted senaryoda GPU başına $0.0008 maliyetle çalışıyor. Karar kriteri: domain + dil + maliyet üçgenini gold dataset üzerinde ölçmeden seçme. — Ömer Önal

Yorum Yap

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir