Elastic’in 2025 Search Performance raporu hibrit BM25 + vektör yaklaşımının saf vektör aramaya kıyasla recall@10 metriğini %29 artırdığını gösteriyor. Microsoft 2025 araştırması tam eşleşme gerektiren sorgularda vektör aramanın doğruluğunun %62’ye düştüğünü kanıtlıyor; hibrit arama kurumsal RAG’in olmazsa olmazı.
Hibrit Arama Anatomisi ve 2026 Pazar Bağlamı
Hibrit arama BM25 (sparse, keyword-based) ve dense vector (semantic) retrieval’ı birleştiren yaklaşımdır. İkisinin de güçlü ve zayıf yanları farklı; kombinasyonu kurumsal arama uygulamalarında lider performans sunuyor. BM25 tam eşleşme ve nadiren rastlanan terimlerde lider; dense vector semantik benzerlik ve paraphrase’lerde lider. Hibrit pattern her ikisinin avantajını birleştiriyor.
2026’da vector database pazarı Weaviate, Qdrant, Pinecone, Milvus, Vespa, pgvector arasında bölünüyor. Pinecone managed lider; Weaviate self-host enterprise pazar payı kazandı; Qdrant hızlı büyüyen alternatif; pgvector PostgreSQL-native basit kurulum için varsayılan. Her birinin throughput, latency, hibrit destek profili farklı.
Reciprocal Rank Fusion (RRF) hibrit sonuçları birleştirmek için en yaygın algoritma; basit ve etkili. Detaylar için Weaviate Hybrid Search ve Qdrant Hybrid Search referans niteliğindedir.
BM25 ve Dense Vector Mimari Boyutları
BM25 (Best Matching 25) Okapi BM25 algoritmasının modern uygulaması. Inverted index üzerinde keyword matching; her terim için TF-IDF değişimi hesaplanıyor. Elasticsearch ve OpenSearch BM25 implementasyonunun referansı; Lucene tabanlı. Dense vector embedding modeli ile cosine similarity üzerinde HNSW veya IVF-PQ indeks kullanıyor.
| Aspect | BM25 | Dense Vector | Hibrit (RRF) |
|---|---|---|---|
| Tam eşleşme | Mükemmel | Zayıf | Mükemmel |
| Semantik benzerlik | Zayıf | Mükemmel | Mükemmel |
| Paraphrase | Zayıf | Güçlü | Güçlü |
| Recall@10 | %68 | %72 | %93 |
| NDCG@10 | 0,62 | 0,68 | 0,87 |
| Latency | 15-25 ms | 40-80 ms | 50-95 ms |

Karar Matrisi: Vector DB Seçimi
Vector database seçiminde altı kriter belirleyici: throughput, latency, hibrit destek, fiyatlama, self-host/managed, ekosistem. Aşağıdaki kriterler 2025-2026 saha pratiğine dayalı varsayılan tercihleri özetler:
- 10M altı vektör + PostgreSQL stack: pgvector varsayılan, basit kurulum
- 100M+ vektör + managed: Pinecone (en yüksek throughput)
- Self-host + native hibrit + enterprise: Weaviate
- Çok yüksek throughput + Rust performance: Qdrant
- Çoklu modalite (text + image): Milvus veya Weaviate multi-vector
- SPLADE sparse vector + dense hibrit: Vespa veya Qdrant 2025 sparse desteği
İlgili konu: RAG re-ranking rehberimizde hibrit retrieval sonrası iki aşamalı pipeline pattern’ini anlattık.
RRF Implementation Pattern
Reciprocal Rank Fusion algoritması basit ama etkili. Her sorgu için BM25 ve dense vector sonuçları ayrı ayrı sıralanıyor; her doküman için RRF score = sum(1 / (k + rank)) hesaplanıyor (k=60 varsayılan). En yüksek skorlu dokümanlar final sıralamayı oluşturuyor. Bu basit formül karmaşık learning-to-rank yaklaşımlarının %94’üne ulaşıyor; çoğu senaryoda yeterli.
Alternatif yaklaşımlar: convex combination (α × BM25 + (1-α) × dense), learned fusion (LightGBM ile), cross-encoder reranking. Cross-encoder reranking ek %5-12 doğruluk kazandırıyor ama latency ekliyor. SPLADE sparse vector pattern’i 2024-2025’in yeni yaklaşımı; learned sparse representations BM25’ten üstün. Naver Labs’in SPLADE araştırması referans niteliğindedir; detaylar için SPLADE GitHub kaynak.

Operasyon, Throughput ve Maliyet
Vector DB seçimini throughput ve maliyet beraber belirler. Pinecone p1.x1 instance saatlik 0,096 USD, 5000 QPS throughput; Weaviate self-host eşdeğer için ~0,15 USD/saat (GPU değil CPU). Qdrant Rust implementation sayesinde aynı resource’la %35 daha yüksek throughput sunuyor. 100M vektör için aylık maliyet: Pinecone p1.x4 800 USD, Weaviate self-host ~350 USD, pgvector ~200 USD.
| Vector DB | QPS (HNSW) | P99 Latency | Hibrit Native | 100M Vector Aylık |
|---|---|---|---|---|
| Pinecone | 5.000 | 40 ms | 2025 sürümü | 800 USD |
| Weaviate (self-host) | 3.500 | 60 ms | Native | 350 USD |
| Qdrant (self-host) | 4.800 | 45 ms | Native 2025 | 320 USD |
| pgvector | 1.200 | 85 ms | SQL ile manual | 200 USD |
| Milvus | 4.200 | 50 ms | Yes | 380 USD |
Sektörel Use Case’ler
E-ticarette ürün arama hibrit zorunlu; “ABC-2026 ürün kodu” tam eşleşme + “kırmızı koşu ayakkabısı” semantik birlikte çalışıyor. Hukukta sözleşme arşivinde hibrit mantıksal; case numarası ve madde adı tam eşleşme, konsept arama semantik. Sağlıkta ICD-10 kodu ve semptom açıklaması hibrit ile birlikte aranıyor.
Pinecone’un 2025 Customer Stats raporu, hibrit aramaya geçen müşterilerin retrieval doğruluğunu ortalama %29 artırdığını gösteriyor. Tek başına dense vector arama 2024’ten itibaren mainstream production’da yeterli görülmüyor. 2026’da hibrit arama RAG mimarisinin temel pattern’i, opsiyon değil.

Kurumsal Hibrit Arama Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- Sadece dense vector arama; tam eşleşme sorgularında doğruluk %62’ye düşüyor
- RRF k parametresini varsayılan bırakma; k=60 her senaryoda optimal değil
- BM25 stop word ve tokenizer’ı Türkçe için özelleştirmeme
- Vector DB seçiminde hibrit native desteği kontrol etmeme; sonradan migration zorluğu
- Re-ranking adımını atlama; recall yüksek ama precision optimize edilmiyor
- Throughput testini production scale’de yapmama; demo’da güzel, prod’da yetersiz
Sonuç
Hibrit arama 2026 RAG mimarisinin temel pattern’i. BM25 + dense vector + RRF kombinasyonu recall@10 metriğini %29 artırıyor; tek başına yetersiz. Weaviate self-host enterprise için, Pinecone managed yüksek throughput için, Qdrant performans odaklı use case’ler için, pgvector basit kurulum için varsayılan. Pilot 3 hafta: mevcut RAG’a hibrit ekle, A/B test ile recall@5, recall@10, MRR metriklerini ölç. Yatırım çoğunlukla aynı ay içinde geri ödüyor.
Sıkça Sorulan Sorular
RRF k parametresini nasıl seçmeli?
Varsayılan k=60 çoğu use case’de işe yarar. Daha küçük k (k=20-40) BM25 ağırlığını artırır; daha büyük k (k=80-100) dense vector’u öne çıkarır. A/B test ile optimize edilir.
Weaviate ve Qdrant arasında nasıl seçim?
Weaviate olgun, geniş ekosistem, GraphQL API güçlü. Qdrant Rust ile daha yüksek throughput, daha düşük memory. Hızlı PoC için Weaviate, yüksek scale için Qdrant.
SPLADE sparse vector BM25’in yerini alır mı?
Belirli senaryolarda evet. Learned sparse representations BM25’ten %8-15 daha yüksek doğruluk. Ancak embedding maliyeti var; her sorgu için inference gerekiyor.
pgvector enterprise scale için yeterli mi?
50M vektör altında evet, üstünde sınırlı. PostgreSQL ekosistemini değiştirmemek için pgvector ideal; 100M+ için specialized vector DB.
Türkçe için BM25 nasıl optimize edilir?
Türkçe stop words listesi, Zemberek veya Snowball Turkish stemmer, lowercase normalizasyonu. Elasticsearch Turkish analyzer hazır pattern.










Ömer ÖNAL
Mayıs 23, 2026Kurumsal arama mimarisinde sadece vektör araması büyük tuzak. Müşterilerimizde gözlemlediğimiz tipik problem: ürün kodu, sözleşme numarası, kişi adı gibi tam eşleşme gerektiren sorgular vektör aramada düşük doğruluk veriyor. BM25 ile hibrit RRF (Reciprocal Rank Fusion) kombinasyonu, tek başına vektör aramaya kıyasla doğruluğu %29 artırıyor. Production’da varsayılan tercih hep hibrit. — Ömer ÖNAL