Vector DB 2026: pgvector Milvus Qdrant Üretim Karşılaştırma

Q: Recall@10 metriği için ideal değer ne?

RAG use case'lerinde recall@10 > %90 hedef olmalı. %85'in altında LLM hallucination riski yükseliyor.

Q: Vector DB için backup stratejisi nasıl olmalı?

İki katmanlı: raw embedding'lerin object storage'da saklanması ve vector DB'nin daily snapshot'ı.

Q: Multi-tenancy vector DB'de nasıl sağlanır?

Üç pattern var: tenant başına ayrı collection, tek collection + metadata filter, tenant başına ayrı cluster.

Haziran 11, 2026Ömer ÖNAL1 Yorum

Pinecone 2025 State of Vector Search raporu, vector database pazarının yıllık %78 büyüdüğünü, ortalama kurumsal vektör sayısının 24 ay içinde 50 milyondan 800 milyona çıktığını gösteriyor. En yaygın production sorun: yanlış HNSW parametresi yüzünden recall@10 metriği %85’ten %62’ye düşüyor. Konuyla ilişkili olarak Vector Quantization 2026: Matryoshka Embeddings ve Binary Embedding Production rehberimiz detaylı incelemeyi içerir.

📖 6 dakikalık okuma

İçindekiler

Vector Database 2026: RAG'in Altyapı Omurgası
Üç Teknolojinin Mimari Karşılaştırması
HNSW vs IVF-PQ: Index Algoritması Seçimi
HNSW Parametreleri: ef_construction ve M Tuning
Hybrid Search: Dense + Sparse Birleşimi
Sharding Stratejisi ve Cluster Operasyonu
Kurumsal Vector DB Dönüşümünde Karşılaşılan Tipik Sorunlar
Sonuç
Sıkça Sorulan Sorular

Vector Database 2026: RAG’in Altyapı Omurgası

Retrieval-Augmented Generation (RAG) mimarileri 2024-2025’te kurumsal LLM standardı haline geldi; vektör veri tabanları bu mimarinin omurgası. Forrester 2025 Vector Database Wave değerlendirmesinde pgvector (PostgreSQL extension), Milvus ve Qdrant açık kaynak liderler olarak konumlandı. Gartner 2025 verilerine göre kurumsal RAG implementasyonlarının %71’i bu üç teknolojiden birini kullanıyor; Pinecone ve Weaviate managed segment’te güçlü. Pazar 2026 sonunda $4.6 milyar büyüklüğe ulaşacak (IDC tahmini).

Müşterilerimde gördüğüm en sık production hatası: pgvector’ı 50M+ vektöre zorlamak. Eşik 5-10M civarı; bu noktanın üstünde sharding, partitioning ve özelleşmiş vector DB’ler kaçınılmaz. pgvector PostgreSQL deneyimi olan ekipler için golden path ama scale limit’i gözden kaçırılıyor.

Üç Teknolojinin Mimari Karşılaştırması

pgvector PostgreSQL extension olarak çalışıyor; mevcut PostgreSQL altyapısına sıfır yatırımla vector search ekliyor. Milvus dedicated distributed vector DB; cluster mode ile multi-billion vector ölçeğine erişiyor. Qdrant Rust-based, single-node ve cluster mode’da çalışıyor; hızlı setup ve hybrid search (dense + sparse) ile öne çıkıyor.

Özellik	pgvector	Milvus	Qdrant
Tipik vektör sayısı	1M-10M	10M-10B+	1M-1B
Index tipi	HNSW, IVFFlat	HNSW, IVF, DiskANN	HNSW
Query latency (p99)	20-200ms	10-100ms	5-80ms
Hybrid search	Sınırlı	Sparse + dense	BM25 + dense
Sharding	Manuel	Otomatik	Otomatik

Vector Database Production 2026: pgvector, Milvus ve Qdrant Operasyon Rehberi — Görsel 1

HNSW vs IVF-PQ: Index Algoritması Seçimi

Vektör arama için en yaygın iki algoritma HNSW (Hierarchical Navigable Small World) ve IVF-PQ (Inverted File with Product Quantization). HNSW yüksek recall ve düşük latency sunar ama bellek tüketimi yüksek; IVF-PQ bellek-efficient ama recall daha düşük. Üretim seçimi vektör sayısı ve bellek bütçesine bağlı.

HNSW: 1M-100M vektör, yüksek bellek (vektör başına ~1.5KB), p99 < 100ms, recall@10 > %95
IVF-PQ: 100M+ vektör, düşük bellek (vektör başına ~50-200 byte), p99 200-500ms, recall@10 %75-85
DiskANN (Milvus): SSD-based; 1B+ vektör, ortalama bellek, p99 100-300ms
Hybrid: HNSW + product quantization; bellek ve recall arasında denge

Feature store entegrasyonu için feature store rehberimize bakabilirsiniz.

HNSW Parametreleri: ef_construction ve M Tuning

HNSW iki kritik parametreye sahip: M (her node’un graf bağlantı sayısı, default 16) ve ef_construction (index build sırasında aday komşu sayısı, default 200). Bu iki parametrenin yanlış değeri Pinecone 2025 raporundaki recall%62 düşüşünün başlıca sebebi. Tipik öneri: M=16-48, ef_construction=200-800. ef_construction artırmak build süresini lineer artırıyor ama recall’ı 1-3 puan iyileştiriyor.

Vector Database Production 2026: pgvector, Milvus ve Qdrant Operasyon Rehberi — Görsel 2

Hybrid Search: Dense + Sparse Birleşimi

Pure dense vector search semantic anlam yakalıyor ama exact keyword match’i kaçırıyor (örn. ürün kodu, vergi numarası). Hybrid search dense embedding + BM25/sparse vector kombinasyonu ile bu boşluğu kapatıyor. Qdrant 2025’te native hybrid search desteğini ekledi; Milvus 2.4+ sparse vector field destekliyor; pgvector için ek tsvector kolon + manual fusion gerekiyor. Qdrant resmi makalesinde hybrid search detaylı işleniyor.

Use Case	Pure Dense	Pure Sparse	Hybrid
Semantic Q&A	Yüksek recall	Düşük recall	En yüksek
Exact term match	Düşük	Mükemmel	Mükemmel
Ürün arama	İyi	İyi	En iyi
Maliyet	Embedding	İndeks	Toplam
Latency overhead	Baseline	+5-15ms	+10-25ms

Sharding Stratejisi ve Cluster Operasyonu

100M+ vektöre ulaşıldığında sharding zorunlu. Milvus query node + data node + index node ayrımıyla otomatik sharding sunuyor; Qdrant collection-level sharding desteği var. pgvector PostgreSQL’in native partitioning’ini kullanmak zorunda; manuel ve hata-yüksek. Sharding stratejisi öncesi vektör ID dağılımı (hash-based mi range-based mi), query pattern (tek query mi cross-shard mi), replication factor (3 standart) belirlenmeli.

Vector Database Production 2026: pgvector, Milvus ve Qdrant Operasyon Rehberi — Görsel 3

Kurumsal Vector DB Dönüşümünde Karşılaşılan Tipik Sorunlar

Danışmanlık projelerinde gözlemlenen tipik darboğazlar:

pgvector 50M+ vektöre zorlanıyor, p99 latency patlamaya başlıyor
HNSW ef_construction default’ta bırakılıyor, recall%85’ten %62’ye düşüyor
Embedding model değişimi sonrası index rebuild planlanmıyor, eski model + yeni query yanlış sonuç veriyor
Hybrid search gerektiren use case’lerde pure dense kullanılıyor, exact match kaçıyor
Cluster sharding stratejisi yapılmadan production’a çıkılıyor, 6 ay sonra rebuild gerekiyor
Backup ve disaster recovery planlaması atlanıyor; vektör DB tek nokta arıza

Sonuç

Vector DB seçimi 2026’da artık “hangisi en hızlı” değil, “hangisi operasyonel maliyeti en düşük” sorusu. pgvector 1-10M vektöre kadar PostgreSQL deneyimi olan ekipler için golden path; Milvus 100M+ vektör + hibrit cloud için; Qdrant hızlı setup + hybrid search isteyenler için doğru. Karar öncesi mutlaka mevcut vektör sayısını, 12-24 ay büyüme tahmini, recall hedefi (%85, %95, %99 hangisi yeterli) ve p99 latency budget’ı netleştirin. Bu dört metrik olmadan seçim 9-12 ay sonra migrate edileceğiniz bir karara dönüşüyor.

Sıkça Sorulan Sorular

pgvector ne zaman yetersiz kalır?

5-10M vektör eşiğinin üstünde ve p99 < 100ms hedefi olan use case'lerde pgvector zorlanıyor. PostgreSQL replication ve vacuum'unun vektör workload'ına uyumsuzluğu büyük cluster'larda görünür hale geliyor. Bu noktada Milvus veya Qdrant'a geçiş öneriliyor.

Recall@10 metriği için ideal değer ne?

RAG use case’lerinde recall@10 > %90 hedef olmalı. %85’in altında LLM hallucination riski yükseliyor çünkü doğru context retrieve edilmiyor. Production’da recall’ı sürekli ölçmek için ground truth test set hazırlanmalı.

Embedding model değiştiğinde tüm vektörleri yeniden mi üretmeli?

Evet. Farklı model’lerin embedding space’leri uyumsuz; karıştırılırsa benzerlik sorgusu yanlış sonuç verir. Migration sırasında dual-index pattern (eski model + yeni model paralel) öneriliyor; gradual rollout ile test edilir.

Vector DB için backup stratejisi nasıl olmalı?

İki katmanlı: raw embedding’lerin source-of-truth olarak object storage’da (S3/GCS) saklanması, vector DB’nin daily snapshot’ı. Vector DB tek başına source-of-truth olmamalı; rebuild senaryosu için raw embedding’ler şart.

Multi-tenancy vector DB’de nasıl sağlanır?

Üç pattern var: tenant başına ayrı collection (Qdrant, Milvus), tek collection + metadata filter (pgvector için ideal), tenant başına ayrı cluster (büyük tenant’lar için). Seçim tenant sayısı ve isolation gereksinimine bağlı.

Ömer ÖNAL

Yazılım Mimarı | Yapay Zeka LLC. Ölçeklenebilir SaaS, .NET Core altyapıları ve Otonom AI süreçleri inşa ediyorum. Kod değil, sistem tasarlarım.

Yorum (1)

Ömer ÖNAL
Mayıs 23, 2026
Yanıtla

Vector DB seçimi 2026’da artık ‘hangisi en hızlı’ değil, ‘hangisi operasyonel maliyeti en düşük’ sorusu. Müşterilerimde gördüğüm gerçek: pgvector PostgreSQL deneyimi olan ekipler için golden path; Milvus 100M+ vektör ve yüksek recall isteyenler için; Qdrant hızlı setup ve hybrid search isteyenler için. En sık hata: pgvector’ı 50M+ vektöre zorlayıp p99 latency’yi patlatmak. Eşik 5-10M civarı. — Ömer ÖNAL

Our Gallery

Contact Info

Vector Database Production 2026: pgvector, Milvus ve Qdrant Operasyon Rehberi