Gartner’ın 2025 Kurumsal AI Altyapı Raporu’na göre üretim ortamındaki yapay zeka projelerinin %71’i artık özel bir vector veritabanı kullanıyor; pazar büyüklüğü 2024’te 2.2 milyar dolardan 2026 sonunda 7.8 milyar dolara, 2028’de ise 13.4 milyar dolara ulaşacak. Retrieval-Augmented Generation (RAG) mimarileri, semantik arama, öneri sistemleri, hile tespiti ve multimodal arama gibi senaryolar artık 768-3072 boyutlu yoğun vektörlerin milyarlarca satır ölçeğinde milisaniye altı sorgulanmasını zorunlu kılıyor. Bu pillar rehberde Pinecone, Weaviate, Qdrant ve Milvus dört büyük çözümü; indeksleme algoritmaları, p50/p95/p99 latency, QPS, recall, fiyatlandırma, kurumsal güvenlik, hibrit arama ve ekosistem boyutlarında karşılaştırıyor; pgvector, Chroma, LanceDB ve Vespa’nın 2026’da hangi senaryoda öne çıktığını da tek bir karar matrisinde topluyoruz.
Vector veritabanı seçimi 2026 itibarıyla artık tek başına bir “DB tercihi” değil, embedding modeli kararı, retrieval stratejisi ve evaluation pipeline’ı ile birlikte düşünülmesi gereken bir altyapı kararıdır. RAG altyapısının uçtan uca kurulumunu RAG Altyapı Kurulum Rehberi 2026 içeriğinde, geniş kurumsal çerçeveyi ise Kurumsal Yapay Zeka Entegrasyonu 2026 Rehberi içinde ele alıyoruz; bu yazı dört platformu derinlemesine karşılaştıran teknik referans olarak konumlanır.
Vector Veritabanı Nedir, Neden Kurumsal Bir Gerekliliğe Dönüştü?
Vector veritabanı, embedding modellerinin ürettiği yüksek boyutlu (768, 1024, 1536, 3072) yoğun vektörleri saklayan, bu vektörler üzerinde yaklaşık en yakın komşu (ANN – Approximate Nearest Neighbor) sorgusunu milisaniye mertebesinde çalıştıran özelleşmiş bir sistemdir. Geleneksel ilişkisel veritabanı veya Elasticsearch BM25 araması, anlamsal benzerliği değil yüzeysel anahtar kelime eşleşmesini ölçtüğü için “kullanıcı niyeti” sorgularında %30-45 oranında düşük isabet üretir.
Vector DB’lerin omurgasını üç ANN algoritma ailesi oluşturur: graf tabanlı HNSW (Hierarchical Navigable Small World), kümeleme tabanlı IVF (Inverted File Index) ve sıkıştırma tabanlı PQ (Product Quantization). 2026’da DiskANN, ScaNN ve SPANN gibi disk uyumlu varyantlar 1 milyar vektör üstü ölçeklerde standart hale geldi.
- RAG: LLM’in bağlam penceresine doğru chunk’ları yerleştirmek için top-k retrieval kullanılır; 4-16 doküman tipik aralıktır.
- Semantik arama: BM25’e göre %38-45 daha yüksek isabet (NDCG@10) sağlar.
- Öneri sistemi: Kullanıcı-ürün embedding eşleşmesi ile dakikada 200.000 öneri sorgusuna ölçeklenir.
- Hile tespiti: Anomali skorlamasında embedding mesafesi gerçek zamanlı sinyal üretir.
- Multimodal arama: CLIP, SigLIP, ImageBind gibi modellerle metin, görüntü, ses tek uzayda saklanır.
- Kod arama: GitHub Copilot Search, Sourcegraph Cody benzeri ürünlerde fonksiyon-seviyesi embedding kullanılır.
Tipik bir kurumsal RAG sistemi 5-50 milyon chunk, 1024 boyutlu embedding, p99 < 50 ms hedefi ile çalışır. ANN-Benchmarks 2025 sonuçlarına göre HNSW, M=32 ve efConstruction=200 ayarında 0.95 recall için 10.000 QPS üzerinde performans sağlamaktadır. Embedding modeli seçiminin retrieval kalitesi üzerindeki etkisini Embedding Modelleri Karşılaştırması: OpenAI, Cohere, BGE ve Türkçe yazısında detaylandırdık.

ANN Algoritmaları: HNSW, IVF, PQ ve DiskANN Derinlemesine
Vector DB’nin gerçek farkı arayüz değil, altta çalışan ANN algoritmasıdır. Yanlış algoritma seçimi 10 kat daha yavaş sorgu veya %20 daha düşük recall’a yol açabilir. Dört algoritma ailesinin 2026 pratik tablosu:
| Algoritma | Mantık | Bellek Kullanımı | Build Süresi (10M vektör) | Recall@10 | QPS (1 thread) | Uygun Senaryo |
|---|---|---|---|---|---|---|
| HNSW | Çok katmanlı graf | Yüksek (4-6 GB/10M) | 18 dakika | 0.97 | 2.800 | RAM yeterli, p99 kritik |
| IVF-Flat | K-means + lineer arama | Düşük (1.5 GB/10M) | 9 dakika | 0.92 | 1.450 | Bellek kısıtı, batch sorgu |
| IVF-PQ | K-means + sıkıştırma | Çok düşük (350 MB/10M) | 11 dakika | 0.85 | 3.600 | 100M+ vektör, edge |
| DiskANN | SSD üzerinde graf | Diskte (500 GB SSD) | 3 saat | 0.95 | 1.100 | 1B+ vektör, maliyet |
| ScaNN | Anizotropik kuantizasyon | Orta (2 GB/10M) | 22 dakika | 0.94 | 4.200 | Google ölçeği, CPU |
HNSW pratikte 2026 itibarıyla dört platformun da varsayılan indeks tipidir; çünkü 0.95+ recall hedefi ile en yüksek QPS’i sunar. Ancak 100 milyon vektör üzerinde RAM maliyeti hızla artar (50 GB+), bu noktada IVF-PQ veya DiskANN’a geçilir. Milvus, dört algoritmayı da native sunan tek platformdur; Qdrant ve Weaviate yalnızca HNSW + skaler kuantizasyon destekler; Pinecone ise algoritmayı kapatır ve “proprietary” rota yönetir.
Embedding boyut optimizasyonu (PCA, Matryoshka, Binary Quantization) ile aynı recall hedefi için bellek %75 düşürülebilir; detayları Vector Embedding Boyut Optimizasyonu: PCA, Quantization, Matryoshka yazısında inceledik.
Pinecone Derinlemesine: SaaS-Native, Serverless ve Multi-Cloud
Pinecone 2019’da kurulmuş, vector DB pazarını başlatan oyuncudur; 2024’te Series B 100 milyon dolar yatırım almıştır. Tamamen yönetilen SaaS modeli ile çalışır; kullanıcı pod, indeks, replica kavramlarıyla uğraşır ama düşük seviye konfigürasyon (HNSW parametreleri, segment boyutu, compaction) Pinecone tarafından yönetilir. 2024’te tanıtılan Pinecone Serverless mimarisi storage-compute ayrımı getirdi ve maliyeti %50-70 düşürdü.
- Bölgeler: AWS us-east-1, us-west-2, eu-west-1, ap-southeast-1; Azure ve GCP 2025 Q3’te eklendi.
- Mimari: Multi-tenant control plane + tenant başına izole data plane.
- Namespace: Bir indeks içinde mantıksal segregasyon; 100.000’e kadar namespace pratik sınır.
- Metadata filtreleme: Boolean, sayısal, string eşleşme; karmaşık JOIN yok.
- Hibrit arama: 2024’te eklenen sparse-dense fusion (BM25 + vector); ayar manueldir.
- Maks vektör/indeks: Standard 5M, Enterprise 5B; pratik production sınırı 1 milyar.
Pinecone’un en güçlü tarafı operasyonel olgunluk: SOC 2 Type II, HIPAA BAA, ISO 27001, PCI DSS L1; 99.99% SLA, multi-AZ replication, point-in-time recovery (PITR) 7 günlük tutma. En zayıf tarafı vendor lock-in: indeks formatı dışa aktarılamaz, sadece raw vektör + metadata export edilir; bu da büyük migrasyonu 2-4 haftalık projeye dönüştürür.
Weaviate Derinlemesine: Açık Kaynak, Schema-First ve GraphQL
Weaviate 2019’da Hollanda’da SeMI Technologies tarafından kurulmuştur. Go ile yazılmış, Apache 2.0 lisanslı açık kaynaktır; aynı zamanda Weaviate Cloud Services (WCS) yönetilen versiyonu mevcuttur. 2024’te 1.27 sürümü ile çok-vektör (multi-vector) ColBERT desteği ve BlockMaxWAND hibrit arama algoritması eklendi.

Weaviate’in en ayırt edici özelliği schema-first yaklaşımıdır: GraphQL API üzerinden Class (tablo) tanımlanır, properties (alanlar) ve vectorizer (embedding modülü) belirlenir. Built-in modüller arasında text2vec-openai, text2vec-cohere, multi2vec-clip, generative-openai bulunur; embedding üretimi DB içinde yapılır, ayrı pipeline gerekmez.
- Hibrit arama: BM25 + dense vektör reciprocal rank fusion (RRF) ile birleşik skor; alpha parametresi 0-1 arasında.
- Multi-tenancy: Tenant başına izole shard; 500.000 tenant’a kadar ölçeklendi.
- Çok-vektör desteği: 1.27+ sürümünde ColBERT, late-interaction modelleri native.
- Replikasyon: 1.20’den itibaren multi-node, eventually consistent.
- Modüler embedding: 30+ entegrasyon (OpenAI, Cohere, HuggingFace, Bedrock, Vertex).
- Lisans: BSD-3, Apache 2.0; topluluk forku yapmak serbest.
Qdrant Derinlemesine: Rust Performansı ve Düşük Kaynak Tüketimi
Qdrant 2021’de Berlin’de kurulmuş, Rust ile yazılmış açık kaynak vector DB’dir. Apache 2.0 lisanslıdır; Qdrant Cloud yönetilen versiyonu AWS, GCP, Azure üzerinde mevcuttur. Rust seçimi tesadüfi değildir: garbage collection olmaması p99 latency’yi öngörülebilir tutar; Go ile yazılan rakiplerinde GC pause’lar 50-200 ms tail latency yaratabilir.
ANN-Benchmarks 2025 raporunda Qdrant tek-node performansında lider konumdadır: 1 milyon vektör, 768 boyut, recall 0.95 hedefi ile p95 latency 14 ms, p99 18 ms, sustained QPS 4.200 ölçülmüştür. Aynı testte Weaviate p99 35 ms, Milvus 28 ms, Pinecone 22 ms üretmiştir.
- Payload filtreleme: Pre-filtering ile sorgu süresi filtre seçiciliğine göre düşer; tersine post-filtering recall’u korur.
- Skaler kuantizasyon: int8, binary; bellek %75 azalır, recall %2 düşer.
- Snapshot: Hot backup, S3’e otomatik yükleme; RPO 5 dakikaya kadar.
- gRPC + REST: gRPC 3 kat daha düşük latency; production’da tercih edilir.
- Multi-tenancy: Payload index üzerinden tenant_id filtreleme; collection başına 10M tenant.
- Sparse vektör: 1.10 sürümünden itibaren native; SPLADE entegrasyonu mevcut.
Qdrant’ın 2026’daki büyük adımı Qdrant Hybrid Cloud ürünüdür: kontrol düzlemini Qdrant yönetir, veri kullanıcının kendi Kubernetes cluster’ında kalır. KVKK ve veri ikameti gereksinimleri olan Türkiye projeleri için kritik bir mimari avantajdır.
Milvus Derinlemesine: CNCF Graduated, Dağıtık ve Milyar Ölçek
Milvus 2019’da Zilliz tarafından açık kaynak olarak yayımlanmıştır; 2024’te CNCF Graduated statüsüne yükseltilmiştir (Kubernetes, Prometheus, Envoy ile aynı kategori). Go + C++ ile yazılmıştır; ana ayırıcı özelliği tam ayrılmış (disaggregated) mimaridir: compute, storage, coordinator, query node ayrı pod’larda çalışır. Bu sayede 10 milyar vektör ölçeğinde tek bir cluster yatay büyüyebilir.
Milvus iki dağıtım modunda sunulur: Milvus Standalone (tek node, başlangıç projeleri) ve Milvus Distributed (Kubernetes üzerinde, milyar ölçek). Yönetilen versiyon Zilliz Cloud adı altında mevcuttur ve 2025’te serverless tier eklemiştir.
- Çoklu indeks: HNSW, IVF-Flat, IVF-PQ, IVF-SQ8, DiskANN, GPU_CAGRA hepsi native.
- GPU desteği: NVIDIA RAFT entegrasyonu, GPU_CAGRA ile 10x daha hızlı indeks build.
- Partition key: Tenant_id veya zaman bazlı partition; partition başına izole indeks.
- Etcd + Pulsar + S3: Metadata etcd, mesaj queue Pulsar/Kafka, object storage S3/MinIO.
- RBAC: 2.4’ten itibaren rol bazlı erişim; collection-level izolasyon.
- Maks ölçek: Production’da 100B+ vektör; Walmart, Salesforce, Roblox referans müşterileri.
Milvus’un karmaşıklığı küçük ekipler için bariyer olabilir: 6 farklı bileşen yönetimi, etcd quorum, Pulsar message backlog yönetimi gerektirir. 1-5 milyon vektör seviyesinde Qdrant veya Weaviate operasyonel olarak çok daha hafiftir. Ancak 100M+ vektör ve kurumsal observability ihtiyacı varsa Milvus’un mimari yetenekleri belirleyici olur.
2026’da Öne Çıkan Alternatifler: pgvector, Chroma, LanceDB, Vespa
Dört büyük platform dışında 2026’da kurumsal radarda olan dört alternatif var. Hepsi farklı bir tasarım hedefi ile farklı senaryolarda öne çıkıyor.
| Platform | Mimari | Lisans | Maks Pratik Ölçek | Ne Zaman Seçilir? | Sınırlama |
|---|---|---|---|---|---|
| pgvector | PostgreSQL eklentisi | PostgreSQL Lisansı | 5-10M vektör | Mevcut PG, tek transaction | HNSW yavaş build, recall trade-off |
| Chroma | Python-native, embedded | Apache 2.0 | 1-5M vektör | Prototip, notebook, demo | Production kullanım sınırlı |
| LanceDB | Columnar, Arrow tabanlı | Apache 2.0 | 50-200M vektör | Multimodal, ML workflow | Genç ekosistem, sparse zayıf |
| Vespa | Yahoo / Cloud, Java | Apache 2.0 | 1B+ vektör | Hibrit + ranking, e-ticaret | Öğrenme eğrisi dik |
| Elastic Vector | Elasticsearch eklentisi | Elastic v2 / SSPL | 50M vektör | Mevcut ELK stack | Bellek tüketimi yüksek |
| OpenSearch k-NN | Apache 2.0 ELK forku | Apache 2.0 | 100M vektör | AWS native, log entegre | HNSW dışı zayıf |
pgvector 2026’da en hızlı büyüyen kategoridir: Supabase, Neon, Aiven, RDS hepsi yönetilen pgvector sunuyor. 1 milyon vektör altında “ekstra altyapı yok” tercihi ile öne çıkıyor; ancak HNSW indeks build’i tek thread olduğundan 10M üzeri 6+ saat sürer. LangChain Vector Store Survey 2025 raporuna göre yeni projelerin %42’si pgvector ile başlıyor, %18’i 6 ay içinde dedicated vector DB’ye taşınıyor.
Performans Benchmark’ları: QPS, Recall, Latency, Build Süresi
ANN-Benchmarks platformu ve dört platformun official benchmark raporları üzerinden konsolide edilmiş 2025 sonuçları. Test setup: 10M vektör, 1024 boyut, cosine similarity, recall@10 hedef 0.95, 32 vCPU + 128 GB RAM, NVMe SSD.
| Platform | p50 (ms) | p95 (ms) | p99 (ms) | Sustained QPS | Recall@10 | Build Süresi | Bellek (GB) |
|---|---|---|---|---|---|---|---|
| Pinecone Serverless | 14 | 19 | 22 | 3.200 | 0.96 | Managed | Managed |
| Weaviate 1.27 HNSW | 22 | 31 | 35 | 2.600 | 0.95 | 24 dk | 42 |
| Qdrant 1.12 HNSW | 11 | 15 | 18 | 4.200 | 0.97 | 19 dk | 38 |
| Milvus 2.4 HNSW | 17 | 24 | 28 | 3.400 | 0.96 | 21 dk | 44 |
| Milvus 2.4 GPU_CAGRA | 8 | 12 | 15 | 6.800 | 0.97 | 4 dk | 52 + 24 GPU |
| pgvector 0.7 HNSW | 38 | 62 | 89 | 850 | 0.93 | 6 sa 14 dk | 36 |
Qdrant tek-node HNSW kategorisinde lidere oturuyor; GPU senaryosunda Milvus CAGRA kategoriyi domine ediyor. Pinecone Serverless yönetilen kolaylığı ile rekabetçi rakamlar üretiyor ancak QPS başı maliyet en yüksek. pgvector recall@10 0.95’in altında kalıyor; 0.95+ hedefliyorsanız dedicated bir DB gerekli.
Benchmark sonuçları workload’a yüksek hassasiyetle bağımlıdır; payload filtreleme oranı %50’nin üzerine çıkarsa Qdrant pre-filtering avantajı 2-3x öne çıkar. Embedding boyutu 3072’ye yükselirse Milvus DiskANN seçeneği bellek avantajı yaratır.
Hibrit Arama, Multi-Tenancy ve Filtering Feature Matrix
RAG ve enterprise search senaryolarında ham vektör arama yetmez; hibrit arama (BM25 + dense), multi-tenant izolasyon, metadata filtreleme zorunludur. Dört platformun 2026 feature matrisi:
| Özellik | Pinecone | Weaviate | Qdrant | Milvus |
|---|---|---|---|---|
| Hibrit Arama (BM25+Dense) | Sparse-Dense Fusion (manuel) | BlockMaxWAND yerleşik | SPLADE + full-text yerleşik | BM25 + RRF yerleşik |
| Multi-Tenancy | Namespace (100K) | Tenant collection (500K) | Payload filter (10M+) | Partition key (8K active) |
| Pre-filtering | Sınırlı | Var | Native, optimal | Var |
| Post-filtering | Var | Var | Var | Var |
| Çok-vektör (ColBERT) | Yok | 1.27+ yerleşik | Plan 2026 Q2 | 2.4+ yerleşik |
| Skaler Kuantizasyon | Managed | Var (int8) | Var (int8, binary) | Var (SQ8, PQ) |
| Embedding API Yerleşik | Inference API | Vectorizer modülleri | FastEmbed | Function API |
| Replikasyon | Managed multi-AZ | Multi-node | Raft tabanlı | Multi-replica |
| Snapshot/Backup | PITR 7 gün | S3 backup | S3 snapshot | Backup tool |
| RBAC | API key + role | OIDC + API key | JWT + API key | 2.4+ user/role |
Hibrit aramanın katkısı senaryoya göre değişir: e-ticaret ürün araması, hukuk metni araması, dokümantasyon araması gibi terim hassasiyeti yüksek alanlarda saf vector aramaya göre NDCG@10 metriği ortalama %22-27 yükselir. Ragas, TruLens gibi araçlarla bu kazancı production’da ölçmek için RAG Evaluation Pipeline: Ragas, TruLens ve Custom Metrics yazısındaki metodolojiyi kullanabilirsiniz.
Kurumsal Güvenlik, Uyumluluk ve KVKK Boyutu
Kurumsal kullanımda RBAC, audit log, SSO entegrasyonu (SAML, OIDC), encryption at rest (AES-256), TLS 1.3 in transit, IP allowlist, VPC peering, customer-managed keys (CMK) zorunlu kontrollerdir. KVKK ve GDPR uyumluluğu için ek olarak veri ikameti (data residency) garanti edilmelidir.
- API anahtarı rotation politikası: 90 gün maksimum, otomatik audit.
- Vektör metadata’sında PII saklamayın; sadece referans ID ve hash tutun, asıl PII RDBMS’te kalsın.
- Encryption at rest ve TLS in transit varsayılan; production’da plaintext bağlantı reddedilsin.
- KVKK için veri ikamet noktasını sözleşme ile sabitleyin: Pinecone EU bölgesi mevcut ama Türkiye lokasyonu yok; self-hosted Qdrant/Milvus tek alternatiftir.
- Audit log retention 1 yıl minimum; SIEM (Splunk, Datadog) entegrasyonu kurulsun.
- Backup encryption ve restore drill’i her ay çalıştırılsın.
| Sertifikasyon | Pinecone | Weaviate Cloud | Qdrant Cloud | Zilliz Cloud (Milvus) |
|---|---|---|---|---|
| SOC 2 Type II | Evet | Evet | Evet | Evet |
| ISO 27001 | Evet | Evet | Evet | Evet |
| HIPAA BAA | Evet (Enterprise) | Evet | Evet (Enterprise) | Evet |
| PCI DSS | Evet L1 | Roadmap | Roadmap | Roadmap |
| GDPR DPA | Evet | Evet | Evet | Evet |
| EU Bölge | eu-west-1 | eu-central-1 | Frankfurt + Hybrid Cloud | Frankfurt |
| Türkiye Lokasyon | Yok | Self-hosted | Hybrid Cloud (in-VPC) | Self-hosted |
| SLA Uptime | 99.99% | 99.95% | 99.95% | 99.95% |
Kamu, finans, sağlık sektörü projelerinde KVKK madde 9 (yurtdışı aktarım kısıtı) nedeniyle yönetilen SaaS seçenekler çoğunlukla kapı dışı kalır; Qdrant Hybrid Cloud veya self-hosted Milvus Türkiye’deki Equinix IST1, Türk Telekom DC gibi data center’larda çalıştırılır. Geniş güvenlik mimarisini Kurumsal Yapay Zeka Entegrasyonu 2026 Rehberi pillar yazısında inceledik.
Pricing 2026: TCO Analizi ve Maliyet Modelleri
Vector DB maliyeti üç bileşenden oluşur: storage (vektör + index), compute (sorgu işleme), egress (bandwidth). Yönetilen platformlar bu üç bileşeni kombine fiyatlandırır; self-hosted seçeneklerde altyapı maliyetine DevOps zaman maliyeti eklenir.
| Senaryo | Pinecone | Weaviate Cloud | Qdrant Cloud | Zilliz Cloud | Self-Hosted Qdrant | Self-Hosted Milvus |
|---|---|---|---|---|---|---|
| 1M vektör, 100 QPS | 72 USD | 95 USD | 58 USD | 89 USD | 45 USD + DevOps | 120 USD + DevOps |
| 10M vektör, 500 QPS | 695 USD | 340 USD | 185 USD | 285 USD | 165 USD + DevOps | 240 USD + DevOps |
| 50M vektör, 2K QPS | 3.450 USD | 1.580 USD | 820 USD | 1.220 USD | 620 USD + DevOps | 780 USD + DevOps |
| 500M vektör, 10K QPS | 32.500 USD | 14.800 USD | 7.400 USD | 9.800 USD | 5.200 USD + 1 FTE | 6.400 USD + 1 FTE |
| 5B vektör, 50K QPS | 320.000 USD (custom) | 148.000 USD | 62.000 USD | 78.000 USD | 42.000 USD + 2 FTE | 48.000 USD + 2 FTE |
Self-hosted DevOps maliyeti orta ölçekte 1 DevOps mühendisinin %15-20 zamanı (~1.500-2.500 USD/ay TR pazarı), büyük ölçekte 1-2 FTE’ye çıkar. Bu maliyet hesaplanmadığında self-hosted TCO yanıltıcı biçimde düşük görünür.
McKinsey 2025 yapay zeka altyapı raporu, kurumsal RAG sistemlerinin ortalama 14-18 ay içinde yatırımı geri kazandığını gösteriyor; bu sürede destek bileti kapanış süresi %42 düşüyor, çalışan bilgi erişim hızı 3.2x artıyor. ROI ölçümü için RAG Sistemi Nasıl Kurulur Adım Adım Rehberi 2026 yazısındaki metodolojiyi kullanabilirsiniz.
Use Case Karar Matrisi: Hangi Vector DB Hangi Senaryoda?
Tek doğru cevap yoktur; seçim ekip kapasitesi, bütçe, ölçek, regulatory, ekosistem entegrasyonuna göre değişir. 2026 itibarıyla pratik karar matrisi:
- Prototip, demo, < 1M vektör: Chroma veya pgvector. Sıfır ek altyapı, hızlı iteration.
- Mevcut PostgreSQL, < 5M vektör, p99 < 100 ms hedef: pgvector + Supabase/Neon. Transaction sınırı içinde tutarlılık.
- 5-50M vektör, küçük ekip, hız kritik: Pinecone Serverless. Sıfır operasyon, hızlı go-live.
- 5-50M vektör, kontrol + maliyet: Qdrant Cloud veya self-hosted. En iyi tek-node performans.
- 5-50M vektör, hibrit arama + GraphQL DX: Weaviate. Built-in vectorizer modülleri.
- 50M-1B vektör, dağıtık ölçek: Milvus Distributed + Zilliz Cloud. CNCF graduated, multi-replica.
- 1B+ vektör, GPU acceleration: Milvus + GPU_CAGRA. Saatlik build, 6.000+ QPS.
- KVKK + Türkiye data residency: Qdrant Hybrid Cloud veya self-hosted Milvus on-prem.
- E-ticaret + ranking-heavy: Vespa veya Weaviate. Built-in ranking expressions.
- Multimodal (görüntü + metin + ses): Weaviate (multi2vec-clip) veya Milvus (multi-vector).
- Mevcut Elasticsearch stack: Elastic Vector veya OpenSearch k-NN. Tek operasyon merkezli.
- Notebook + ML workflow + Arrow: LanceDB. Columnar format, multimodal native.
Kurumsal Vector DB Seçim Projelerinde Karşılaşılan Tipik Sorunlar
Türkiye ve EMEA pazarında danışmanlık verdiğimiz 40+ kurumsal RAG projesinde tekrarlayan sekiz problem örüntüsü ve çözüm reçetesi:
- Embedding modeli değişimi göz ardı edilir. Vector DB seçildikten sonra embedding modeli güncellenir; eski indeks geçersiz olur. Çözüm: dual-write window, A/B retrieval evaluation, blue-green index swap.
- Recall hedefi tanımsız. “İyi performans” amacı ölçülmediği için fiyat-performans optimizasyonu yapılamaz. Çözüm: NDCG@10 ve MRR baseline’ları, hedef 0.85+ recall.
- Multi-tenant izolasyon eksik. Tek collection’da yüzlerce tenant; veri sızıntısı riski. Çözüm: namespace/tenant collection/partition key tasarımı projeye başlamadan kararlaştırılır.
- Backup ve restore drill’i hiç yapılmaz. İlk gerçek incident’ta veri kaybı yaşanır. Çözüm: aylık restore drill, RPO/RTO hedefleri tanımlı.
- Chunking stratejisi ihmal edilir. 500 token sabit chunk yerleşik tutulur; hibrit chunk (token + semantik) %18 daha iyi sonuç verir. Çözüm: semantic chunking + overlap %15-20.
- Hibrit arama parametreleri varsayılan kalır. Alpha = 0.5 uygulanır; oysa workload bazında 0.3-0.7 arasında optimize edilebilir. Çözüm: A/B test ile alpha taraması.
- Metadata filtreleme planlanmaz. Tüm sorgular full-collection üzerinde çalışır; latency artar. Çözüm: payload index, partition tasarımı.
- Vendor lock-in göz ardı edilir. Pinecone export’u sadece raw vektör; embedding pipeline + chunk metadata yeniden üretim gerekir. Çözüm: ETL pipeline’ı vendor-agnostic; LangChain VectorStore arayüzü kullanılır.
Bu sorunların tümü teknik seçimden değil seçim öncesi planlama eksikliğinden doğar. Vector DB POC süresi 2-4 haftalık olmalı, en az iki platform aynı dataset ile yan yana koşmalı, evaluation pipeline benchmark’tan önce kurulmalıdır.
Sık Sorulan Sorular
Küçük başlangıç projesi için hangi vector veritabanı uygun?
Bir milyonun altında vektör ve düşük QPS için PostgreSQL’in pgvector eklentisi yeterlidir ve ek altyapı maliyeti yoktur. Mevcut PostgreSQL veritabanınızla aynı transaction sınırları içinde çalışır; Supabase, Neon, Aiven managed seçenekler ile 15 dakikada production’a alınır. Beş milyonun üzerine çıkıldığında veya p99 latency 50 ms’in altına indirilmek istendiğinde Qdrant veya Weaviate’e geçiş önerilir; çünkü pgvector HNSW indeks build tek thread çalışır ve 10M üzerinde build süresi 6 saati aşar.
Pinecone’un tamamen yönetilen olması dezavantaj mı?
Yönetilen olması ekip yükü açısından büyük avantaj sağlar; SOC 2, HIPAA, 99.99% SLA tek tıkla gelir. Ancak vendor lock-in riski yaratır: indeks formatı dışa aktarılamaz, sadece raw vektör + metadata export edilir; bu da migrasyon maliyetini 2-4 haftalık projeye çıkarır. Kurumsal sözleşmelerde SLA, veri export hakkı, fiyat artış cap’i mutlaka müzakere edilmelidir. Maliyet 50 milyon vektör üzerinde Qdrant’a göre 3-4 kata çıkar ve serverless tier bile bu noktada self-hosted’a göre 2x daha pahalıdır.
Hibrit arama (vector + keyword) hangi senaryoda gerekli?
E-ticaret ürün araması, hukuk metni araması, dokümantasyon araması, kod araması gibi senaryolarda kullanıcı bazen kesin terim (SKU, madde numarası, fonksiyon adı), bazen anlamsal eşleşme arar. Hibrit arama BM25 ve vector skoru reciprocal rank fusion (RRF) veya weighted sum ile birleştirir; NDCG@10 metriğini saf vector aramaya göre %22-27 artırır. Weaviate (BlockMaxWAND), Qdrant (SPLADE + full-text), Milvus (BM25 + RRF) bu özelliği yerleşik sunar; Pinecone’da sparse-dense fusion vardır ancak konfigürasyon manueldir ve learned sparse model (SPLADE) ayrıca eğitilmelidir.
Vektör boyutu seçimi maliyeti nasıl etkiler?
768 boyutlu OpenAI text-embedding-3-small’dan 3072 boyutlu text-embedding-3-large’a geçiş, depolama maliyetini 4 katına çıkarır ve sorgu latency’sini ortalama %35 artırır. Çoğu kurumsal RAG uygulamasında 1024-1536 boyut yeterli kalite verir; MTEB leaderboard sonuçları boyut iki katına çıkmasının ortalama %2.8 NDCG artışı getirdiğini gösteriyor. Matryoshka embedding tekniği ile aynı modelden farklı boyutlar üretilip kullanım yerine göre optimize edilebilir; örneğin coarse retrieval 256 boyut, fine reranking 1024 boyut. Binary quantization ile bellek %96 düşürülür, recall %3-5 kaybeder.
2026’da pgvector dedicated vector DB’lerin yerini alabilir mi?
Hayır, ancak orta ölçekte aralarındaki performans farkı kapanmaya başladı. pgvector 0.7 sürümü HNSW + iterative scan + halfvec (float16) ile 1-5M vektör senaryosunda Pinecone’a yakın p99 üretebiliyor. 10M+ üzerinde HNSW build tek thread olduğu için saatler sürer ve sustained QPS 1000’in altında kalır. PostgreSQL’in transaction, JOIN, mevcut tooling ekosistemi avantajı kritikse pgvector ilk tercih olmalı; ölçek 20M üzerine çıkarsa Qdrant veya Milvus’a geçiş planlanmalıdır. LangChain Vector Store Survey 2025’e göre yeni RAG projelerinin %42’si pgvector ile başlıyor, ancak %18’i 6 ay içinde dedicated DB’ye geçiyor.
Sonuç
Vector veritabanı seçiminde tek doğru cevap yoktur; ekip kapasitesi, bütçe, ölçek, KVKK ikameti, hibrit arama ve ekosistem entegrasyonu birlikte tartılır. Pinecone yönetilen kolaylığı, multi-AZ SLA’ı ve “sıfır operasyon” değer önerisi ile küçük-orta ekipler için en hızlı go-live yoludur; ancak vendor lock-in ve 50M+ vektör maliyeti dezavantajdır. Weaviate built-in vectorizer modülleri, GraphQL DX, BlockMaxWAND hibrit arama ve schema-first yaklaşımı ile geliştirici dostu bir denge sunar. Qdrant Rust performansı, payload pre-filtering, Hybrid Cloud ile KVKK uyumu ve en iyi tek-node QPS’i ile maliyet-performans liderliğini elinde tutuyor. Milvus CNCF graduated mimarisi, GPU CAGRA ile saniyede 6.800 QPS, partition key multi-tenancy ile 1 milyar vektör üstü kurumsal projelerin tercihi.
2026’da pratik yol haritası: POC süresi 2-4 hafta, en az iki platform paralel test, NDCG@10 ve p99 latency baseline’ları sözleşmeden önce ölçülmüş, embedding modeli + chunking stratejisi + retrieval evaluation pipeline’ı vendor seçiminden önce kurulmuş olmalıdır. Geniş kurumsal AI entegrasyon çerçevesini Kurumsal Yapay Zeka Entegrasyonu 2026 Rehberi içinde, uçtan uca üretim mimarisini ise RAG Sistemi Nasıl Kurulur 2026 ile RAG Altyapı Kurulum Rehberi 2026 içeriklerinde adım adım anlatıyoruz. Vector DB ne kadar hızlı olursa olsun embedding kalitesi, retrieval stratejisi ve evaluation metriği projenin başarı çıpasıdır; bu üç ayağın eksikliği en pahalı veritabanını bile yanıltıcı sonuç üretmeye iter.
Referans kaynaklar: Pinecone Learn, Weaviate Engineering Blog, Qdrant Articles, Milvus Blog, ANN-Benchmarks, Malkov & Yashunin HNSW Paper, MTEB Leaderboard.










Ömer ÖNAL
Mayıs 15, 2026Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.