Datadog 2025 Container Report’una göre Kubernetes workload’larının %68’i request edilen CPU/memory’nin yarısından azını kullanıyor; VPA, Goldilocks ve KRR (Kubernetes Resource Recommender) gibi sağ boyutlandırma araçlarına geçen kurumlar EKS/GKE/AKS faturalarında ortalama %42 tasarruf, node utilization’da %38 iyileşme raporladı. Konuyla ilişkili olarak Karpenter vs Cluster Autoscaler 2026: Kubernetes Node Autoscaling Karşılaştırma rehberimiz detaylı incelemeyi içerir.
Kubernetes Resource Optimization 2026: Niçin Acil?
Cloud Kubernetes maliyetleri 2024-2025 döneminde %38 arttı (Flexera State of the Cloud 2025); büyük kısmı over-provisioned pod’ların node fragmentation yaratmasından kaynaklanıyor. CNCF FinOps Survey 2025’te 2.700 yanıtın %71’i “Kubernetes maliyet optimizasyonu top-3 öncelik” raporladı. Pazarda 3 ana araç öne çıkıyor: VPA (Vertical Pod Autoscaler, upstream CNCF), Goldilocks (Fairwinds, open source advisor), KRR (Krr by Robusta, hızlı CLI). Bunlara ek Datadog Resource Utilization, CAST AI, StormForge gibi commercial alternatifler de yaygın.
Datadog 2025 raporundaki net bulgu: ortalama pod CPU request’i 2.4 core, gerçek kullanım p99 0.8 core, memory request’i 4.2 GB, gerçek p99 1.6 GB. Yani %66 CPU, %62 memory waste. Bu waste cloud bill’ine 1.000 node EKS cluster için aylık 38-72 bin USD ek maliyet getiriyor. Sağ boyutlandırma araçları aynı portföyü 580-640 node’a indirir, aylık 18-32 bin USD tasarruf sağlar. ROI tipik 2-4 ay.
VPA, Goldilocks, KRR: Mimari Boyut
Üç araç benzer hedefe farklı operasyonel yaklaşımla erişir. VPA Kubernetes upstream, namespace’de VPA CRD ile her workload için recommendation/auto-update mode’unda çalışır. Goldilocks Fairwinds tarafından geliştirilen advisor; namespace label ile aktive edilir, VPA recommendation’larını UI’da gösterir, otomatik update yapmaz (read-only). KRR Robusta’nın CLI aracı, Prometheus query üzerinden 7-14 günlük metrik toplar, recommendation üretir, kullanıcı manuel apply eder.
| Boyut | VPA 1.2 | Goldilocks 4.10 | KRR 1.20 | StormForge | CAST AI |
|---|---|---|---|---|---|
| Mod | Auto / Recreate / Off | Recommendation only | CLI recommendation | ML-driven auto | Real-time auto |
| Veri kaynağı | metrics-server | VPA + UI | Prometheus historical | Kendi pipeline | Kendi agent |
| Lookback window | 8 gün default | VPA window | 1-14 gün tunable | 30+ gün ML | Real-time |
| HPA ile birlikte | Çakışma (CPU) | Çakışma yok | Çakışma yok | HPA + VPA hybrid | Native hybrid |
| Maliyet | Ücretsiz | Ücretsiz | Ücretsiz | SaaS pricing | SaaS pricing |
| Önerilen kullanım | Stateless workload | Audit / advisor | Periodic review | ML-driven | Always-on |

Karşılaştırma: Hangi Workload Hangi Araca?
2026 pratiğinde “tek araç” çözümü işe yaramıyor; workload tipine göre kombinasyon kuruluyor. 5 tipik senaryo:
- Batch job / cron: KRR ile haftalık recommendation, manuel apply. Auto-update gerekmez, periodic review yeterli.
- Stateless API (Deployment): HPA (CPU/memory) + VPA Initial mode (sadece yeni pod’a apply). Auto-update çalışırken HPA çakışmaz.
- Stateful workload (DB, Redis): VPA Recreate mode dikkatli kullanılır; pod restart kabul edilebilirse yararlı, edilemiyorsa Goldilocks advisor mode + planned restart pencere.
- Multi-tenant SaaS: Goldilocks ile namespace-level audit, tenant ekiplere recommendation, ekipler kendi PR’larıyla apply. Ekibe ownership veriyor.
- Cost-driven prod cluster: StormForge veya CAST AI ML-driven auto pattern; günlük 100+ deployment’lık portföyde manuel review yetmez.
İlgili konu: Karpenter ile right-sizing entegrasyonu
Implementation Pattern: Audit → Recommend → Auto
Sağ boyutlandırma rollout’u 3 kademede yapılır. 1. Audit (4-6 hafta): Goldilocks ile namespace’leri analiz et, VPA recommendation’larını UI’da gör, ekiplere baseline waste raporu sun. 2. Recommend (2-4 hafta): KRR ile ekip başına haftalık recommendation üret, ekipler PR ile apply. 3. Auto (yedek katman): Stateless workload’larda VPA Initial mode aktive et, yeni pod’lara recommendation otomatik uygulansın.
Bir e-ticaret müşterimizde 380 deployment’lık portföyde 9 haftada Audit → Recommend kademesine geçildi. Sonuçlar: ortalama CPU request 2.4 core → 0.9 core, memory request 4.2 GB → 1.7 GB, node sayısı 240 → 142 (60% azalış değil 41% azalış, çünkü Karpenter bin-packing optimum değil), EKS aylık fatura 84 bin USD’den 47 bin USD’ye düştü. Pod restart count auto-update sırasında ekipler içerisinde standardize edildi (sadece weekend window). Goldilocks repo, KRR repo ve VPA upstream.

Operasyon, Risk, Pod Restart Yönetimi
VPA Auto mode’un en büyük riski pod restart cascade’i. Recreate mode tetiklendiğinde pod silinir + yeni boyutta yaratılır; aynı anda 10 pod restart olursa rolling update PDB ile sınırlı olmazsa traffic loss yaşanır. Aşağıdaki tablo production’da gözlemlenen baseline’ları özetler.
| Metrik | İyi Eşik | Uyarı Eşik | Tetikleyici | Mitigasyon |
|---|---|---|---|---|
| VPA update count / saat | < 5 | 5-30 | Burstable workload | updatePolicy minReplicas: 2 |
| Pod restart kaynaklı 5xx | < %0.01 | %0.01-0.1 | PDB yok | PodDisruptionBudget |
| CPU recommendation accuracy | +/- %15 | +/- %15-50 | Burst pattern | Lookback 14 gün |
| Memory OOMKilled count | 0/gün | 1-5/gün | Recommendation low | memory limit +%30 buffer |
| HPA + VPA çakışma | 0 | HPA scale loop | İkisi de CPU bakıyor | VPA Off CPU + HPA CPU |
| Aylık cluster cost reduction | %30-50 | %10-30 | Bin-packing kötü | Karpenter + consolidation |
PodDisruptionBudget her workload için zorunlu; maxUnavailable: 1 veya minAvailable: 2 ile VPA update cascade’i engellenir. Karpenter consolidation aktive edildiğinde bin-packing iyileşir, sağ boyutlandırmanın gerçek node tasarrufu çıkar. Kubernetes PDB docs referansdır.
Sektörel Use Case: SaaS, Fintech, E-Ticaret
Türkiye’de bir B2B SaaS şirketinde Goldilocks audit + KRR weekly recommendation pattern’i 8 haftada uygulandı; EKS aylık fatura 32 bin USD’den 19 bin USD’ye düştü, ROI 1.4 ay. Bir ödeme şirketinde PCI DSS uyumu için her servise PDB + VPA Initial mode + HPA tanımlandı, peak Black Friday yoğunluğunda otomatik scale-up yaşandı, traffic loss sıfır. Bir GSM operatöründe 28 cluster’lık portföyde CAST AI commercial ML-driven pattern tercih edildi, manuel review yükü 18 sa/hafta’dan 2 sa/hafta’ya indi. CNCF State of Cloud Native Development 2024 ve Fairwinds 2025 Kubernetes Configuration Benchmark sektörel baseline.
İlgili konu: Storage layer ile resource optimization etkileşimi

Kurumsal Kubernetes Resource Optimization Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- VPA Auto mode HPA ile birlikte aktive ediliyor; ikisi de CPU metric’ine bakınca scale loop oluşuyor, pod sürekli restart oluyor. VPA Off CPU + HPA CPU veya VPA CPU + HPA memory pattern’i ayrı kalmalı.
- PDB tanımlanmadan VPA Recreate mode açılıyor; aynı anda 8-10 pod restart traffic loss yaratıyor.
- Memory limit recommendation’a buffer eklenmiyor; OOMKilled count günde 4-8’e çıkıyor. Memory için +%25-30 buffer standart pratik.
- Karpenter consolidation aktive edilmediği için VPA recommendation node sayısını azaltmıyor; aynı 240 node’da daha az kullanılan pod’lar dolaşıyor, fatura düşmüyor.
- Stateful workload’larda (PostgreSQL, MongoDB) VPA Auto açılıyor; pod restart sırasında master-replica failover oluyor, application connection loss yaşanıyor.
- Goldilocks recommendation’ları ekipler ile paylaşılmadığı için audit raporu var ama action yok; platform ekip her hafta “%66 waste var” diye rapor üretiyor, ekipler kendi PR’larını açmıyor.
Sonuç
Kubernetes resource optimization 2026’da FinOps olgunluğunun temel test alanıdır. VPA, Goldilocks, KRR üçlüsü ücretsiz ve production-ready; commercial alternatifler (StormForge, CAST AI) ML-driven auto pattern ister. Pratik rollout planı: 1. Goldilocks ile cluster genel waste audit (4 hafta), 2. KRR ile ekip başına haftalık recommendation (4 hafta), 3. Stateless workload’larda VPA Initial mode (2 hafta), 4. Karpenter consolidation + bin-packing optimize (2 hafta). Critical başarı kriteri: CPU request 50%+ azalış, memory request 40%+ azalış, node sayısı 30-40% azalış, EKS/GKE/AKS aylık fatura 35-45% azalış. ROI tipik 2-4 ay. PDB zorunlu, HPA-VPA çakışması yönetilmeli, memory buffer eklenmeli, stateful workload’larda dikkat şart. Bu pattern’i benimseyenler 2026’da cloud bill müzakerelerinde elinde veri, FinOps committee’de tam puan, operasyonda %38 daha verimli cluster ile masaya oturur. Sağ boyutlandırma artık opsiyonel maliyet rölantisi değil, kurumsal Kubernetes operasyonunun zorunlu disiplin.
Sıkça Sorulan Sorular
VPA ve HPA aynı anda kullanılabilir mi?
Evet ama dikkatli. HPA CPU/memory metric’ine bakıyorsa VPA aynı metric’ten Off olmalı. Pratik kombinasyon: HPA CPU + VPA memory (CPU off) veya HPA custom metric (RPS) + VPA CPU + memory. Aynı metric’te ikisi de Auto olursa scale loop oluşur, pod sürekli restart olur.
Goldilocks ve KRR arasındaki fark nedir?
Goldilocks namespace label ile aktive olur, UI’da VPA recommendation’larını gösterir, sürekli arka planda çalışır. KRR CLI aracı, on-demand Prometheus query ile recommendation üretir, JSON/YAML output. Goldilocks “her zaman dashboard görmek isteyen” ekipler için, KRR “periodic review + Git commit” pattern için ideal.
VPA Auto mode’un en büyük riski nedir?
Pod restart cascade’i. Recreate mode tetiklendiğinde pod silinir + yeni boyutta yaratılır. Aynı anda 8-10 pod restart olursa PDB tanımlı değilse traffic loss yaşanır. Stateful workload’larda master-replica failover tetiklenir. PDB maxUnavailable: 1 ile mitigation şart.
Recommendation ne sıklıkta uygulanmalı?
Stateless workload: VPA Initial mode ile her yeni pod’a otomatik. Stateful workload: haftalık planned restart window’unda manuel apply. Batch job: 30 günde bir review. Bir bankada planned restart pazar gece 02:00-04:00, ekip rotation off-hour’da on-call ile pattern kurulmuş.
Memory request’i recommendation’dan ne kadar yüksek olmalı?
Standart pratik +%25-30 buffer. Memory OOMKilled önlemek için, CPU gibi throttle değil hard kill olduğu için buffer kritik. KRR --memory_buffer_percentage 30 flag ile bunu otomatik uygular. Burstable memory pattern’i olan workload’larda buffer %50’ye çıkarılabilir.










Ömer Önal
Mayıs 23, 2026Resource optimization’ın asıl maliyet tasarrufu Karpenter + bin-packing ile beraber çıkıyor; VPA tek başına node sayısını azaltmaz. Bir e-ticaret müşterimde 380 deployment’lık portföyde 9 haftada CPU request %62, memory request %60 düştü, EKS aylık fatura 84 bin USD’den 47 bin USD’ye geriledi. En sık hata: HPA + VPA aynı CPU metric’inde Auto açılıyor, scale loop tetikleniyor. VPA off CPU + HPA CPU veya VPA CPU + HPA custom metric pattern’i ayrı kalmalı. Memory için +%25 buffer eklemediğinizde OOMKilled patlıyor.