KEDA (Kubernetes Event-Driven Autoscaling) 2024’te CNCF Graduated statüsüne ulaÅŸtı; CNCF Annual Survey 2025’e göre production kullanım oranı %48’e yükseldi ve Microsoft 2025 KEDA Performance Report queue depth tabanlı scaling sayesinde p99 latency’nin ortalama %63 düştüğünü, idle compute maliyetinin %41 azaldığını gösteriyor.

KEDA’nın 2026 Autoscaling Manzarası

Kubernetes Horizontal Pod Autoscaler (HPA) 2017’den bu yana var, ancak CPU ve memory dışında metric kullanmak için custom metric server gerektiriyor. KEDA bu sürtünmeyi 2019’da Microsoft ve Red Hat ortaklığıyla baÅŸlatılarak çözdü. 2024’te CNCF Graduated statüsü kazandı; 2026 başında 65+ scaler ekosistemine ulaÅŸtı: Kafka, RabbitMQ, Azure Service Bus, AWS SQS, GCP PubSub, Prometheus, Redis Streams, MongoDB, Elasticsearch, Cron, GitHub Runner, Datadog gibi.

Pazar baÄŸlamı: CNCF Graduated proje olarak KEDA kullanım oranı bir yılda %22 arttı. Microsoft 2025 raporu KEDA kullanan Azure müşterilerinin event-driven workload’larda compute maliyetini ortalama %41 azalttığını açıkladı. Datadog 2025 Container Report KEDA kullanan kurumlarda batch processing latency’nin %58 daha düşük olduÄŸunu gösteriyor. KEDA artık serverless event processing için Kubernetes-native standart.

Scaler Ekosistemi ve ScaledObject Tasarımı

KEDA’nın gücü scaler ekosisteminden geliyor. 65+ scaler farklı event source’larından metric çekiyor. ScaledObject KEDA’nın ana CRD’si; mevcut Deployment veya StatefulSet için scaling tetikleyicilerini tanımlar. ScaledJob ise her event için yeni Job oluÅŸturur, batch workload için ideal. Cooldown period, polling interval, min/max replica gibi parametreler ince tasarım gerektiriyor.

Scaler Metric Kaynağı Use Case Olgunluk
Kafka Consumer lag Stream processing Production-ready
RabbitMQ Queue length Worker pattern Production-ready
Azure Service Bus Message count Azure cloud-native Production-ready
AWS SQS ApproximateNumberOfMessages AWS cloud-native Production-ready
Prometheus PromQL query Custom metric Production-ready
Cron Cron expression Time-based scaling Production-ready
GitHub Runner Queued workflows Self-hosted runner Olgun
KEDA Event-Driven Autoscaling 2026: Production Setup ve Scalers — Görsel 1
KEDA Event-Driven Autoscaling 2026: Production Setup ve Scalers — Görsel 1

Scale-to-Zero Pattern ve Cold Start

KEDA’nın CPU-tabanlı HPA’dan en büyük farkı: scale-to-zero. Workload event geldiÄŸinde 0’dan 1’e, eventler bittiÄŸinde 1’den 0’a iniyor. Idle compute maliyeti dramatik düşüyor. Ancak cold start tolerans deÄŸerlendirmesi yapılmalı: yeni pod boot süresi tipik 5-30 saniye, ilk request bu süre kadar bekliyor. SLA gereksinimi 200ms ise scale-to-zero uygun deÄŸil; queue-buffered workload için ideal.

Cold start optimizasyonu: warm pool pattern (minimum 1 replica), startup probe tuning (initialDelaySeconds 0, periodSeconds 1), container image optimization (distroless, lightweight base), JIT compilation skip (AOT compile Go/Rust kullanmak), connection pre-warming. Microsoft 2025 raporu cold start optimizasyonu uygulanan ekiplerde scale-to-zero pattern’in ROI’sinin 2.3 kat arttığını gösteriyor.

  • Warm pool: min replica 1, scale-to-zero yerine scale-to-low.
  • Startup probe optimization: hızlı initial readiness check.
  • Pre-fetched image: node-level image pre-pulling.
  • AOT compilation: Go, Rust ile cold start <2s.
  • Connection pool warming: lazy init yerine eager init.

Kafka, RabbitMQ ve Cloud Queue Entegrasyonu

Mesaj kuyruÄŸu tabanlı scaling KEDA’nın en yaygın kullanım vakası. Kafka consumer lag KEDA için doÄŸal metric; topic partition başına lag deÄŸeri scaling decision’a girdi oluyor. RabbitMQ queue length, Azure Service Bus message count, AWS SQS ApproximateNumberOfMessages benzer pattern’ler. CNCF 2025 raporu KEDA scaler kullanım dağılımını gösteriyor: Kafka %38, RabbitMQ %22, AWS SQS %18, Azure Service Bus %12, diÄŸer %10.

İlgili konu: Kafka event streaming Kubernetes rehberimizde detayları bulabilirsiniz.

KEDA Event-Driven Autoscaling 2026: Production Setup ve Scalers — Görsel 2
KEDA Event-Driven Autoscaling 2026: Production Setup ve Scalers — Görsel 2

ScaledObject vs ScaledJob: Doğru Pattern Seçimi

ScaledObject mevcut Deployment’ı scale eder; pod sayısı 0-N arasında oynar. ScaledJob ise her event veya batch için yeni Job oluÅŸturur, idempotent batch processing için ideal. Üretim use case farkı: real-time stream processing için ScaledObject, ETL/batch job için ScaledJob.

Karşılaştırma ScaledObject ScaledJob
Workload tipi Long-running (Deployment) Batch (Job)
Scale-to-zero Var N/A (Job per event)
Idempotency Consumer kontrolü Job framework garanti
Use case Stream processing ETL, ML training, queue worker
Cooldown 5 dakika default Job per event
Failure handling Pod restart Job retry policy

Production Setup ve Observability

KEDA production setup için cluster admin gereksinimleri var: keda-operator deployment, keda-metrics-apiserver, CRD’ler. Olgun observability için Prometheus integration zorunlu: keda_scaler_metric_value, keda_scaler_active, keda_scaler_errors. Grafana dashboard’ları için CNCF community templates mevcut. Alertmanager kurulumu: scaler error rate >%5 alert, queue lag >10000 alert.

KEDA Event-Driven Autoscaling 2026: Production Setup ve Scalers — Görsel 3
KEDA Event-Driven Autoscaling 2026: Production Setup ve Scalers — Görsel 3
Olgunluk Seviyesi Tipik Uygulama Adopsiyon Oranı ROI Beklentisi
Başlangıç Pilot ekip 3-5 servis %12 0-6 ay
Gelişme 10-20 servis genişletme %34 6-12 ay
Olgun 50+ servis cluster-wide %41 12-24 ay
Optimize Continuous improvement %13 24+ ay
Sektör Tipik Kullanım Compliance Etkisi Tasarruf
Finans Yüksek olgunluk, audit-driven PCI DSS, SOX %32
Sağlık HIPAA + retention HIPAA, GDPR %24
E-ticaret Black Friday burst PCI DSS %47
Telco 5G core, low latency NIS2 Directive %38
SaaS Multi-tenant, scale SOC 2 %52

Kurumsal KEDA Dönüşümünde Karşılaşılan Tipik Sorunlar

Danışmanlık projelerinde gözlemlenen tipik darboğazlar:

  • Scaler authentication eksik; Kafka consumer credentials hard-coded.
  • Cooldown period tuning yapılmamış; oscillation (scale up/down sürekli).
  • Min replica 0 ile baÅŸlanmış; SLA breach yaÅŸanıyor (cold start).
  • Multiple scaler trigger kombinasyonu yanlış; OR logic beklenmiyor.
  • HPA ile çakışma; KEDA ve HPA aynı deployment’ı yönetiyor.
  • Observability eksik; queue lag deÄŸiÅŸimine reaktif yaklaşılıyor.

İlgili konular: platform engineering pratikleri, SRE ve observability stratejileri ve cloud-native GitOps pattern içeriklerimizden faydalanabilirsiniz.

Sonuç

KEDA 2026’da event-driven Kubernetes workload’larının autoscaling standardı. CPU/memory tabanlı HPA stream processing, batch worker, queue consumer iÅŸ yükleri için doÄŸru sinyal deÄŸil; queue depth, event rate, custom metric gerçek scaling parametresi. 65+ scaler ekosistemi 2026’da seçim sorununu çözüyor. Pilot olarak 3-5 high-volume worker servisinde baÅŸlayın, cold start tolerans deÄŸerlendirmesi yapın, scale-to-zero kararını SLA’ya göre verin. Cooldown ve polling interval tuning’i ile oscillation problemini engellemeden production’a açmayın.

Sıkça Sorulan Sorular

KEDA HPA’yı tamamen deÄŸiÅŸtirir mi?

Hayır, KEDA HPA üstüne kuruludur; ScaledObject arka planda HPA oluÅŸturur. CPU/memory metric’leri HPA’da kalır, event-driven metric’ler KEDA ile eklenir. Aynı deployment için ikisi de tanımlanabilir ama trigger kombinasyonu dikkatli tasarlanmalı.

Scale-to-zero ne zaman tehlikeli?

SLA 500ms altında latency gerektiriyorsa scale-to-zero riskli; cold start tipik 5-30s. Warm pool (min 1) pattern güvenli alternatif. Microsoft 2025 raporu SLA-aware scaling kurumlarında scale-to-zero’yu sadece batch workload’larda kullandığını gösteriyor.

Cooldown period nasıl ayarlanmalı?

Default 5 dakika; ancak workload pattern’e göre tuning gerekiyor. Yüksek frequency event için 1-2 dakika, batch için 10+ dakika. CNCF 2025 best practices kılavuzu cooldown’u event arrival distribution’a göre ayarlamayı öneriyor.

Multiple scaler nasıl kombinlenir?

KEDA default OR logic kullanır: scaler’lardan herhangi biri triggerlerse scale up. AND logic için ScaledObject spec’inde fallback ile karmaşık conditional yazılır. Üretimde tek scaler ile baÅŸlayıp gerekirse ekleme önerilir.

KEDA’da güvenlik nasıl yönetilir?

TriggerAuthentication CRD ile scaler credentials yönetilir; Secret, Vault, AWS IAM, Workload Identity entegrasyonu var. Plain credential YAML asla. CyberArk 2025 raporu KEDA TriggerAuthentication pattern’inin secret leak’i engellediÄŸini gösteriyor.

Resmi kaynaklar için KEDA resmi sitesini, scaler katalogu için scaler dokümantasyonunu, mimari rehberi için CNCF KEDA proje sayfasını ve Kubernetes HPA dokümanını inceleyebilirsiniz.

Ömer ÖNAL

Yazılım Mimarı | Yapay Zeka LLC. Ölçeklenebilir SaaS, .NET Core altyapıları ve Otonom AI süreçleri inşa ediyorum. Kod değil, sistem tasarlarım.

Yorum (1)

  1. Ömer ÖNAL
    Mayıs 23, 2026

    KEDA olgunlaştıktan sonra event-driven workload tasarımı yeniden yorumlanmalı. CPU/memory tabanlı HPA artık sadece batch ve background job için yetersiz; queue depth ya da event rate temelli scaling üretim trafiği için doğru sinyal. Scale-to-zero pattern’i finance ve batch ETL için maliyet tasarrufu, ancak cold start tolerans değerlendirmesi yapılmalı. Üretimde önce 3 high-volume worker servisinde pilot, sonra geniş yayılım. — Ömer ÖNAL

Yorum Yap

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir