AWS Spot Advisor 2025 verilerine göre popüler EC2 instance ailelerinde Spot interruption rate medyanı %5’in altında ve fiyat indirimi %90’a kadar ulaşıyor; Azure Spot interruption statistics 2025 ortalama eviction’ı %3-5 bandında raporluyor — doğru workload tipini Spot / Preemptible VM stratejisine taşıyan ekipler 2026’da compute maliyetinde %70-90 tasarruf elde ediyor.
Spot ve Preemptible VM Pazar Bağlamı, 2026 Compute Ekonomisi
AWS Spot Instances 2009’da, GCP Preemptible 2015’te (2022’de Spot VM olarak yeniden markalandı), Azure Spot VM 2020’de tanıtıldı. Üç bulutta da temel mantık aynı: bulut sağlayıcının atıl kapasitesi indirimli fiyatla satılır, ihtiyaç olduğunda kullanıcıya kısa bildirimle geri alınır. Flexera State of the Cloud 2025’e göre kurumsal müşterilerin %63’ü Spot/Preemptible kullanıyor; bu oran 2021’de %38 seviyesindeydi. Gartner 2025 IaaS pricing analizine göre Spot adopsiyon ortalamada compute maliyetinde %42-58 düşüş sağlıyor.
Fiyatlandırma farklılaşıyor. AWS Spot dinamik fiyat (eskiden ihale tabanlı, 2017 sonrası price smoothing) ile %90’a kadar indirim sunar; instance type ve AZ özelinde fiyat dakikalık değişir. Azure Spot sabit eviction-based fiyatlama kullanır; “Eviction policy: Deallocate” (kullanım sayacı durur, OS disk korunur) veya “Delete” (tamamen kaldırılır) seçilebilir, fiyat indirimi %60-90 arası. GCP Spot VM Preemptible’ın halefi, 24 saat süre limiti yok, %60-91 indirim, eviction notification 30 saniye.
Interruption metrics: AWS Spot Advisor c6i.large %2-5, m5.large %3-7, g4dn.xlarge %8-12 medyan interruption. Azure D-series ortalama %3-5, NCv3 GPU %10-15. GCP n2-standard %5-10, a2-highgpu (A100 GPU) %15-25 bandında. Aynı instance type için bölgeden bölgeye interruption %2-15 farklılık göstermesi yaygın.
Üç Cloud Spot Mekaniği: Bildirim, Eviction Davranışı ve Reclaim Süreçleri
Cloud provider’lar arası Spot mekaniği farklıdır ve workload tasarımı bu farklara göre şekillenmelidir. AWS Spot 2 dakika kapatma uyarısı (EC2 instance metadata service IMDSv2 /spot/instance-action endpoint) ve isteğe bağlı “Rebalance Recommendation” sinyali sunar. Azure Spot 30 saniye kapatma uyarısı (Azure Instance Metadata Service /scheduledevents) sağlar. GCP Spot VM 30 saniye preemption notification gönderir (ACPI G2 Soft Off signal).
| Özellik | AWS Spot | Azure Spot | GCP Spot VM |
|---|---|---|---|
| Bildirim süresi | 2 dk (CloudWatch) | 30 sn (IMDS) | 30 sn (ACPI) |
| Maks. indirim | %90 | %90 | %91 |
| Süre limiti | Yok | Yok | Yok (eski Preemptible 24 saat) |
| Fiyat modeli | Dinamik (smoothed) | Eviction-based fixed | Sabit (interruption-tabanlı) |
| Re-launch garantisi | Yok | Yok | Yok |
| Diversification API | Mixed Instances Policy + ASG | VMSS + multi-SKU | MIG + multi-machine |
| Capacity reservation | On-Demand reserve | Capacity reserve | Reservation API |
| Spot Advisor | Public stats | Public interruption | Public dokuman |

Workload Uygunluk Matrisi: Hangi İş Yükü Spot için Doğru?
Spot stratejisinin %95’lik başarı oranı doğru workload seçiminde gizlidir. Üç temel kriter: stateless mimari (oturum verisi external store’da), checkpoint kapasitesi (kısa sürede geri yüklenebilir), ve idempotent retry (interruption sonrası işlem yeniden çalışabilir). AWS Spot Best Practices 2025 belgesi 17 workload tipini “Recommended”, “Tunable” ve “Not Recommended” şeklinde sınıflar.
- Stateless web tier (Recommended): Load balancer arkası, oturum Redis/DB’de, %85+ Spot oran tipik
- CI/CD runner (Recommended): GitHub Actions self-hosted, GitLab runner, Jenkins agent — %95+ Spot
- Batch ETL (Recommended): Spark, Hadoop, dbt — checkpoint + idempotent
- ML training (Tunable): Checkpoint her 5-15 dakikada bir, framework Spot-aware (PyTorch Lightning, TensorFlow)
- Render farm (Recommended): Blender, Maya, Houdini — frame bazlı parallel
- Stateful database (Not Recommended): RDBMS primary, leader election, replication state
İlgili konu: AWS maliyet stratejisi rehberimizde Spot + Compute Optimizer kombinasyonu detaylı işlendi.
Implementation Pattern’ları: Karpenter, Mixed Instances, Multi-AZ Diversification
Spot başarısının ikinci ayağı diversification stratejisidir: tek instance type + tek AZ’de %100 Spot çalıştıran ekipler %30+ interruption ile karşılaşır; 6 instance type x 3 AZ matrisinde aynı workload %3-5 altına düşer. AWS tarafında Karpenter (open-source K8s autoscaler) ve EC2 Auto Scaling Group Mixed Instances Policy iki ana mekanizma. Karpenter “Best Effort” allocation strategy ile pool genişliği maksimize edilir. Azure’da Virtual Machine Scale Sets (VMSS) multi-SKU desteği 2024 sonrası geldi. GCP’de Managed Instance Group (MIG) + Spot VM kombinasyonu standart.
Karpenter konfigürasyon örneği özet: NodePool resource’unda requirements bölümünde karpenter.k8s.aws/instance-family olarak [“c6i”,”c6a”,”c7i”,”c7a”,”m6i”,”m6a”,”m7i”,”m7a”] tanımlanır, karpenter.k8s.aws/instance-size olarak [“large”,”xlarge”,”2xlarge”] eklenir, capacity-type “spot” + “on-demand” karışımı olarak konfigüre edilir. consolidation policy “WhenUnderutilized” + ttlSecondsAfterEmpty 30 sn ile boşa çıkan node’lar hızla temizlenir.

Operasyon, Interruption Handling ve Checkpoint Stratejileri
Spot çalışan workload’larda operasyonel olgunluk 4 katmandan oluşur. Birinci katman: graceful shutdown handler. AWS’de IMDSv2 endpoint poll edilir veya CloudWatch event subscribe edilir; 2 dakikalık pencere içinde drain → checkpoint → terminate sırası çalışır. Azure’da scheduled events JSON parse edilir. GCP’de ACPI signal’i systemd üzerinden handle edilir. İkinci katman: checkpoint sıklığı. ML training tipik 5-15 dakika, batch ETL her stage sonu, render farm her frame sonu. Üçüncü katman: retry orchestration. Argo Workflows, Step Functions, GCP Workflows ile interruption sonrası işlem state’i restore edilir. Dördüncü katman: cost monitoring. Spot saving rate haftalık dashboard’da görünür; %60 altına düşerse alarm.
| Pattern | Workload Tipi | Aksiyon | Tipik Tasarruf | Risk |
|---|---|---|---|---|
| Karpenter + Mixed | K8s stateless | NodePool diversification | %70-85 | Düşük |
| ASG Mixed Instances | EC2 stateless | 6+ type, multi-AZ | %65-80 | Düşük |
| EKS Spot node pool | K8s batch | Taint + Toleration | %75-90 | Orta |
| VMSS Spot | Azure stateless | Multi-SKU VMSS | %60-80 | Düşük |
| GCP MIG Spot | GCP stateless | Multi-machine MIG | %70-85 | Düşük |
| Spark on Spot | Batch analytics | YARN + checkpoint | %80-90 | Orta |
Sektörel Use Case’ler ve Ölçeklenmiş Sonuçlar
Medya / VFX (Render farm, 12.000 saatlik aylık compute): AWS Spot c6i + c7i + m6i diversification ile render maliyetinde %82 düşüş, interruption rate %4.2 medyan, frame restart penalty <90 saniye. ML platformu (PyTorch training, A100 GPU 80GB): Azure Spot NCv3 + checkpoint Azure Blob ile training maliyetinde %71 düşüş, model convergence sürelerinde <%5 etki. SaaS B2B (GKE stateless tier, 240 node): GCP Spot VM n2-standard + Karpenter-eşdeğer GKE autoscaler ile compute maliyetinde %68 düşüş, p99 latency stabil korundu. Fintech CI runner (GitHub Actions self-hosted, 1.500 build/gün): AWS Spot diversification + auto-restart hook ile CI compute maliyetinde %89 düşüş, build success rate %99.6 sabit kaldı.

Kurumsal Spot Stratejisi Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- Tek instance type + tek AZ ile Spot başlatılıyor; diversification eksikliği nedeniyle interruption %30+ çıkıyor ve ekip “Spot çalışmıyor” sonucuna varıyor.
- Graceful shutdown handler kurulmadığı için 2 dakikalık pencere kaçırılıyor; pod’lar abrupt termination ile düşüyor, kuyruktaki işlemler kayboluyor.
- Checkpoint sıklığı yanlış tunlanıyor: çok sık (her 1 dakika) I/O cost yaratıyor, çok seyrek (60 dakikada bir) interruption sonrası uzun replay maliyeti çıkıyor; doğru pencere 5-15 dakika.
- Stateful workload (RDBMS primary, leader election servisi) Spot’a taşınıyor; veri tutarsızlığı ve split-brain riski oluşuyor.
- Spot fiyat takibi yapılmıyor; bazı instance type’larda price spike sırasında %30+ indirim eridiği halde ekip eski varsayım ile çalışıyor.
- FinOps showback raporunda Spot saving görünür değil; CFO Spot yatırımının ROI’ını sorgulayınca ekip pozisyon savunamıyor.
Sonuç
2026’da Spot / Preemptible VM stratejisi compute maliyetini %70-90 azaltma kaldıracı sağlayan en güçlü FinOps aracıdır — ancak başarı tek başına “Spot kullanıyoruz” demekle değil, beş kademeli disiplinle gelir: doğru workload seçimi (stateless + checkpoint + idempotent), diversification (6+ instance type x 3+ AZ), graceful shutdown handler, checkpoint stratejisi (5-15 dakika), ve haftalık cost monitoring. Bugün başlamak isteyenlere ilk dört adımı net öneririm: (1) workload’larınızı stateless / stateful sınıfla ve uygun olanları işaretle, (2) AWS Spot Advisor / Azure Spot interruption stats / GCP Spot dokumantasyonundan instance type interruption rate’lerini topla, (3) Karpenter veya equivalent ile diversification konfigürasyonu kur, (4) graceful shutdown handler + checkpoint pipeline’ı 30 günde devreye al. Yorumlarınızı bekliyorum: en başarılı veya en sancılı Spot deneyiminiz hangi workload üzerinde?
Sıkça Sorulan Sorular
AWS Spot, Azure Spot ve GCP Spot VM arasında en ucuz olan hangisi?
Pratikte üç cloud’da maksimum indirim oranı yakın (%90-91). Esas fark interruption davranışı ve bildirim süresinde: AWS 2 dakika, Azure 30 saniye, GCP 30 saniye. Workload’ın graceful shutdown’a uyum seviyesine göre seçim yapılır; multi-cloud kurumlar 3’ünü de paralel kullanır.
Spot Instance ile Reserved Instance / Savings Plans birlikte kullanılır mı?
Evet, kurumsal best practice “commitment piramidi” modelidir: tabanda 3 yıl RI/SP (%50-72 indirim, baseline %30-50 coverage), üstte 1 yıl Compute SP (%28 indirim, baseline +%20-30), elastik tepe On-Demand (%0), ve Spot (%70-90 indirim) batch + stateless tier. Bu kombinasyon ortalama %45-60 toplam compute tasarrufu üretir.
Spot interruption rate’i nereden takip edilir?
AWS Spot Advisor public sayfası instance type bazlı historical interruption gösterir (her bölge için ayrı). Azure portalında “Spot VM Pricing” altında bölge + SKU bazlı eviction rate raporlanır. GCP belgelerinde Spot interruption “regional availability” başlığında işlenir, public dashboard yok ama destek üzerinden alınabilir.
Karpenter ile Cluster Autoscaler arasında Spot için fark var mı?
Karpenter Spot-native tasarımı ile çok daha hızlı node provisioning (30-60 saniye), instance type diversification ve “Best Effort” allocation strategy sunar. Cluster Autoscaler ASG bazlı çalışır ve Spot için Mixed Instances Policy gerekir. AWS EKS workload’larında 2024 sonrası Karpenter dominant tercih, %40+ adopsiyon raporlanıyor.
Spot kullanırken SLA korunabilir mi?
Stateless + diversification + autoscaler triad’ı doğru kurulduğunda kullanıcı tarafında %99.9+ SLA korunabilir. SaaS müşteri projelerinde Spot dominant cluster’da p99 latency stabil, request loss <%0.1 deneyimi yaygındır. Ancak compute katmanının altında DB, cache, queue gibi stateful tier’lar On-Demand veya reserved kalmalıdır.
Kaynaklar: AWS EC2 Spot Instances + Spot Advisor, Azure Spot Virtual Machines + interruption statistics, GCP Spot VMs, Karpenter Kubernetes autoscaler.










Ömer ÖNAL
Mayıs 18, 2026Spot/Preemptible stratejisi danışmanlık projelerinde en hızlı geri dönüşü veren kaldıraç: doğru workload (CI runner, batch ETL, ML training, stateless web) %70-90 indirim, yanlış workload (stateful DB) tam felaket. Karpenter veya Cluster Autoscaler ile multi-AZ + multi-instance-family diversification kurulduğunda interruption %5’in altına iner. Müşterilerimde 60 günde %35-55 kümülatif compute tasarrufu standart sonuç. — Ömer ÖNAL