2026’da Kubernetes operator yazımı artık bir niÅŸ uzmanlık deÄŸil; CNCF Annual Survey 2025’e göre kurumsal cluster’ların %78’i en az bir custom operator çalıştırıyor ve bu sayı her yıl %22 artıyor. Operator SDK ve Kubebuilder, bu otomasyonun arkasındaki iki büyük framework. Konuyla ilişkili olarak Kubernetes Operator Geliştirme: Operator SDK ve Kubebuilder Karşılaştırması rehberimiz detaylı incelemeyi içerir.
Kubernetes Operator Pattern’inin 2026 Pazar BaÄŸlamı
Operator pattern, CoreOS’un 2016’da tanımladığı kavramdan çok daha geniÅŸ bir alana yayıldı. CNCF 2025 Operator Maturity Report’a göre operator hub’larında 412 farklı operator listeleniyor; bunların 158 tanesi Capability Level 4 veya 5 olgunluÄŸuna ulaÅŸtı. Red Hat OpenShift ekibinin Ekim 2025 raporu, üretim ortamlarında çalışan operator’ların %62’sinin hala Level 1-2 olgunluk seviyesinde takılı kaldığını gösteriyor — bu, otomasyonun ötesinde reconcile, monitor ve auto-pilot yeteneklerini eksik kullanan ekiplerin hala büyük çoÄŸunluÄŸu oluÅŸturduÄŸunu iÅŸaret ediyor.
Operator yazımının önemi ÅŸu rakamlarda netleÅŸiyor: Stack Overflow Developer Survey 2025’e göre Go dili Kubernetes ekosisteminde %91 paya sahip ve operator yazımının %94’ü Go ile gerçekleÅŸtiriliyor. CNCF’in Mayıs 2025 raporu, bir kurumda çalışan ortalama 7.3 custom operator olduÄŸunu, bu sayının 2022’deki 3.1 rakamından iki kattan fazla büyüdüğünü açıklıyor. DataDog 2025 Container Report ise operator kullanan cluster’larda incident MTTR’ın %47 daha kısa olduÄŸunu raporluyor.
Operator SDK ve Kubebuilder Arasındaki Mimari Fark
Her iki framework de controller-runtime kütüphanesi üzerine kurulu, ancak farklı abstraction katmanları sunuyor. Operator SDK Red Hat’in yönlendirdiÄŸi bir proje; OpenShift entegrasyonu, Helm operator, Ansible operator gibi alternatif yaklaşımları doÄŸal destekliyor. Kubebuilder ise Kubernetes SIG-API-Machinery tarafından yönetiliyor ve Go odaklı, daha sıkı bir CRD scaffolding contract sunuyor.
| Özellik | Operator SDK | Kubebuilder | Hangi Senaryo |
|---|---|---|---|
| Yönetici proje | Red Hat / CNCF | Kubernetes SIG | OpenShift agnostik / SIG yakınlığı |
| Desteklenen yaklaşımlar | Go, Helm, Ansible | Sadece Go | Hızlı PoC için Helm operator |
| Scaffolding | operator-sdk init | kubebuilder init | Pratik olarak benzer |
| Webhook desteÄŸi | Var, OLM entegrasyonlu | Var, vanilla | OLM gerekiyorsa SDK |
| OLM bundle | Native | Manuel | OperatorHub publish |
| Topluluk büyüklüğü | GitHub 24K star | GitHub 8K star | Ekosistem desteği |

Reconcile Loop İdempotency: 8 Production Pattern
Reconcile loop, operator’ın kalbi; her tetiklenmede aynı sonucu üretmiyorsa cluster tutarsız hale gelir. CNCF 2025 Operator Best Practices kılavuzu, üretimde baÅŸarılı operator’ların 8 ortak pattern uyguladığını gösteriyor. Bu pattern’lerin %71’i Level 3 ve üstü olgunluÄŸa eriÅŸen operator’larda mevcut.
- Status subresource: Spec ve status ayrılır, status sadece controller tarafından güncellenir; bu pattern desync olaylarını %63 azaltıyor.
- Finalizer: Delete sırasında external resource cleanup garantisi; finalizer’sız operator’larda orphan resource oranı %38’e ulaşıyor.
- Owner reference: Garbage collection için child resource’lara owner pointer atanır.
- Conditional update: Sadece spec deÄŸiÅŸikliÄŸinde reconcile tetiklenir, periodic resync overhead’i azalır.
- Exponential backoff: Hata durumunda retry interval üstel artar; default ratelimiter 5ms-1000s arası.
- Observed generation: Spec’in hangi versiyonu reconcile edildi takip edilir.
- Idempotent CreateOrUpdate: controller-runtime’in helper fonksiyonu, manuel diff pattern’ından %47 daha az hatalı.
- Watch with predicate: Sadece ilgili event’leri filtrele; cluster API yükü %62 azalır.
İlgili konu: Kubernetes deployment stratejileri rehberimizde detayları bulabilirsiniz.
CRD Versioning ve Conversion Webhook Stratejisi
Custom Resource Definition versiyonlama, operator’ı uzun ömürlü kılan en kritik tasarım kararlarından biri. Kubernetes 1.16’dan bu yana CRD versioning ile birlikte conversion webhook desteÄŸi var. Üretimde v1alpha1’den v1’e geçiÅŸ yapmadan da scaling yapan operator’lar var ama bu durumda backward compatibility problemleri hızla birikiyor. Google Cloud 2025 GKE Operator Report’a göre conversion webhook kullanan operator’larda upgrade success rate %94, kullanmayanlarda %71.
Storage version, etcd’de hangi versiyonun saklandığını belirler. Bir CRD’de sadece bir storage version olabilir; diÄŸer versiyonlar conversion ile bu storage version’a çevrilir. Webhook tabanlı conversion latency’yi 5-15ms artırır, ancak none conversion sadece field rename gibi basit deÄŸiÅŸiklikler için yeterli. Üretimde önerilen pattern: yeni version’u storage:false olarak iÅŸaretle, conversion webhook’u aç, kademeli olarak storage version’u deÄŸiÅŸtir.

Operator Observability ve Production Operasyon
Bir operator’ı production’a koymak demek, onun da observable olması demek. Operator SDK ve Kubebuilder her ikisi de Prometheus metric’leri için controller-runtime metric server’ı kullanıyor. CNCF Observability TAG’in 2025 önerisi, operator başına en az 12 standart metric expose edilmesi: reconcile latency p50/p95/p99, reconcile errors total, queue depth, work duration, leader election status, custom resource count, last reconcile timestamp, finalizer queue, conversion errors, webhook latency, cache sync duration.
| Metric | Sinyal Tipi | Alarm EÅŸiÄŸi | Sorun Tipi |
|---|---|---|---|
| Reconcile error rate | Counter | >%5 / 5dk | Logic veya API bug |
| Queue depth | Gauge | >1000 | Workload spike, slow reconcile |
| Reconcile latency p99 | Histogram | >30s | External call timeout |
| Cache sync | Boolean | false 2dk | API server connectivity |
| Leader election | Boolean | flap >3/saat | Lease pressure, network |
Sektörel Operator Use Case’leri
Operator pattern her sektörde aynı ÅŸekilde uygulanmıyor. Finans sektöründe en yüksek olgunluk seviyeleri görülüyor; JP Morgan Chase 2025 Tech Report 47 custom operator kullandıklarını, %71’inin Level 4-5 olgunlukta olduÄŸunu açıkladı. SaÄŸlık sektöründe HIPAA compliance baskısıyla audit-log operator’ları yaygın. Telco sektöründe RAN-DU/CU otomasyonu için 5G core operator’ları kritik; AT&T 2025 Open RAN raporu network function deployment süresinin operator’larla 4 saatten 12 dakikaya düştüğünü gösteriyor.
- Database operator: CloudNativePG, Percona, MongoDB operator’ları kurumsal Postgres/Mongo yönetimini Kubernetes-native yapıyor.
- Cert-manager: X.509 sertifika otomasyonu için endüstri standardı, ayda 1.2 milyar sertifika düzenliyor.
- Crossplane: Multi-cloud provisioning için universal control plane operator pattern.
- Strimzi: Apache Kafka için en olgun K8s operator, 7K+ GitHub star.
- Velero plugin operator: Backup orkestrasyonu için CRD tabanlı yaklaşım.

| Olgunluk Seviyesi | Tipik Uygulama | Adopsiyon Oranı | ROI Beklentisi |
|---|---|---|---|
| Başlangıç | Pilot ekip 3-5 servis | %12 | 0-6 ay |
| Gelişme | 10-20 servis genişletme | %34 | 6-12 ay |
| Olgun | 50+ servis cluster-wide | %41 | 12-24 ay |
| Optimize | Continuous improvement | %13 | 24+ ay |
| Sektör | Tipik Kullanım | Compliance Etkisi | Tasarruf |
|---|---|---|---|
| Finans | Yüksek olgunluk, audit-driven | PCI DSS, SOX | %32 |
| Sağlık | HIPAA + retention | HIPAA, GDPR | %24 |
| E-ticaret | Black Friday burst | PCI DSS | %47 |
| Telco | 5G core, low latency | NIS2 Directive | %38 |
| SaaS | Multi-tenant, scale | SOC 2 | %52 |
Kurumsal Kubernetes Operator Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- Reconcile loop idempotent deÄŸil, periyodik resync state’i bozuyor.
- Finalizer eksik veya yanlış uygulanmış; orphan external resource’lar birikiyor.
- Status subresource etkin deÄŸil, controller spec’i de güncelliyor ve hot loop oluÅŸuyor.
- CRD versioning planlanmamış, v1alpha1’den v1’e geçiÅŸte downtime yaÅŸanıyor.
- Observability metric’leri eksik, hangi operator’un yavaÅŸladığı tespit edilemiyor.
- RBAC çok geniş, operator cluster-admin yetkisiyle çalışıyor.
İlgili konular: platform engineering pratikleri, SRE ve observability stratejileri ve cloud-native GitOps pattern içeriklerimizden faydalanabilirsiniz.
Sonuç
Kubernetes operator yazımı 2026’da artık platform engineering ekiplerinin temel yetkinliÄŸi. DoÄŸru framework seçimi (Operator SDK vs Kubebuilder), reconcile loop’un idempotent tasarımı, CRD versioning planlaması ve observability metric’lerinin doÄŸru çıkartılması üretim olgunluÄŸunun dört temel direÄŸi. Capability Level 3+ hedefiyle baÅŸlamayan operator’lar uzun vadede teknik borç biriktiriyor. Pilot operator’unuzu önce stateless ve düşük blast radius’lu bir CRD ile baÅŸlatın; status, finalizer, owner reference üçlüsünü oturtmadan production’a açmayın.
Sıkça Sorulan Sorular
Operator SDK mi Kubebuilder mi seçmeliyim?
OpenShift kullanıyorsanız ve OLM bundle yayımlayacaksanız Operator SDK doÄŸal seçim. Saf Go ve SIG yakınlığı önemliyse Kubebuilder daha sade. CNCF 2025 raporu yeni baÅŸlangıçların %63’ünün Kubebuilder seçtiÄŸini gösteriyor.
Reconcile loop’un idempotent olduÄŸunu nasıl test ederim?
Aynı CR üzerinde reconcile’ı manuel olarak 10 kez tetikleyip cluster state’inin deÄŸiÅŸmediÄŸini doÄŸrulayın. Controller-runtime envtest paketi ile bu testi unit test seviyesinde otomatize edebilirsiniz; envtest CI’de 8 saniyenin altında çalışıyor.
CRD v1alpha1’den v1’e nasıl geçerim?
Conversion webhook tanımlayın, yeni version’u served:true, storage:false olarak ekleyin, mevcut CR’ları güncelleyin, sonra storage version’u deÄŸiÅŸtirin. GKE 2025 raporuna göre bu pattern’le upgrade success rate %94.
Operator için minimum hangi metric’leri expose etmeliyim?
Reconcile latency p99, reconcile error rate, queue depth, cache sync status ve leader election status — bu 5 metric kapsamı %80 incident’i yakalıyor. CNCF Observability TAG en az 12 standart metric öneriyor.
Operator’un RBAC scope’unu nasıl daraltırım?
Cluster-admin yerine namespace-scoped ClusterRole tasarlayın; sadece operator’un yönettiÄŸi CRD’lere ve onların alt kaynaklarına eriÅŸim verin. NSA Kubernetes Hardening Guide 2025 bu pattern’i mandatory olarak iÅŸaretliyor.
Detaylı arka plan için CNCF resmi raporlarını, framework dokümantasyonu için Kubebuilder kılavuzunu, OLM ve bundle yapımı için Operator Framework resmi sitesini ve API design rehberi için Kubernetes API reference’ı inceleyebilirsiniz.










Ömer ÖNAL
Mayıs 23, 2026Danışmanlık projelerinde gözlemlediğim en kritik nokta, ekiplerin operator yazımına idempotency disiplini olmadan başlamasıdır. Reconcile loop her tetiklendiğinde aynı sonucu üretmiyorsa cluster’ı tutarsız hale getirir. Kubebuilder’ın controller-runtime kütüphanesi bu konuda Operator SDK’dan daha sıkı bir contract dayatıyor. Üretimde önce status subresource, finalizer ve owner reference üçlüsünü oturtmadan CRD’yi açmamayı öneriyorum. — Ömer ÖNAL