Confluent 2025 State of Streaming raporu, schema registry kullanan ekiplerde üretim data incident sayısının %63 azaldığını, kullanmayan ekiplerde ortalama haftalık 3.1 schema kaynaklı outage yaşandığını gösteriyor. Data contract artık opsiyonel değil, kurumsal veri stratejisinin omurgası. Konuyla ilişkili olarak Redpanda 24.2 2026: Kafka Compatible Streaming Production Implementation rehberimiz detaylı incelemeyi içerir. Konuyla ilişkili olarak Schema Registry Production 2026: Confluent, Apicurio, Karapace Karşılaştırma rehberimiz detaylı incelemeyi içerir.
Data Contract 2026: Veri Üreticisi-Tüketici Sözleşmesi
Data contract, veri üreticisi (operasyonel servis) ile tüketici (analitik/ML pipeline) arasında schema, semantik ve SLA garantileri tanımlayan sözleşme. 2023’te ortaya çıkan kavram 2025’te kurumsal veri mimarisinde “must-have” haline geldi. Gartner 2025 Data and Analytics Strategy araştırmasında data contract benimseyen kurumlar veri kalitesi yatırım getirisini 11 ay içinde gerçeklemiş durumda; benimsemeyenlerde bu süre 28 aya çıkıyor. Confluent 2025 verilerine göre schema registry kullanan ekiplerin %78’i data contract pattern’lerini hayata geçirmiş.
Müşterilerimde en pahalı incident vakası şuydu: üretim DB’sinde “user_email” kolonu “user_emails” olarak çoğul yapıldı, 14 dashboard ve 6 ML modeli aynı anda bozuldu. Veri ekibi durumu 3 saat sonra fark etti, business sahibi bir gün sonra. Data contract olsaydı bu commit CI’de blok edilirdi.
Schema Registry: Producer-Side Validation Garantisi
Schema registry, schema’ları merkezi olarak versiyonlayan ve compatibility check yapan servis. Confluent Schema Registry, AWS Glue Schema Registry, Apicurio Registry üç ana çözüm. Producer her mesaj yazmadan önce schema’yı registry’ye gönderir; registry compatibility kuralına göre kabul veya red eder. Bu sayede breaking change CI/CD’de yakalanır, üretime ulaşmaz.
| Compatibility Mode | İzin Verir | Engeller | Kullanım |
|---|---|---|---|
| BACKWARD | Yeni kolon ekleme (default) | Kolon silme/rename | Yaygın default |
| BACKWARD_TRANSITIVE | Tüm geçmiş sürümle uyum | Eski sürümleri bozan | Güvenli production |
| FORWARD | Eski reader yeni veri | Yeni alan eski reader’a | Reader-side ağırlıklı |
| FULL | İki yönlü uyum | Tek yönlü değişim | Çok katı |
| NONE | Her şey | Hiçbir şey | Sadece dev |

Protobuf vs Avro vs JSON Schema: Format Karşılaştırması
Schema formatı seçimi serialization performance, ekosistem desteği ve developer ergonomisini belirler. Protobuf binary serialization ile en küçük payload (Avro’ya göre %15-25 daha küçük), tip güvenliği güçlü, gRPC ile uyumlu. Avro JSON-uyumlu schema definition, Kafka ekosisteminde standart, generic record reflection güçlü. JSON Schema REST API ekosisteminde yaygın, ancak binary olmadığı için throughput düşük. Google Cloud 2025 Pub/Sub verilerine göre Protobuf throughput Avro’ya göre %32, JSON’a göre %85 daha yüksek.
- Protobuf: gRPC microservices + yüksek throughput Kafka + tip güvenliği önemli ise
- Avro: Kafka-centric ekosistem + dynamic schema evolution + Hadoop/Spark interop
- JSON Schema: REST API + human-readable + düşük throughput
- Apache Iceberg ve Delta Lake metadata Protobuf kullanıyor; analitik için doğal seçim
Streaming pipeline ve schema entegrasyonu için streaming ETL rehberimize bakabilirsiniz.
CI/CD’de Breaking Change Detection Pipeline
Data contract’ın değer üretmesi için CI/CD’ye entegre edilmesi şart. Pratik pipeline şu adımları içerir: pull request açılınca schema lint, schema registry’de compatibility check (örn. BACKWARD_TRANSITIVE), consumer impact analysis (hangi downstream proje etkilenir), deployment gate (breaking change ise PR blok). Confluent resmi dokümantasyonunda bu pipeline detaylı anlatılıyor.

Consumer-Side: DLQ ve Quarantine Pattern
Schema validation %100 üretici tarafında çözülmez; bazı durumlarda invalid mesajlar yine de stream’e girer (örn. compatibility mode NONE veya manuel produce). Consumer-side için Dead Letter Queue (DLQ) ve quarantine topic pattern’leri zorunlu. Confluent 2025 verisine göre DLQ pattern’i uygulayan ekiplerde data pipeline downtime %58 düşüyor çünkü tek bir invalid mesaj tüm consumer’ı durdurmuyor.
| Pattern | Tetik | Hedef | Recovery |
|---|---|---|---|
| DLQ (dead letter) | Schema validation fail | __dlq topic | Manuel inceleme |
| Quarantine | Business rule fail | __quarantine topic | Replay tool |
| Skip + log | Compatibility warn | Log + metric | Asla durmadan |
| Retry exponential | Transient error | Aynı topic | Otomatik |
| Circuit breaker | Eşik aşımı | Stop consumer | Alarm + ops |
Data Contract Semantik Boyutu: Sadece Schema Değil
Data contract sadece schema değil; semantik kurallar, SLA tanımları ve ownership bilgilerini de içerir. Örnek: “order_amount kolonu USD cinsinden ve 0 ile 10000 arasında”, “her saatte en az 1000 satır gelir”, “downstream impact için Slack #data-incidents kanalında ilan edilir”. Bu semantik kurallar Great Expectations, dbt test veya Soda gibi data quality framework’lerinde kodlanıyor. data quality rehberimizde bu framework’leri karşılaştırdık.

Kurumsal Data Contract Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- Schema registry kuruluyor ama compatibility mode NONE bırakılıyor, breaking change’ler hâlâ üretime ulaşıyor
- Producer-side validation entegre edilmiyor, contract teoride var pratikte yok
- Semantik kurallar sözlü kalıyor, Great Expectations veya benzeri framework’lere yazılmıyor
- DLQ pattern’i kurulmuyor, tek invalid mesaj tüm consumer’ı durduruyor
- Consumer impact analysis manual; breaking change kim etkilenir bilinmiyor
- Contract ownership tanımlı değil; sorun olduğunda kim sorumlu belirsiz
Sonuç
Data contract 2026’da kurumsal veri stratejisinin omurgası; “Slack’ten haber veririm” yaklaşımı bitti. Doğru uygulama için üç katman gerekiyor: producer-side schema registry + compatibility mode, consumer-side DLQ + quarantine, semantic layer data quality tests. Bunların üçünü birlikte kuran ekiplerde data incident sayısı %63 düşüyor, üretim downtime %58 azalıyor. Karar öncesi mutlaka schema formatı (Protobuf/Avro/JSON), compatibility mode (BACKWARD_TRANSITIVE genelde doğru başlangıç) ve ownership matrix’i tanımlayın. Bu üç karar olmadan data contract sadece etiket.
Sıkça Sorulan Sorular
Schema registry için Confluent mu açık kaynak mı seçmeli?
Kafka ekosistemi Confluent dışında kullanılıyorsa (örn. AWS MSK + Glue Schema Registry) buna uygun seçim. Confluent Cloud kullananlar Confluent Schema Registry doğal seçim. Apicurio Registry açık kaynak alternatif, Kafka ekosistemi dışında REST API ekosisteminde de güçlü.
Compatibility mode olarak BACKWARD mı BACKWARD_TRANSITIVE mı?
Production’da BACKWARD_TRANSITIVE öneriliyor çünkü sadece son sürümle değil, tüm geçmiş sürümlerle uyumluluğu zorluyor. Bu durumda 3 ay önceki consumer hâlâ yeni mesajları okuyabiliyor. BACKWARD ise sadece bir önceki sürümle uyum garantili.
Protobuf vs Avro arasında 2026’da hangi daha trend?
Confluent 2025 raporuna göre Protobuf kullanım oranı son 24 ayda %28’den %47’ye çıktı; Avro %52’den %38’e düştü. Bu trend gRPC, Apache Iceberg ve modern microservices ekosisteminin Protobuf’a yönelmesiyle örtüşüyor.
Data contract violation olduğunda nasıl alert vermeli?
İki katmanlı alert öneriliyor: PR seviyesinde GitHub status check (geliştirici hemen görür), production seviyesinde Slack/PagerDuty alarm (data team on-call’una). Severity tanımı kritik: schema breaking change critical, semantik warn, performance budget warn-only.
Schema registry latency’si Kafka throughput’unu etkiler mi?
Çok minimal. Confluent Schema Registry production’da ortalama 3-8ms latency ekliyor, throughput etkisi %1-2 civarı. Schema cache producer-side aktif olduğunda her mesajda registry’ye sorgu atılmıyor, sadece schema değişiminde.










Ömer ÖNAL
Mayıs 23, 2026Data contract söylemi son 2 yılda popüler oldu, ama uygulamada %80 ekip hâlâ Slack mesajıyla ‘şu kolon eklendi’ deyip geçiyor. Müşterilerimde kalıcı çözüm üç katmanlı: producer-side schema validation (CI’de), schema registry compatibility mode (‘BACKWARD_TRANSITIVE’), consumer-side data quality test. Bu üçü olmadan contract laftan ibaret kalıyor ve breaking change 6 ay sonra rapor ekibinin önünde patlıyor. — Ömer ÖNAL