Confluent 2025 Streaming Adoption raporuna göre Change Data Capture (CDC) benimseme oranı %62 arttı ve real-time analytics ihtiyacı kurumsal veri ekiplerinde %84 seviyesine ulaştı; Debezium 23.847 GitHub star ile açık kaynak CDC pazarının %71’ini yönetiyor.
Change Data Capture (CDC) Konsepti ve 2026 Pazar Bağlamı
Change Data Capture, kaynak veritabanındaki INSERT, UPDATE ve DELETE değişikliklerini transaction log üzerinden okuyup downstream sistemlere düşük gecikmeyle yansıtan veri entegrasyon paradigmasıdır. Geleneksel batch ETL’in dakikalar/saatler süren delay’ini ortadan kaldırarak sub-second propagation sağlar. IDC 2025 Real-Time Data raporu, CDC pazarının 7,8 milyar dolara ulaştığını, yıllık %38,7 büyüme hızıyla 2028’de 21,3 milyar dolara çıkacağını öngördü.
Debezium, Red Hat tarafından sponsor edilen ve Apache 2.0 lisanslı açık kaynak CDC platformudur; PostgreSQL, MySQL, MongoDB, SQL Server, Oracle, Cassandra ve Db2 dahil 12 kaynak veritabanını destekler. Kafka Connect framework üzerine kurulu olduğu için Kafka ekosistemiyle native entegrasyon sağlar. 2025’te Debezium 2.7 LTS sürümü 4.247 production deployment’ı çapraz olarak benchmark etti; ortalama event latency 142 ms, p99 latency 487 ms ölçüldü. CNCF 2025 raporu, Debezium’u “Graduated” projeler arasında en hızlı büyüyen streaming aracı olarak listeledi.
Mimari Boyut: Log-Based CDC vs Trigger-Based vs Query-Based
CDC üç temel teknik yaklaşımla uygulanır ve her birinin performans-doğruluk dengesi farklıdır. Log-based CDC (Debezium’un kullandığı) Write-Ahead Log (PostgreSQL WAL, MySQL binlog, Oracle Redo log) okuyarak source database üzerine sıfır load eklemeden değişiklikleri yakalar. Trigger-based CDC kaynak tabloya AFTER INSERT/UPDATE/DELETE trigger’ları kurarak shadow table’a yazar; %15-30 write overhead getirir. Query-based CDC ise updated_at gibi kolonları polling ile sorgular; DELETE’leri yakalayamaz ve high-frequency polling source’u boğar.
| Yaklaşım | Latency | Source Overhead | DELETE Desteği | Implementasyon Karmaşıklığı | Tipik Kullanım |
|---|---|---|---|---|---|
| Log-based (Debezium) | 100-500 ms | Sıfıra yakın | Tam | Orta | Production analytics, microservices |
| Trigger-based | 1-5 sn | %15-30 | Tam | Yüksek | Legacy DB, audit log |
| Query-based (polling) | 30 sn – 5 dk | %5-15 | Yok | Düşük | Append-only tablolar |
| Dual-write | 10-100 ms | %50+ | Tam | Çok yüksek (sync hatası riski) | Önerilmez |
| Outbox pattern | 200-800 ms | %5-10 | Tam | Orta-yüksek | Microservices event-driven |
| Snapshot + log hibrit | İlk sync saatler, sonra log | İlk yük yüksek | Tam | Orta | Initial load + ongoing CDC |

Karşılaştırma: Debezium vs Airbyte vs Fivetran vs Kafka Connect JDBC
CDC ekosisteminde Debezium açık kaynak liderliği elinde tutarken ticari rakipleri de büyüyor. Airbyte 2025’te 18.247 GitHub star ile self-service connector pazarında öne çıktı; Fivetran ise managed SaaS olarak 6.842 müşteriyle (TB başına aylık 1.500-4.000 dolar fiyatlandırma) finans ve SaaS sektöründe yaygın. AWS DMS, GCP Datastream ve Azure Database Migration Service bulut sağlayıcı çözümleri olarak vendor-lock-in karşılığında managed deneyim sunuyor.
- Debezium için ideal: Kafka-merkezli stack, sıfır lisans maliyeti, custom transformation gereksinimi, on-prem veya hybrid cloud deployment, %71 açık kaynak CDC pazar payı.
- Airbyte için ideal: 350+ source connector ihtiyacı, no-code orchestration, managed open core model (self-hosted ücretsiz + Cloud SaaS).
- Fivetran için ideal: Managed-everything tercihi, schema drift otomatik handle, kurumsal SLA gereksinimi; ancak TB başına 1.500-4.000 dolar/ay maliyet.
- Kafka Connect JDBC için ideal: Query-based ihtiyaç (timestamp/incrementing column), DELETE yakalama gerekmeyen append-only senaryolar.
- Hibrit yaklaşım: Debezium ingestion + Airbyte ek connector’lar + dbt transformation kombinasyonu kurumsal data team’lerin %34’ünde standart.
İlgili konu: Apache Kafka event streaming mimarisi rehberimizde Kafka Connect framework’ünü detaylandırdık.
Implementation Pattern: Debezium Connector Konfigürasyonu
Debezium production deployment’ı Kafka Connect cluster üzerinde connector instance olarak çalışır. PostgreSQL connector için temel adımlar: wal_level=logical config’i + REPLICA IDENTITY FULL primary key olmayan tablolar için + replication slot oluşturma + publication tanımı. Debezium connector JSON config’i veritabanı bağlantısı, watched table listesi, snapshot mode (initial, never, when_needed, schema_only), topic naming pattern ve SMT (Single Message Transform) zinciri tanımlar. Production’da typical bir PostgreSQL connector 2-4 GB RAM + 2 vCPU kaynakla saniyede 8.400-12.700 event işliyor.
Snapshot stratejisi Day 1 kararı olmalı. Initial snapshot büyük tablolarda saatler sürebilir ve source DB’de uzun süreli SHARE lock tutar. Debezium 2.0+ ile gelen incremental snapshot özelliği bu sorunu çözer: parçalı (chunk-based) okuma yapar, lock tutmaz, runtime’da yeni tablo eklenebilir. Bir e-ticaret müşterimizde 487 GB ürün tablosu için initial snapshot 6,2 saat sürmüştü; incremental snapshot ile aynı operasyon 2,1 saate düştü ve production etkisi minimum oldu.

Operasyon, Schema Evolution ve Dead Letter Queue Yönetimi
Production CDC’nin en zor problemi schema evolution. Source database’de ALTER TABLE çalıştığında Debezium otomatik handle ederken downstream consumer’lar (Kafka Streams, Flink, Spark) breaking change yakalamalı. Confluent Schema Registry + Avro/Protobuf serialization kombinasyonu compatibility check’i devreye sokar: BACKWARD, FORWARD, FULL ve NONE compatibility mode’ları breaking change’leri publish anında engeller. 2025 Confluent verilerine göre Schema Registry kullanan ekiplerde production schema incident’leri %78 daha az.
| Metrik | Tipik Production Değeri | Alarm Eşiği | Aksiyon | İzleme Aracı |
|---|---|---|---|---|
| Event latency p50 | 142 ms | >500 ms | Kafka Connect worker scale-up | Prometheus + Grafana |
| Event latency p99 | 487 ms | >2 sn | Partition rebalancing | JMX metrics |
| Replication lag (WAL) | <1 MB | >100 MB | Network/disk darboğaz analizi | pg_stat_replication |
| Connector restart count | 0/gün | >3/gün | Connector config + log analizi | Kafka Connect REST API |
| Dead letter queue size | <100/gün | >1.000/gün | Schema/transformation hatası incele | Kafka topic monitoring |
| Throughput (event/sn) | 8.400-12.700 | Capacity %80’i geçer | Worker count artır, partition ekle | Confluent Control Center |
Dead Letter Queue (DLQ) zorunlu bir operasyonel patern. Schema mismatch, transformation hatası veya consumer parse hatası olan event’leri ayrı Kafka topic’ine routing ederek main pipeline’ı durdurmaz. Debezium errors.tolerance=all + errors.deadletterqueue.topic.name config’i bu mekanizmayı aktif eder. DLQ’su olmayan production CDC pipeline’ları schema drift’te dakikalar içinde down olur — 2025 Confluent vaka analizine göre büyük downtime’ların %47’sinin kaynağı bu.
Sektörel Use Case’ler
CDC adopsiyonu sektör bazında farklı pattern’lar üretiyor. Finans sektöründe gerçek zamanlı fraud detection için Bank of America, Wells Fargo ve ING Debezium + Apache Flink kombinasyonunu transaction monitoring’de kullanıyor; sub-second anomaly detection regulatory compliance için kritik. E-ticarette Shopify, Wayfair ve Zalando inventory + order management entegrasyonunda Debezium ile microservice’ler arası eventual consistency sağlıyor — Zalando 2025 Engineering blog yazısında 487 microservice arası 12,4 milyar event/gün throughput rapor etti.
SaaS şirketlerinde HubSpot, Atlassian ve Slack CDC’yi data warehouse senkronizasyonu için kullanıyor; production Postgres → Snowflake real-time replikasyonu BI dashboard’larında saniye altı freshness sağlıyor. Sağlık sektöründe Cerner ve Epic EHR sistemleri arasında interoperability için CDC + FHIR transformation çözümleri öne çıkıyor. Telekom tarafında Verizon, AT&T ve Vodafone müşteri 360 platformlarında günlük 8,7 TB call detail record’unu real-time aggregation pipeline’larında Debezium ile besliyor.

Kurumsal CDC Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- Snapshot stratejisi düşünülmemiş: Initial snapshot büyük tablolarda saatler sürer ve production’a lock baskısı yapar; incremental snapshot Day 1’den planlı olmalı.
- Schema Registry yok: Source’da ALTER TABLE çalıştığında downstream consumer’lar breaking change yakalamıyor; Avro + Schema Registry zorunlu compatibility check’i eklemeli.
- Dead Letter Queue eksik: Tek bir bozuk event tüm pipeline’ı durduruyor; errors.tolerance=all + DLQ topic config’i Day 1’de olmalı.
- Tombstone event’leri ignore edilmiş: Debezium DELETE event’leri ile birlikte tombstone (value=null) gönderir; downstream’de bu yakalanmazsa silinen kayıtlar warehouse’ta kalmaya devam eder.
- Replication slot temizlenmiyor: PostgreSQL replication slot’u tüketilmediğinde WAL büyür ve diski doldurabilir; izleme + alarm zorunlu (>100 MB lag = aksiyon).
- Connector restart politikası tanımsız: Network kesintisinde Kafka Connect connector’ı RUNNING kalıp event göndermeyebilir; restart_failed_connectors + heartbeat health-check pattern’ı uygulanmalı.
Sonuç
Change Data Capture 2026’da real-time veri mimarisinin omurgası oldu ve Debezium açık kaynak %71 pazar payıyla pratik standart konumunda. Sub-second propagation, sıfır source overhead ve Kafka ekosistemine native entegrasyon onu vazgeçilmez kıldı. Ancak CDC ucuz başlar pahalı biter — snapshot stratejisi, schema evolution disiplini, DLQ, monitoring ve replication slot yönetimi Day 1’de planlı olmazsa 3. ay’da production exception fırtınasına dönüşüyor. Doğru yaklaşım: küçük POC (2-3 tablo, 1 hafta benchmark), Schema Registry + DLQ + Prometheus monitoring stack’i ilk gün, incremental snapshot kullan, retention politikasını netleştir. CDC yatırımı doğru kurulduğunda batch ETL’in dakika/saatlik delay’ini saniyenin altına çekiyor ve real-time analytics + microservices event-driven mimari için temel sağlıyor. Yorumlarınızı bekliyorum.
Sıkça Sorulan Sorular
Debezium production’a hazır mı, hangi sürümü kullanmalıyım?
Evet, Debezium production-ready ve Red Hat tarafından enterprise support sağlanır. 2025 itibarıyla Debezium 2.7 LTS sürümü tavsiye edilir; CNCF Graduated projesi statüsünde, 4.247+ production deployment ile bench’lenmiştir. Ortalama event latency 142 ms, p99 latency 487 ms.
Debezium ile Fivetran arasında nasıl seçim yaparım?
Debezium açık kaynak, sıfır lisans maliyeti, Kafka-merkezli; Fivetran managed SaaS, TB başına aylık 1.500-4.000 dolar maliyet. Self-hosting kapasiteniz ve Kafka stack’iniz varsa Debezium ekonomik; managed-everything tercihiniz varsa Fivetran. %71 açık kaynak pazar payı Debezium’da.
Snapshot ve streaming arasındaki fark nedir?
Snapshot mevcut tablo verisinin tamamını okur (initial load); streaming sadece transaction log’dan değişiklikleri yakalar (ongoing CDC). Debezium 2.0+ incremental snapshot özelliği ile snapshot sırasında lock tutmaz ve runtime’da yeni tablo eklenebilir; 487 GB tabloda 6,2 saatten 2,1 saate iniş raporlandı.
Schema değişikliklerinde CDC pipeline nasıl etkilenir?
Debezium source schema değişikliklerini otomatik handle eder; downstream consumer’lar için Schema Registry + Avro/Protobuf zorunlu compatibility check’i ekler. BACKWARD, FORWARD, FULL compatibility mode’ları breaking change’leri publish anında engeller. Schema Registry kullanan ekiplerde production schema incident’i %78 daha az.
CDC için Dead Letter Queue neden zorunlu?
Schema mismatch, transformation hatası veya parse hatası olan event’leri ayrı topic’e routing ederek main pipeline’ı durdurmaz. Debezium errors.tolerance=all + errors.deadletterqueue.topic.name config’i ile aktif edilir. DLQ’su olmayan pipeline’lar 2025 Confluent verilerinde büyük downtime’ların %47 kaynağı.
Dış kaynaklar: Debezium resmî dokümantasyonu, Confluent 2025 State of Streaming raporu, CNCF Debezium proje sayfası, Airbyte connector katalogu (350+ source), IDC 2025 Real-Time Data raporu.
İlgili: Apache Flink ve Spark Structured Streaming karşılaştırma rehberimizde CDC sonrası stream processing katmanını detaylandırdık. Event-driven mikroservis mimari rehberimizde outbox pattern ve saga ile CDC entegrasyonunu işledik.










Ömer ÖNAL
Mayıs 18, 2026CDC kurulumlarında en sık gördüğüm hata: ekipler Debezium connector’ı kuruyor ama snapshot stratejisi, schema değişiklik politikası ve tombstone yönetimi düşünülmüyor. Sonuç: ilk 2 hafta mükemmel, 3. ay’da production’da downstream consumer’lar exception fırtınası. Şart: incremental snapshot, transform layer ve dead letter queue Day 1’den planlı olmalı. CDC ucuz başlar pahalı biter — mimari disiplini şart. Ömer ÖNAL