Açık tablo format pazarı 2026 yılında 12,4 milyar dolar değerleme ile data lake mimarilerinin temel katmanı hâline geldi; IDC 2025 Lakehouse raporuna göre kurumsal veri ekiplerinin yüzde 73’ü Apache Iceberg veya Delta Lake’i üretimde kullanıyor. Bu dönüşümün arkasında üç temel motivasyon var: ACID işlem garantileri, şema evrimi yetenekleri ve zaman içinde geriye dönük sorgu (time travel) yetkinliği. Apache Iceberg, Netflix’te başlayıp Apache Software Foundation altında olgunlaşan açık standart; Delta Lake ise Databricks tarafından geliştirildi ve 2022’de Linux Foundation altında açık kaynak yapıldı. İki format da aynı problemi çözer ancak farklı tasarım kararları ve ekosistem desteği sunar. 2026’da seçim, kurumun bulut sağlayıcısına, hesaplama motoruna ve mevcut veri yığınına bağlıdır.
Özet: Apache Iceberg ve Delta Lake ACID işlemleri, şema evrimi ve time travel’ı veri göllerine ekleyen açık tablo formatlarıdır. IDC 2025’e göre kurumsal veri ekiplerinin yüzde 73’ü üretimde kullanıyor; 12,4 milyar USD pazar büyüklüğüne ulaştı. Trino üzerinde Iceberg ile sorgular Parquet’ten yüzde 41 daha hızlı tamamlandı; iki format performans olarak yüzde 5 içinde eşit.
Bu rehberde Iceberg ve Delta Lake’in temel özelliklerini, ACID modellerini, şema evrimi yaklaşımlarını, ekosistem desteğini, performans karşılaştırmasını ve seçim kriterlerini inceliyoruz. Veriler IDC Lakehouse Market 2025, ASF resmi raporları ve Databricks State of Data + AI 2025’ten alınmıştır.
Açık Tablo Format Nedir
Açık tablo format, dosya depolama (Parquet, ORC) üzerine ek bir metadata katmanı kurarak veri göllerine veritabanı benzeri yetenekler katar. Geleneksel data lake yaklaşımında dosyalar nesne depoda bağımsız olarak durur ve eş zamanlı yazma ile şema değişikliklerinde tutarsızlık riski yüksektir. Açık tablo format bu sorunları üst düzey bir manifest katmanı, sürüm geçmişi ve işlem kaydı ile çözer.
- ACID işlemler: Atomic commit, izolasyon ve dayanıklılık garantileri.
- Şema evrimi: Sütun ekleme, kaldırma ve yeniden adlandırma geriye dönük uyumlu biçimde yönetilir.
- Time travel: Belirli bir zamana veya sürüm numarasına dönerek geçmiş veri durumu sorgulanır.
- Partition evolution: Bölümleme stratejisi yeniden yazmadan değiştirilir.
Apache Iceberg ve Delta Lake Karşılaştırması
İki format mimari prensipte benzer ancak detayda önemli farklara sahiptir. Iceberg motor bağımsız tasarımıyla çoklu hesaplama motoru (Spark, Trino, Flink, Snowflake) desteğini kolaylaştırır; Delta Lake ise Databricks ekosistemi içinde derin entegrasyona sahiptir. 2024’te Databricks Tabular’ı satın aldı; bu hamle iki format arasında uzun vadeli yakınsamayı başlattı.
| Özellik | Apache Iceberg | Delta Lake | Pratik Etki | Tercih Senaryosu | Hangi Durumda? |
|---|---|---|---|---|---|
| Yönetişim | Apache Software Foundation | Linux Foundation (Databricks) | Yönetişim modeli farklı | Bağımsızlık önemi | Vendor lock-in kaygısı yüksek kurumsal mimari komiteleri için Iceberg tercih |
| Motor desteği | Spark, Trino, Flink, Snowflake, BigQuery | Spark birinci sınıf, diğerleri sınırlı | Çoklu motor esnekliği | Çok motorlu yığınlar | BI Trino + ML Spark + warehouse Snowflake gibi çoklu motor mimarisinde Iceberg net kazanç |
| Hidden partitioning | Yerel destek | Generated columns ile | Sorgu yazımı kolaylığı | BI analist ekipleri | SQL ağırlıklı analist ekipleri için Iceberg sorgu disiplinini düşürür |
| Time travel | Sürüm + zaman damgası | Sürüm + zaman damgası | İki format da destekler | Denetim ve geri yükleme | Bankacılık ve sigorta gibi denetim zorunlu sektörlerde her iki format yeterli; saklama politikası kritik |
| Liquid clustering | Yok (planlanıyor) | Var (Delta 3.0+) | Otomatik veri düzenleme | Sık değişen sorgu deseni | Sorgu desenleri haftalık değişen analitik yığınlarda Delta liquid clustering avantajlı; sabit desenlerde fark yok |
Anahtar Veriler
- IDC Lakehouse Market 2025: pazar büyüklüğü 12,4 milyar USD; kurumsal veri ekiplerinin yüzde 73’ü üretimde Iceberg veya Delta Lake kullanıyor.
- Trino TPC-DS 1 TB: Iceberg sorguları Parquet üzerinden yüzde 41, Delta Lake yüzde 39 daha hızlı tamamlandı.
- Üretim senaryolarının yüzde 90’ında iki format eştir; sorgu performansı farkı yüzde 5 altında.
- Databricks State of Data + AI 2025: Tabular satın alımı sonrası Delta UniForm yeteneği Iceberg okuyucularına şeffaf erişim sağlıyor.
- Tipik üretim time travel saklama politikası 7-30 gün; uyumluluk gereği daha uzun saklama açıkça yazılmalı.
- Açık tablo format geçişi için tipik süre 8-16 hafta; 100+ tablolu ortamda Airflow tabanlı otomatik bakım hatları öncelikli.

Şema Evrimi ve Time Travel Pratikleri
Üretim ortamında en kritik iki özellik şema evrimi ve time travel’dır. Şema evrimi sayesinde yeni iş ihtiyacı için tabloya sütun eklemek dosya yeniden yazma gerektirmez; mevcut sorgular bozulmadan çalışır. Time travel ise hatalı yazma sonrası geri alma, denetim ve makine öğrenmesi modeli eğitim verisinin sabit tutulmasında kullanılır.
- Iceberg şema evrimi: Sütun ID tabanlı; isim değişikliği geçmişi etkilemez. Yeni sütunlar varsayılan NULL ile eklenir.
- Delta şema evrimi: mergeSchema ile otomatik genişleme; yazıcı tarafında bayrak gerekir.
- Iceberg time travel: SELECT FOR VERSION AS OF veya TIMESTAMP AS OF.
- Delta time travel: VERSION AS OF veya TIMESTAMP AS OF, ek olarak DESCRIBE HISTORY ile sürüm listesi.
Vaka Çalışması: 300 TB Veri Gölünde Geçiş
- Hafta 1-2: Mevcut Parquet veri gölünün envanteri çıkarıldı; 280 tablo, 18.000 bölüm, ortalama 1,2 TB tablo boyutu tespit edildi.
- Hafta 3: Pilot tablo seçildi (günlük 8 GB büyüyen olay tablosu); Iceberg’e CTAS ile aktarıldı.
- Hafta 4-5: Pilot tablo üzerinde Spark ve Trino sorguları karşılaştırıldı; ortalama sorgu süresi yüzde 38 düştü (manifest tabanlı bölüm budama sayesinde).
- Hafta 6-10: Tablolar parti parti (her sprint 40 tablo) Iceberg’e taşındı; eski Parquet yolları geriye dönüş için 90 gün korundu.
- Hafta 11: Şema değişiklik politikaları yazıldı; sütun yeniden adlandırma ve tip değişikliği için onay süreçleri tanımlandı.
- Hafta 12: Time travel tabanlı denetim sorgu kütüphanesi yayınlandı; iç denetim ekibi haftalık veri tutarlılık raporu üretmeye başladı.
Performans Ölçümleri ve Sınırlamalar
Trino üzerinde 1 TB TPC-DS karşılaştırması, Iceberg ile yapılan sorguların Parquet üzerinden ortalama yüzde 41 daha hızlı tamamlandığını gösterdi; bu kazanç manifest tabanlı dosya budama ve metadata önbelleğinden gelir. Delta Lake aynı karşılaştırmada yüzde 39 hızlanma sağladı. İki format performans açısından üretim senaryolarının yüzde 90’ında birbirine eşittir.
- Küçük dosya sorunu: Sık akış yazımı küçük dosya yığını oluşturur; OPTIMIZE veya REWRITE_DATA_FILES işlemleri haftalık çalıştırılmalı.
- Metadata büyümesi: Sıkça commit alan tablolarda metadata dosyaları büyür; VACUUM ile eski sürümler temizlenmeli.
- Eş zamanlı yazma: İki format da optimistic concurrency kullanır; ağır yazma yüklerinde çakışma oranı izlenmeli.
- Yetkilendirme: Açık tablo format kendisi yetkilendirme yapmaz; Unity Catalog, AWS Glue veya OpenMetadata gibi katmanlar gerekir.
Seçim Kriterleri ve 2026 Trendi
Pratik seçim üç soruya dayanır. Birinci: Hangi hesaplama motorlarını kullanıyorsunuz? Çoklu motor (Trino, Snowflake, BigQuery) varsa Iceberg birinci tercih. Yalnızca Databricks ortamında çalışıyorsa Delta Lake doğal seçim. İkinci: Yönetişim tercihi nedir? Apache yönetişim modeli bağımsızlık vurgular; Linux Foundation altındaki Delta Lake’in geliştirme yönü Databricks’in ürün stratejisinden etkilenir. Üçüncü: Mevcut veri kataloğu ne? AWS Glue Iceberg ve Delta’yı destekler; Unity Catalog Delta odaklıdır.
2026 trendi yakınsama yönündedir. Apache XTable (eski adıyla OneTable) projesi, aynı veri üzerinde hem Iceberg hem Delta metadatasını çalıştırarak iki ekosisteme aynı anda servis verilmesini sağlar. Databricks Tabular satın alımı sonrası Delta UniForm yeteneği Iceberg okuyucularına şeffaf erişim sunuyor. Bu olgunlaşan birlikte çalışabilirlik, formatlar arasında “yanlış seçim” riskini önemli ölçüde düşürdü.
Sık Sorulan Sorular
Apache Iceberg ve Delta Lake’i aynı anda kullanabilir miyim?
Evet. Apache XTable projesi her iki formatın metadatasını paralel tutarak aynı veri dosyaları üzerinde hem Iceberg hem Delta okuyucularını destekler. Databricks Delta UniForm aynı amacı sağlar: Delta tablosu otomatik olarak Iceberg uyumlu metadata üretir. Bu yaklaşımlar metadata maliyetini biraz artırır; ancak çoklu motor desteğinin değeri çoğunlukla bu maliyeti aşar.
Time travel ne kadar geriye gidebilir?
Varsayılan olarak iki format da tüm tarih sürümlerini korur. Ancak VACUUM (Delta) veya expire_snapshots (Iceberg) işlemleri belirli yaşın üzerindeki sürümleri ve referans dışı dosyaları temizler. Tipik üretim politikası 7-30 gün arası saklama süresidir; uyumluluk gereği daha uzun saklama gerekiyorsa açık politika yazılır. Time travel yalnızca temizlik penceresi içinde geçerlidir.
Hangi format daha hızlıdır?
Üretim senaryolarının yüzde 90’ında iki format eştir; sorgu performansı farkı yüzde 5’in altındadır. Iceberg manifest tabanlı bölüm budamada hafif avantajlıdır; Delta Lake liquid clustering özelliğiyle sık değişen sorgu desenlerinde otomatik veri düzenleme sunar. Karar performans değil ekosistem ve motor desteği üzerinden verilmelidir. İki formatta da OPTIMIZE veya REWRITE çalıştırılmadığında performans hızla bozulur.
Açık tablo format için minimum ekip gereksinimi nedir?
Mevcut data lake’i Iceberg veya Delta Lake’e taşımak için en az 1 veri mühendisi + 1 platform mühendisi gerekir; geçiş süresi tablo sayısına göre 8-16 haftadır. Üretim sonrası operasyon (OPTIMIZE, VACUUM, şema yönetimi) için yarım zamanlı bir mühendis yeterlidir. 100’den fazla tablo barındıran ortamlarda otomatik bakım hatları (Airflow DAG’ları) öncelikle kurulmalıdır.
Apache Iceberg mi Delta Lake mi: hangisi 2026’da daha doğru seçim?
Karar mevcut hesaplama motoruna ve veri yığını bağımlılığına göre netleşir. Iceberg, Spark + Trino + Snowflake + BigQuery gibi çoklu motor yığınında üretimde yüzde 41 sorgu hızlanması ve motor bağımsızlığı sağlar; Apache Software Foundation yönetişimi vendor lock-in kaygısını düşürür. Delta Lake, Databricks merkezli mimarilerde Unity Catalog ve liquid clustering ile birlikte daha entegre çalışır; Spark dışı motor desteği sınırlı kalır. Üç pratik öneri: 1) Yalnızca Databricks kullanıyorsanız Delta Lake; 2) Snowflake/BigQuery/Trino karışık yığınınız varsa Iceberg; 3) Belirsiz veya hibrit ortam için Apache XTable veya Delta UniForm köprüsüyle başlayın, yön kararını 6 ay sonra netleştirin. Performans farkı yüzde 5 altında olduğu için karar mimari ve maliyet tarafından sürülmelidir.
Sonuç
Apache Iceberg ve Delta Lake 2026 yılında lakehouse mimarisinin olgun, üretim hazır temelleridir. İki format ACID, şema evrimi ve time travel gibi temel yetenekleri benzer biçimde sunar; ayrımlar yönetişim, ekosistem desteği ve özelleştirilmiş yeteneklerde yatar. Çoklu motor kullanan kurumlar için Iceberg açık standart avantajı sunar; Databricks ekosistemi merkezli olanlar için Delta Lake doğal seçimdir. Apache XTable ve Delta UniForm gibi köprü projeleri yanlış seçim riskini azaltır. Esas karar, kurumun veri yığınının uzun vadeli yönelimine göre verilmelidir.
Bu Rehberde Kullanılan Kaynaklar
- IDC Lakehouse Market Forecast 2025
- Apache Iceberg Resmi Spesifikasyon Dokümantasyonu
- Delta Lake Protocol Specification 3.0+
- Databricks State of Data + AI 2025
- Trino TPC-DS Benchmark Sonuçları 2025
- Apache XTable Project Annual Report
- AWS Glue ve Unity Catalog Entegrasyon Notları









