Iceberg vs Delta Lake 2026: Açık Tablo Format Rehberi

Haziran 21, 2026Ömer ÖNAL0 Yorum

Açık tablo format pazarı 2026 yılında 12,4 milyar dolar değerleme ile data lake mimarilerinin temel katmanı hâline geldi; IDC 2025 Lakehouse raporuna göre kurumsal veri ekiplerinin yüzde 73’ü Apache Iceberg veya Delta Lake’i üretimde kullanıyor. Bu dönüşümün arkasında üç temel motivasyon var: ACID işlem garantileri, şema evrimi yetenekleri ve zaman içinde geriye dönük sorgu (time travel) yetkinliği. Apache Iceberg, Netflix’te başlayıp Apache Software Foundation altında olgunlaşan açık standart; Delta Lake ise Databricks tarafından geliştirildi ve 2022’de Linux Foundation altında açık kaynak yapıldı. İki format da aynı problemi çözer ancak farklı tasarım kararları ve ekosistem desteği sunar. 2026’da seçim, kurumun bulut sağlayıcısına, hesaplama motoruna ve mevcut veri yığınına bağlıdır. Konuyla ilişkili olarak Trino vs Apache Drill vs Presto: Federated Query 2026 Karşılaştırması rehberimiz detaylı incelemeyi içerir.

Özet: Apache Iceberg ve Delta Lake ACID işlemleri, şema evrimi ve time travel’ı veri göllerine ekleyen açık tablo formatlarıdır. IDC 2025’e göre kurumsal veri ekiplerinin yüzde 73’ü üretimde kullanıyor; 12,4 milyar USD pazar büyüklüğüne ulaştı. Trino üzerinde Iceberg ile sorgular Parquet’ten yüzde 41 daha hızlı tamamlandı; iki format performans olarak yüzde 5 içinde eşit.

Bu rehberde Iceberg ve Delta Lake’in temel özelliklerini, ACID modellerini, şema evrimi yaklaşımlarını, ekosistem desteğini, performans karşılaştırmasını ve seçim kriterlerini inceliyoruz. Veriler IDC Lakehouse Market 2025, ASF resmi raporları ve Databricks State of Data + AI 2025’ten alınmıştır.

📖 12 dakikalık okuma

İçindekiler

Açık Tablo Format Nedir
Apache Iceberg ve Delta Lake Karşılaştırması
Şema Evrimi ve Time Travel Pratikleri
Vaka Çalışması: 300 TB Veri Gölünde Geçiş
Performans Ölçümleri ve Sınırlamalar
Seçim Kriterleri ve 2026 Trendi
Sık Sorulan Sorular
Sonuç

Açık Tablo Format Nedir

Açık tablo format, dosya depolama (Parquet, ORC) üzerine ek bir metadata katmanı kurarak veri göllerine veritabanı benzeri yetenekler katar. Geleneksel data lake yaklaşımında dosyalar nesne depoda bağımsız olarak durur ve eş zamanlı yazma ile şema değişikliklerinde tutarsızlık riski yüksektir. Açık tablo format bu sorunları üst düzey bir manifest katmanı, sürüm geçmişi ve işlem kaydı ile çözer.

ACID işlemler: Atomic commit, izolasyon ve dayanıklılık garantileri.
Şema evrimi: Sütun ekleme, kaldırma ve yeniden adlandırma geriye dönük uyumlu biçimde yönetilir.
Time travel: Belirli bir zamana veya sürüm numarasına dönerek geçmiş veri durumu sorgulanır.
Partition evolution: Bölümleme stratejisi yeniden yazmadan değiştirilir.

Apache Iceberg ve Delta Lake Karşılaştırması

İki format mimari prensipte benzer ancak detayda önemli farklara sahiptir. Iceberg motor bağımsız tasarımıyla çoklu hesaplama motoru (Spark, Trino, Flink, Snowflake) desteğini kolaylaştırır; Delta Lake ise Databricks ekosistemi içinde derin entegrasyona sahiptir. 2024’te Databricks Tabular’ı satın aldı; bu hamle iki format arasında uzun vadeli yakınsamayı başlattı.

Özellik	Apache Iceberg	Delta Lake	Pratik Etki	Tercih Senaryosu	Hangi Durumda?
Yönetişim	Apache Software Foundation	Linux Foundation (Databricks)	Yönetişim modeli farklı	Bağımsızlık önemi	Vendor lock-in kaygısı yüksek kurumsal mimari komiteleri için Iceberg tercih
Motor desteği	Spark, Trino, Flink, Snowflake, BigQuery	Spark birinci sınıf, diğerleri sınırlı	Çoklu motor esnekliği	Çok motorlu yığınlar	BI Trino + ML Spark + warehouse Snowflake gibi çoklu motor mimarisinde Iceberg net kazanç
Hidden partitioning	Yerel destek	Generated columns ile	Sorgu yazımı kolaylığı	BI analist ekipleri	SQL ağırlıklı analist ekipleri için Iceberg sorgu disiplinini düşürür
Time travel	Sürüm + zaman damgası	Sürüm + zaman damgası	İki format da destekler	Denetim ve geri yükleme	Bankacılık ve sigorta gibi denetim zorunlu sektörlerde her iki format yeterli; saklama politikası kritik
Liquid clustering	Yok (planlanıyor)	Var (Delta 3.0+)	Otomatik veri düzenleme	Sık değişen sorgu deseni	Sorgu desenleri haftalık değişen analitik yığınlarda Delta liquid clustering avantajlı; sabit desenlerde fark yok

Anahtar Veriler

IDC Lakehouse Market 2025: pazar büyüklüğü 12,4 milyar USD; kurumsal veri ekiplerinin yüzde 73’ü üretimde Iceberg veya Delta Lake kullanıyor.
Trino TPC-DS 1 TB: Iceberg sorguları Parquet üzerinden yüzde 41, Delta Lake yüzde 39 daha hızlı tamamlandı.
Üretim senaryolarının yüzde 90’ında iki format eştir; sorgu performansı farkı yüzde 5 altında.
Databricks State of Data + AI 2025: Tabular satın alımı sonrası Delta UniForm yeteneği Iceberg okuyucularına şeffaf erişim sağlıyor.
Tipik üretim time travel saklama politikası 7-30 gün; uyumluluk gereği daha uzun saklama açıkça yazılmalı.
Açık tablo format geçişi için tipik süre 8-16 hafta; 100+ tablolu ortamda Airflow tabanlı otomatik bakım hatları öncelikli.

Açık tablo format katmanları: metadata, snapshot ve parquet dosya yapısının izometrik gösterimi

Şema Evrimi ve Time Travel Pratikleri

Üretim ortamında en kritik iki özellik şema evrimi ve time travel’dır. Şema evrimi sayesinde yeni iş ihtiyacı için tabloya sütun eklemek dosya yeniden yazma gerektirmez; mevcut sorgular bozulmadan çalışır. Time travel ise hatalı yazma sonrası geri alma, denetim ve makine öğrenmesi modeli eğitim verisinin sabit tutulmasında kullanılır.

Iceberg şema evrimi: Sütun ID tabanlı; isim değişikliği geçmişi etkilemez. Yeni sütunlar varsayılan NULL ile eklenir.
Delta şema evrimi: mergeSchema ile otomatik genişleme; yazıcı tarafında bayrak gerekir.
Iceberg time travel: SELECT FOR VERSION AS OF veya TIMESTAMP AS OF.
Delta time travel: VERSION AS OF veya TIMESTAMP AS OF, ek olarak DESCRIBE HISTORY ile sürüm listesi.

Vaka Çalışması: 300 TB Veri Gölünde Geçiş

Hafta 1-2: Mevcut Parquet veri gölünün envanteri çıkarıldı; 280 tablo, 18.000 bölüm, ortalama 1,2 TB tablo boyutu tespit edildi.
Hafta 3: Pilot tablo seçildi (günlük 8 GB büyüyen olay tablosu); Iceberg’e CTAS ile aktarıldı.
Hafta 4-5: Pilot tablo üzerinde Spark ve Trino sorguları karşılaştırıldı; ortalama sorgu süresi yüzde 38 düştü (manifest tabanlı bölüm budama sayesinde).
Hafta 6-10: Tablolar parti parti (her sprint 40 tablo) Iceberg’e taşındı; eski Parquet yolları geriye dönüş için 90 gün korundu.
Hafta 11: Şema değişiklik politikaları yazıldı; sütun yeniden adlandırma ve tip değişikliği için onay süreçleri tanımlandı.
Hafta 12: Time travel tabanlı denetim sorgu kütüphanesi yayınlandı; iç denetim ekibi haftalık veri tutarlılık raporu üretmeye başladı.

Performans Ölçümleri ve Sınırlamalar

Trino üzerinde 1 TB TPC-DS karşılaştırması, Iceberg ile yapılan sorguların Parquet üzerinden ortalama yüzde 41 daha hızlı tamamlandığını gösterdi; bu kazanç manifest tabanlı dosya budama ve metadata önbelleğinden gelir. Delta Lake aynı karşılaştırmada yüzde 39 hızlanma sağladı. İki format performans açısından üretim senaryolarının yüzde 90’ında birbirine eşittir.

Küçük dosya sorunu: Sık akış yazımı küçük dosya yığını oluşturur; OPTIMIZE veya REWRITE_DATA_FILES işlemleri haftalık çalıştırılmalı.
Metadata büyümesi: Sıkça commit alan tablolarda metadata dosyaları büyür; VACUUM ile eski sürümler temizlenmeli.
Eş zamanlı yazma: İki format da optimistic concurrency kullanır; ağır yazma yüklerinde çakışma oranı izlenmeli.
Yetkilendirme: Açık tablo format kendisi yetkilendirme yapmaz; Unity Catalog, AWS Glue veya OpenMetadata gibi katmanlar gerekir.

Seçim Kriterleri ve 2026 Trendi

Pratik seçim üç soruya dayanır. Birinci: Hangi hesaplama motorlarını kullanıyorsunuz? Çoklu motor (Trino, Snowflake, BigQuery) varsa Iceberg birinci tercih. Yalnızca Databricks ortamında çalışıyorsa Delta Lake doğal seçim. İkinci: Yönetişim tercihi nedir? Apache yönetişim modeli bağımsızlık vurgular; Linux Foundation altındaki Delta Lake’in geliştirme yönü Databricks’in ürün stratejisinden etkilenir. Üçüncü: Mevcut veri kataloğu ne? AWS Glue Iceberg ve Delta’yı destekler; Unity Catalog Delta odaklıdır.

2026 trendi yakınsama yönündedir. Apache XTable (eski adıyla OneTable) projesi, aynı veri üzerinde hem Iceberg hem Delta metadatasını çalıştırarak iki ekosisteme aynı anda servis verilmesini sağlar. Databricks Tabular satın alımı sonrası Delta UniForm yeteneği Iceberg okuyucularına şeffaf erişim sunuyor. Bu olgunlaşan birlikte çalışabilirlik, formatlar arasında “yanlış seçim” riskini önemli ölçüde düşürdü.

Sık Sorulan Sorular

Apache Iceberg ve Delta Lake’i aynı anda kullanabilir miyim?

Evet. Apache XTable projesi her iki formatın metadatasını paralel tutarak aynı veri dosyaları üzerinde hem Iceberg hem Delta okuyucularını destekler. Databricks Delta UniForm aynı amacı sağlar: Delta tablosu otomatik olarak Iceberg uyumlu metadata üretir. Bu yaklaşımlar metadata maliyetini biraz artırır; ancak çoklu motor desteğinin değeri çoğunlukla bu maliyeti aşar.

Time travel ne kadar geriye gidebilir?

Varsayılan olarak iki format da tüm tarih sürümlerini korur. Ancak VACUUM (Delta) veya expire_snapshots (Iceberg) işlemleri belirli yaşın üzerindeki sürümleri ve referans dışı dosyaları temizler. Tipik üretim politikası 7-30 gün arası saklama süresidir; uyumluluk gereği daha uzun saklama gerekiyorsa açık politika yazılır. Time travel yalnızca temizlik penceresi içinde geçerlidir.

Hangi format daha hızlıdır?

Üretim senaryolarının yüzde 90’ında iki format eştir; sorgu performansı farkı yüzde 5’in altındadır. Iceberg manifest tabanlı bölüm budamada hafif avantajlıdır; Delta Lake liquid clustering özelliğiyle sık değişen sorgu desenlerinde otomatik veri düzenleme sunar. Karar performans değil ekosistem ve motor desteği üzerinden verilmelidir. İki formatta da OPTIMIZE veya REWRITE çalıştırılmadığında performans hızla bozulur.

Açık tablo format için minimum ekip gereksinimi nedir?

Mevcut data lake’i Iceberg veya Delta Lake’e taşımak için en az 1 veri mühendisi + 1 platform mühendisi gerekir; geçiş süresi tablo sayısına göre 8-16 haftadır. Üretim sonrası operasyon (OPTIMIZE, VACUUM, şema yönetimi) için yarım zamanlı bir mühendis yeterlidir. 100’den fazla tablo barındıran ortamlarda otomatik bakım hatları (Airflow DAG’ları) öncelikle kurulmalıdır.

Apache Iceberg mi Delta Lake mi: hangisi 2026’da daha doğru seçim?

Karar mevcut hesaplama motoruna ve veri yığını bağımlılığına göre netleşir. Iceberg, Spark + Trino + Snowflake + BigQuery gibi çoklu motor yığınında üretimde yüzde 41 sorgu hızlanması ve motor bağımsızlığı sağlar; Apache Software Foundation yönetişimi vendor lock-in kaygısını düşürür. Delta Lake, Databricks merkezli mimarilerde Unity Catalog ve liquid clustering ile birlikte daha entegre çalışır; Spark dışı motor desteği sınırlı kalır. Üç pratik öneri: 1) Yalnızca Databricks kullanıyorsanız Delta Lake; 2) Snowflake/BigQuery/Trino karışık yığınınız varsa Iceberg; 3) Belirsiz veya hibrit ortam için Apache XTable veya Delta UniForm köprüsüyle başlayın, yön kararını 6 ay sonra netleştirin. Performans farkı yüzde 5 altında olduğu için karar mimari ve maliyet tarafından sürülmelidir.

Sonuç

Apache Iceberg ve Delta Lake 2026 yılında lakehouse mimarisinin olgun, üretim hazır temelleridir. İki format ACID, şema evrimi ve time travel gibi temel yetenekleri benzer biçimde sunar; ayrımlar yönetişim, ekosistem desteği ve özelleştirilmiş yeteneklerde yatar. Çoklu motor kullanan kurumlar için Iceberg açık standart avantajı sunar; Databricks ekosistemi merkezli olanlar için Delta Lake doğal seçimdir. Apache XTable ve Delta UniForm gibi köprü projeleri yanlış seçim riskini azaltır. Esas karar, kurumun veri yığınının uzun vadeli yönelimine göre verilmelidir.

Bu Rehberde Kullanılan Kaynaklar

IDC Lakehouse Market Forecast 2025
Apache Iceberg Resmi Spesifikasyon Dokümantasyonu
Delta Lake Protocol Specification 3.0+
Databricks State of Data + AI 2025
Trino TPC-DS Benchmark Sonuçları 2025
Apache XTable Project Annual Report
AWS Glue ve Unity Catalog Entegrasyon Notları

Ömer ÖNAL

Yazılım Mimarı | Yapay Zeka LLC. Ölçeklenebilir SaaS, .NET Core altyapıları ve Otonom AI süreçleri inşa ediyorum. Kod değil, sistem tasarlarım.

Our Gallery

Contact Info

Apache Iceberg ve Delta Lake: Açık Tablo Format Karşılaştırması

Açık Tablo Format Nedir