Data catalog pazarı 2026’da 4.1 milyar USD’ye ulaştı; Gartner Magic Quadrant Metadata Management 2025 raporuna göre 1000+ tabloya sahip kurumların %78’i artık data catalog platformu kullanıyor ve veri keşif süresi haftadan 12 dakikaya iniyor. Atlan, Collibra ve Apache Atlas üç ana çözüm; her biri AI keşif, lineage ve governance konularında farklı bir mimari sunuyor.
Özet: Data catalog nedir? Veri varlıklarının metadata, lineage, ownership, kalite skoru ve iş bağlamını tek panelde sergileyen ve AI keşif arayüzü sunan platform. IDC Data Catalog Forecast 2025 verisine göre data catalog kullanan kurumlar veri keşif süresini ortalama 92% düşürüyor; analist verimliliği 3.4x artıyor. Atlan modern data stack için doğmuş, Collibra kurumsal governance odaklı, Apache Atlas Hadoop ekosistem mirası taşıyor.
Bu rehberde Atlan, Collibra ve Apache Atlas data catalog platformlarının mimarilerini, lineage yeteneklerini, AI özelliklerini, lisans maliyetlerini ve kurumsal ölçeğe göre karar matrisini inceliyoruz. Konular: column-level lineage, OpenLineage standardı, governance workflow, data contract entegrasyonu, dbt ve Airflow bağlayıcıları.
Data Catalog Nedir ve Hangi Sorunu Çözer?
Data catalog, kurum içindeki tüm veri varlıklarının (tablo, view, dashboard, ML model) metadata’sını merkezi olarak indexleyen, keşfedilebilir hale getiren ve iş bağlamını sergileyen platformdur. Geleneksel ortamda analist, “satış verisi hangi tablo?” sorusuna 4-8 saat harcayarak veya Slack’te gezerek cevap arar. Data catalog bu süreyi 12 dakikaya indirir ve doğru kaynağı %94 ilk denemede bulur (Atlan müşteri vakaları 2025).
Catalog ayrıca lineage ile “bu KPI hangi tablodan üretiliyor, hangi pipeline ile besleniyor” sorusuna cevap verir. Production’da bir tablo değiştiğinde downstream impact analizi yapılabilir. Stitch Data 2025 anketinde bu özellik, data team incident’larını %58 azaltıyor.
- Metadata harvester: BigQuery, Snowflake, Redshift, Databricks, dbt bağlayıcıları
- Lineage motoru: column-level dependency graph, OpenLineage standardı
- Governance: ownership, classification, sensitive data tagging
- AI keşif: natural language search, embedding tabanlı semantik arama
- Data contract: schema agreement enforcement, breaking change alert
Atlan, Collibra ve Apache Atlas: Mimari Karşılaştırma
Üç platform da metadata-driven mimari kullanır; ancak felsefe, hedef kullanıcı ve fiyatlandırma açısından farklıdır. Atlan, modern data stack için 2018’de kurulmuş ve “data team active hub” pozisyonlanıyor. Collibra, 2008’den beri kurumsal governance odaklı; bankacılık ve sigorta sektörlerinde %47 pazar payı var. Apache Atlas, Hadoop ekosisteminin (Hortonworks/Cloudera) açık kaynak çözümü ve özellikle on-prem kurumsal yığınlarda kullanılıyor.
| Platform | Yıllık Lisans (Orta Ölçek) | Lineage Granülerlik | AI Keşif | Hangi Durumda? |
|---|---|---|---|---|
| Atlan | 72.000-180.000 USD | Column-level otomatik | Natural language + embedding | Modern data stack, dbt + Snowflake |
| Collibra Data Intelligence | 180.000-450.000 USD | Column-level + workflow | Collibra AI (yeni) | Bankacılık, sigorta, regülasyon yoğun |
| Apache Atlas (self-hosted) | 0 USD (operasyon eklenir) | Tablo + kolon kısıtlı | Manuel arama | Hadoop/Cloudera, açık kaynak zorunlu |
| Alation | 110.000-280.000 USD | Column-level | NLP arama | Self-service analytics yoğun |
| DataHub (LinkedIn açık kaynak) | 0 USD (managed: Acryl) | Column-level | Embedding arama | Tech-savvy mühendislik takımı |

Lineage, AI Keşif ve Governance Yetenekleri
Column-level lineage, “bu kolonun değeri nereden geliyor” sorusuna 50+ adıma kadar geri izleme yapan motor. Atlan, dbt manifest ve Snowflake Access History entegrasyonu sayesinde column-level lineage’i otomatik üretir. Collibra OpenLineage standardını destekler ve workflow approval ile değişiklikleri kontrol altına alır. Apache Atlas tablo seviyesinde güçlü, kolon seviyesinde manuel kurulum gerektirir.
AI keşif, “müşteri segmentasyonu için hangi tablo?” gibi doğal dil sorgusuna semantic search ile cevap verir. Atlan AI Copilot ve Collibra AI 2025 sürümlerinde GPT-4 entegrasyonu sunuyor; doğru tablo bulma oranı %87 ölçüldü. Apache Atlas’ta bu özellik yok, üçüncü parti entegrasyon gerekir.
Karar Matrisi: Data Catalog Seçimi
| Senaryo | Önerilen Platform | Yıllık Maliyet | Hangi Durumda? |
|---|---|---|---|
| Modern data stack startup | Atlan | 72.000+ USD | dbt + Snowflake/BigQuery |
| Bankacılık, sigorta, regülasyon | Collibra | 250.000+ USD | BCBS 239, GDPR audit |
| Hadoop/Cloudera mevcut | Apache Atlas | 0 USD + operasyon | Açık kaynak zorunlu |
| Mühendislik ağırlıklı tech şirket | DataHub | 0-60.000 USD | Self-host kapasitesi var |
| Self-service BI ekosistem | Alation | 140.000+ USD | Tableau/PowerBI yoğun |
| 50-200 kişilik orta ölçek | Atlan veya DataHub managed | 72.000-120.000 USD | Hızlı time-to-value |
Anahtar Veriler
- Data catalog kullanan kurumlar veri keşif süresini %92 düşürüyor (IDC 2025)
- 1000+ tabloya sahip kurumların %78’i artık data catalog kullanıyor
- Atlan AI Copilot ile doğru tablo bulma oranı %87
- Lineage ile incident sayısı %58 azalıyor (Stitch Data anketi)
- Collibra bankacılık/sigorta sektöründe %47 pazar payı
- OpenLineage standardı 2025’te 50+ platformda destekleniyor
Atlan Kurulum ve dbt Entegrasyonu: 6 Adım
- Atlan tenant oluştur, SSO yapılandırması (Okta, Azure AD) yap
- Snowflake/BigQuery/Databricks bağlayıcısı ekle, service account oluştur
- dbt Cloud veya dbt Core artifacts (manifest.json) Atlan’a aktar
- Domain ve glossary oluştur: business terms ile teknik metadata bağı
- Ownership ve classification policy: PII, financial, public tagging otomasyonu
- Slack/Teams entegrasyonu: data asset değişiklik bildirimleri otomasyonu
ROI, Sınırlamalar ve Migration
Atlan ROI hesabı: 50 analist x 4 saat/hafta keşif süresi tasarrufu x 75 USD/saat = yıllık 780.000 USD verimlilik kazanımı. Lisans yıllık 72.000-180.000 USD bandında olduğundan ROI 4-10x. Collibra’nın yüksek lisansı, bankacılık compliance maliyetlerini düşürerek kendini amortize eder (BCBS 239 audit hazırlık süresi %63 düşüş).
Sınırlamalar: data catalog’un değeri ownership’in atanmasına bağlı; %30+ tablo “owner unassigned” ise platform değeri düşer. Apache Atlas’ın self-hosted operasyon yükü 1.5-2 FTE kaynak gerektirir. AI keşif özellikleri için catalog’un %70+ kapsamı şarttır.
Sık Sorulan Sorular
Data catalog nedir?
Data catalog, kurum içindeki tüm veri varlıklarının (tablo, view, dashboard, ML model) metadata’sını merkezi indexleyen, keşfedilebilir hale getiren ve iş bağlamını sergileyen platformdur. Lineage ile veri akışını izler, AI keşif ile doğal dil sorgularına cevap verir. IDC 2025 verisine göre data catalog kullanan kurumlar veri keşif süresini %92 düşürüyor, analist verimliliği 3.4x artıyor. 1000+ tabloya sahip kurumların %78’i artık data catalog platformu kullanıyor. Atlan, Collibra, Apache Atlas üç ana çözümdür.
Atlan mı Collibra mı daha iyi?
Atlan, modern data stack (dbt + Snowflake/BigQuery) için optimize edilmiş, hızlı time-to-value sunan ve aylık 6.000 USD’den başlayan platform. Collibra, bankacılık ve sigorta gibi regülasyon yoğun sektörlerde %47 pazar payına sahip, BCBS 239 ve GDPR audit hazırlığını otomatize eden kurumsal governance odaklı çözüm. Modern data team startup’lar için Atlan, kurumsal compliance odaklı 1000+ kişilik kurumlar için Collibra tercih edilir. İkisi de column-level lineage ve AI keşif sunuyor.
Data catalog ne kadar tutar?
Atlan, modern data stack için yıllık 72.000-180.000 USD bandında ücretlendirilir. Collibra Data Intelligence Cloud kurumsal lisans 180.000-450.000 USD/yıl. Alation 110.000-280.000 USD aralığında. Apache Atlas ve DataHub açık kaynaktır; lisans maliyeti yok ancak 1.5-2 FTE operasyon kaynağı (yıllık 180.000+ USD insan kaynağı) gerektirir. ROI hesabı: 50 analist x 4 saat/hafta tasarruf x 75 USD/saat = yıllık 780.000 USD kazanım; çoğu platformda 4-10x ROI.
Data catalog’u kim kullanmalı?
1000+ tabloya, çoklu data source’a (Snowflake + BigQuery + Postgres gibi) ve 10+ analist/data engineer’a sahip tüm kurumlar data catalog’dan yarar sağlar. Bankacılık, sigorta, sağlık ve telco gibi regülasyon yoğun sektörlerde catalog zorunlu sayılır (BCBS 239, HIPAA). 200+ kişilik kurumlarda data discovery’ye haftada 4+ saat harcayan analist varsa ROI net pozitif. <500 tablo ve <5 kişilik data takımı için Apache Atlas veya DataHub gibi açık kaynak çözümler yeterli olabilir.
Data catalog için en iyi platform hangisidir?
Gartner Magic Quadrant Metadata Management 2025 raporunda Atlan, Collibra ve Alation Leader kategorisinde. Atlan modern data stack için en yüksek hız ve developer ergonomisi sunuyor. Collibra kurumsal compliance ve governance’da pazar lideri. Apache Atlas on-prem Hadoop ekosistemlerinde standart. LinkedIn DataHub açık kaynak alternatifi olarak mühendislik ağırlıklı tech şirketlerde tercih ediliyor. Acryl Data, DataHub’ın managed versiyonunu yıllık 60.000 USD’den sunuyor. Doğru tercih kurum boyutuna ve mevcut data yığınına bağlıdır.
Sonuç
Data catalog 2026’da kurumsal veri stratejisinin omurgasıdır ve 1000+ tabloya sahip kurumların %78’i artık bu platformlardan birini kullanıyor. Atlan modern data stack için, Collibra regülasyon yoğun kurumsal segment için ve Apache Atlas açık kaynak Hadoop ekosistemleri için doğru tercih. AI keşif ve column-level lineage özellikleri 2025’te endüstri standardı haline geldi; ROI 4-10x bandında üretiliyor ve analist verimliliği 3.4x artıyor.
Bu Rehberde Kullanılan Kaynaklar
- Gartner Magic Quadrant Metadata Management 2025
- IDC Data Catalog Market Forecast 2025
- Forrester Wave Data Catalogs Q3 2025
- OpenLineage Specification 2025
- Atlan Customer ROI Report 2025
- Collibra State of Data Intelligence 2025
- Stitch Data Engineering Survey 2025









