Forrester 2025 Data Catalog Wave araştırması, doğru kurgulanmış data catalog yatırımının ortalama 11 ay içinde ROI ürettiğini, analist üretkenliğinin %32 arttığını gösteriyor. IBM 2025 Data Discovery raporunda catalog olmayan ortamda analistler haftada 5.4 saat metadata aramayla geçiriyor, catalog adoption sonrası bu süre 1.2 saate düşüyor.
Data Catalog 2026: Discovery’den Governance’a
Data catalog veri varlıklarının discovery, lineage, ownership, glossary ve governance bilgisini saklayan merkezi platform. 2018-2020’de “nice-to-have” olarak görülen kavram 2025’te kurumsal veri stratejisinin omurgası haline geldi. Forrester 2025 değerlendirmesinde DataHub (LinkedIn open-source), OpenMetadata (Collate), Atlan (Atlan Inc) üç hızlı yükselen platform olarak konumlandı. Gartner 2025 verilerine göre Fortune 500 kurumların %68’i bir data catalog platformu kullanıyor; 2 yıl önce bu oran %41’di. Konuyla ilişkili olarak Platform Engineering Team Topology 2026: Stream-Aligned Team Owners… rehberimiz detaylı incelemeyi içerir.
Müşterilerimde gördüğüm gerçek: catalog projeleri %70 “metadata doldurduk, kimse kullanmıyor” senaryosuyla bitiyor. Çalışan catalog için üç şart var: otomatik metadata ingestion + lineage, Slack/Teams entegrasyonu ile in-context discovery, ownership zorunlu + SLA. Bunlar yoksa catalog ölü doğuyor.
DataHub: Open-Source Catalog Lideri
DataHub LinkedIn tarafından 2019’da open-source yapılan, sonradan Acryl Data tarafından SaaS olarak da sunulan platform. GitHub’da 9.500+ star, 800+ aktif contributor; kurumsal kullanım Netflix, Pinterest, Uber, Adidas dahil 1.200+ şirket. Metadata ingestion için 50+ source connector (Snowflake, BigQuery, Databricks, dbt, Airflow, Tableau), GraphQL-based API, react-based UI. Sweet spot: open-source kontrol isteyen, on-prem deployment yapan, large-scale data ecosystem.
| Özellik | DataHub | OpenMetadata | Atlan |
|---|---|---|---|
| License | Apache 2 (OSS) | Apache 2 (OSS) | Commercial SaaS |
| Source connectors | 50+ | 80+ | 100+ |
| Column-level lineage | Evet | Evet | Evet (en gelişmiş) |
| UI/UX | İyi | Modern | En modern |
| Yıllık başlangıç maliyet | Self-host: $0 | Self-host: $0 | $100K-500K |

OpenMetadata: Modern UX ile Hızlı Yükseliş
OpenMetadata Collate Inc tarafından 2021’de başlatılan, 80+ connector ve modern React-based UI sunan açık kaynak platform. DataHub’a göre daha yeni ancak son 18 ayda hızla benimsendi. Forrester 2025 verisine göre OpenMetadata 600+ kurumsal kullanıcıya ulaştı; ortalama deploy süresi 4-8 hafta (DataHub’da 8-16 hafta). Sweet spot: hızlı setup + modern UI isteyen orta-büyük ekipler.
- 80+ source connector (en geniş open-source ekosistem)
- Native data quality testing entegrasyonu
- SDK ile custom connector yazma kolay
- Conversational AI (LLM-based) data discovery
- Self-host: PostgreSQL + Elasticsearch backend; orta ölçek için 8 vCPU yeterli
Data quality entegrasyonu için data quality rehberimize bakabilirsiniz.
Atlan: Enterprise SaaS Lideri
Atlan modern enterprise data catalog’un SaaS lideri; iş kullanıcı ergonomisi, Slack/Teams entegrasyonu ve “active metadata” konseptiyle öne çıkıyor. Fortune 500’den 200+ müşterisi var; Netflix, Postman, Plaid gibi modern data team’lerin tercihi. Atlan’ın farkı sadece catalog değil; in-context discovery (Slack’te “find me sales data”), data product workflow, governance otomasyonu. Atlan resmi sitesinde detaylı use case dokümantasyonu var.

Column-Level Lineage: Üç Platformun Yaklaşımı
Column-level lineage modern data catalog’un en kritik özelliği; bir kolonun nereden geldiğini ve nereye etki ettiğini son granülde gösteriyor. Impact analysis için zorunlu. DataHub ve OpenMetadata SQL parsing tabanlı column-lineage sunuyor; dbt ile entegrasyon güçlü. Atlan AI-powered lineage iddiasıyla diğerlerine göre %35-50 daha az manuel düzeltme gerektirdiğini belirtiyor.
| Lineage Kaynağı | DataHub | OpenMetadata | Atlan |
|---|---|---|---|
| dbt | Native + tested | Native + tested | Native + tested |
| Airflow | Operator-level | Operator-level | Auto-detect |
| Spark SQL | SQL parsing | SQL parsing | SQL + AI |
| Snowflake/BigQuery | Query history | Query history | Query + AI |
| BI Tools (Tableau) | Native | Native | Native |
Adoption Playbook: 3-6-12 Ay Milestones
Data catalog’un başarısı teknoloji değil, adoption. Forrester 2025 verisine göre adoption rate %30+ olmayan catalog’lar 18 ay içinde abandoned oluyor. Pratik adoption pattern: ilk 3 ay top-50 critical asset için metadata + ownership doldurma, 3-6 ay analyst training + Slack integration, 6-12 ay self-serve discovery + data product workflow. Bu pattern ile adoption rate ortalama %45-60 oluyor.

Kurumsal Data Catalog Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- Metadata ingestion kuruluyor ama manuel doldurma adımı atlanıyor; ownership ve description boş
- Slack/Teams entegrasyonu kurulmuyor; analist UI’a girip aramıyor, eski “Wiki sayfası” pattern’i devam
- Adoption metric’i ölçülmüyor (haftalık active user, search volume); abandoned olduğu fark edilmiyor
- Column-level lineage SQL parsing eksiklikleri yüzünden %20-30 yanlış sonuç veriyor
- Catalog’a yeni asset eklenmesi manuel; CI/CD entegrasyonu yok, drift
- Governance ownership + SLA tanımlanmıyor; arıza durumunda kim sorumlu belirsiz
Sonuç
Data catalog 2026’da artık opsiyonel değil; ROI 11 ayda kanıtlanıyor, analist verimi %32 artıyor. Doğru platform seçimi deployment kısıtı ve ekibin profiline bağlı: open-source + on-prem kontrol için DataHub, modern UI + hızlı setup için OpenMetadata, enterprise + active metadata için Atlan. Karar öncesi mutlaka şu üç soruyu cevaplayın: Hangi ekip adoption’ı sahiplenecek? Slack/Teams integration için kaynak var mı? Adoption KPI’ları (haftalık active user, search volume) nasıl ölçülecek? Bu üç hazırlık olmadan catalog “metadata mezarlığına” dönüşüyor.
Sıkça Sorulan Sorular
DataHub vs OpenMetadata seçiminde kritik fark ne?
DataHub daha olgun ve büyük scale için optimize (LinkedIn, Netflix scale); OpenMetadata daha modern UI ve daha geniş out-of-box connector. 100+ kişilik veri ekibinde DataHub avantajlı; 20-100 kişilik orta ekipte OpenMetadata daha kolay setup.
Atlan’ın enterprise SaaS fiyatı haklı mı?
$100K-500K yıllık ücret büyük kurumlar için active metadata workflow, Slack integration ve adoption desteği değer üretiyorsa haklı. Forrester 2025 verisine göre Atlan kullanan kurumlarda adoption rate %58 (DataHub OSS’te %35); 2x adoption ROI farkını kapatıyor.
Open-source catalog self-host maintenance yükü ne?
DataHub veya OpenMetadata için tipik 0.5-1 FTE; PostgreSQL + Elasticsearch backend + ingestion job’ları yönetmek gerekiyor. Bu yükü kaldıramayan ekipler için Acryl (DataHub SaaS) veya Collate (OpenMetadata SaaS) tercih edilir.
Column-level lineage doğruluğu pratikte ne?
SQL parsing-based lineage (DataHub, OpenMetadata) %75-85 doğruluk; manuel düzeltme gerektiriyor. Atlan’ın AI-powered lineage iddiası %90+ doğruluk; pratikte %85-92 oluyor. Hiçbir platform %100 doğruluk sunmuyor; tüm complex SQL patterns için sürekli iyileştirme gerekiyor.
Catalog adoption rate’i nasıl artırılır?
Üç pattern: Slack/Teams in-context discovery (en etkili, %20-30 adoption artış), data product workflow (yeni asset oluştururken otomatik catalog kayıt), executive sponsorship ve KPI’lar (haftalık active user dashboard). Bu üçü birlikte uygulandığında adoption rate %60+ ulaşıyor.










Ömer ÖNAL
Mayıs 23, 2026Data catalog projeleri %70 ‘metadata doldurduk, kimse kullanmıyor’ senaryosuyla bitiyor. Müşterilerimde gördüğüm pattern: çalışan catalog için 3 şart var: (1) otomatik metadata ingestion + lineage, (2) Slack/Teams entegrasyonu ile in-context discovery, (3) ownership zorunlu + SLA. Bunlar yoksa catalog ölü doğuyor. DataHub açık kaynak gücü, OpenMetadata UI modernliği, Atlan iş kullanıcı ergonomisi getiriyor. — Ömer ÖNAL