dbt (data build tool), 2026 itibarıyla modern veri yığınının dönüşüm katmanında fiilî standart konumuna ulaştı ve “analytics engineering” disiplininin ana dili haline geldi. dbt Labs’in Coalesce 2025 keynote’unda paylaşılan rakamlara göre platform 50.000’i aşkın organizasyonda kullanılıyor; Fivetran “State of the Data Stack 2025” raporu ise üretim seviyesinde modeli olan veri ekiplerinin %71’inin dönüşüm katmanı için dbt’yi tercih ettiğini ortaya koyuyor. Geleneksel ETL araçları lisanslı GUI’lerle kapalı ekosistemler kurarken dbt, SQL ve Git bilen herkesin yazılım mühendisliği pratikleriyle (versiyonlama, test, doküman, CI/CD, code review) veri ürünleri inşa etmesine olanak veriyor.
Bu kapsamlı rehberde; dbt’nin mimari değer önerisini, modern data stack içindeki konumunu, materialization stratejilerini, test ve dokümantasyon çerçevesini, MetricFlow tabanlı semantik katmanı, dbt Cloud 2.0 ve SQLMesh gibi alternatifleri, kurumsal benimseme adımlarını ve 2026 vizyonunu ele alacağız. https://omeronal.com/wp-content/uploads/2026/05/dbt-analytics-engineering-2026-v2-inline-1.webp
dbt, veri ambarındaki ham veriyi modüler SQL modelleriyle iş zekasına hazır hale getiren açık kaynaklı bir dönüşüm aracıdır. “Analytics engineering” rolü; veri mühendisi (pipeline yazan) ile veri analisti (rapor üreten) arasındaki köprüyü kurar ve dbt bu rolün araç setinin tam merkezindedir. Gartner’in 2025 “Future of Data & Analytics Roles” raporu, analytics engineer pozisyonunu 2026’da en hızlı büyüyen üç veri rolünden biri olarak listeliyor; LinkedIn 2025 verilerine göre Türkiye’de açık dbt-ilişkili pozisyon sayısı son 12 ayda %184 arttı.
Modeller SELECT ifadesi olarak yazılır, Jinja şablonlama ile parametrik hale gelir.
ref() makrosu bağımlılık grafiğini (DAG) otomatik olarak çıkarır.
Testler (unique, not_null, accepted_values, relationships, singular, custom) veri kalitesini garanti eder.
Snapshots, yavaş değişen boyutları (SCD Type 2) basit bir YAML konfigürasyonu ile yönetir.
Sources blokları, ham tabloları belgeler ve freshness kontrolüyle veri tazeliğini izler.
Seeds, küçük statik CSV dosyalarını versiyon kontrolüne tabi tablo olarak yükler.
Macros, tekrarlayan SQL parçalarını DRY prensibiyle paketler ve paylaşılabilir kılar.
Modern Data Stack ve dbt’nin Konumu
Modern data stack genel olarak beş katmandan oluşur: kaynak, ingest, depolama, dönüşüm ve tüketim. dbt, dönüşüm katmanında konumlanır ve yalnızca “T” sorumluluğunu üstlenir. Bu sınırlama, dbt’nin felsefi gücüdür: tek bir sorumluluğa odaklanır ve veri ambarının hesaplama gücünü kaldıraç olarak kullanır. Data Lakehouse mimarisi içinde Databricks, Snowflake veya BigQuery üzerinde çalışan dbt projeleri, hem geleneksel veri ambarı senaryolarını hem de modern lakehouse yaklaşımlarını destekler.
Katman
Rol
Yaygın Araçlar
2026 Maliyet Profili
Kaynak
İşletme sistemleri
Salesforce, SAP, Stripe, Postgres
Mevcut altyapı
Ingest (EL)
Extract + Load
Fivetran, Airbyte, Stitch, Meltano
800 – 6.000 USD/ay
Depolama
Veri ambarı/lakehouse
Snowflake, BigQuery, Databricks, Redshift
1.500 – 30.000 USD/ay
Dönüşüm (T)
Modelleme + test + doküman
dbt Core/Cloud, SQLMesh, Coalesce
Açık kaynak veya 100 USD/dev/ay
Tüketim
BI, analitik, aktivasyon
Looker, Tableau, Metabase, Hex
Lisans bazlı
ELT Yaklaşımı ve dbt’nin Sorumluluğu
Geleneksel ETL paradigmasında dönüşüm, ambar yüklemesinin öncesinde yapılırdı; çünkü depolama pahalıydı ve hesaplama yerel sunucularda sınırlıydı. Modern bulut ambarlarında durum tersine döndü: depolama ucuz, hesaplama esnek ve sınırsız. Bu nedenle ELT modeli (önce yükle, sonra dönüştür) baskın hâle geldi ve dbt’nin doğuş gerekçesi tam olarak buydu. Modern veri pipeline mimarilerinde dbt, batch dönüşümün referans aracıdır.
Fivetran/Airbyte ile kaynak veri Snowflake veya BigQuery’ye ham haliyle yüklenir.
dbt staging modelleri ham veriyi temizler, tip dönüşümü yapar ve standartlaştırır.
Intermediate modeller iş mantığını parçalara ayırır ve karmaşık joinleri yönetir.
Mart modelleri (fact ve dimension tabloları) tüketim için optimize edilmiş şekilde materyalize edilir.
Test, doküman ve freshness kontrolleri CI sürecinde otomatik çalışır.
Semantic layer ile BI araçları aynı metrik tanımını kullanır; “single source of truth” sağlanır.
dbt Core ücretsiz, açık kaynak ve CLI tabanlıdır; dbt Cloud ise yönetilen IDE, scheduler, semantic layer, CI/CD entegrasyonları ve gözlemlenebilirlik (observability) özelliklerini içerir. dbt Labs Coalesce 2025’te tanıtılan “dbt Cloud 2.0” ile birlikte VSCode tabanlı yeni IDE, doğal dil sorgu üretimi (dbt Copilot) ve Iceberg/Delta tablolar için yerel destek geldi.
Özellik
dbt Core
dbt Cloud (Team/Enterprise)
Lisans
Apache 2.0, ücretsiz
100 – 1.000+ USD/kullanıcı/ay
IDE
Lokal (VSCode + extension)
Web IDE + dbt Copilot
Scheduler
Airflow/Dagster/cron gerekir
Yerleşik Job scheduler
CI/CD
GitHub Actions kurulumu
Slim CI, PR sandbox otomatik
Semantic Layer
MetricFlow CLI
MetricFlow API + caching
Gözlem (Explorer)
dbt docs serve manuel
Lineage, column-level + alerts
SSO/RBAC
Yok (manuel)
SAML, SCIM, granular RBAC
Destek
Topluluk Slack
SLA’lı kurumsal destek
Materialization Stratejileri
dbt’nin sunduğu en güçlü soyutlamalardan biri “materialization” kavramıdır: aynı SELECT ifadesinin ambarda nasıl somutlaşacağını YAML/Jinja konfigürasyonuyla seçersiniz. Bu sayede dev/prod ortamları, küçük/büyük tablolar ve gerçek zamanlı/batch ihtiyaçlar için aynı kod tabanı kullanılabilir.
dbt’nin yazılım mühendisliği DNA’sını taşıyan en kritik bileşeni test çerçevesidir. ThoughtWorks Tech Radar 2025, “data quality at transformation layer” pratiğini “Adopt” kategorisine taşıdı ve dbt testlerini referans olarak gösterdi. Veri kalitesi yönetimi ekosisteminde dbt yerleşik testleri, Great Expectations ve Soda gibi araçlarla tamamlayıcı şekilde çalışır.
Test Tipi
Tanım
Örnek
Severity
Generic (schema)
YAML’de tanımlı, model.yml içine yazılan hazır testler
unique, not_null, accepted_values, relationships
error (default)
Singular
Tek seferlik özel SQL sorgusu
tests/assert_revenue_positive.sql
error veya warn
Custom Generic
Tekrar kullanılabilir parametrik test makrosu
test_at_least_one makrosu
Konfigüre edilebilir
dbt-expectations
Great Expectations stilinde 50+ ek test
expect_column_values_to_match_regex
Package import gerekir
Unit Test (dbt 1.8+)
Model SQL’in mock veriyle birim testi
given/expect YAML
error
Data Contract
Şema enforcement: kolon tipi/listesi sözleşmesi
contract: enforced: true
Build zamanı hata
Data contracts 2026’da kritik öneme sahip: model çıktısının “kamu API’si” gibi davranmasını sağlar.
CI/CD’de PR açıldığında slim CI sadece değişen modelleri ve aşağı akış bağımlılıklarını test eder.
store_failures konfigürasyonu, başarısız satırları ayrı tablolara yazarak debug süresini kısaltır.
dbt 1.8+ unit testing ile karmaşık dönüşüm mantığı mock veri ile doğrulanır; CI çalıştırma süresi düşer.
Semantic Layer ve MetricFlow
dbt’nin 2024’te satın aldığı Transform şirketinden gelen MetricFlow projesi, semantic layer’ı dbt’nin birinci sınıf vatandaşı yaptı. 2026’da semantic layer, “headless BI” akımının temel bileşeni olarak tüm BI araçlarının (Tableau, Looker, Hex, Mode, Excel) aynı metrik tanımına gitmesini sağlıyor. Bu yaklaşım, metric drift problemine (her ekibin “aktif kullanıcı” tanımını farklı yazması) doğrudan çözüm getiriyor.
MetricFlow Bileşeni
Tanım
Örnek
Semantic Model
Bir fact/dimension tablosunun semantik tanımı
orders üzerinden gelir, sayım
Entity
Join key (primary/foreign)
customer_id, order_id
Dimension
Slice/dice ekseni
country, order_date
Measure
Toplanabilir sayısal alan
SUM(order_total)
Metric
İş anlamı yüklü ölçüm
weekly_active_users, net_revenue
Saturated Metric (cumulative/ratio/derived)
Birden fazla measure’dan türetilmiş metrik
Conversion rate, MoM growth
Semantic Layer API’si JDBC, GraphQL ve REST üzerinden erişilebilir; bu sayede Trino gibi federated query motorları, BI araçları ve özel uygulamalar tutarlı metrik tanımlarını sorgulayabilir.
dbt, Dataform ve SQLMesh: Alternatifler Matrisi
dbt baskın olsa da 2026’da rekabet zenginleşti. Google’ın 2020’de satın aldığı Dataform BigQuery’ye sıkı entegredir ve ücretsizdir; Tobiko Data’nın geliştirdiği SQLMesh ise “virtual data environments” ve sanal preview ortamları gibi yenilikçi özellikleriyle Fortune 500 ekipleri tarafından benimseniyor. Modern Data Stack Survey 2025’e göre SQLMesh adopsiyonu yıllık %340 büyüdü; ancak toplam pazar payı hâlâ %4 civarında.
Özellik
dbt Core/Cloud
Google Dataform
SQLMesh
Lisans
Apache 2.0 / SaaS
BigQuery ile ücretsiz
Apache 2.0 / Tobiko Cloud
Ambar desteği
20+ adapter
Sadece BigQuery
Snowflake, BQ, Databricks, DuckDB
Virtual Environments
Yok (PR sandbox)
Yok
Var (zero-copy preview)
Incremental kolaylığı
Jinja konfig
Manuel
Otomatik aralık tabanlı
Semantic Layer
MetricFlow yerleşik
Yok
Beta
Ekosistem (paket)
1.200+ topluluk paketi
Sınırlı
Gelişmekte
Schema değişim algılama
Manuel kontrat
Manuel
Otomatik impact analizi
Kullanım eğrisi
Düşük-orta
Düşük (BQ uzmanları)
Orta-yüksek
Kurumsal Benimseme Stratejisi ve Klasör Yapısı
Bir kurumda dbt’yi başarılı kılan şey araç değil, süreç ve yetkinlik tasarımıdır. ThoughtWorks 2025 raporu, dbt projelerinin %42’sinin “klasör yapısı kaosu” nedeniyle iki yıl içinde sürdürülemez hale geldiğini gösteriyor. Dijital dönüşüm KPI’ları arasında veri ürünleri TTM (time-to-market) metriği için dbt benimsemesi referans gösteriliyor.
Katman ayrımı:models/staging/, models/intermediate/, models/marts/ dizinleri ilk günden ayrılmalı.
Statik analiz:dbt-project-evaluator paketiyle CI içinde proje sağlık skoru üretilmeli.
Slim CI: GitHub Actions üzerinde state:modified+ ifadesiyle sadece değişen modeller test edilmeli.
Data contracts + versioned models: Aşağı akış BI sorgularını kıran şema değişiklikleri build zamanında bloklanmalı.
Exposure tanımları: Hangi dashboard/uygulamanın hangi modele bağlı olduğu YAML’de açıkça beyan edilmeli.
Owner metadata: Her marts modelinin teknik ve iş sahibi YAML’de etiketlenmeli; PagerDuty entegrasyonu yapılmalı.
ref() ve source() ile Bağımlılık Yönetimi
dbt’nin mimari kalbinde iki Jinja makrosu yatar: ref() ve source(). Bu iki yapı dbt’yi sıradan bir SQL şablon motorundan farklılaştıran ve DAG (directed acyclic graph) tabanlı orkestrasyonu mümkün kılan temel öğelerdir. ref('model_adı') ifadesi, dbt’ye iki bilgi verir: hedef tablonun gerçek veritabanı/şema adı (target profile’a göre değişir) ve modelin bu çıktıya bağımlı olduğu. Bu bilgi sayesinde dbt run, modelleri doğru topolojik sırayla çalıştırır.
Yapı
Amaç
DAG’da Konum
Avantaj
source()
Ambar’daki ham (raw) tabloları beyan etmek
Yaprak (root) düğüm
Freshness kontrolü + dokümantasyon
ref() staging
Başka dbt modeline referans (staging)
1. seviye
Otomatik DAG, env-aware
ref() intermediate
İş mantığı parçalanmış orta katman
Orta seviye
Tekrarın azalması, test kolaylığı
ref() mart
Tüketim için optimize edilmiş son katman
Üst seviye
BI/Exposure beslemesi
ref(..., v=2)
Versiyonlanmış model referansı
Esnek
Breaking change yönetimi
Bu disiplin sayesinde dbt projeleri “hard-coded” tablo adlarından kurtulur: aynı kod tabanı geliştirme, staging ve production ortamlarında farklı şemalara çıktı verecek şekilde otomatik yönlendirilir. Pull request açıldığında dbt Cloud Slim CI veya dbt Core --defer --state kombinasyonu sadece değişen modelleri ve onların aşağı akış bağımlılıklarını CI’de derler; bu mekanizma orta büyüklükteki projelerde CI süresini %70-80 kısaltır. Veri ürünleri TTM metriği için bu kazanım kritik öneme sahiptir.
Performans, Maliyet ve Gözlemlenebilirlik
dbt projesi büyüdükçe en sık karşılaşılan iki problem ambar maliyeti ve run süresinin uzamasıdır. Snowflake ve BigQuery üzerinde 500+ modeli olan ekiplerde günlük dbt run maliyeti 10.000 USD’yi aşabilir. 2026’da bu sorunu adresleyen üç pratik öne çıkıyor: stream processing ile gerçek zamanlı katmanı dbt batch’ten ayırmak, elementary-data gibi gözlem paketleriyle pahalı modelleri tespit etmek ve incremental + microbatch stratejilerini agresif uygulamak.
--defer bayrağı ile geliştirme sırasında prod state kullanılır, gereksiz model build edilmez.
dbt Cloud 2.0 ile birlikte gelen yeni nesil IDE, VSCode tabanlı bir mimariye geçerek geliştirici deneyimini ciddi şekilde modernleştirdi. Önceki Monaco editor temelli IDE’nin sınırlamalarını (extension eksikliği, sınırlı klavye kısayolları) aşan yeni IDE, hem tarayıcıdan hem de yerel VSCode’a iliştirilebilen bir uzaktan geliştirme deneyimi sunuyor. Bu yaklaşım, analytics engineer’ların yazılım mühendisleriyle aynı araçları kullanmasını ve onboarding süresini kısaltıyor.
dbt Cloud IDE Özelliği
Faydası
2026 Yeniliği
Branch-based geliştirme
Git iş akışı IDE içinde
Co-pilot otomatik branch öneri
Inline lineage
Model bağımlılığı sağ panelde
Column-level lineage default
dbt Copilot
Doğal dil → SQL/YAML üretimi
Test ve doc otomatik tamamlama
Preview & Compile
Çalıştırmadan sonuç önizleme
Cost estimate görünür
Sandbox şema
Her geliştirici izole çalışır
Auto-cleanup TTL politikası
SQLFluff entegre lint
Stil tutarlılığı zorunlu
PR’da otomatik fix önerisi
Yeni IDE, “open in IDE” linkiyle PR yorumundan doğrudan ilgili satıra atlama desteği veriyor.
Geliştirici metrikleri (PR-to-merge süresi, test kapsamı) Cloud Admin paneline yansıyor; veri ekibi DORA-style KPI üretebiliyor.
2026 Vizyonu: AI Destekli Veri Dönüşümü
dbt Cloud 2.0 ile birlikte tanıtılan dbt Copilot, doğal dil prompt’undan dbt modeli üretebiliyor; lineage grafiği üzerinde “neden bu metrik bu hafta düştü?” gibi soruları LLM agent’larına yönlendiriyor. Coalesce 2025 keynote’unda paylaşılan Tristan Handy vizyonu üç başlık üzerinde yoğunlaşıyor: (1) “AI-native dbt”: semantic katmanın LLM’ler için bağlam olması, (2) “open table standard”: Iceberg ve Delta üzerinde dbt projelerinin doğrudan çalışması, (3) “metric mesh”: semantic katmanın federated bir ağ olarak kurumlar arası paylaşılması. RAG altyapısında dbt semantic layer’ın “structured context” sağlayıcısı olarak kullanılması en güçlü trendlerden biri.
Sık Sorulan Sorular
dbt bir ETL aracı mıdır?
Hayır. dbt yalnızca dönüşüm (T) katmanı için tasarlanmıştır; veri yüklemek için Fivetran, Airbyte, Meltano veya özel pipeline’lar gerekir. Bu sınırlama dbt’nin gücüdür: tek bir sorumluluğa odaklanır, ambar hesaplama gücünü kaldıraç olarak kullanır ve yazılım mühendisliği pratikleriyle modelleri yönetir.
dbt Core mu yoksa dbt Cloud mu seçmeliyim?
5 kişiye kadar olan ekipler ve Airflow/Dagster zaten kullanan organizasyonlar için dbt Core + GitHub Actions kombinasyonu maliyet açısından avantajlıdır. 10+ kullanıcılı orta-büyük ekipler için dbt Cloud’un yerleşik scheduler, semantic layer ve Explorer (lineage) özellikleri operasyonel yükü ciddi şekilde azaltır. Coalesce 2025 sonrası dbt Copilot ve VSCode IDE entegrasyonu Cloud tarafını daha cazip hâle getirdi.
dbt hangi veri ambarlarıyla çalışır?
dbt; Snowflake, BigQuery, Databricks, Redshift, PostgreSQL, DuckDB, Microsoft Fabric ve Synapse üzerinde resmi adapter’larla çalışır. Topluluk adapter’ları MS SQL Server, Trino, Athena, ClickHouse ve Firebolt’u da destekler. Aynı dbt projesi farklı ortamlar (dev/staging/prod) için farklı target profile’lara yönlendirilebilir; ambar değiştirmek genelde adapter ve incremental stratejisi düzeyinde değişiklik gerektirir.
SQLMesh, dbt’nin yerini alacak mı?
Kısa vadede hayır. SQLMesh’in virtual environments ve otomatik schema impact analizi gibi yenilikçi özellikleri var; ancak dbt’nin 1.200+ topluluk paketi, 50.000+ organizasyon adopsiyonu ve “dbt mezunu” iş gücü pazarı önemli bir ağ etkisi yaratıyor. Modern Data Stack Survey 2025, SQLMesh kullanan ekiplerin çoğunlukla mevcut dbt projeleriyle paralel çalıştırıp seçici migrasyon yaptığını gösteriyor. dbt Labs’in 2026 yol haritasında benzer özelliklerin (defer + microbatch + state comparison) eklenmesi rekabet baskısını yansıtıyor.
dbt ile veri kalitesi nasıl güvence altına alınır?
dbt yerleşik schema testleri (unique, not_null, accepted_values, relationships) her CI çalıştırmasında veri kalitesini doğrular. dbt-expectations paketi 50+ ek test ekler; singular SQL testleri özel iş kuralları için kullanılır. dbt 1.8+ unit testing özelliği mock veri ile model mantığını birim test eder. Production tarafında Elementary, Monte Carlo veya Soda gibi araçlar dbt run sonuçları üzerinde anomaly detection sağlar. Veri sözleşmeleri (data contracts) ile aşağı akışı kıran şema değişiklikleri build zamanında bloklanır.
Sonuç ve Adopsiyon Verdikti
2026 itibarıyla dbt, modern data stack’in dönüşüm katmanında varsayılan tercih haline gelmiştir; herhangi bir veri ürünü stratejisinde “neden dbt değil” sorusunun “neden dbt” sorusundan daha açıklama gerektirir konuma geldiği bir denge oluşmuştur. Analytics engineering disiplinini olgunlaştıran dbt; veri kalitesini, ekip verimliliğini ve organizasyon genelinde “single source of truth” hedefini aynı anda yükseltiyor. Doğru benimsenmiş bir dbt projesi (katman ayrımı + adlandırma + data contracts + slim CI + semantic layer + gözlem), kurumsal veri organizasyonunun ölçeklenebilirliğini ve güvenilirliğini garantili biçimde artırır. Önümüzdeki 18 ayda dbt Copilot, Iceberg yerel desteği ve metric mesh vizyonu adopsiyon hızını daha da yukarı çekecek; SQLMesh ve Coalesce gibi alternatiflerin baskısı dbt’yi de hızlandıran sağlıklı bir rekabet yaratacak. Veri ekiplerinin 2026 önceliği: dbt’yi bir araç olarak değil, bir disiplin olarak kurmak ve organizasyona analytics engineering kültürünü yerleştirmek olmalıdır. Daha derin referanslar için dbt Labs resmi dokümantasyonu, dbt-core GitHub deposu, MetricFlow resmi dokümanı, Coalesce konferans arşivi, SQLMesh dokümanı, Fivetran State of Data blogu ve Data Engineering Weekly kaynaklarını incelemenizi öneririz.
Ömer ÖNAL
Yazılım Mimarı | Yapay Zeka LLC. Ölçeklenebilir SaaS, .NET Core altyapıları ve Otonom AI süreçleri inşa ediyorum. Kod değil, sistem tasarlarım.
Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.
Ömer ÖNAL
Mayıs 16, 2026Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.