IDC Worldwide Lakehouse Software Forecast 2026 raporu, federated SQL motorlarının yıllık 6,8 milyar dolar pazara ulaşacağını öngörüyor; Trino, Apache Drill ve Presto üçlüsü açık kaynak federated query segmentinde %71’lik paya sahip.
Federated Query Motorlarının 2026 Bağlamı
Federated query, farklı veri kaynaklarındaki (S3 üzerindeki Parquet, ilişkisel veritabanları, Kafka, MongoDB, ElasticSearch) verileri tek SQL diliyle sorgulayan motorların ortak adı. Trino Software Foundation, 2024 yıl sonu istatistiklerinde 720’den fazla katkıda bulunanı ve Netflix, Pinterest, Stripe, Lyft, LinkedIn dahil 200+ üretim kullanıcısını raporladı. PrestoDB ekosistemi, Linux Foundation’a 2019’da bağlandı; Meta üzerinde günlük 2,3 petabayt veriyi sorgulamaya devam ediyor. Apache Drill 2022 sonrası yavaşlasa da schema-on-read keşif senaryolarında niş bir tercih olmayı koruyor.
Trino ve Presto, 2018 yılında “Presto” projesi çatallandığında ayrıştı: PrestoSQL ekibi Trino markasına döndü, Meta liderliğindeki ekip PrestoDB olarak devam etti. ThoughtWorks Technology Radar 2024 sonu raporu, Trino’yu “Adopt” kategorisinde lakehouse projeleri için önerirken Presto’yu “Trial” kategorisinde sınırlı use case’lere yönlendirdi. Apache Drill ise “Hold” kategorisinde, mevcut implementasyonların korunmasına işaret etti.
Mimari ve Sorgu Motoru Tasarımı
Üç motor da MPP (Massively Parallel Processing) yapıda çalışır: coordinator + worker mimarisi, in-memory pipelined query execution, vectorized operator framework. Ancak detaylar farklılaşıyor. Trino Java 21 üzerinde çalışıyor, page-based memory format ve cost-based optimizer (CBO) ile geliyor. PrestoDB Java 11 üzerinde, Velox C++ execution engine entegrasyonuyla 2024’te performans artışı sağlandı. Apache Drill JSON ve nested data structures için optimize edilmiş, schema-on-read ile Parquet ve JSON dosyalarını sorgu zamanı keşfetme yeteneği sunuyor.
| Özellik | Trino 442 | PrestoDB 0.290 | Apache Drill 1.21 |
|---|---|---|---|
| Runtime | Java 21 | Java 11 + Velox (C++) | Java 17 |
| Connector sayısı | 60+ | 40+ | 30+ |
| CBO desteği | Tam | Tam | Sınırlı |
| Schema-on-read | Sınırlı | Sınırlı | Native |
| Iceberg desteği | v2 + writes | v2 read-only | Yok |
| Maksimum cluster ölçek | 5000+ worker | 5000+ worker | 200+ drillbit |

Connector Ekosistemi ve Lakehouse Entegrasyonu
Connector seçimi 2026’da federated query motor kararının %60’ını belirliyor. Trino lakehouse ekosistemi (Apache Iceberg, Delta Lake, Apache Hudi) için en kapsamlı entegrasyonu sunuyor; Iceberg connector’ında write desteği 2024 itibarıyla GA, Delta Lake connector’ı 2025 sonu itibarıyla full DDL/DML destekli. Apache Iceberg dokümantasyonu, Trino’yu en aktif sorgu motoru olarak listeliyor. PrestoDB Iceberg connector’ı 2024 itibarıyla v2 spec read-only, Delta Lake desteği topluluk eklentisi seviyesinde. Apache Drill’in açık tablo formatı desteği yok; ancak Parquet, JSON ve HBase ile schema-on-read keşif senaryolarında öne çıkıyor.
- Trino: Iceberg + Delta + Hudi tam destek, BigQuery, Snowflake, Redshift connector’ları.
- PrestoDB: Hive Metastore + Iceberg v2 read + Snowflake connector.
- Apache Drill: Parquet/JSON/CSV schema-on-read + HBase + S3.
- Üç motor da Kafka, MongoDB, Elasticsearch ve PostgreSQL/MySQL bağlantısı sunar.
- Trino “any-to-any” join sayısı 60+ connector çiftinde optimize edilmiş.
Lakehouse mimarisini tasarlarken data lakehouse rehberimizde tablo formatı seçim kriterleri var.
Performans, TPC-DS ve Concurrency
Performans karşılaştırmaları benchmark seçimine duyarlı. Starburst Şubat 2025 raporu Trino 442’nin TPC-DS 1TB üzerinde geometric mean’i 87 saniye, PrestoDB 0.288’in 96 saniye, eşdeğer ortamda Apache Drill 1.21’in TPC-DS subseti üzerinde 142 saniye seviyesinde performans gösterdiğini ölçtü. Velox engine entegrasyonu sonrası PrestoDB’nin bazı sorgularda Trino’nun önüne geçtiği gözlemlendi; özellikle CPU-bound aggregate işlemleri.
Concurrency tarafında Trino her sorgu için resource group + queue priority sistemi sunar; 1000 paralel sorguya kadar p99 latency 12 saniyenin altında. PrestoDB Meta ölçeğinde 3000 paralel sorguya kadar test edildi, GC tuning gerektirir. Apache Drill 200 paralel sorgu üzerinde memory pressure göstermeye başlar.

Operasyon, Maliyet ve İzleme
Federated query motorlarının operasyonel maliyeti compute-only modelde toplam altyapının yarısını oluşturuyor. AWS EMR Trino cluster (r6g.4xlarge x 10) aylık 4.890 USD, Starburst Galaxy managed Trino 50 vCPU plan aylık 4.200 USD, AWS Athena (PrestoDB tabanlı) sorgu başına 5 USD/TB ile pay-per-query, Apache Drill self-host EC2 ortalama 2.400 USD/ay seviyesinde konumlanır.
| Senaryo (50 TB lakehouse / 1000 günlük sorgu) | Trino (EMR) | PrestoDB / Athena | Apache Drill |
|---|---|---|---|
| Aylık altyapı (USD) | 4.890 | 3.200 (Athena pay-per-query) | 2.400 |
| Connector sayısı | 60+ | 40+ | 30+ |
| SLA (managed) | %99,9 (Starburst) | %99,95 (Athena) | — |
| Yıllık SRE saati | 200 | 20 (Athena) | 320 |
| Iceberg write desteği | Tam | Sınırlı | Yok |
| Ortalama TPC-DS 1TB (geomean) | 87 sn | 96 sn | 142 sn |
İzleme tarafında Trino’nun JMX exporter’ı + OpenTelemetry trace export + Grafana dashboard ekosistemi olgunlaştı. PrestoDB Prometheus + Grafana standartında. Apache Drill JMX gösterse de community dashboard ekosistemi sınırlı. OpenTelemetry rehberimiz Trino tracing kurulumunu adım adım gösteriyor.
Sektörel Use Case’ler
Lakehouse + BI tüketici tarafında Trino baskın; Netflix, Stripe, Pinterest ve Salesforce Trino üzerinde günlük 1,5 milyon analitik sorgu çalıştırıyor (Trino Conference 2025 sunumları). PrestoDB Meta tarafında 2,3 PB/gün sorgu hacmiyle internet ölçeğinde olgun; ayrıca Uber, Twitter (X) ve Alibaba kullanım vakalarında 1000+ worker cluster’lar görülüyor. Apache Drill, schema-on-read keşif yetenekleriyle veri keşif lab senaryolarında, IoT ham veri inceleme ve nested JSON analitiğinde değer sunuyor; özellikle MapR / HPE Ezmeral kurulumlarında yaygın.
- Lakehouse BI tüketim katmanı: Trino (Iceberg + Delta + Tableau/Power BI).
- Internet ölçeği ad-hoc analitik: PrestoDB (Meta, Uber, Alibaba).
- AWS native pay-per-query: Athena (PrestoDB tabanlı).
- Veri keşif lab + nested JSON: Apache Drill (schema-on-read).
- Cross-cloud federated reporting: Trino (BigQuery + Snowflake + Redshift).

Kurumsal Federated Query Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- Trino dynamic catalog özelliği olmadan connector yönetiminin manuel YAML editleri ile yapılması: 50+ connector sonrası operasyonel yük.
- PrestoDB Iceberg connector’ının read-only sınırının fark edilmemesi: insert/update job’ları başka bir motora taşınmak zorunda.
- Apache Drill’in cluster ölçeğine kadar test edilmemesi: 200 worker üzerinde memory pressure ve OOM.
- Resource group + queue policy tanımının yapılmaması: bir kullanıcının uzun sorgusu cluster’ı bloke ediyor.
- Cost-based optimizer için tablo istatistiklerinin (column-level stats, NDV) güncel tutulmaması: query plan suboptimal, latency 5x.
- Federated join’lerde pushdown optimizasyonunun ihmal edilmesi: connector tarafına filter push edilmiyor, network IO 10x artıyor.
Sonuç
Trino, Presto ve Apache Drill seçimi 2026’da iş yükü profiline bağlı netleşiyor. Trino lakehouse mimarileri (Iceberg, Delta, Hudi), cross-cloud federated raporlama ve BI tüketim katmanında en hızlı evrim hızıyla “Adopt” kategorisinde. PrestoDB internet ölçeğindeki tek bir motor + Velox C++ engine entegrasyonuyla Meta ve büyük tech ekosisteminde olgun. Apache Drill schema-on-read keşif senaryoları ve nested JSON analizinde niş ama değerli; aktif geliştirme yavaşladı, bu nedenle yeni projelerde dikkatli değerlendirilmeli. Karar verirken connector ekosistemini, hedef tablo formatını (Iceberg vs Delta vs Hive) ve concurrency profilini eşzamanlı analiz edin. PoC’nizi gerçek üretim sorgu paterniyle, en az 30 günlük ölçümlerle yapın; tek seferlik benchmark yanıltıcı sonuç verir.
Sıkça Sorulan Sorular
Trino ve Presto farkı sadece marka mı?
Hayır, 2018 fork sonrası iki motor bağımsız evrim geçirdi. Trino Java 21 üzerinde Iceberg write + dynamic catalog gibi yeni özellikler ekledi; PrestoDB Velox C++ engine entegrasyonuyla CPU-bound sorgularda hızlandı. Trino Conference 2025’e göre Trino aylık 800 binin üzerinde Docker pull alırken PrestoDB 250 bin civarında kalıyor.
Apache Drill hâlâ aktif geliştiriliyor mu?
Apache Drill 1.21 sürümü 2024 sonunda yayımlandı ancak release temposu yavaşladı; son 18 ayda sadece 1 minor sürüm çıktı. ThoughtWorks Technology Radar 2024, Drill’i “Hold” kategorisine yerleştirdi. Mevcut kurulumlar için stabil kalmaya devam ediyor ancak yeni projelerde önerilmiyor.
AWS Athena ile self-host PrestoDB arasındaki temel farklar?
Athena managed pay-per-query servis (TB başına 5 USD), self-host PrestoDB ise compute cluster modeli sunar. Sürekli yüksek sorgu hacmi olan iş yüklerinde self-host %35-50 daha düşük maliyet sağlar; tüketim trafiği değişken olan ekipler için Athena maliyet kontrolünde avantajlı. AWS re:Invent 2024 fiyat analizinde 50K sorgu/ay üstünde self-host PrestoDB lehine kırıldı.
Iceberg yazma desteği hangi motorda en olgun?
Trino Iceberg connector’ı 2024 itibarıyla v2 spec’in write desteğini GA seviyesine taşıdı; MERGE, UPDATE, DELETE ve schema evolution sorunsuz çalışıyor. PrestoDB Iceberg desteği şu an read-only. Apache Iceberg dokümantasyonu Trino’yu birincil yazma motoru olarak listeliyor.
Federated query motoru ne zaman tek warehouse yerine tercih edilir?
3+ veri kaynağında dağılmış veriyi tek SQL diliyle sorgulamak gerektiğinde, federated query motoru veriyi taşımadan analitik yapmayı sağlar; bu özellikle compliance (KVKK/GDPR) gerekçesiyle veri yerelliği zorunlu olan ekiplerde avantajlı. Forrester 2025 raporu, federated query benimseyen kurumların ETL pipeline maliyetini ortalama %42 düşürdüğünü raporluyor.










Ömer ÖNAL
Mayıs 18, 2026PrestoDB ile Trino çatallanması sonrası ekosistem ikiye bölündü ama gerçek karar ‘hangi connector’ sorusu. Trino Iceberg ve Delta entegrasyonunda en hızlı evrim hızıyla öne çıktı, Presto Meta ölçeğindeki iş yükleriyle olgunlaştı, Apache Drill schema-on-read esnekliğiyle keşif sorgularında hâlâ değerli. Lakehouse mimarisinde kayıp para connector seçiminden çıkar. — Ömer ÖNAL