McKinsey 2025 The State of AI raporuna göre feature store benimseyen kurumlar yapay zeka projelerinin ROI’sini ortalama 6 ay içinde kanıtlıyor; feature store olmayan ekiplerde bu süre 14 aya çıkıyor. Tecton 2025 Production ML Survey’inde online ML latency hedefini tutturan ekiplerin %81’i merkezi feature store kullanıyor. Konuyla ilişkili olarak Feature Store Mimarisi: Tecton vs Feast vs Hopsworks Karşılaştırması rehberimiz detaylı incelemeyi içerir.
Feature Store 2026: Production ML’in Eksik Halkası
Feature store, ML modelleri için feature’ları üreten, saklayan ve sunan merkezi platform. 2020’de Uber Michelangelo ve Airbnb Zipline ile yaygınlaşan kavram 2025’te kurumsal ML için zorunlu altyapı haline geldi. Forrester 2025 ML Platform Wave değerlendirmesinde Tecton, Hopsworks ve Feast üç ana çözüm olarak konumlandı. Gartner 2025 verilerine göre feature store kullanan kurumlarda training/serving feature skew %72 azalıyor, model production-readiness 4 katına çıkıyor.
Müşterilerimde gördüğüm en sık production hatası: model training’de %92 doğruluk veriyor, production’da %78’e düşüyor. Sebep neredeyse her zaman training/serving feature skew. Feature store bu sorunu kökten çözüyor çünkü aynı feature pipeline’ı hem training hem serving için kullanılıyor. Bu garantiyi feature store olmadan kurmak teorik mümkün ama operasyonel olarak sürdürülemez.
Online ve Offline Serving Mimari Karşılaştırması
Feature store iki ana serving modu sunar: offline (batch training için yüksek throughput, point-in-time correctness), online (real-time inference için düşük latency). Bu iki katman farklı storage backend’leri kullanıyor; offline genelde Parquet/Iceberg, online genelde Redis/DynamoDB/Cassandra. İki katman arasındaki materializasyon job’u doğru kalibre edilmediğinde freshness/latency trade-off problemleri çıkıyor.
| Özellik | Feast (OSS) | Tecton (SaaS) | Hopsworks (Hibrit) |
|---|---|---|---|
| Online latency (p99) | 5-20ms | 2-10ms | 3-15ms |
| Streaming source | Kafka, Kinesis | Native streaming | Flink + Kafka |
| Point-in-time join | Evet, manuel | Otomatik | Otomatik |
| Backfill kapasitesi | Manuel | Otomatik | Otomatik |
| Yıllık başlangıç maliyet | Self-host ~$50K | $120K+ | $80K+ |

Point-in-Time Correctness ve Training/Serving Skew Önleme
Feature store’un en kritik garantisi point-in-time correctness. Bir training örneği için belirli bir tarihte hangi feature değerinin geçerli olduğu, gelecekteki bir bilgi sızıntısı (data leakage) olmadan üretilmeli. Bu özellik manuel SQL pipeline’larında ortalama 3-7 hata noktası içerirken feature store’da deklaratif bir özellik. Tecton 2025 raporunda manuel pipeline kullanan ekiplerde data leakage %23 oranında tespit edilirken feature store kullananlarda bu oran %2.
- Training örneğinin event_timestamp’ı feature’ın geçerli olduğu zaman aralığında olmalı
- Future bilgisi training’e sızdırılmamalı (örn. bir hafta sonraki transaction count)
- Online serving’de feature freshness staleness budget’ı tanımlanmalı (örn. max 5 dakika)
- Serving anında gelen feature değeri training’deki feature değer dağılımına yakın olmalı
RAG sistemlerinde vektör veri saklama için vector database üretim rehberimize bakabilirsiniz.
Feast vs Tecton vs Hopsworks: Karar Matrisi
Feast (Featurestore-as-Code) açık kaynak, Python-native ve Kubernetes-friendly. Düşük volume + ekip Kubernetes’te kontrol istiyorsa Feast doğru seçim. Tecton tam-yönetimli SaaS, streaming + offline native birleşik; ML platform engineer ihtiyacını minimize ediyor. Hopsworks hibrit deployment + LLM RAG entegrasyonu + governance birleştiren konseptle öne çıkıyor. Tecton resmi blog’unda bu üç platform için karşılaştırma çalışmaları yayınlanıyor.

Operasyonel Konular: Lineage, PII Handling, Maliyet
Feature store production’a alındığında ortaya çıkan üç konu: feature lineage (hangi raw source’tan hangi transformasyonla üretildi), PII handling (kişisel veri içeren feature’ların erişim kontrolü), maliyet (storage + compute). McKinsey 2025 verilerine göre feature store maliyetinin %62’si online serving (Redis/DynamoDB), %28’i offline storage (S3/Parquet), %10’u materialization compute. Maliyet kontrolü için cold feature’ları online’dan kaldırma, TTL stratejisi ve partial materialization kritik.
| Maliyet Kalemi | Pay | Optimizasyon | Beklenen Tasarruf |
|---|---|---|---|
| Online serving | %62 | TTL + cold tier kaldır | %30-50 |
| Offline storage | %28 | Iceberg partition + lifecycle | %20-40 |
| Materialization compute | %10 | Incremental + on-demand | %40-60 |
| Network egress | %5 | Aynı region serving | %70-90 |
| Monitoring/logging | %3 | Sample + aggregation | %50-70 |
Sektörel Use Case’ler: Fraud, Recommendation, IoT
Fraud detection iş yüklerinde p99 latency genelde 50ms’in altında olmalı; Tecton veya Hopsworks gibi düşük latency optimize platformlar öne çıkıyor. Recommendation engine’lerde feature freshness 5-15 dakika tolerans gösteriyor, Feast self-hosted yeterli oluyor. IoT predictive maintenance’da event-driven streaming feature’lar gerekiyor, Hopsworks Flink entegrasyonu avantaj sağlıyor. Healthcare ML’de PII governance kritik, Tecton enterprise tier veya Hopsworks self-hosted tercih ediliyor.

Kurumsal Feature Store Dönüşümünde Karşılaşılan Tipik Sorunlar
Danışmanlık projelerinde gözlemlenen tipik darboğazlar:
- Online serving latency p99 hedeflenmiyor; production’da fraud model’i timeout veriyor
- Point-in-time join kuralı bilinmiyor, data leakage modeli optimistic gösteriyor
- Materialization job sıklığı yanlış ayarlanıyor; ya freshness ya maliyet zarar görüyor
- Cold feature’lar online layer’da unutuluyor, Redis maliyeti gereksiz şişiyor
- PII feature’larına erişim kontrolü tanımlanmıyor, audit talebine cevap verilemiyor
- Feast/Tecton seçimi POC yapılmadan veriliyor, 9 ay sonra migrate ediliyor
Sonuç
Feature store 2026’da production ML için zorunlu altyapı; ekiplerin %81’i kullanıyor. Doğru platform seçimi iş yükü profili, ekip büyüklüğü ve maliyet hassasiyetine bağlı: Feast Kubernetes kontrolü isteyenler için, Tecton ML platform engineer ihtiyacını minimize edenler için, Hopsworks LLM + RAG + governance arayanlar için. Karar öncesi mutlaka mevcut ML modellerinizin p99 latency hedefini, feature freshness gereksinimini ve PII profilini netleştirin. Bu üç metrik olmadan feature store seçimi 9 ay sonra migrate edileceğiniz bir karara dönüşüyor.
Sıkça Sorulan Sorular
Feature store olmadan production ML mümkün mü?
Teorik olarak evet, pratikte sürdürülemez. McKinsey 2025 verisi feature store olmayan ekiplerde training/serving feature skew nedeniyle production model doğruluğunun %15-25 düştüğünü gösteriyor. 3+ aktif modeli olan ekipler için feature store ROI eşiğini geçiyor.
Feast self-hosted yeterli mi, ne zaman Tecton’a geçmeli?
Feast 50M+ inference/gün veya 100+ feature’a kadar self-hosted sürdürülebilir. Bu eşiğin üzerinde Tecton veya Hopsworks gibi SaaS/yönetimli çözümler operasyonel yükü kaldırıyor. ML platform engineer maliyeti SaaS’tan tasarruftan büyükse SaaS daha ekonomik.
Online serving p99 latency hedefi ne olmalı?
Use case’e göre değişiyor: fraud detection 20-50ms, recommendation 50-200ms, IoT predictive 100-500ms. p99 ölçümü tek başına yetersiz; p99.9 ve worst-case latency de takip edilmeli, model serving SLO’su buna göre tasarlanmalı.
Streaming feature için Flink mi Kafka Streams mi kullanmalı?
Karmaşık event-time + state ihtiyacı olan feature’lar için Flink (Hopsworks native, Tecton compute layer); basit transformation + Kafka-only ekosistem için Kafka Streams (Feast destekliyor). stream processing rehberimizde bu seçim detaylı.
Feature monitoring nasıl yapılmalı?
İki katmanlı: feature distribution monitoring (KS test, PSI) + serving latency monitoring (p50/p99/p99.9). Arize, Fiddler veya WhyLabs gibi ML monitoring platformları feature drift’i otomatik takip ediyor. Detaylı bilgi model drift detection rehberimizde.










Ömer ÖNAL
Mayıs 23, 2026Feature store kararı ‘open-source mu, SaaS mı’ değil, ‘kim materialize ediyor’ sorusudur. Müşterilerimde gördüğüm pattern: Feast düşük volume + Kubernetes’te kontrol isteyen takımlar; Tecton ML platformu hazır gelmeli diyenler; Hopsworks veri governance + LLM RAG’i tek platformda isteyenler. Yanlış seçim ML latency’sini 200ms+ yapıyor ve fraud/recommendation use case’lerini bozuyor. — Ömer ÖNAL