Knowledge graph ve graph neural networks (GNN), 2026’da arama motorları, öneri sistemleri, fraud detection, drug discovery ve LLM destekli reasoning’in temel teknolojilerinden. Google, LinkedIn, Pinterest, Twitter, Uber, Spotify gibi şirketler üretimde milyarlarca node + ilişki içeren knowledge graph’ları çalıştırıyor. Türkiye’de finans ve sağlık dışında bu teknolojinin adoption’ı henüz %14 ama hızla yükseliyor — özellikle LLM’lerle entegrasyon (GraphRAG) yeni dalga.

2024-2026 arasındaki en büyük dönüşüm GraphRAG: Microsoft’un açık kaynak GraphRAG implementasyonu ile knowledge graph + LLM birleşimi mainstream oldu. Bu rehberde knowledge graph mimarisini, GNN modellerini, popüler kütüphaneleri ve gerçek üretim senaryolarını somut sayılarla aktarıyoruz.

Knowledge Graph Nedir?

Knowledge graph, entities (kişi, yer, kavram) ve aralarındaki ilişkileri (works_at, located_in, similar_to) graf yapısında modeller. Her node ve her edge zengin özelliklere sahip olabilir. Klasik tablolarda 5+ JOIN gereken sorular, knowledge graph üzerinde tek traversal ile çözülebiliyor.

  • Triple format: (subject, predicate, object) — RDF standardı.
  • Property graph: Neo4j, JanusGraph — daha esnek.
  • Knowledge base: Wikidata, DBpedia, Yago örnekleri.
  • Schema flexibility: Klasik DB’den farklı, evrime açık.

Graph Database Karşılaştırması

DBTipBest forPerformans
Neo4jProperty graphMature, tooling güçlü1B+ node
JanusGraphProperty graph (Cassandra/HBase backed)Petabyte scale10B+ node
ArangoDBMulti-model (graph + doc)Hibrit kullanım500M+ node
Amazon NeptuneManaged, RDF + propertyAWS ekosistemOtomatik scale
TigerGraphNative parallel graphReal-time analyticHızlı çoklu hop
NebulaGraphDistributed open sourceÇin merkezli, çok büyük100B+ node
MemgraphIn-memory, real-timeStreaming graph50M+ node hızlı
Apache AGE (PostgreSQL)Property graph extensionPostgreSQL ekosistemi50M-500M node
Knowledge graph dashboard Neo4j node edge gorselleme GNN inference metrics
Knowledge graph dashboard Neo4j node edge gorselleme GNN inference metrics

GraphRAG: LLM + Knowledge Graph

2024-2026 trendi: klasik RAG’ın yetersiz kaldığı durumlarda LLM’i knowledge graph ile zenginleştirme. Microsoft’un GraphRAG referans implementasyonu, akademik literatür ve OpenAI/Anthropic’in tool use API’leri ile birleşince üretim hazır bir pattern haline geldi. Açık kaynak RAG framework rehberimiz bu yaklaşımları karşılaştırıyor.

  • Classic RAG: Vector arama → ilgili dokümanlar → LLM context. Karmaşık ilişkileri yakalayamaz.
  • GraphRAG: Knowledge graph üzerinde traversal → ilgili entity+ilişki → LLM context. “Şu kişinin şu kişiyle 3 derece ilişkisi nedir?” sorulara cevap.
  • Microsoft GraphRAG: Açık kaynak referans implementasyon, community detection + entity summarization.
  • LightRAG: Daha hafif GraphRAG alternatifi.
  • Avantaj: Multi-hop reasoning, ilişki açıklaması, daha az hallucination.
  • Dezavantaj: İlk graph kurulum maliyeti, entity extraction kalitesi kritik.

Graph Neural Networks (GNN)

GNN, graph üzerinde derin öğrenme modelleridir. Klasik CNN/RNN graph yapısını işleyemez; GNN node’un komşularını agregate ederek embedding üretir. PyTorch Geometric (PyG) ve DGL üretim standardı kütüphaneler.

  • GCN (Graph Convolutional Network): Klasik baseline.
  • GraphSAGE: Inductive (yeni node desteklenir).
  • GAT (Graph Attention Network): Attention mekanizması.
  • GIN (Graph Isomorphism Network): Theoretical maximum expressivity.
  • Transformer-based: Graphormer, NodeFormer.
  • R-GCN: Relational graph convolution (multi-edge type).
  • Heterogeneous GNN: HetGNN, HAN — farklı tip node/edge.

GNN Görevleri

  • Node classification: Bu kullanıcı fraudster mı?
  • Link prediction: Bu iki kullanıcı arkadaş olur mu?
  • Graph classification: Bu molekül toxic mi?
  • Node clustering: Komiteleri keşfet.
  • Anomaly detection: Sıradışı ilişkiler.
  • Recommendation: User-item bipartite graph üzerinde GraphSAGE.
Graph neural network mimarisi GraphSAGE GCN attention aggregation diagram
Graph neural network mimarisi GraphSAGE GCN attention aggregation diagram

Üretim Senaryoları

1. Fraud Detection (Banka)

  • Hesap, işlem, cihaz, merchant düğümler.
  • İlişkiler: işlem_yapıldı, cihazdan_kullanıldı, ortak_adres.
  • GNN node classification ile fraud skoru.
  • Tek tek transaction’a göre %25-40 daha iyi yakalama.
  • Anomaly detection ile birleştirilince ring fraud detection güçleniyor.

2. Drug Discovery

  • Molekül atomları + bağları graph olarak.
  • GNN ile molecule property prediction (toxicity, solubility).
  • Üretim: Insilico Medicine, DeepMind GNN, Recursion.
  • İlaç keşif süresini 2-4 yıl kısaltıyor.
  • AlphaFold 3 protein-ilaç etkileşimi için GNN tabanlı.

3. Recommendation (Pinterest, Twitter)

  • User-item bipartite graph.
  • PinSage (Pinterest) GraphSAGE tabanlı.
  • Klasik CF’ye göre %18-30 daha iyi önergi.
  • Two-tower recommendation mimarisi ile birleştirilebiliyor.

4. Supply Chain Optimization

  • Üreticiler, dağıtıcılar, müşteriler düğümler.
  • Tedarik zinciri risk analizi.
  • Tedarikçi bulup → ürün → ham madde traversal.
  • COVID/savaş gibi disruption senaryolarında alternative sourcing.

5. Cybersecurity Threat Intelligence

  • IP, domain, malware hash, threat actor düğümler.
  • İlişkiler: connects_to, communicates_with, associated_with.
  • GNN ile yeni saldırı kampanyası tespiti.
  • MITRE ATT&CK framework knowledge graph olarak modellenebilir.

Kütüphaneler

KütüphaneBackendBest for
PyTorch Geometric (PyG)PyTorchEn yaygın, araştırma + üretim
DGL (Deep Graph Library)PyTorch/TF/MXNetAmazon destekli, büyük graph
SpektralTensorFlow/KerasKeras kullananlar
StellarGraphMultiEdu / başlangıç
Graph Nets (DeepMind)TFKlasik DeepMind koleksiyonu
cuGraph (NVIDIA)RAPIDS GPUKlasik graph algoritma GPU
Veri muhendisleri knowledge graph schema dizayn ve GraphRAG entegrasyon
Veri muhendisleri knowledge graph schema dizayn ve GraphRAG entegrasyon

Performans ve Ölçek

  • Neo4j Community: 1-100M node iyi performans.
  • JanusGraph + Cassandra: 10B+ node.
  • GNN inference: 1M-10M node’da < 100 ms.
  • Mini-batch GNN training: GraphSAGE / NeighborSampler ile.
  • Edge sayısı arttıkça bellek üstel büyür — sampling kritik.
  • Distributed GNN: DGL DistDGL, PyG distributed.

Knowledge Graph İnşa Yöntemleri

  • Manuel curation: Domain uzmanı eli ile schema + initial seed.
  • ETL’den otomatik: Mevcut tablolardan triple üretme.
  • NER + RE pipeline: Named Entity Recognition + Relation Extraction (spaCy, AllenNLP).
  • LLM tabanlı extraction: GPT-4o/Claude ile doküman → entity + relation.
  • Public KG entegrasyonu: Wikidata, DBpedia, ConceptNet’ten alıntı.
  • Knowledge fusion: Çoklu kaynaktan gelen aynı entity’leri birleştirme (entity resolution).

Türkiye Özelinde KG ve GNN

  • Bankacılık: Garanti, Akbank, İş Bankası fraud detection için GNN denemeleri 2024-2025’te başladı.
  • Sigorta: SigortaCom, NN Hayat suspicious claim ağı için GNN.
  • Sağlık: Hasta-hekim-hastane-tedavi knowledge graph pilotları.
  • E-ticaret: Hepsiburada, Trendyol cross-category recommendation için GraphSAGE.
  • Türkçe NLP: Türkçe Wikipedia → Wikidata bridge ile yerel knowledge base inşası.
  • Akademik: Boğaziçi, ODTÜ, Bilkent GNN araştırması aktif.

Maliyet ve Süre

KapsamSüreMaliyet (TL)
MVP: Neo4j + basic GNN PoC3-5 ay500.000-900.000
Orta: prod GNN + ETL pipeline7-12 ay1.400.000-2.700.000
Enterprise: GraphRAG + LLM hibrit14-22 ay3.500.000-7.500.000
Aylık operasyon (graph DB + GNN serving)40.000-200.000

Sık Sorulan Sorular

Knowledge graph mı yoksa relational DB mi?

3+ JOIN’li sorgu sıkça yapılıyorsa graph DB. PostgreSQL’de recursive CTE bir noktadan sonra patlar; Neo4j’de 6-10 hop hâlâ milisaniyeler içinde döner. Hybrid: master data relational, ilişki yoğun analytic graph.

Knowledge graph’ı nasıl populate ederim?

3 yol: (1) Manuel kurum verisinden ETL, (2) LLM ile NER + ilişki çıkarımı, (3) Public KG’dan (Wikidata) entegrasyon. Genelde hepsi karışık. LLM tabanlı extraction 2024 sonrası en yaygın başlangıç noktası.

GraphRAG vs Vector RAG?

Multi-hop reasoning gereken sorular (örn. “X’in bağlantısı olan kişilerin Y şehrindeki şirketleri”) için GraphRAG. Basit anlamsal arama için vector RAG. Hibrit en güçlü.

GNN’i CPU’da çalıştırabilir miyim?

Eğitim için pratikte hayır (saatler/günler sürer). Inference için orta boyutlu modeller CPU’da çalışır. Production training için NVIDIA L4/A100 önerilir.

Neo4j Enterprise mi yoksa Community mi?

Community: tek node, basic graph algorithms — 1B node altı projeler için yeterli. Enterprise: clustering, RBAC, hot backup, advanced security — kurumsal projeler için. Açık kaynak alternatif: Apache AGE (PostgreSQL extension), Memgraph Community.

Ömer Önal’dan pratik not: Türkiye’de fintech ve sigorta müşterilerimle knowledge graph + GNN projelerinde gözlemlediğim en kritik hata, “GNN her şeyi çözer” beklentisi. Saha pratiğinde GNN’in başarısı %70 oranında graph kalitesine bağlı — entity resolution kötü ise, edge’lerin yarısı yanlış ise model bunu öğrenir ve garbage prediction üretir. İlk 4-6 hafta entity resolution + data quality + schema dizayn için ayırın, sonra GNN’e geçin. Bir diğer detay: GraphRAG iddialarını test ederken classical RAG baseline’ı atlamayın — basit hybrid retrieval (vector + BM25) çoğu use case’de GraphRAG’ın %80’ine ulaşıyor, ek karmaşıklık değer mi iş ekibiyle birlikte ölçün. Türkiye’de Neo4j Enterprise lisans maliyeti yüksek; PostgreSQL + Apache AGE kombinasyonu çoğu <100M node projede pragmatik. Sizin projenizde knowledge graph’tan beklenen başlıca iş çıktısı ne — multi-hop reasoning mı yoksa basit relationship exploration mu?

Sonuç

Knowledge graph + GNN, klasik tablosal/vector verinin yetersiz kaldığı ilişki-yoğun problemlerin modern cevabı. Doğru tasarım (Neo4j/JanusGraph + PyTorch Geometric + GraphRAG ile LLM hibrit) fraud detection’ı %25-40, recommendation’ı %18-30 iyileştirir, multi-hop sorgu performansını 100-1000x hızlandırır. Knowledge graph’ı anomaly detection ile birleştirip ilişki anomalisi yakalayabilir, recommendation systems rehberimizdeki two-tower modeline graph features ekleyebilir, açık kaynak RAG rehberimizdeki GraphRAG pattern’ını uygulayabilirsiniz. İletişim formundan projeniz için knowledge graph mimari değerlendirme talep edebilirsiniz.

Dış otorite kaynaklar: Neo4j · PyTorch Geometric · Microsoft GraphRAG · DGL

Ömer ÖNAL

Yazılım Mimarı | Yapay Zeka LLC. Ölçeklenebilir SaaS, .NET Core altyapıları ve Otonom AI süreçleri inşa ediyorum. Kod değil, sistem tasarlarım.

Yorum (1)

  1. Ömer ÖNAL
    Mayıs 17, 2026

    Türkiye’de fintech ve sigorta müşterilerimle knowledge graph + GNN projelerinde gözlemlediğim en kritik hata, “GNN her şeyi çözer” beklentisi. Saha pratiğinde GNN’in başarısı %70 oranında graph kalitesine bağlı — entity resolution kötü ise, edge’lerin yarısı yanlış ise model bunu öğrenir ve garbage prediction üretir. Pratik öneri: ilk 4-6 hafta entity resolution + data quality + schema dizayn için ayırın, sonra GNN’e geçin. Bir diğer detay: GraphRAG iddialarını test ederken classical RAG baseline’ı atlamayın — basit hybrid retrieval (vector + BM25) çoğu use case’de GraphRAG’ın %80’ine ulaşıyor, ek karmaşıklık değer mi iş ekibiyle birlikte ölçün. Türkiye’de Neo4j Enterprise lisans maliyeti yüksek; PostgreSQL + Apache AGE kombinasyonu çoğu <100M node projede pragmatik bir alternatif. Sizin projenizde knowledge graph’tan beklenen başlıca iş çıktısı ne — multi-hop reasoning mı yoksa basit relationship exploration mu?

Yorum Yap

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir