Knowledge graph ve graph neural networks (GNN), 2026’da arama motorları, öneri sistemleri, fraud detection, drug discovery ve LLM destekli reasoning’in temel teknolojilerinden. Google, LinkedIn, Pinterest, Twitter, Uber, Spotify gibi şirketler üretimde milyarlarca node + ilişki içeren knowledge graph’ları çalıştırıyor. Türkiye’de finans ve sağlık dışında bu teknolojinin adoption’ı henüz %14 ama hızla yükseliyor — özellikle LLM’lerle entegrasyon (GraphRAG) yeni dalga.
2024-2026 arasındaki en büyük dönüşüm GraphRAG: Microsoft’un açık kaynak GraphRAG implementasyonu ile knowledge graph + LLM birleşimi mainstream oldu. Bu rehberde knowledge graph mimarisini, GNN modellerini, popüler kütüphaneleri ve gerçek üretim senaryolarını somut sayılarla aktarıyoruz.
Knowledge Graph Nedir?
Knowledge graph, entities (kişi, yer, kavram) ve aralarındaki ilişkileri (works_at, located_in, similar_to) graf yapısında modeller. Her node ve her edge zengin özelliklere sahip olabilir. Klasik tablolarda 5+ JOIN gereken sorular, knowledge graph üzerinde tek traversal ile çözülebiliyor.
- Triple format: (subject, predicate, object) — RDF standardı.
- Property graph: Neo4j, JanusGraph — daha esnek.
- Knowledge base: Wikidata, DBpedia, Yago örnekleri.
- Schema flexibility: Klasik DB’den farklı, evrime açık.
Graph Database Karşılaştırması
| DB | Tip | Best for | Performans |
|---|---|---|---|
| Neo4j | Property graph | Mature, tooling güçlü | 1B+ node |
| JanusGraph | Property graph (Cassandra/HBase backed) | Petabyte scale | 10B+ node |
| ArangoDB | Multi-model (graph + doc) | Hibrit kullanım | 500M+ node |
| Amazon Neptune | Managed, RDF + property | AWS ekosistem | Otomatik scale |
| TigerGraph | Native parallel graph | Real-time analytic | Hızlı çoklu hop |
| NebulaGraph | Distributed open source | Çin merkezli, çok büyük | 100B+ node |
| Memgraph | In-memory, real-time | Streaming graph | 50M+ node hızlı |
| Apache AGE (PostgreSQL) | Property graph extension | PostgreSQL ekosistemi | 50M-500M node |

GraphRAG: LLM + Knowledge Graph
2024-2026 trendi: klasik RAG’ın yetersiz kaldığı durumlarda LLM’i knowledge graph ile zenginleştirme. Microsoft’un GraphRAG referans implementasyonu, akademik literatür ve OpenAI/Anthropic’in tool use API’leri ile birleşince üretim hazır bir pattern haline geldi. Açık kaynak RAG framework rehberimiz bu yaklaşımları karşılaştırıyor.
- Classic RAG: Vector arama → ilgili dokümanlar → LLM context. Karmaşık ilişkileri yakalayamaz.
- GraphRAG: Knowledge graph üzerinde traversal → ilgili entity+ilişki → LLM context. “Şu kişinin şu kişiyle 3 derece ilişkisi nedir?” sorulara cevap.
- Microsoft GraphRAG: Açık kaynak referans implementasyon, community detection + entity summarization.
- LightRAG: Daha hafif GraphRAG alternatifi.
- Avantaj: Multi-hop reasoning, ilişki açıklaması, daha az hallucination.
- Dezavantaj: İlk graph kurulum maliyeti, entity extraction kalitesi kritik.
Graph Neural Networks (GNN)
GNN, graph üzerinde derin öğrenme modelleridir. Klasik CNN/RNN graph yapısını işleyemez; GNN node’un komşularını agregate ederek embedding üretir. PyTorch Geometric (PyG) ve DGL üretim standardı kütüphaneler.
- GCN (Graph Convolutional Network): Klasik baseline.
- GraphSAGE: Inductive (yeni node desteklenir).
- GAT (Graph Attention Network): Attention mekanizması.
- GIN (Graph Isomorphism Network): Theoretical maximum expressivity.
- Transformer-based: Graphormer, NodeFormer.
- R-GCN: Relational graph convolution (multi-edge type).
- Heterogeneous GNN: HetGNN, HAN — farklı tip node/edge.
GNN Görevleri
- Node classification: Bu kullanıcı fraudster mı?
- Link prediction: Bu iki kullanıcı arkadaş olur mu?
- Graph classification: Bu molekül toxic mi?
- Node clustering: Komiteleri keşfet.
- Anomaly detection: Sıradışı ilişkiler.
- Recommendation: User-item bipartite graph üzerinde GraphSAGE.

Üretim Senaryoları
1. Fraud Detection (Banka)
- Hesap, işlem, cihaz, merchant düğümler.
- İlişkiler: işlem_yapıldı, cihazdan_kullanıldı, ortak_adres.
- GNN node classification ile fraud skoru.
- Tek tek transaction’a göre %25-40 daha iyi yakalama.
- Anomaly detection ile birleştirilince ring fraud detection güçleniyor.
2. Drug Discovery
- Molekül atomları + bağları graph olarak.
- GNN ile molecule property prediction (toxicity, solubility).
- Üretim: Insilico Medicine, DeepMind GNN, Recursion.
- İlaç keşif süresini 2-4 yıl kısaltıyor.
- AlphaFold 3 protein-ilaç etkileşimi için GNN tabanlı.
3. Recommendation (Pinterest, Twitter)
- User-item bipartite graph.
- PinSage (Pinterest) GraphSAGE tabanlı.
- Klasik CF’ye göre %18-30 daha iyi önergi.
- Two-tower recommendation mimarisi ile birleştirilebiliyor.
4. Supply Chain Optimization
- Üreticiler, dağıtıcılar, müşteriler düğümler.
- Tedarik zinciri risk analizi.
- Tedarikçi bulup → ürün → ham madde traversal.
- COVID/savaş gibi disruption senaryolarında alternative sourcing.
5. Cybersecurity Threat Intelligence
- IP, domain, malware hash, threat actor düğümler.
- İlişkiler: connects_to, communicates_with, associated_with.
- GNN ile yeni saldırı kampanyası tespiti.
- MITRE ATT&CK framework knowledge graph olarak modellenebilir.
Kütüphaneler
| Kütüphane | Backend | Best for |
|---|---|---|
| PyTorch Geometric (PyG) | PyTorch | En yaygın, araştırma + üretim |
| DGL (Deep Graph Library) | PyTorch/TF/MXNet | Amazon destekli, büyük graph |
| Spektral | TensorFlow/Keras | Keras kullananlar |
| StellarGraph | Multi | Edu / başlangıç |
| Graph Nets (DeepMind) | TF | Klasik DeepMind koleksiyonu |
| cuGraph (NVIDIA) | RAPIDS GPU | Klasik graph algoritma GPU |

Performans ve Ölçek
- Neo4j Community: 1-100M node iyi performans.
- JanusGraph + Cassandra: 10B+ node.
- GNN inference: 1M-10M node’da < 100 ms.
- Mini-batch GNN training: GraphSAGE / NeighborSampler ile.
- Edge sayısı arttıkça bellek üstel büyür — sampling kritik.
- Distributed GNN: DGL DistDGL, PyG distributed.
Knowledge Graph İnşa Yöntemleri
- Manuel curation: Domain uzmanı eli ile schema + initial seed.
- ETL’den otomatik: Mevcut tablolardan triple üretme.
- NER + RE pipeline: Named Entity Recognition + Relation Extraction (spaCy, AllenNLP).
- LLM tabanlı extraction: GPT-4o/Claude ile doküman → entity + relation.
- Public KG entegrasyonu: Wikidata, DBpedia, ConceptNet’ten alıntı.
- Knowledge fusion: Çoklu kaynaktan gelen aynı entity’leri birleştirme (entity resolution).
Türkiye Özelinde KG ve GNN
- Bankacılık: Garanti, Akbank, İş Bankası fraud detection için GNN denemeleri 2024-2025’te başladı.
- Sigorta: SigortaCom, NN Hayat suspicious claim ağı için GNN.
- Sağlık: Hasta-hekim-hastane-tedavi knowledge graph pilotları.
- E-ticaret: Hepsiburada, Trendyol cross-category recommendation için GraphSAGE.
- Türkçe NLP: Türkçe Wikipedia → Wikidata bridge ile yerel knowledge base inşası.
- Akademik: Boğaziçi, ODTÜ, Bilkent GNN araştırması aktif.
Maliyet ve Süre
| Kapsam | Süre | Maliyet (TL) |
|---|---|---|
| MVP: Neo4j + basic GNN PoC | 3-5 ay | 500.000-900.000 |
| Orta: prod GNN + ETL pipeline | 7-12 ay | 1.400.000-2.700.000 |
| Enterprise: GraphRAG + LLM hibrit | 14-22 ay | 3.500.000-7.500.000 |
| Aylık operasyon (graph DB + GNN serving) | — | 40.000-200.000 |
Sık Sorulan Sorular
Knowledge graph mı yoksa relational DB mi?
3+ JOIN’li sorgu sıkça yapılıyorsa graph DB. PostgreSQL’de recursive CTE bir noktadan sonra patlar; Neo4j’de 6-10 hop hâlâ milisaniyeler içinde döner. Hybrid: master data relational, ilişki yoğun analytic graph.
Knowledge graph’ı nasıl populate ederim?
3 yol: (1) Manuel kurum verisinden ETL, (2) LLM ile NER + ilişki çıkarımı, (3) Public KG’dan (Wikidata) entegrasyon. Genelde hepsi karışık. LLM tabanlı extraction 2024 sonrası en yaygın başlangıç noktası.
GraphRAG vs Vector RAG?
Multi-hop reasoning gereken sorular (örn. “X’in bağlantısı olan kişilerin Y şehrindeki şirketleri”) için GraphRAG. Basit anlamsal arama için vector RAG. Hibrit en güçlü.
GNN’i CPU’da çalıştırabilir miyim?
Eğitim için pratikte hayır (saatler/günler sürer). Inference için orta boyutlu modeller CPU’da çalışır. Production training için NVIDIA L4/A100 önerilir.
Neo4j Enterprise mi yoksa Community mi?
Community: tek node, basic graph algorithms — 1B node altı projeler için yeterli. Enterprise: clustering, RBAC, hot backup, advanced security — kurumsal projeler için. Açık kaynak alternatif: Apache AGE (PostgreSQL extension), Memgraph Community.
Ömer Önal’dan pratik not: Türkiye’de fintech ve sigorta müşterilerimle knowledge graph + GNN projelerinde gözlemlediğim en kritik hata, “GNN her şeyi çözer” beklentisi. Saha pratiğinde GNN’in başarısı %70 oranında graph kalitesine bağlı — entity resolution kötü ise, edge’lerin yarısı yanlış ise model bunu öğrenir ve garbage prediction üretir. İlk 4-6 hafta entity resolution + data quality + schema dizayn için ayırın, sonra GNN’e geçin. Bir diğer detay: GraphRAG iddialarını test ederken classical RAG baseline’ı atlamayın — basit hybrid retrieval (vector + BM25) çoğu use case’de GraphRAG’ın %80’ine ulaşıyor, ek karmaşıklık değer mi iş ekibiyle birlikte ölçün. Türkiye’de Neo4j Enterprise lisans maliyeti yüksek; PostgreSQL + Apache AGE kombinasyonu çoğu <100M node projede pragmatik. Sizin projenizde knowledge graph’tan beklenen başlıca iş çıktısı ne — multi-hop reasoning mı yoksa basit relationship exploration mu?
Sonuç
Knowledge graph + GNN, klasik tablosal/vector verinin yetersiz kaldığı ilişki-yoğun problemlerin modern cevabı. Doğru tasarım (Neo4j/JanusGraph + PyTorch Geometric + GraphRAG ile LLM hibrit) fraud detection’ı %25-40, recommendation’ı %18-30 iyileştirir, multi-hop sorgu performansını 100-1000x hızlandırır. Knowledge graph’ı anomaly detection ile birleştirip ilişki anomalisi yakalayabilir, recommendation systems rehberimizdeki two-tower modeline graph features ekleyebilir, açık kaynak RAG rehberimizdeki GraphRAG pattern’ını uygulayabilirsiniz. İletişim formundan projeniz için knowledge graph mimari değerlendirme talep edebilirsiniz.
Dış otorite kaynaklar: Neo4j · PyTorch Geometric · Microsoft GraphRAG · DGL










Ömer ÖNAL
Mayıs 17, 2026Türkiye’de fintech ve sigorta müşterilerimle knowledge graph + GNN projelerinde gözlemlediğim en kritik hata, “GNN her şeyi çözer” beklentisi. Saha pratiğinde GNN’in başarısı %70 oranında graph kalitesine bağlı — entity resolution kötü ise, edge’lerin yarısı yanlış ise model bunu öğrenir ve garbage prediction üretir. Pratik öneri: ilk 4-6 hafta entity resolution + data quality + schema dizayn için ayırın, sonra GNN’e geçin. Bir diğer detay: GraphRAG iddialarını test ederken classical RAG baseline’ı atlamayın — basit hybrid retrieval (vector + BM25) çoğu use case’de GraphRAG’ın %80’ine ulaşıyor, ek karmaşıklık değer mi iş ekibiyle birlikte ölçün. Türkiye’de Neo4j Enterprise lisans maliyeti yüksek; PostgreSQL + Apache AGE kombinasyonu çoğu <100M node projede pragmatik bir alternatif. Sizin projenizde knowledge graph’tan beklenen başlıca iş çıktısı ne — multi-hop reasoning mı yoksa basit relationship exploration mu?