AI Safety, 2026’da kurumsal yapay zeka yatırımlarının %67’sinin bütçe onay kapısı haline geldi. Stanford HAI AI Index 2025 raporu, kurumların %74’ünün en az bir AI projesini etik, bias veya regülasyon riski gerekçesiyle askıya aldığını ortaya koyuyor. EU AI Act yüksek riskli sistem uyum tarihi 2 Ağustos 2026’da işlemeye başlıyor; uyumsuzluk cezası küresel cironun %7’sine veya 35 milyon EUR’ya çıkıyor. NIST AI Risk Management Framework 1.0 ve ISO/IEC 42001 standardını uygulayan kurumlarda olay sayısı %58 daha düşük, müşteri güveni puanı 14 puan daha yüksek ölçülüyor. AI Safety artık opsiyonel bir mükemmellik değil; risk yönetimi, hukuk ve mühendisliğin ortak operasyonel disiplinidir.
Bu rehber sorumlu yapay zeka çerçevesini risk taksonomisi, regülasyon haritası, red-teaming metodolojisi, model değerlendirme, bias mitigasyonu, deployment guardrail’leri ve 0-4 olgunluk tier’ları üzerinden derinleştiriyor. Stack tamamlayıcısı için kurumsal yapay zeka entegrasyonu rehberi ve LLMOps üretim yönetimi referans alınabilir.
AI Safety’nin Kurumsal Tanımı ve 2026 Önemi
AI Safety; bir modelin amaçlanan hedefin dışında davranma, ayrımcı çıktı üretme, hassas veriyi sızdırma, halüsinasyon yayma ve kötüye kullanılma risklerini ölçen ve azaltan disiplindir. Stanford HAI AI Index 2025, sorumlu AI yatırımının 2024’te 12,8 milyar USD’ye ulaştığını ve yıllık %47 büyüdüğünü raporluyor. NIST AI Risk Management Framework 1.0 Govern, Map, Measure, Manage fonksiyonlarıyla 2025 sonu itibarıyla Fortune 500 kurumlarının %43’ü tarafından operasyonel hale getirildi. OECD AI Principles ve OECD AI policy observatory verisi, 47 ülkenin sorumlu AI ilkelerini ulusal stratejiye bağladığını gösteriyor.
McKinsey State of AI 2025 raporu, AI olayı yaşamış kurumların ortalama 11,8 milyon USD doğrudan kayıp ve %18 marka değer aşınması raporladığını ortaya koyuyor. Bu rakam sorumlu AI programını maliyet merkezi olmaktan çıkarıp pozitif ROI kategorisine taşıyor. Aşağıdaki taksonomi, kurumsal AI risk kategorilerini Anthropic Responsible Scaling Policy ve UK AI Safety Institute referansıyla özetler.
AI Risk Taksonomisi: 5 Kategori Detaylı Harita
Risk taksonomisi yönetişim için zorunlu temeldir. Bias, gizlilik, güvenlik, safety ve açıklanabilirlik kategorileri her use case için bağımsız puanlanır. Aşağıdaki tablo NIST AI RMF, EU AI Act yüksek risk listesi ve Anthropic RSP’yi sentezler.
| Risk kategorisi | Tipik tezahür | Ölçüm metriği | Mitigasyon kontrolü | Sahip rolü |
|---|---|---|---|---|
| Bias / Adillik | Demografik ayrımcılık, proxy önyargı | Demographic parity, equal opportunity | Reweighting, adversarial debiasing | Data Science + Ethics |
| Gizlilik | PII sızıntısı, membership inference | Differential privacy budget (ε) | DP-SGD, k-anonymity, redaction | DPO + Security |
| Güvenlik | Prompt injection, model theft | OWASP LLM Top 10 score | Input filtering, rate limiting | AppSec + ML Engineering |
| Safety | Toxic output, self-harm, CBRN | BBQ, BOLD, RealToxicityPrompts | Constitutional AI, RLHF, refusal | Alignment team |
| Açıklanabilirlik | Black-box karar, traceability eksiği | SHAP fidelity, sparsity | SHAP, LIME, attention map | ML Eng + Compliance |

Regülasyon Çerçeveleri: EU AI Act, NIST RMF, ISO 42001, Singapore Model
Sorumlu AI rejimi 2026 itibarıyla coğrafyaya göre fark eden ama prensipte yakınsayan dört ana çerçeve etrafında konsolide oldu. Tek bir governance dosyası dört çerçeveye birden hizmet edecek şekilde tasarlanmalıdır.
| Çerçeve | Yayın / yürürlük | Kapsam | Yaptırım | Kurumsal etkisi |
|---|---|---|---|---|
| EU AI Act | Aug 2024 / yüksek risk Aug 2026 | AB pazarı + AB’de kullanılan çıktı | 35M EUR veya %7 küresel ciro | CE benzeri uyum dosyası zorunlu |
| NIST AI RMF 1.0 | Jan 2023, gönüllü | ABD federal + tedarikçi zinciri | Sözleşmesel; federal alımda zorunlu | Govern-Map-Measure-Manage süreç |
| ISO/IEC 42001 | Dec 2023 | Global, sertifikasyon | 3. taraf denetim, sertifika kaybı | AI Management System (AIMS) |
| Singapore Model AI Governance v2 | 2024, gönüllü + sektörel | APAC, finansal hizmet | Sektör regülatörü (MAS) baskısı | Risk-orantı governance |
| UK AISI Voluntary Code | 2024, frontier model | Frontier AI üreticileri | Pre-deployment eval anlaşması | Test erişimi + raporlama |
EU AI Act enforcement zaman çizelgesi 2025-2026 boyunca aşamalı işliyor. Şubat 2025 itibarıyla yasaklı uygulamalar (social scoring, real-time biometric ID kamuda) yürürlükte; Ağustos 2025’te general-purpose AI obligations devreye girdi; Ağustos 2026’da yüksek riskli sistemler için conformity assessment, post-market monitoring ve Annex IV teknik dokümantasyon zorunlu hale geliyor. AI Act resmi portali haritası bu fazları detaylandırır.
Red-Teaming Metodolojisi: Probe, Finding, Remediation
Red-teaming, modelin saldırgan kullanıcı, yanlış prompt ve kötü niyetli aktör senaryolarında nasıl davrandığını sistematik test etmenin disiplinidir. Anthropic Responsible Scaling Policy, OpenAI Preparedness Framework ve UK AISI joint testing protokolü 2025’in standartı haline geldi. Süreç tek seferlik test değil sürekli operasyon olmalıdır.
| Faz | Aktivite | Çıktı | Frekans | Araç |
|---|---|---|---|---|
| 1. Scope | Threat model, capability mapping | Tehdit kataloğu, kapsam dokümanı | Çeyreklik | MITRE ATLAS, ATT&CK |
| 2. Probe design | Adversarial prompt seti | 1000+ test promptu | Aylık | PAIR, Garak, PromptInject |
| 3. Execute | Otomatik + manuel test | Raw output kayıtları | Sürekli | Lakera Red, HiddenLayer |
| 4. Triage | Bulgu sınıflandırma, severity | Finding ticketleri | Haftalık | Jira, GitHub Security |
| 5. Remediate | Patch, refusal, guardrail | Doğrulanmış kapama | Sprint | Llama Guard, NeMo Guardrails |
| 6. Verify | Regression test, retest | Closure report | Patch sonrası | HELM, MLCommons |

Model Değerlendirme: TruthfulQA, MMLU, BBQ, BOLD
Bir modelin safety profilini ölçmek genel yetenek (capability) ve risk yönelimi (alignment) eksenlerinde paralel benchmark çalıştırmayı gerektirir. Stanford HAI HELM bunu standartlaştırdı. Aşağıdaki benchmark seti üretime gönderilecek her model için minimum eşik kabul edilir.
| Benchmark | Ölçtüğü | Boyut | 2025 SOTA skor | Üretim eşiği |
|---|---|---|---|---|
| MMLU | Genel akademik bilgi | 57 konu, 15.908 soru | %89,7 (GPT-5) | %75+ |
| TruthfulQA | Yanlış bilgiye direnç | 817 soru, 38 kategori | %72,4 | %65+ |
| BBQ | Sosyal bias (yaş, etnik, cinsiyet) | 58.492 örnek, 9 eksen | %87 bias-free | %80+ |
| BOLD | Open-ended bias üretimi | 23.679 prompt, 5 domain | 0,18 toxic gap | < 0,25 |
| RealToxicityPrompts | Toksik çıktı eğilimi | 100K prompt | %2,1 toxic rate | < %5 |
| HELM Safety | Bütünsel zarar değerlendirme | 16 senaryo, 7 metrik | Composite 0,82 | > 0,70 |
Anthropic, Claude modellerini her major sürümde ASL-2 / ASL-3 capability threshold’a karşı bağımsız değerlendirmeye gönderir; bulgular kamuya açık model card’da yayınlanır. Bu pratik kurumsal model değerlendirme için referans nokta haline geldi: dahili modelinizi capability + safety eval matrisi olmadan üretime almayın. Claude API tool use entegrasyonu ve LLMOps üretim yönetimi tarafında benchmark gate operasyonel hale getirilir; RAG altyapı rehberi ise kaynaklama-zorunlu üretim pattern’ı için temel sunar.
Bias Mitigasyon Araçları ve Operasyonel Akış
Bias hem veride, hem modelde, hem de kullanım bağlamında oluşur. Tek bir aşamada müdahale yeterli değildir; pre-processing, in-processing ve post-processing kombinasyonu gerekir. Aşağıdaki tablo araç ekosistemini operasyonel hedefe göre eşler.
| Araç | Aşama | Tekni̇k | Lisans | Tipik kullanım |
|---|---|---|---|---|
| Fairlearn | In-processing | Exponentiated gradient, GridSearch | MIT, Microsoft | scikit-learn entegrasyonu |
| AIF360 | 3 aşama hepsi | 70+ adillik metrik, 10+ algoritma | Apache 2.0, IBM | Kurumsal denetim raporu |
| Aequitas | Post-processing | Group fairness audit | MIT | Hükümet ve sosyal hizmet |
| Credo AI | Governance | Policy intelligence, evidence | Ticari | Compliance dokümantasyonu |
| Arize Phoenix | Post-deployment | Drift + bias monitoring | BSD 3-Clause + ticari | Production observability |
| Fiddler AI | Pre + post | Explainability + monitoring | Ticari | Finansal hizmet, sağlık |
Operasyonel akış altı adımda kurulur:
- Korunan özellik (yaş, cinsiyet, etnik köken, bölge, engellilik) ve proxy değişken envanteri.
- Eğitim verisinde demografik dağılım raporu; %20’den büyük dengesizliklerde reweighting veya synthetic augmentation.
- Modeli demographic parity, equal opportunity ve equalized odds metriklerine karşı eğitirken ölç.
- Pre-deployment denetim: use case sahibi iş birimiyle imzalı risk dosyası.
- Production’da çeyreklik bias monitor raporu; eşik aşımında otomatik alarm + insan onayı.
- Tüm metrik geçmişi versiyonlu artefakt olarak saklanır (Credo evidence vault, MLflow tag).
Deployment Guardrails ve Runtime Kontrol Katmanı
Modeli üretime almak güvenliğin başlangıcıdır, sonu değildir. Runtime guardrail’leri input, processing ve output olmak üzere üç katmanda işler. Llama Guard 3, NeMo Guardrails, Lakera Guard ve AISI evaluation suite bu katmanı oluşturur.
| Guardrail tipi | Konum | İşlev | Tipik latency | Araç örneği |
|---|---|---|---|---|
| Input filtering | Pre-model | Prompt injection, PII, jailbreak | 20-40ms | Lakera Guard, Llama Guard |
| Policy classifier | Pre-model | Konu, izin verilen kullanım | 30-60ms | NeMo Guardrails, AWS Bedrock |
| Refusal training | Model içi | Constitutional AI, RLHF | 0ms (built-in) | Anthropic, OpenAI alignment |
| Output filter | Post-model | Toksik, halüsinasyon, sızıntı | 40-80ms | Llama Guard 3, Detoxify |
| Citation enforcement | Post-model | RAG için kaynak zorunluluğu | 50-100ms | Custom orchestrator |
| Rate limit + abuse | API gateway | DoS, scraping, model theft | 10-20ms | Cloudflare AI, Kong |

AI Lifecycle Governance: Data, Train, Eval, Deploy, Monitor
Olgun sorumlu AI programı governance kapılarını model yaşam döngüsünün her aşamasına yerleştirir. Tek bir pre-deployment review denetim için yeterli değildir; her aşamada otomatik check + dokümante imza üretilir.
- Data gate: Lineage, consent, sentetik / gerçek dengesi, DPIA imzası. Sahip rolü DPO + Data Steward.
- Train gate: Reproducibility (seed, hash), compute log, kart taslağı. ML Engineering + MLOps.
- Eval gate: HELM/MMLU/BBQ skor minimumu, red-team raporu kapama. Safety + Alignment.
- Deploy gate: Risk dosyası, AI Komite onayı, runbook + rollback. SRE + AI Komite.
- Monitor gate: Drift, bias, incident SLA; her 90 günde re-review. SRE + Compliance.
- Sunset gate: Model deprecation politikası, veri silme, müşteri bildirim.
Lifecycle artefaktları model card (Mitchell et al. 2019), data card, system card, FactSheet (IBM) ve evidence vault olarak versiyonlu saklanır. EU AI Act Annex IV teknik dokümantasyon talebi bu kümeyle birebir eşleşir. ISO/IEC 42001 sertifikasyonu da aynı kanıt setini denetler.

Türkiye Bağlamı: KVKK, BTK ve Sektörel Düzenleyiciler
Türkiye’de AI’ya özel monolitik bir kanun bulunmasa da otomatik karar verme süreçlerinin KVKK 11. maddesi kapsamında değerlendirilmesi yerleşmiştir. KVKK Kurumu’nun 2025 sonu rehberi DPIA zorunluluğunu, insan denetimini ve veri minimizasyonunu açıkça vurguladı. BDDK 2024 dijital bankacılık tebliği AI tabanlı kredi modellerinde açıklanabilirlik ve insan onayı bekliyor. SPK ve EPDK sektörel pilotlar üzerinden benzer yaklaşımı şekillendiriyor. AB’de hizmet veren Türk şirketleri için EU AI Act kapsam dışı değildir: ürün veya çıktının AB’de kullanılması yeterli tetikleyicidir. Türkiye Yapay Zeka Stratejisi 2024-2026 ulusal eylem planı, kamu kurumlarına ve düzenleyicilere AI etik komiteleri kurma talimatı verdi; bu pratik özel sektör için de referans çerçeve haline geliyor.
Pratik strateji: tek governance dosyası hem KVKK hem EU AI Act hem ISO 42001 gereksinimlerini karşılayacak şekilde super-set olarak tasarlanır. Tek bir bias raporu, tek bir DPIA, tek bir model card hepsinin kanıtı olur. Türk kurumları için yol haritası şu sırayı izler: önce KVKK uyum dosyası (zaten zorunlu), sonra NIST AI RMF süreci (gönüllü ama olgunluk yapı taşı), ardından EU AI Act dosyalaması (AB’ye hizmet veriyorsanız) ve nihai katman olarak ISO 42001 sertifikasyonu. Bu çerçeveye dair tamamlayıcı detay için teknoloji risk yönetimi KPI rehberimiz, GovTech dijital dönüşüm yazısı ve AI agent memory mimarisi incelenebilir.
ROI, Maliyet ve Yaygın Antipatternler
Forrester TEI 2025 araştırması, sorumlu AI programına yatırılan 1 USD’nin üç yılda ortalama 3,8 USD geri dönüş ürettiğini hesaplıyor: %52’si ceza ve dava maliyetinden kaçınma, %31’i marka değer koruma, %17’si operasyonel iyileşme. Olgun bir program tipik olarak yıllık 1,2-3,5 milyon USD’ye kurulur (orta ölçek kurum); kazanılan ortalama olay maliyeti ise 11,8 milyon USD’dir. Maliyet kalemleri sırasıyla: AI Komite + Ethics Officer rolü (yıllık 350-550K USD), bias / red-team araç lisansları (yıllık 180-420K USD), 3. taraf denetim ve sertifikasyon (90-220K USD), eğitim programı (60-140K USD), evidence vault ve dokümantasyon altyapısı (80-180K USD).
- Antipattern 1 — Tick-the-box komite: Ayda bir toplanan, onayı kauçuk damga olan komite. Çözüm: OKR’ye bağlı metrik + AI Ethics Officer.
- Antipattern 2 — Yalnız compliance silosu: Mühendislikten kopuk hukuk-only program. Çözüm: ML Engineering içinde gömülü sorumlu AI rolü.
- Antipattern 3 — Tek seferlik bias testi: Modeli üretime aldıktan sonra unutmak. Çözüm: Çeyreklik bias monitor + drift alarmı.
- Antipattern 4 — Red-team olarak QA ekibi: Adversarial yetkinliği olmayan testçi. Çözüm: bağımsız red-team veya 3. taraf (Apollo, METR).
- Antipattern 5 — Kapalı evidence vault: Denetçi erişemediği için sertifika kaybı. Çözüm: Credo / FactSheet gibi yapılandırılmış evidence platformu.
Sorumlu AI Olgunluk Tier’ları: 0’dan 4’e Kurumsal Yol Haritası
Gartner Responsible AI Maturity Model 2025’in beş tier’lı yapısı, kurumun nerede olduğunu objektif konumlandırır.
- Tier 0 — Ad-hoc: Ne politika ne komite. AI tek tek ekiplerde, risk görünmüyor. Tipik olay başına 12M+ USD kayıp riski.
- Tier 1 — Aware: Yazılı politika var, eğitim başlamış. Bias testi vaka bazlı. Olgunluk yolculuğunun başlangıcı.
- Tier 2 — Defined: AI Komite kuruldu, risk dosyası şablonu, lifecycle gates’in en az 3’ü çalışıyor.
- Tier 3 — Managed: Tüm modeller risk dosyalı, çeyreklik bias monitor, evidence vault, OKR entegrasyonu.
- Tier 4 — Optimized: AI Ethics Officer tam zamanlı, ISO 42001 sertifikalı, 3. taraf red-team, sürekli iyileşme.
Sık Sorulan Sorular
EU AI Act Türk şirketleri için bağlayıcı mı?
EU AI Act, sistemin AB pazarına sürülmesi veya çıktısının AB’de kullanılması durumunda ülke fark etmeksizin uygulanır. AB’ye hizmet veren Türk SaaS, dış kaynak veya outsourcing firmaları kapsama girer. Uyumsuzluk cezası 35 milyon EUR veya küresel cironun %7’si (hangisi yüksekse). Yalnız yerel hizmet veren kurumlar için doğrudan bağlayıcılık yoktur fakat KVKK Kurumu 2026 rehberinde aynı prensipleri yansıttı.
NIST AI RMF, ISO 42001 ve EU AI Act arasında nasıl seçim yapmalıyım?
Seçim değil katmanlama. EU AI Act yasal zorunluluk (AB pazarına çıkıyorsanız), NIST AI RMF süreç çerçevesi (gönüllü ama federal alımda zorunlu), ISO 42001 sertifikasyon (denetim ve müşteri güveni). Üçü birden işletilebilir: RMF süreci üretir, AI Act dosyayı talep eder, ISO 42001 denetçiyle ortak dil oluşturur.
Red-teaming için kendi ekibim mi yoksa 3. taraf mı kullanmalıyım?
İdeal kombinasyon: dahili red-team günlük operasyon için (otomatik probe seti, regression test), 3. taraf yılda en az bir kez derin değerlendirme için. Frontier model deploy ediyorsanız Apollo Research, METR veya AISI joint testing katılımı standart hale geldi. Yüksek riskli use case’lerde EU AI Act 3. taraf conformity assessment talep eder.
LLM halüsinasyonu sıfırlanabilir mi?
Sıfırlanamaz, yönetilir. Yaklaşımlar: RAG ile kaynak gösterme zorunluluğu, güven skoru altında insan onayı, output doğruluk denetim katmanı (citation enforcement, fact-check classifier), kullanıcıya halüsinasyon olasılığının açık iletilmesi. RAG + güven eşiği uygulayan sistemlerde halüsinasyon oranı 2025 verilerine göre %63 düşüyor. Detay için LLM hallucination azaltma rehberini inceleyin.
AI Ethics Officer rolü ne zaman tam zamanlı yapılır?
1.000+ çalışan, üretimde 10+ model veya yüksek riskli use case (kredi, işe alım, sağlık) varsa tam zamanlı yapın. Daha küçük kurumda hibrit rol: Compliance Lead veya Data Protection Officer + sorumlu AI portföyü. Rapor hattı doğrudan C-level (CISO, Chief Risk Officer veya CTO) olmalı; orta yönetim altında konuşlandırma yetki kaybı yaratır.
Sonuç: 2026 İçin Olgunluk Verdikti
AI Safety 2026’da artık bir yatırım stratejisi değil; risk dosyası, marka itibarı ve düzenleyici uyumun ortak operasyonel direğidir. Bizim verdiğimiz olgunluk verdikti: AB pazarına ürün veya çıktı veren her Türk kurumu için minimum Tier 3 (Managed), AB dışı yerel kurumlar için minimum Tier 2 (Defined). Tier 4 (Optimized) ise yüksek riskli use case (kredi, işe alım, sağlık, kritik altyapı) çalıştıran kurumlar için 2026 sonuna kadar zorunlu hedeftir. NIST AI RMF süreci, EU AI Act dosyalama, ISO 42001 sertifikasyonu ve Anthropic RSP / AISI red-team protokolünü tek bir governance pipeline’ında konsolide eden kurumlar; ceza, dava ve marka aşınma maliyetinden kaçınırken ortalama 3,8x ROI yakalıyor. İlk 90 günlük yol haritası şu sırayla işletilir: hafta 1-2 risk envanteri ve use case kataloğu, hafta 3-6 AI Komite kuruluşu ve politika belgesi, hafta 7-10 bias ve red-team pilot, hafta 11-13 lifecycle gate’lerin minimum dördünün operasyonel hale getirilmesi. AI Safety teknik bir lüks değil, 2026’nın sermaye disiplinidir; kurumsal değer üretiminin kapı kontrolüdür.










Ömer ÖNAL
Mayıs 16, 2026Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.