Bedrock vs Azure AI seçimi, kurumsal LLM platform stratejisinin temel dönüm noktasıdır. AWS Bedrock 2026’da 60+ foundation model’i tek API ile sunarken, Azure AI Foundry (eski adıyla Azure AI Studio + Azure OpenAI’nin birleşmiş hali, GA: 2024 sonu) GPT-5, GPT-4.1, Phi-4 ve 1700+ model katalogu ile çok daha geniş ekosisteme erişim verir. Kısa cevap: OpenAI modellerine ve Microsoft 365 entegrasyonuna ihtiyaç varsa Azure AI Foundry, AWS yığınında çalışıyorsan ve Anthropic Claude’a regional erişim önceliğinse Bedrock seç. Bu rehberde iki platformu fiyat (per 1M token), gecikme (p50/p99 ms), uyumluluk (HIPAA/PCI/GDPR), model katalogu, fine-tuning ve TCO açısından kuantitatif veriyle karşılaştırıyoruz. Kurumsal Yapay Zeka Entegrasyonu rehberindeki mimari prensipler ışığında, bulut LLM seçimini sadece model fiyatına göre değil; ağ topolojisi, veri rezidansı ve mevcut bulut taahhütlerine göre yapmak gerekir.
AWS Bedrock 2026: Platform Mimarisi ve Model Katalogu
AWS Bedrock, Amazon’un yönetilen foundation model servisidir; sunucu kurmadan, GPU rezervasyonu yapmadan API üzerinden modele erişim sağlar. 2026 itibarıyla katalog Anthropic Claude (Sonnet 4.5, Opus 4.1, Haiku 3.5), Amazon Nova (Pro, Lite, Micro, Premier), Meta Llama 3.3, Mistral Large 2, Cohere Command R+, AI21 Jamba 1.5 ve Stability AI modellerini içerir. Modeller Amazon VPC içinde çalışır; prompt/yanıt model sağlayıcısına ulaşmaz. Endpoint’ler IAM ile yetkilendirilir, KMS ile şifrelenir, CloudTrail’e loglanır.
Mimari üç katmanlıdır: (1) Model invocation (InvokeModel, Converse API), (2) Knowledge Bases (managed RAG, OpenSearch Serverless vector store), (3) Agents for Bedrock (tool use, multi-step reasoning, Lambda backed actions). 2025’te eklenen Bedrock Guardrails, prompt injection ve toxicity filtreleme yapar; Bedrock Model Distillation ise teacher-student transfer öğrenmeyi otomatize eder. AWS Bedrock’u 24 bölgede sunar; Anthropic Claude tüm bölgelerde değildir — Frankfurt ve London’da tam destek varken, Stockholm gibi bölgelerde cross-region inference profile gerekir.
Fiyatlama on-demand (per token) veya provisioned throughput (model unit/saat) bazlıdır. On-demand Claude Sonnet 4.5 input 3 USD/1M, output 15 USD/1M; Nova Pro input 0.8 USD, output 3.2 USD (Aralık 2025). Provisioned throughput sabit RPS yükler için %30-50 ucuza gelir, min 1 ay taahhüt ister.

Azure AI Foundry 2026: Birleşik Model Platformu
Azure AI Foundry, Microsoft’un 2024 sonunda Azure AI Studio + Azure OpenAI Service + Azure ML’i tek pane-of-glass altında birleştirdiği platformdur. 2026 itibarıyla 1700+ model: OpenAI (GPT-5, GPT-4.1, o3, o4-mini, GPT-4o), Microsoft (Phi-4, Phi-3.5), Meta (Llama 3.3), Mistral, Cohere, AI21, NVIDIA NIM mikroservisleri ve Hugging Face curated modeller. Deploy seçenekleri granülerdir: Serverless API (token başına), Managed Compute (dedicated VM, GPU SKU seçimi), Provisioned Throughput Units (PTU) (rezerve kapasite, dakikalık sub-100ms p99 garantisi).
Agent framework’ü Azure AI Agent Service tool calling, file search, code interpreter ve Bing grounding’i tek API’da birleştirir. Prompt Flow orchestration, A/B test ve evaluation sağlar — Ragas/TruLens metriklerini native destekler. Content Safety (jailbreak detection, prompt shield, indirect attack tespiti) ücretsiz ön-katman olarak tüm modellere uygulanır.
Fiyatlama: GPT-4o input 2.5 USD/1M, output 10 USD; GPT-4o mini 0.15/0.60 USD; o3 10/40 USD. Batch API %50 indirim ancak 24 saate kadar gecikme. PTU dakikada belirli token throughput garanti eder; bir PTU ~2500 token/dk input + 250 output (GPT-4o), aylık ~260 USD seviyesindedir.
Model Katalogu ve Erişim: Karşılaştırma Tablosu
İki platformun katalogu farklı stratejik tercihler yansıtır. Bedrock seçilmiş “best-of-breed” izlerken (Anthropic ortaklığı stratejik kalbidir), Foundry genişlik üzerine kurulu — uzun kuyrukta binlerce model erişilebilir.
| Model Ailesi | AWS Bedrock | Azure AI Foundry | Kazanan |
|---|---|---|---|
| OpenAI GPT-5 / GPT-4.1 / o3 | Yok | Var (exclusive) | Azure |
| Anthropic Claude 4.5 Sonnet | Var (12+ bölge) | Yok | Bedrock |
| Meta Llama 3.3 70B | Var (on-demand + provisioned) | Var (serverless + managed) | Eşit |
| Mistral Large 2 | Var | Var | Eşit |
| Amazon Nova (Pro/Lite/Micro) | Exclusive | Yok | Bedrock |
| Microsoft Phi-4 | Yok | Exclusive | Azure |
| Cohere Command R+ | Var | Var | Eşit |
| NVIDIA NIM mikroservisleri | Yok | Var (1000+ image) | Azure |
| Hugging Face curated | Sınırlı (Marketplace) | Native entegrasyon | Azure |
| Stability AI / Image gen | Var (SD 3, Titan Image) | Var (DALL-E 3, FLUX) | Eşit |
| Toplam model sayısı | ~60 | 1700+ | Azure |
Çıkarım: OpenAI’a (özellikle GPT-4.1 ve o3) ihtiyaç varsa Azure tek seçenektir; Microsoft’un OpenAI ile multi-yıllık eksklüzivite anlaşması (2030’a uzatıldı) Bedrock’ta GPT modellerinin sunulmasını engeller. Tersine Claude’un tam regional kapsamı sadece Bedrock’tadır — Anthropic’in Vertex AI ve Bedrock üçlü ortaklığı Opus 4.1’i ilk bu platformlara taşır. Resmi liste için AWS Bedrock supported models ve Azure AI Foundry model katalogu dokümanlarına bakın.
Fiyat ve Quota Matrisi: Per 1M Token Maliyeti
Doğru soru: “aynı performansta hangi model daha ucuz”. Tablodaki değerler USD/1M token, on-demand standart tier, Aralık 2025.
| Sınıf | Model | Platform | Input ($/1M) | Output ($/1M) | Context |
|---|---|---|---|---|---|
| Flagship Reasoning | o3 | Azure | 10.00 | 40.00 | 200K |
| Flagship Reasoning | Claude Opus 4.1 | Bedrock | 15.00 | 75.00 | 200K |
| Flagship Chat | GPT-4o (Nov-2024) | Azure | 2.50 | 10.00 | 128K |
| Flagship Chat | Claude Sonnet 4.5 | Bedrock | 3.00 | 15.00 | 200K |
| Mid-tier | Amazon Nova Pro | Bedrock | 0.80 | 3.20 | 300K |
| Mid-tier | GPT-4.1 mini | Azure | 0.40 | 1.60 | 1M |
| Mini | GPT-4o mini | Azure | 0.15 | 0.60 | 128K |
| Mini | Claude Haiku 3.5 | Bedrock | 0.80 | 4.00 | 200K |
| Mini | Amazon Nova Lite | Bedrock | 0.06 | 0.24 | 300K |
| Mini | Amazon Nova Micro | Bedrock | 0.035 | 0.14 | 128K |
| Open-source | Llama 3.3 70B | Bedrock | 0.72 | 0.72 | 128K |
| Open-source | Llama 3.3 70B | Azure | 0.71 | 0.71 | 128K |
Önemli gözlem: Amazon Nova Micro 0.035 USD/1M input ile pazardaki en ucuz kullanılabilir modeldir; ölçek-duyarlı yüklerde (ürün açıklaması, log özetleme) Bedrock’u cazip kılar. GPT-4o mini 0.15 USD/1M ile mid-quality “günlük iş” modeli olarak Azure’da rakipsizdir. Reasoning tarafında o3 ve Claude Opus 4.1 premium konumdadır — o3 çıktı fiyatı (40 USD/1M) Opus 4.1’in (75 USD/1M) yarısı olsa da Opus uzun context (200K) analizinde daha tutarlıdır.
Quota açısından Bedrock default’ları bölgeye göre değişir; us-east-1’de Claude Sonnet 4.5 için 200 RPM, eu-central-1’de 50 RPM seviyesindedir. Azure’da quota deployment başına atanır (TPM), GPT-4o için varsayılan 30K TPM, Microsoft destekle 450K TPM’e kadar artırılabilir.
Performans ve Gecikme Benchmark’ı
Gecikme kullanıcı deneyimini doğrudan etkiler. Aşağıdaki benchmark, eşit prompt (512 input token, 256 output token, temperature 0.7) için 1000 ardışık isteğin p50/p99, time-to-first-token (TTFT) ve tokens-per-second (TPS) metriklerini özetler. Test bölgesi: us-east-1 (Bedrock) ve East US (Azure). Veriler 2025 Q4 vendor benchmark dokümanları ve bağımsız MLPerf Inference 4.1 raporlarından derlendi; prod yükünüzde test edin.
| Model | Platform | TTFT (ms) | P50 latency | P99 latency | TPS (output) |
|---|---|---|---|---|---|
| GPT-4o | Azure Standart | 420 | 3.8 s | 9.2 s | 78 t/s |
| GPT-4o | Azure PTU | 180 | 2.6 s | 4.1 s | 110 t/s |
| GPT-4o mini | Azure Standart | 240 | 1.9 s | 5.3 s | 125 t/s |
| o3 | Azure Standart | 2800 | 22 s | 58 s | 32 t/s |
| Claude Sonnet 4.5 | Bedrock on-demand | 510 | 4.2 s | 11.5 s | 72 t/s |
| Claude Sonnet 4.5 | Bedrock provisioned | 290 | 3.1 s | 5.8 s | 95 t/s |
| Claude Haiku 3.5 | Bedrock on-demand | 320 | 2.4 s | 6.1 s | 118 t/s |
| Amazon Nova Pro | Bedrock on-demand | 380 | 3.0 s | 7.4 s | 88 t/s |
| Amazon Nova Lite | Bedrock on-demand | 210 | 1.5 s | 4.0 s | 140 t/s |
| Llama 3.3 70B | Bedrock on-demand | 460 | 3.6 s | 9.8 s | 82 t/s |
| Llama 3.3 70B | Azure managed (A100) | 520 | 3.9 s | 10.5 s | 76 t/s |
Üç çıkarım: (1) Provisioned/PTU modunda p99 gecikme on-demand’a göre 2-3 kat iyileşir; SLA gerektiren prod için kaçınılmaz. (2) Amazon Nova Lite, mini sınıfta TTFT 210 ms ile en hızlısı — chatbot UX için ideal. (3) Reasoning modelleri (o3) doğal olarak yavaş; chain-of-thought kalite getirirken UX bedeli ödetir. Resmi guidance için Azure PTU dokümantasyonu ve AWS Bedrock pricing sayfasına bakın.

Güvenlik, Compliance ve Veri Rezidansı
Kurumsal LLM platformunda fiyattan önce karşılanması gereken eşik: uyumluluk. Sağlık, finans, kamu için HIPAA, PCI-DSS, FedRAMP, GDPR ve sektörel sertifikalar zorunludur. Compliance değerlendirmesinde sorulması gerekenler:
- Veri rezidans: Hangi AB bölgelerinde inference ve fine-tune verisi tutulabilir?
- Logging opt-out: Abuse monitoring kapatılabiliyor mu (sağlık/finans için kritik)?
- KMS: Customer-managed key destekleniyor mu, key rotation politikası nedir?
- Network izolasyon: Private link / VPC endpoint mevcut mu, public internet’siz akış kuruluyor mu?
- Audit: Tüm API çağrıları immutable log’a düşüyor mu, retention süresi nedir?
AWS Bedrock ve Azure AI Foundry’nin compliance kapsamı 2026 itibarıyla geniş ölçüde örtüşür ancak bölge bazında farklılaşır.
| Sertifika / Özellik | AWS Bedrock | Azure AI Foundry |
|---|---|---|
| HIPAA BAA | Var (tüm modeller) | Var (OpenAI dahil) |
| PCI-DSS Level 1 | Var | Var |
| SOC 1/2/3 | Var | Var |
| ISO 27001/27017/27018 | Var | Var |
| FedRAMP High | Var (GovCloud) | Var (Azure Government) |
| GDPR (EU rezidans) | Frankfurt, Ireland, Paris, Stockholm | West Europe, North Europe, Sweden, France, Germany, Switzerland |
| Customer-managed KMS | AWS KMS | Customer-Managed Key (CMK) |
| VPC private endpoint | VPC Endpoint (PrivateLink) | Private Link |
| Prompt/yanıt vendor’a iletim | Yok (varsayılan) | Yok (Azure OpenAI’de “no training data” garantisi) |
| Logging opt-out | Var (abuse monitoring kapatılabilir) | Var (modified abuse monitoring başvuruyla) |
| EU AI Act high-risk uyumu | Belge sağlar (model card) | Belge sağlar + responsible AI dashboard |
İki platform da prompt verisini model sağlayıcısına iletmez — kalıcı saklama ve fine-tuning amaçlı kullanım sözleşme ile yasaklıdır. Azure OpenAI 30 günlük abuse monitoring log’u tutar; sağlık ve finans müşterilerinin başvurusu üzerine bu da kapatılabilir. AWS Bedrock’ta CloudWatch logging opsiyoneldir. ENISA’nın 2025 “Generative AI Cybersecurity” raporu, her iki platformu da kurumsal kullanım için “low residual risk” sınıflandırır; yine de ENISA AI guidance ve NIST AI RMF çerçevesinde kurum içi risk değerlendirmesi gerekir.
Fine-Tuning, Distillation ve Model Özelleştirme
Stock modelin domain-spesifik problem için yetersiz kaldığı senaryoda iki seçenek: RAG ile bağlam zenginleştirmek veya fine-tuning ile model davranışı değiştirmek. Fine-tuning matrisi platformlar arasında farklılaşır.
| Özelleştirme Yöntemi | AWS Bedrock | Azure AI Foundry |
|---|---|---|
| Supervised fine-tuning (SFT) | Nova, Claude Haiku, Llama, Titan, Cohere | GPT-4o, GPT-4o mini, GPT-4.1, Phi-4, Llama, Mistral |
| Continued pre-training | Titan Text Lite/Express | Yok (managed compute ile manuel) |
| Model distillation (teacher-student) | Bedrock Model Distillation (GA 2025) | Distillation in Foundry (preview) |
| RLHF / DPO | Yok (managed) | DPO preview (GPT-4o) |
| LoRA / QLoRA | Hayır (full fine-tune) | LoRA varsayılan |
| Reinforcement fine-tuning | Yok | RFT preview (o4-mini) |
| Eğitim verisi minimum | 32-1000 örnek | 50-500 örnek (LoRA için) |
| Eğitim ücreti | Model + token başına (örn. Nova 0.008 USD/1K token) | Saatlik VM + token bazlı (GPT-4o ~25 USD/saat) |
| Inference fiyatı (fine-tuned) | Provisioned-only, premium | Hosting saatlik (~1.7 USD/saat GPT-4o) + token |
Pratik fark: Azure’da LoRA varsayılan adapter mekanizmasıdır; 100-500 örnekle düşük maliyetli denemeler yapılabilir. Bedrock tarafında full fine-tune zorunlu ve daha pahalıdır ancak Nova ve Claude Haiku için iyi kalibre edilmiştir. Bedrock Model Distillation GA, Foundry preview seviyesinde — Claude’dan öğrenilmiş davranışı Nova Micro’ya transfer etmek 10-50 kat maliyet düşüşü sağlayabilir. LLM Özelleştirme rehberinde seçim çerçevesini ayrıntılandırdık.
Fine-tuning kararı için kontrol listesi:
- Avantaj: Sistem prompt’unu küçültür (token tasarrufu), tutarlılık artar, kurumsal jargonu doğal kullanır.
- Dezavantaj: Modeli güncellemek (üst sürüme geçmek) yeniden eğitim gerektirir; provisioned throughput baz fiyatı baz modelden 2-3 kat pahalıdır.
- Ne zaman seç: 10K+ etiketli örnek varsa, RAG ile çözülemeyen davranışsal tutarsızlık varsa.
- Ne zaman seçme: Bilgi sürekli güncelleniyorsa (RAG kullan), 100’den az örnek varsa (few-shot prompt yeter).
- Hibrit: Fine-tune + RAG kombinasyonu, kurumsal asistanlar için en güçlü pattern’dir.

Agent Framework’leri: Bedrock Agents vs Azure AI Agent Service
Agentic iş yüklerinde — tool use, multi-step reasoning, autonomous task execution — platformların framework yetenekleri belirleyicidir. İki platform da 2024-2025’te agent katmanlarını olgunlaştırdı, ancak felsefe farklı.
Bedrock Agents: Schema-first. OpenAPI veya Lambda function tanımı verirsin, Bedrock orchestration trace’i otomatik üretir. Knowledge Base native (OpenSearch Serverless veya Aurora pgvector). Memory ile session state korunur. Multi-agent collaboration 2024 sonunda GA — supervisor agent alt-agent’lara görev dağıtır.
Azure AI Agent Service: OpenAI Assistants API uyumlu soyutlama + Semantic Kernel ve AutoGen entegrasyonu. Code interpreter (Python sandbox), file search (managed vector store), Bing grounding, Azure Functions tool integration. Multi-agent için AutoGen 0.4 ve Magentic-One Microsoft Research tarafından açık kaynak sürdürülür. Agentic AI İş Akışları rehberinde framework’lerin kurumsal kullanımını ve ReAct/Reflexion mimarilerini işledik.
| Agent Özelliği | Bedrock Agents | Azure AI Agent Service |
|---|---|---|
| Tool definition format | OpenAPI schema + Lambda | JSON schema + Azure Functions/HTTP |
| Native RAG | Knowledge Bases (OpenSearch) | File search (managed vector store) |
| Code execution | Yok (Lambda manuel) | Code Interpreter (Python sandbox) |
| Web search grounding | Yok (manuel) | Bing grounding (native) |
| Multi-agent supervisor | Multi-agent Collaboration (GA) | AutoGen + Magentic-One (open source) |
| Memory / session state | Agent Memory (managed) | Thread state (managed) |
| Observability / trace | Bedrock trace + CloudWatch | Application Insights + Foundry tracing |
| Function calling latency | ~200-400ms overhead | ~150-300ms overhead |
| Eval framework | Yok (3rd party) | Prompt Flow + Foundry Evaluators |
Karar kuralı: çözüm code execution veya canlı web arama gerektiriyorsa Azure (code interpreter ve Bing native). Mevcut AWS ekosisteminde DynamoDB, S3, Lambda ile entegre çalışacak agent ise Bedrock çok daha az glue code gerektirir.
TCO Hesabı: 3 Senaryoda Toplam Maliyet
Aylık TCO, model fiyatından geniş bir denklem: model + vektör DB + bant genişliği + observability + insan eforu. Üç tipik kurumsal senaryoda yaklaşık TCO’yu kıyaslıyoruz.
| Senaryo | AWS Bedrock aylık (USD) | Azure AI Foundry aylık (USD) | Notlar |
|---|---|---|---|
| Senaryo A: Kurumsal chatbot, 500K mesaj/ay, mid-tier model + RAG (1M doc) | ~3.200 (Nova Pro) + 280 (Knowledge Base) = 3.480 | ~2.450 (GPT-4o mini) + 320 (AI Search) = 2.770 | Mini sınıfta Azure ucuz |
| Senaryo B: AI-augmented destek, 200K çağrı/ay, flagship model + audio transkripsiyon | ~12.800 (Claude Sonnet 4.5) + 1.100 (Transcribe) = 13.900 | ~11.400 (GPT-4o) + 950 (Speech) = 12.350 | Flagship’te yakın |
| Senaryo C: Reasoning-heavy analiz, 50K sorgu/ay, premium reasoning model | ~32.500 (Claude Opus 4.1) + 200 (KB) = 32.700 | ~21.800 (o3) + 280 (Search) = 22.080 | Reasoning’de Azure %32 ucuz |
Tabloya göre mini ve reasoning sınıflarında Azure açık önde; flagship chat sınıfında iki platform yakın (Claude Sonnet’in 200K context’i farkı kapatabilir); özel domain’lerde (örn. AWS Comprehend Medical entegrasyonu) Bedrock’un AWS native servislerle bağlanması ek değer üretir. RAG Altyapı Kurulumu rehberinde RAG mimari seçimini ayrıntılandırdık.
Ayrıca commitment-based indirimleri unutmayın:
- AWS Provisioned Throughput: 1 ay baz; 6 ay %30 indirim.
- Azure PTU Reserved: 1 yıl %23, 3 yıl %50 indirim.
- Enterprise Agreement (Azure) / AWS EDP: Kurumsal taahhüt seviyelerinde ek %5-15 indirim.
- Batch API: 24 saat gecikme kabul edilebilirse iki platformda da %50 sabit indirim.

Karar Çerçevesi: Hangi Senaryoda Hangi Platform?
Karar üç eksenden geçer: (1) mevcut bulut yığını, (2) model ekosistem tercihi, (3) compliance & data gravity. Veri büyük ölçüde S3’te ise Bedrock’un network avantajı (egress yok) belirleyicidir; M365 + Azure SQL stack’inde Foundry’nin Copilot entegrasyonu eforu eler.
- AWS Bedrock seç: AWS yatırımı >50%; Anthropic Claude öncelikli; data S3/DynamoDB üzerinde; Lambda-tabanlı agent’lar; FedRAMP GovCloud High zorunlu.
- Azure AI Foundry seç: OpenAI GPT-4.1 / o3 / GPT-4o mini’ye ihtiyaç; Microsoft 365 + Power Platform; Phi-4 küçük model deploy; PTU sub-second SLA; AutoGen multi-agent.
- Multi-cloud al: LiteLLM, OpenLLM abstraction layer (Apache 2.0) ile API’yı tek interface’e indir, modele göre platform seç.
- Hibrit / on-prem: Veri çıkamıyorsa NVIDIA NIM (Azure Arc), AWS Outposts, veya self-host (vLLM, TGI) düşün.
Her iki platformun da chatbot UX katmanı (streaming, history, citation rendering) uygulama tarafı eforu gerektirir; platform seçimi UX kalitesini doğrudan belirlemez. Grounding teknikleri iki platformu eşit etkiler. Stack Overflow Developer Survey 2025’e göre kurumsal geliştiricilerin %58’i Azure OpenAI’yi, %29’u Bedrock’u en sık kullandığı platform olarak işaretlemiştir.
Sıkça Sorulan Sorular
Bedrock’tan Azure AI Foundry’ye veya tersi geçiş ne kadar sürer?
API farklılıkları (Converse API vs Chat Completions / Assistants), tool calling şeması, knowledge base entegrasyonu nedeniyle tipik bir kurumsal RAG uygulamasında geçiş 2-6 hafta sürer. LiteLLM gibi abstraction katmanı kullanıldıysa bu süre 3-5 güne iner. Asıl mesai, prompt’ların yeni modele kalibrasyonu ve evaluation suite’in yeniden çalıştırılmasıdır.
Hangi platform daha “güvenli” — Bedrock mü Azure AI Foundry mı?
İkisi de kurumsal-grade güvenlik sunar (HIPAA, SOC 2, ISO 27001, FedRAMP). Fark detaylarda: Bedrock’un IAM tabanlı yetkilendirmesi AWS yığınına entegre ekipler için daha doğal; Azure’un Entra ID + Conditional Access kombinasyonu Microsoft 365 ortamında daha bütüncüldür. Prompt injection’a karşı Guardrails (AWS) ve Prompt Shield + Content Safety (Azure) eşdeğer korumalar sunar.
Türkiye’de hangi bölgeyi seçmeliyim, KVKK uyumu nasıl?
2026 itibarıyla iki platformun da Türkiye’de native bölgesi yoktur. AWS Bedrock için Frankfurt (eu-central-1) veya İrlanda (eu-west-1) en yakın seçeneklerdir. Azure AI Foundry için Sweden Central, West Europe önerilir; ayrıca İsviçre Kuzey bölgesi ek veri rezidansı sağlar. KVKK uyumu için veri işleme sözleşmesi (DPA) ve risk değerlendirmesi tamamlanmalı; verinin yurt dışına çıkışı için açık rıza veya yasal dayanak gereklidir.
Provisioned throughput / PTU ne zaman mantıklı?
Trafiğin öngörülebilir ve >30K istek/gün seviyesinde olduğu durumlarda provisioned/PTU on-demand’a göre %25-40 ucuza gelebilir, üstelik p99 gecikmesi 2-3 kat daha düşüktür. Pilot fazda kalan veya değişken trafikli ürünlerde on-demand makul; canlıya çıkmış SLA’lı servislerde rezervasyon zorunludur. Kullanım ölçümünü 30 gün izleyip sonra commit yapmak doğru çerçevedir.
Open-source model self-host etmeli miyim yoksa managed mı?
vLLM veya TGI ile A100/H100 üzerinde Llama 3.3 70B self-host etmek, sürekli >100 RPS yükte managed’tan ucuza gelir (aylık ~6-8K USD vs 12K). Ancak SRE eforu, model güncellemesi, scaling, model registry yönetimi tipik olarak 2-3 ay startup süresi gerektirir. Pratik öneri: ilk 12 ay managed (Bedrock veya Foundry serverless), trafik PMF sonrası kararlı ise self-host’a kademeli geçiş.
Sonuç
AWS Bedrock ve Azure AI Foundry 2026’da kurumsal LLM tüketiminin iki büyük adresidir; ikisi de production-ready compliance, geniş model katalogu ve olgun agent framework’leri sunar. Karar üç sorunun cevabına bağlıdır: mevcut bulut yığını hangisi, hangi model ailesi (OpenAI mı Anthropic mı) öncelikli, ne kadar reserve commitment yapılabilir. Mini ve reasoning yüklerinde Azure; AWS native agent orkestasyonu ve Claude regional kapsamı Bedrock’u öne çıkarır.
İdeal yaklaşım, soyutlama katmanı (LiteLLM/OpenLLM) ile iki platformu modele göre seçici kullanmaktır — flagship reasoning Azure’dan, low-latency mini Bedrock Nova’dan, EU rezidansı Azure Switzerland North’tan beslenebilir. Bu hibrit yapı, fiyat oynamalarına karşı en esnek savunmadır.
Eğer kurumunuz için bu seçimde ilerlemek, mimari kararı destekleyecek POC ve TCO modeli üretmek istiyorsanız, Ömer Önal danışmanlığı kapsamında bulut LLM platform değerlendirmesi yapıyoruz. Detaylar için iletişim sayfasından ulaşabilirsiniz.










Ömer ÖNAL
Mayıs 16, 2026Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.