AWS Bedrock vs Azure AI Foundry 2026: Platform Karşılaştırma

Q: Provisioned throughput / PTU ne zaman mantıklı?

Trafiğin öngörülebilir ve 30K istek/gün üzerinde olduğu durumlarda provisioned/PTU on-demand'a göre yüzde 25-40 ucuza gelebilir, üstelik p99 gecikmesi 2-3 kat daha düşüktür. Pilot fazda kalan veya değişken trafikli ürünlerde on-demand makul; canlıya çıkmış SLA'lı servislerde rezervasyon zorunludur. Kullanım ölçümünü 30 gün izleyip sonra commit yapmak doğru çerçevedir.

Yapay Zeka & LLM

Mayıs 16, 2026OmerOnal1 Yorum

Bedrock vs Azure AI seçimi, kurumsal LLM platform stratejisinin temel dönüm noktasıdır. AWS Bedrock 2026’da 60+ foundation model’i tek API ile sunarken, Azure AI Foundry (eski adıyla Azure AI Studio + Azure OpenAI’nin birleşmiş hali, GA: 2024 sonu) GPT-5, GPT-4.1, Phi-4 ve 1700+ model katalogu ile çok daha geniş ekosisteme erişim verir. Kısa cevap: OpenAI modellerine ve Microsoft 365 entegrasyonuna ihtiyaç varsa Azure AI Foundry, AWS yığınında çalışıyorsan ve Anthropic Claude’a regional erişim önceliğinse Bedrock seç. Bu rehberde iki platformu fiyat (per 1M token), gecikme (p50/p99 ms), uyumluluk (HIPAA/PCI/GDPR), model katalogu, fine-tuning ve TCO açısından kuantitatif veriyle karşılaştırıyoruz. Kurumsal Yapay Zeka Entegrasyonu rehberindeki mimari prensipler ışığında, bulut LLM seçimini sadece model fiyatına göre değil; ağ topolojisi, veri rezidansı ve mevcut bulut taahhütlerine göre yapmak gerekir. Konuyla ilişkili olarak Foundation Model Seçim Çerçevesi 2026: Llama 3, Mistral, Claude ve GPT-4 Karşılaştırması rehberimiz detaylı incelemeyi içerir. Konuyla ilişkili olarak Constitutional AI 2026: Anthropic Self-Critique ile Kurumsal LLM Hizalama rehberimiz detaylı incelemeyi içerir.

📖 17 dakikalık okuma

İçindekiler

AWS Bedrock 2026: Platform Mimarisi ve Model Katalogu
Azure AI Foundry 2026: Birleşik Model Platformu
Model Katalogu ve Erişim: Karşılaştırma Tablosu
Fiyat ve Quota Matrisi: Per 1M Token Maliyeti
Performans ve Gecikme Benchmark'ı
Güvenlik, Compliance ve Veri Rezidansı
Fine-Tuning, Distillation ve Model Özelleştirme
Agent Framework'leri: Bedrock Agents vs Azure AI Agent Service
TCO Hesabı: 3 Senaryoda Toplam Maliyet
Karar Çerçevesi: Hangi Senaryoda Hangi Platform?
Sıkça Sorulan Sorular
Sonuç

AWS Bedrock 2026: Platform Mimarisi ve Model Katalogu

AWS Bedrock, Amazon’un yönetilen foundation model servisidir; sunucu kurmadan, GPU rezervasyonu yapmadan API üzerinden modele erişim sağlar. 2026 itibarıyla katalog Anthropic Claude (Sonnet 4.5, Opus 4.1, Haiku 3.5), Amazon Nova (Pro, Lite, Micro, Premier), Meta Llama 3.3, Mistral Large 2, Cohere Command R+, AI21 Jamba 1.5 ve Stability AI modellerini içerir. Modeller Amazon VPC içinde çalışır; prompt/yanıt model sağlayıcısına ulaşmaz. Endpoint’ler IAM ile yetkilendirilir, KMS ile şifrelenir, CloudTrail’e loglanır.

Mimari üç katmanlıdır: (1) Model invocation (InvokeModel, Converse API), (2) Knowledge Bases (managed RAG, OpenSearch Serverless vector store), (3) Agents for Bedrock (tool use, multi-step reasoning, Lambda backed actions). 2025’te eklenen Bedrock Guardrails, prompt injection ve toxicity filtreleme yapar; Bedrock Model Distillation ise teacher-student transfer öğrenmeyi otomatize eder. AWS Bedrock’u 24 bölgede sunar; Anthropic Claude tüm bölgelerde değildir — Frankfurt ve London’da tam destek varken, Stockholm gibi bölgelerde cross-region inference profile gerekir. Konuyla ilişkili olarak LoRA Adapter Merging 2026: PEFT ile Multi-Task Fine-Tuning Pattern rehberimiz detaylı incelemeyi içerir. Konuyla ilişkili olarak Spin 3.0 Mimari: WASI Preview 2 ile Tam Entegrasyon rehberimiz detaylı incelemeyi içerir.

Fiyatlama on-demand (per token) veya provisioned throughput (model unit/saat) bazlıdır. On-demand Claude Sonnet 4.5 input 3 USD/1M, output 15 USD/1M; Nova Pro input 0.8 USD, output 3.2 USD (Aralık 2025). Provisioned throughput sabit RPS yükler için %30-50 ucuza gelir, min 1 ay taahhüt ister.

Bulut foundation model katalogu mimari katmanları görselleştirme

Azure AI Foundry 2026: Birleşik Model Platformu

Azure AI Foundry, Microsoft’un 2024 sonunda Azure AI Studio + Azure OpenAI Service + Azure ML’i tek pane-of-glass altında birleştirdiği platformdur. 2026 itibarıyla 1700+ model: OpenAI (GPT-5, GPT-4.1, o3, o4-mini, GPT-4o), Microsoft (Phi-4, Phi-3.5), Meta (Llama 3.3), Mistral, Cohere, AI21, NVIDIA NIM mikroservisleri ve Hugging Face curated modeller. Deploy seçenekleri granülerdir: Serverless API (token başına), Managed Compute (dedicated VM, GPU SKU seçimi), Provisioned Throughput Units (PTU) (rezerve kapasite, dakikalık sub-100ms p99 garantisi).

Agent framework’ü Azure AI Agent Service tool calling, file search, code interpreter ve Bing grounding’i tek API’da birleştirir. Prompt Flow orchestration, A/B test ve evaluation sağlar — Ragas/TruLens metriklerini native destekler. Content Safety (jailbreak detection, prompt shield, indirect attack tespiti) ücretsiz ön-katman olarak tüm modellere uygulanır.

Fiyatlama: GPT-4o input 2.5 USD/1M, output 10 USD; GPT-4o mini 0.15/0.60 USD; o3 10/40 USD. Batch API %50 indirim ancak 24 saate kadar gecikme. PTU dakikada belirli token throughput garanti eder; bir PTU ~2500 token/dk input + 250 output (GPT-4o), aylık ~260 USD seviyesindedir.

Model Katalogu ve Erişim: Karşılaştırma Tablosu

İki platformun katalogu farklı stratejik tercihler yansıtır. Bedrock seçilmiş “best-of-breed” izlerken (Anthropic ortaklığı stratejik kalbidir), Foundry genişlik üzerine kurulu — uzun kuyrukta binlerce model erişilebilir.

Model Ailesi	AWS Bedrock	Azure AI Foundry	Kazanan
OpenAI GPT-5 / GPT-4.1 / o3	Yok	Var (exclusive)	Azure
Anthropic Claude 4.5 Sonnet	Var (12+ bölge)	Yok	Bedrock
Meta Llama 3.3 70B	Var (on-demand + provisioned)	Var (serverless + managed)	Eşit
Mistral Large 2	Var	Var	Eşit
Amazon Nova (Pro/Lite/Micro)	Exclusive	Yok	Bedrock
Microsoft Phi-4	Yok	Exclusive	Azure
Cohere Command R+	Var	Var	Eşit
NVIDIA NIM mikroservisleri	Yok	Var (1000+ image)	Azure
Hugging Face curated	Sınırlı (Marketplace)	Native entegrasyon	Azure
Stability AI / Image gen	Var (SD 3, Titan Image)	Var (DALL-E 3, FLUX)	Eşit
Toplam model sayısı	~60	1700+	Azure

Çıkarım: OpenAI’a (özellikle GPT-4.1 ve o3) ihtiyaç varsa Azure tek seçenektir; Microsoft’un OpenAI ile multi-yıllık eksklüzivite anlaşması (2030’a uzatıldı) Bedrock’ta GPT modellerinin sunulmasını engeller. Tersine Claude’un tam regional kapsamı sadece Bedrock’tadır — Anthropic’in Vertex AI ve Bedrock üçlü ortaklığı Opus 4.1’i ilk bu platformlara taşır. Resmi liste için AWS Bedrock supported models ve Azure AI Foundry model katalogu dokümanlarına bakın.

Fiyat ve Quota Matrisi: Per 1M Token Maliyeti

Doğru soru: “aynı performansta hangi model daha ucuz”. Tablodaki değerler USD/1M token, on-demand standart tier, Aralık 2025.

Sınıf	Model	Platform	Input ($/1M)	Output ($/1M)	Context
Flagship Reasoning	o3	Azure	10.00	40.00	200K
Flagship Reasoning	Claude Opus 4.1	Bedrock	15.00	75.00	200K
Flagship Chat	GPT-4o (Nov-2024)	Azure	2.50	10.00	128K
Flagship Chat	Claude Sonnet 4.5	Bedrock	3.00	15.00	200K
Mid-tier	Amazon Nova Pro	Bedrock	0.80	3.20	300K
Mid-tier	GPT-4.1 mini	Azure	0.40	1.60	1M
Mini	GPT-4o mini	Azure	0.15	0.60	128K
Mini	Claude Haiku 3.5	Bedrock	0.80	4.00	200K
Mini	Amazon Nova Lite	Bedrock	0.06	0.24	300K
Mini	Amazon Nova Micro	Bedrock	0.035	0.14	128K
Open-source	Llama 3.3 70B	Bedrock	0.72	0.72	128K
Open-source	Llama 3.3 70B	Azure	0.71	0.71	128K

Önemli gözlem: Amazon Nova Micro 0.035 USD/1M input ile pazardaki en ucuz kullanılabilir modeldir; ölçek-duyarlı yüklerde (ürün açıklaması, log özetleme) Bedrock’u cazip kılar. GPT-4o mini 0.15 USD/1M ile mid-quality “günlük iş” modeli olarak Azure’da rakipsizdir. Reasoning tarafında o3 ve Claude Opus 4.1 premium konumdadır — o3 çıktı fiyatı (40 USD/1M) Opus 4.1’in (75 USD/1M) yarısı olsa da Opus uzun context (200K) analizinde daha tutarlıdır.

Quota açısından Bedrock default’ları bölgeye göre değişir; us-east-1’de Claude Sonnet 4.5 için 200 RPM, eu-central-1’de 50 RPM seviyesindedir. Azure’da quota deployment başına atanır (TPM), GPT-4o için varsayılan 30K TPM, Microsoft destekle 450K TPM’e kadar artırılabilir.

Performans ve Gecikme Benchmark’ı

Gecikme kullanıcı deneyimini doğrudan etkiler. Aşağıdaki benchmark, eşit prompt (512 input token, 256 output token, temperature 0.7) için 1000 ardışık isteğin p50/p99, time-to-first-token (TTFT) ve tokens-per-second (TPS) metriklerini özetler. Test bölgesi: us-east-1 (Bedrock) ve East US (Azure). Veriler 2025 Q4 vendor benchmark dokümanları ve bağımsız MLPerf Inference 4.1 raporlarından derlendi; prod yükünüzde test edin.

Model	Platform	TTFT (ms)	P50 latency	P99 latency	TPS (output)
GPT-4o	Azure Standart	420	3.8 s	9.2 s	78 t/s
GPT-4o	Azure PTU	180	2.6 s	4.1 s	110 t/s
GPT-4o mini	Azure Standart	240	1.9 s	5.3 s	125 t/s
o3	Azure Standart	2800	22 s	58 s	32 t/s
Claude Sonnet 4.5	Bedrock on-demand	510	4.2 s	11.5 s	72 t/s
Claude Sonnet 4.5	Bedrock provisioned	290	3.1 s	5.8 s	95 t/s
Claude Haiku 3.5	Bedrock on-demand	320	2.4 s	6.1 s	118 t/s
Amazon Nova Pro	Bedrock on-demand	380	3.0 s	7.4 s	88 t/s
Amazon Nova Lite	Bedrock on-demand	210	1.5 s	4.0 s	140 t/s
Llama 3.3 70B	Bedrock on-demand	460	3.6 s	9.8 s	82 t/s
Llama 3.3 70B	Azure managed (A100)	520	3.9 s	10.5 s	76 t/s

Üç çıkarım: (1) Provisioned/PTU modunda p99 gecikme on-demand’a göre 2-3 kat iyileşir; SLA gerektiren prod için kaçınılmaz. (2) Amazon Nova Lite, mini sınıfta TTFT 210 ms ile en hızlısı — chatbot UX için ideal. (3) Reasoning modelleri (o3) doğal olarak yavaş; chain-of-thought kalite getirirken UX bedeli ödetir. Resmi guidance için Azure PTU dokümantasyonu ve AWS Bedrock pricing sayfasına bakın.

LLM model gecikme p99 ve throughput performans benchmark soyut görsel

Güvenlik, Compliance ve Veri Rezidansı

Kurumsal LLM platformunda fiyattan önce karşılanması gereken eşik: uyumluluk. Sağlık, finans, kamu için HIPAA, PCI-DSS, FedRAMP, GDPR ve sektörel sertifikalar zorunludur. Compliance değerlendirmesinde sorulması gerekenler:

Veri rezidans: Hangi AB bölgelerinde inference ve fine-tune verisi tutulabilir?
Logging opt-out: Abuse monitoring kapatılabiliyor mu (sağlık/finans için kritik)?
KMS: Customer-managed key destekleniyor mu, key rotation politikası nedir?
Network izolasyon: Private link / VPC endpoint mevcut mu, public internet’siz akış kuruluyor mu?
Audit: Tüm API çağrıları immutable log’a düşüyor mu, retention süresi nedir?

AWS Bedrock ve Azure AI Foundry’nin compliance kapsamı 2026 itibarıyla geniş ölçüde örtüşür ancak bölge bazında farklılaşır.

Sertifika / Özellik	AWS Bedrock	Azure AI Foundry
HIPAA BAA	Var (tüm modeller)	Var (OpenAI dahil)
PCI-DSS Level 1	Var	Var
SOC 1/2/3	Var	Var
ISO 27001/27017/27018	Var	Var
FedRAMP High	Var (GovCloud)	Var (Azure Government)
GDPR (EU rezidans)	Frankfurt, Ireland, Paris, Stockholm	West Europe, North Europe, Sweden, France, Germany, Switzerland
Customer-managed KMS	AWS KMS	Customer-Managed Key (CMK)
VPC private endpoint	VPC Endpoint (PrivateLink)	Private Link
Prompt/yanıt vendor’a iletim	Yok (varsayılan)	Yok (Azure OpenAI’de “no training data” garantisi)
Logging opt-out	Var (abuse monitoring kapatılabilir)	Var (modified abuse monitoring başvuruyla)
EU AI Act high-risk uyumu	Belge sağlar (model card)	Belge sağlar + responsible AI dashboard

İki platform da prompt verisini model sağlayıcısına iletmez — kalıcı saklama ve fine-tuning amaçlı kullanım sözleşme ile yasaklıdır. Azure OpenAI 30 günlük abuse monitoring log’u tutar; sağlık ve finans müşterilerinin başvurusu üzerine bu da kapatılabilir. AWS Bedrock’ta CloudWatch logging opsiyoneldir. ENISA’nın 2025 “Generative AI Cybersecurity” raporu, her iki platformu da kurumsal kullanım için “low residual risk” sınıflandırır; yine de ENISA AI guidance ve NIST AI RMF çerçevesinde kurum içi risk değerlendirmesi gerekir.

Fine-Tuning, Distillation ve Model Özelleştirme

Stock modelin domain-spesifik problem için yetersiz kaldığı senaryoda iki seçenek: RAG ile bağlam zenginleştirmek veya fine-tuning ile model davranışı değiştirmek. Fine-tuning matrisi platformlar arasında farklılaşır.

Özelleştirme Yöntemi	AWS Bedrock	Azure AI Foundry
Supervised fine-tuning (SFT)	Nova, Claude Haiku, Llama, Titan, Cohere	GPT-4o, GPT-4o mini, GPT-4.1, Phi-4, Llama, Mistral
Continued pre-training	Titan Text Lite/Express	Yok (managed compute ile manuel)
Model distillation (teacher-student)	Bedrock Model Distillation (GA 2025)	Distillation in Foundry (preview)
RLHF / DPO	Yok (managed)	DPO preview (GPT-4o)
LoRA / QLoRA	Hayır (full fine-tune)	LoRA varsayılan
Reinforcement fine-tuning	Yok	RFT preview (o4-mini)
Eğitim verisi minimum	32-1000 örnek	50-500 örnek (LoRA için)
Eğitim ücreti	Model + token başına (örn. Nova 0.008 USD/1K token)	Saatlik VM + token bazlı (GPT-4o ~25 USD/saat)
Inference fiyatı (fine-tuned)	Provisioned-only, premium	Hosting saatlik (~1.7 USD/saat GPT-4o) + token

Pratik fark: Azure’da LoRA varsayılan adapter mekanizmasıdır; 100-500 örnekle düşük maliyetli denemeler yapılabilir. Bedrock tarafında full fine-tune zorunlu ve daha pahalıdır ancak Nova ve Claude Haiku için iyi kalibre edilmiştir. Bedrock Model Distillation GA, Foundry preview seviyesinde — Claude’dan öğrenilmiş davranışı Nova Micro’ya transfer etmek 10-50 kat maliyet düşüşü sağlayabilir. LLM Özelleştirme rehberinde seçim çerçevesini ayrıntılandırdık.

Fine-tuning kararı için kontrol listesi:

Avantaj: Sistem prompt’unu küçültür (token tasarrufu), tutarlılık artar, kurumsal jargonu doğal kullanır.
Dezavantaj: Modeli güncellemek (üst sürüme geçmek) yeniden eğitim gerektirir; provisioned throughput baz fiyatı baz modelden 2-3 kat pahalıdır.
Ne zaman seç: 10K+ etiketli örnek varsa, RAG ile çözülemeyen davranışsal tutarsızlık varsa.
Ne zaman seçme: Bilgi sürekli güncelleniyorsa (RAG kullan), 100’den az örnek varsa (few-shot prompt yeter).
Hibrit: Fine-tune + RAG kombinasyonu, kurumsal asistanlar için en güçlü pattern’dir.

Kurumsal LLM güvenlik uyumluluk sertifika katmanları soyut görsel

Agent Framework’leri: Bedrock Agents vs Azure AI Agent Service

Agentic iş yüklerinde — tool use, multi-step reasoning, autonomous task execution — platformların framework yetenekleri belirleyicidir. İki platform da 2024-2025’te agent katmanlarını olgunlaştırdı, ancak felsefe farklı.

Bedrock Agents: Schema-first. OpenAPI veya Lambda function tanımı verirsin, Bedrock orchestration trace’i otomatik üretir. Knowledge Base native (OpenSearch Serverless veya Aurora pgvector). Memory ile session state korunur. Multi-agent collaboration 2024 sonunda GA — supervisor agent alt-agent’lara görev dağıtır.

Azure AI Agent Service: OpenAI Assistants API uyumlu soyutlama + Semantic Kernel ve AutoGen entegrasyonu. Code interpreter (Python sandbox), file search (managed vector store), Bing grounding, Azure Functions tool integration. Multi-agent için AutoGen 0.4 ve Magentic-One Microsoft Research tarafından açık kaynak sürdürülür. Agentic AI İş Akışları rehberinde framework’lerin kurumsal kullanımını ve ReAct/Reflexion mimarilerini işledik.

Agent Özelliği	Bedrock Agents	Azure AI Agent Service
Tool definition format	OpenAPI schema + Lambda	JSON schema + Azure Functions/HTTP
Native RAG	Knowledge Bases (OpenSearch)	File search (managed vector store)
Code execution	Yok (Lambda manuel)	Code Interpreter (Python sandbox)
Web search grounding	Yok (manuel)	Bing grounding (native)
Multi-agent supervisor	Multi-agent Collaboration (GA)	AutoGen + Magentic-One (open source)
Memory / session state	Agent Memory (managed)	Thread state (managed)
Observability / trace	Bedrock trace + CloudWatch	Application Insights + Foundry tracing
Function calling latency	~200-400ms overhead	~150-300ms overhead
Eval framework	Yok (3rd party)	Prompt Flow + Foundry Evaluators

Karar kuralı: çözüm code execution veya canlı web arama gerektiriyorsa Azure (code interpreter ve Bing native). Mevcut AWS ekosisteminde DynamoDB, S3, Lambda ile entegre çalışacak agent ise Bedrock çok daha az glue code gerektirir.

TCO Hesabı: 3 Senaryoda Toplam Maliyet

Aylık TCO, model fiyatından geniş bir denklem: model + vektör DB + bant genişliği + observability + insan eforu. Üç tipik kurumsal senaryoda yaklaşık TCO’yu kıyaslıyoruz.

Senaryo	AWS Bedrock aylık (USD)	Azure AI Foundry aylık (USD)	Notlar
Senaryo A: Kurumsal chatbot, 500K mesaj/ay, mid-tier model + RAG (1M doc)	~3.200 (Nova Pro) + 280 (Knowledge Base) = 3.480	~2.450 (GPT-4o mini) + 320 (AI Search) = 2.770	Mini sınıfta Azure ucuz
Senaryo B: AI-augmented destek, 200K çağrı/ay, flagship model + audio transkripsiyon	~12.800 (Claude Sonnet 4.5) + 1.100 (Transcribe) = 13.900	~11.400 (GPT-4o) + 950 (Speech) = 12.350	Flagship’te yakın
Senaryo C: Reasoning-heavy analiz, 50K sorgu/ay, premium reasoning model	~32.500 (Claude Opus 4.1) + 200 (KB) = 32.700	~21.800 (o3) + 280 (Search) = 22.080	Reasoning’de Azure %32 ucuz

Tabloya göre mini ve reasoning sınıflarında Azure açık önde; flagship chat sınıfında iki platform yakın (Claude Sonnet’in 200K context’i farkı kapatabilir); özel domain’lerde (örn. AWS Comprehend Medical entegrasyonu) Bedrock’un AWS native servislerle bağlanması ek değer üretir. RAG Altyapı Kurulumu rehberinde RAG mimari seçimini ayrıntılandırdık.

Ayrıca commitment-based indirimleri unutmayın:

AWS Provisioned Throughput: 1 ay baz; 6 ay %30 indirim.
Azure PTU Reserved: 1 yıl %23, 3 yıl %50 indirim.
Enterprise Agreement (Azure) / AWS EDP: Kurumsal taahhüt seviyelerinde ek %5-15 indirim.
Batch API: 24 saat gecikme kabul edilebilirse iki platformda da %50 sabit indirim.

Bulut LLM TCO ve fiyat optimizasyonu soyut maliyet görselleştirme

Karar Çerçevesi: Hangi Senaryoda Hangi Platform?

Karar üç eksenden geçer: (1) mevcut bulut yığını, (2) model ekosistem tercihi, (3) compliance & data gravity. Veri büyük ölçüde S3’te ise Bedrock’un network avantajı (egress yok) belirleyicidir; M365 + Azure SQL stack’inde Foundry’nin Copilot entegrasyonu eforu eler.

AWS Bedrock seç: AWS yatırımı >50%; Anthropic Claude öncelikli; data S3/DynamoDB üzerinde; Lambda-tabanlı agent’lar; FedRAMP GovCloud High zorunlu.
Azure AI Foundry seç: OpenAI GPT-4.1 / o3 / GPT-4o mini’ye ihtiyaç; Microsoft 365 + Power Platform; Phi-4 küçük model deploy; PTU sub-second SLA; AutoGen multi-agent.
Multi-cloud al: LiteLLM, OpenLLM abstraction layer (Apache 2.0) ile API’yı tek interface’e indir, modele göre platform seç.
Hibrit / on-prem: Veri çıkamıyorsa NVIDIA NIM (Azure Arc), AWS Outposts, veya self-host (vLLM, TGI) düşün.

Her iki platformun da chatbot UX katmanı (streaming, history, citation rendering) uygulama tarafı eforu gerektirir; platform seçimi UX kalitesini doğrudan belirlemez. Grounding teknikleri iki platformu eşit etkiler. Stack Overflow Developer Survey 2025’e göre kurumsal geliştiricilerin %58’i Azure OpenAI’yi, %29’u Bedrock’u en sık kullandığı platform olarak işaretlemiştir.

Sıkça Sorulan Sorular

Bedrock’tan Azure AI Foundry’ye veya tersi geçiş ne kadar sürer?

API farklılıkları (Converse API vs Chat Completions / Assistants), tool calling şeması, knowledge base entegrasyonu nedeniyle tipik bir kurumsal RAG uygulamasında geçiş 2-6 hafta sürer. LiteLLM gibi abstraction katmanı kullanıldıysa bu süre 3-5 güne iner. Asıl mesai, prompt’ların yeni modele kalibrasyonu ve evaluation suite’in yeniden çalıştırılmasıdır.

Hangi platform daha “güvenli” — Bedrock mü Azure AI Foundry mı?

İkisi de kurumsal-grade güvenlik sunar (HIPAA, SOC 2, ISO 27001, FedRAMP). Fark detaylarda: Bedrock’un IAM tabanlı yetkilendirmesi AWS yığınına entegre ekipler için daha doğal; Azure’un Entra ID + Conditional Access kombinasyonu Microsoft 365 ortamında daha bütüncüldür. Prompt injection’a karşı Guardrails (AWS) ve Prompt Shield + Content Safety (Azure) eşdeğer korumalar sunar.

Türkiye’de hangi bölgeyi seçmeliyim, KVKK uyumu nasıl?

2026 itibarıyla iki platformun da Türkiye’de native bölgesi yoktur. AWS Bedrock için Frankfurt (eu-central-1) veya İrlanda (eu-west-1) en yakın seçeneklerdir. Azure AI Foundry için Sweden Central, West Europe önerilir; ayrıca İsviçre Kuzey bölgesi ek veri rezidansı sağlar. KVKK uyumu için veri işleme sözleşmesi (DPA) ve risk değerlendirmesi tamamlanmalı; verinin yurt dışına çıkışı için açık rıza veya yasal dayanak gereklidir.

Provisioned throughput / PTU ne zaman mantıklı?

Trafiğin öngörülebilir ve >30K istek/gün seviyesinde olduğu durumlarda provisioned/PTU on-demand’a göre %25-40 ucuza gelebilir, üstelik p99 gecikmesi 2-3 kat daha düşüktür. Pilot fazda kalan veya değişken trafikli ürünlerde on-demand makul; canlıya çıkmış SLA’lı servislerde rezervasyon zorunludur. Kullanım ölçümünü 30 gün izleyip sonra commit yapmak doğru çerçevedir.

Open-source model self-host etmeli miyim yoksa managed mı?

vLLM veya TGI ile A100/H100 üzerinde Llama 3.3 70B self-host etmek, sürekli >100 RPS yükte managed’tan ucuza gelir (aylık ~6-8K USD vs 12K). Ancak SRE eforu, model güncellemesi, scaling, model registry yönetimi tipik olarak 2-3 ay startup süresi gerektirir. Pratik öneri: ilk 12 ay managed (Bedrock veya Foundry serverless), trafik PMF sonrası kararlı ise self-host’a kademeli geçiş.

Sonuç

AWS Bedrock ve Azure AI Foundry 2026’da kurumsal LLM tüketiminin iki büyük adresidir; ikisi de production-ready compliance, geniş model katalogu ve olgun agent framework’leri sunar. Karar üç sorunun cevabına bağlıdır: mevcut bulut yığını hangisi, hangi model ailesi (OpenAI mı Anthropic mı) öncelikli, ne kadar reserve commitment yapılabilir. Mini ve reasoning yüklerinde Azure; AWS native agent orkestasyonu ve Claude regional kapsamı Bedrock’u öne çıkarır.

İdeal yaklaşım, soyutlama katmanı (LiteLLM/OpenLLM) ile iki platformu modele göre seçici kullanmaktır — flagship reasoning Azure’dan, low-latency mini Bedrock Nova’dan, EU rezidansı Azure Switzerland North’tan beslenebilir. Bu hibrit yapı, fiyat oynamalarına karşı en esnek savunmadır.

Eğer kurumunuz için bu seçimde ilerlemek, mimari kararı destekleyecek POC ve TCO modeli üretmek istiyorsanız, Ömer Önal danışmanlığı kapsamında bulut LLM platform değerlendirmesi yapıyoruz. Detaylar için iletişim sayfasından ulaşabilirsiniz.

OmerOnal

Yorum (1)

Ömer ÖNAL
Mayıs 16, 2026
Yanıtla

Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.

Our Gallery

Contact Info

AWS Bedrock vs Azure AI Foundry 2026: Platform Karşılaştırma

AWS Bedrock 2026: Platform Mimarisi ve Model Katalogu

Azure AI Foundry 2026: Birleşik Model Platformu

Model Katalogu ve Erişim: Karşılaştırma Tablosu

Fiyat ve Quota Matrisi: Per 1M Token Maliyeti

Performans ve Gecikme Benchmark’ı

Güvenlik, Compliance ve Veri Rezidansı

Fine-Tuning, Distillation ve Model Özelleştirme

Agent Framework’leri: Bedrock Agents vs Azure AI Agent Service

TCO Hesabı: 3 Senaryoda Toplam Maliyet

Karar Çerçevesi: Hangi Senaryoda Hangi Platform?

Sıkça Sorulan Sorular

Bedrock’tan Azure AI Foundry’ye veya tersi geçiş ne kadar sürer?

Hangi platform daha “güvenli” — Bedrock mü Azure AI Foundry mı?

Türkiye’de hangi bölgeyi seçmeliyim, KVKK uyumu nasıl?

Provisioned throughput / PTU ne zaman mantıklı?

Open-source model self-host etmeli miyim yoksa managed mı?

Sonuç

OmerOnal

Federated Learning 2026: Veri Gizliliği Korunan ML Mimarisi (Flower, NVIDIA FLARE, PySyft)

Long Context LLM: 1M+ Token Modellerle Kurumsal Doküman Analizi

Yorum (1)

Ömer ÖNAL

Yorum Yap Yanıtı iptal et

İletişim

Kurumsal

Hizmetlerimiz

Our Gallery

Contact Info

AWS Bedrock vs Azure AI Foundry 2026: Platform Karşılaştırma

AWS Bedrock 2026: Platform Mimarisi ve Model Katalogu

Azure AI Foundry 2026: Birleşik Model Platformu

Model Katalogu ve Erişim: Karşılaştırma Tablosu

Fiyat ve Quota Matrisi: Per 1M Token Maliyeti

Performans ve Gecikme Benchmark’ı

Güvenlik, Compliance ve Veri Rezidansı

Fine-Tuning, Distillation ve Model Özelleştirme

Agent Framework’leri: Bedrock Agents vs Azure AI Agent Service

TCO Hesabı: 3 Senaryoda Toplam Maliyet

Karar Çerçevesi: Hangi Senaryoda Hangi Platform?

Sıkça Sorulan Sorular

Bedrock’tan Azure AI Foundry’ye veya tersi geçiş ne kadar sürer?

Hangi platform daha “güvenli” — Bedrock mü Azure AI Foundry mı?

Türkiye’de hangi bölgeyi seçmeliyim, KVKK uyumu nasıl?

Provisioned throughput / PTU ne zaman mantıklı?

Open-source model self-host etmeli miyim yoksa managed mı?

Sonuç

OmerOnal

Hono vs Fastify vs Elysia 2026: Edge Backend Karar Rehberi

GitHub Actions Self-Hosted Runner 2026: Maliyet Rehberi

İlgili Yazılar

Federated Learning 2026: Veri Gizliliği Korunan ML Mimarisi (Flower, NVIDIA FLARE, PySyft)

Long Context LLM: 1M+ Token Modellerle Kurumsal Doküman Analizi

Yorum (1)

Ömer ÖNAL

Yorum Yap Yanıtı iptal et