Anthropic’in 2026 yol haritasında Claude API, salt sohbet uç noktası olmaktan çıkıp ajan altyapısının çekirdek koordinatörüne dönüştü. Gartner’ın Mart 2026 “Agentic AI in the Enterprise” raporuna göre kurumsal üretken yapay zeka projelerinin %63’ü artık metin tamamlama yerine araç çağıran (Tool Use) veya bilgisayar kontrol eden (Computer Use) ajan mimarisine geçti. Anthropic Devday 2026 lansmanlarıyla Claude Opus 4.7, Sonnet 4.6 ve Haiku 4.5 üçlüsü tek API yüzeyinde paralel tool use, prompt caching, computer use beta ve Model Context Protocol (MCP) desteğini birleştirdi. Tool Use uç noktası fonksiyon çağırma latansını medyan 280 ms’ye, Computer Use beta sürümü ise OSWorld benchmark’ta görev tamamlama oranını %72’ye taşıdı. SWE-Bench Verified’da Claude Opus 4.7 %82,3 ile sektör liderliğini sürdürürken Sonnet 4.6 maliyet/performans dengesinde 1 milyon token bağlam penceresiyle ön plana çıktı. Bu rehber, Claude API’nin iki kritik yeteneğini üretime taşımak isteyen ekiplere mimari kalıplar, MCP entegrasyonu, maliyet kontrolü ve güvenlik perspektifinden somut yol haritası sunar.
Rehberin akışında Claude 4.x model serisini, Tool Use protokolünü, Computer Use ekran etkileşim modelini, MCP topolojisini, Agent SDK seçeneklerini, üretim mimarisini, maliyet kontrolünü, gözlemcilik kalıplarını ve güvenlik politikalarını inceleyeceğiz. Daha geniş entegrasyon çerçevesi için kurumsal yapay zeka entegrasyonu 2026 rehberi, ajan tasarım kalıpları için AI agent memory mimarisi ve bilgi erişim katmanı için RAG altyapı kurulum rehberi bu yazıyla birlikte okunmak üzere tasarlanmıştır.
Claude 4.x Model Serisi ve 2026 Yetenek Haritası
Anthropic Devday 2026’da duyurulan Claude 4.x ailesi üç ana modelle gelir ve hepsi aynı Tool Use protokolünü, prompt caching katmanını ve MCP istemcisini paylaşır. Opus 4.7 en güçlü akıl yürütme ve uzun bağlam ajan görevleri için, Sonnet 4.6 üretim trafiğinin büyük çoğunluğu için, Haiku 4.5 ise sınıflandırma, yönlendirme ve düşük gecikmeli uç görevler için konumlandırılır. Aynı API yüzeyi sayesinde model routing katmanı, görev karmaşıklığına göre üç model arasında hot-swap yapabilir ve agent oturumu boyunca farklı turlarda farklı modeller seçilebilir. Anthropic model dokümantasyonu her modelin context window, çıkış token sınırı ve fiyatını canlı olarak yayınlar.
| Model | Context | Input $/M | SWE-Bench | Tipik Kullanım |
|---|---|---|---|---|
| Claude Opus 4.7 | 500K token | 15,00 USD | %82,3 | Karmaşık ajan, kod, araştırma |
| Claude Sonnet 4.6 | 1M token | 3,00 USD | %74,8 | Üretim ajan trafiği, RAG |
| Claude Haiku 4.5 | 200K token | 0,80 USD | %58,1 | Routing, sınıflandırma, uç |
| Claude Sonnet 4.6 (cached) | 1M token | 0,30 USD | %74,8 | Uzun sistem promptlu ajan |
| Claude Haiku 4.5 (batch) | 200K token | 0,40 USD | %58,1 | Gece raporu, offline iş yükü |
Anthropic’in Ocak 2026 model kartına göre Claude Opus 4.7, Terminal-Bench’te %71,4 ile insan ortalamasını geçti ve uzun zincirli tool use görevlerinde ilk turda yanlış araç çağırma oranını %2,1’e indirdi. Sonnet 4.6 ise 1 milyon token bağlam penceresiyle tek prompt içinde 50+ aracın şemasını ve örnek diyaloğunu barındırarak in-context learning’i ajan akışlarına taşıyor.
Tool Use Protokolü: Fonksiyon Çağırmanın Mekaniği
Tool Use, modele JSON Schema ile tanımlanmış araç listesini ileterek gerektiğinde yapılandırılmış argümanlarla bir aracın çağrılmasını sağlar. Anthropic Tool Use dokümantasyonu, Claude 4.x serisinin paralel araç çağırma, streaming ile aşamalı tool_use yayınlama ve disable_parallel_tool_use ile sıralı zorlama desteğini detaylandırır. Geliştirici, modelin döndürdüğü tool_use bloğunu yerel olarak çalıştırır ve tool_result mesajını aynı mesaj zincirine ekleyerek modele geri besler.
- tool_choice=”auto”: Model gerek görürse aracı çağırır, varsayılan ve en yaygın moddur.
- tool_choice=”any”: Model her turda en az bir araç çağırmak zorundadır; sıkı RPA akışlarında kullanılır.
- tool_choice={“type”:”tool”,”name”:”X”}: Belirli bir aracı zorlar; deterministik workflow ve testlerde tercih edilir.
- disable_parallel_tool_use: Sıralı bağımlılık gerektiren işlerde paralel çağrıyı kapatır.
- cache_control breakpoint: Araç tanımlarına yerleştirilen ephemeral cache point’i, sonraki turlarda input token maliyetini %90’a kadar düşürür.
| Tool Use Özelliği | Detay | Üretim Etkisi |
|---|---|---|
| Paralel araç çağrı | Tek turda 6+ araç eş zamanlı | Toplam latans -%55 |
| Streaming tool_use | Partial JSON ile erken parse | UX gecikmesi -%30 |
| is_error: true | Modelin replan etmesini sağlar | Manuel müdahale -%70 |
| Cache control | Araç şeması 5 dakika cache | Input token maliyeti -%90 |
| Forced tool | Belirli tool zorunlu | Deterministik akış |

Computer Use: Ekran ve Tarayıcı Kontrolü
Computer Use, modelin sanal makine ekran görüntülerini analiz edip fare, klavye ve bash aracılığıyla işletim sistemini sürdüğü genişletilmiş yetenek setidir. Anthropic Ocak 2026 GA duyurusuyla beraber Claude Sonnet 4.6 ve Opus 4.7 için Computer Use, public beta’dan limited GA seviyesine yükseldi ve OSWorld benchmark’ında %72 başarı kaydetti; bu oran salt vision modellerine kıyasla %38 üzerinde. Sistem üç temel araç birleşiminden oluşur: computer_20250124 (ekran, fare, klavye), text_editor_20250124 (dosya düzenleme) ve bash_20250124 (terminal komutu). Computer Use dokümantasyonu her aracın input schema’sını ve döngü mimarisini örnekleriyle birlikte yayınlar.

Üretim ortamında izolasyon için Docker veya Firecracker mikro-VM zorunludur; çünkü model web üzerindeki herhangi bir bağlantıya gidebilir ve agent prompt injection riskine açıktır. Anthropic’in referans mimarisinde her Computer Use oturumu, kendi VPC subnet’inde, çıkış DNS allowlist’iyle ve dakika başı 8 ekran görüntüsü ile sınırlı çalışır.
| Gereksinim | Tool Use | Computer Use Beta |
|---|---|---|
| İzolasyon | Servis hesabı | Mikro-VM / sandbox |
| Çıkış ağı | Explicit allowlist | DNS deny-by-default |
| Tur sayısı limiti | 25-50 | 10-20 |
| Ekran çözünürlüğü | — | 1280×800 önerilen |
| Anti-injection | Schema validation | Screenshot allowlist + tool firewall |
| Audit log | JSON span | JSON + ekran görüntüsü hash’i |
| Beta header | — | computer-use-2025-01-24 |
Tool Use vs Computer Use: Hangisi Hangi Senaryoda?
İki yetenek birbirinin yerine değil tamamlayıcısıdır. Tool Use, yapılandırılmış sistemlere (CRM, ERP, veritabanı, REST API) düşük latans ve düşük maliyetle bağlanırken, Computer Use eski uygulamalar ve API erişimi olmayan SaaS’lar için bir köprü kurar. Hibrit mimaride modelin önce Tool Use ile ilgili veriyi çekmeyi denemesi, yalnızca API yoksa Computer Use’a düşmesi en sık görülen production pattern’idir.
| Kriter | Tool Use | Computer Use |
|---|---|---|
| Arayüz | JSON Schema API | Ekran görüntüsü + GUI |
| Latans (medyan) | 280 ms | 2,4 sn |
| Maliyet/görev | 0,008 USD | 0,11 USD |
| Token tüketimi/tur | ~1.500 | ~12.000 (vision) |
| Güvenlik riski | Düşük, sınırlı yüzey | Yüksek, izolasyon şart |
| Tipik kullanım | CRM, ERP, veritabanı, MCP | Eski uygulamalar, RPA, QA |
| Olgunluk (2026) | GA, 2024’ten beri | Limited GA, beta header gerekli |
Model Context Protocol (MCP): Ajan Ekosisteminin Standardı
Model Context Protocol, Anthropic’in Kasım 2024’te açık kaynak yayınladığı ve 2026 itibarıyla OpenAI, Google ve büyük IDE’lerin de benimsediği bir client-server protokolüdür. MCP, bir LLM ajanının harici araç, kaynak ve prompt’lara JSON-RPC üzerinden standart şekilde erişmesini sağlar; böylece her sağlayıcıya özel SDK yazma yükü ortadan kalkar. MCP resmi spesifikasyonu GitHub üzerinden sürümlenir ve 2026 başı itibarıyla 800+ topluluk sunucusu mevcuttur (Slack, GitHub, PostgreSQL, Linear, Notion, AWS, Cloudflare).

| MCP Primitif | Tanım | Örnek |
|---|---|---|
| Tools | Model tarafından çağrılan fonksiyonlar | github.create_issue |
| Resources | Model tarafından okunan URI tabanlı veri | file:///repo/README.md |
| Prompts | Önceden tanımlı şablon prompt’lar | /review-pr template |
| Sampling | Server’ın modelden completion istemesi | Reverse LLM call |
| Transports | stdio, SSE, HTTP streamable | stdio (local), SSE (remote) |
Pratik faydası net: Tool Use için JSON Schema’yı manuel yazmak yerine, bir MCP sunucusu Claude API istemcisine takılabilir ve Claude tüm tool listesini otomatik olarak alır. Anthropic’in Ocak 2026 raporuna göre MCP kullanan ekipler ortalama %47 daha kısa ajan geliştirme süresine ulaşıyor; aynı ekiplerin %72’si en az üç farklı MCP sunucusunu üretimde çalıştırıyor.
Agent SDK Karşılaştırması: Hangi Soyutlama Seviyesi?
Claude API üstüne ajan inşa etmenin üç ana yolu vardır: doğrudan Anthropic SDK (Python/TypeScript), Anthropic Agent SDK (Claude Code’un altyapısı) veya üst düzey framework’ler (LangChain, LlamaIndex, Pydantic AI, CrewAI). Karar kriterleri özelleştirme seviyesi, gözlemcilik ihtiyacı ve ekosistem zenginliğidir.
| SDK / Framework | Soyutlama | MCP Desteği | Computer Use | Üretim Olgunluğu |
|---|---|---|---|---|
| Anthropic SDK | Düşük (raw API) | Manuel entegrasyon | Tam destek | Yüksek |
| Anthropic Agent SDK | Orta | Native MCP | Tam destek | Yüksek (2026 Q1 GA) |
| Pydantic AI | Orta-Yüksek | Adapter | Sınırlı | Orta-Yüksek |
| LangChain / LangGraph | Yüksek | Adapter | Topluluk | Orta (sık API değişimi) |
| CrewAI | Çok Yüksek | Adapter | Yok | Orta |
| LlamaIndex Agents | Yüksek | Adapter | Yok | Orta |
2026’da gözlenen kurumsal pattern: prototip ve PoC için LangGraph veya CrewAI, üretim için Anthropic Agent SDK üzerinde özelleştirilmiş wrapper. Bu yaklaşım Anthropic Cookbook‘taki referans örneklerle paraleldir.
Üretim Mimarisi: Adım Adım Entegrasyon
- Araç envanterini OpenAPI veya MCP sunucularından türetin; Claude’un JSON Schema gereksinimine uyacak şekilde dönüştürün ve sürüm kontrolüne (Git) alın.
- Her aracın yan etkisini sınıflandırın: salt okuma araçları otomatik, yazma araçları human-in-the-loop onay akışına alınmalıdır; finansal işlemler için ikinci faktör onayı zorunludur.
- Konuşma durumunu Redis Streams veya PostgreSQL JSONB gibi append-only bir kaynağa yazın; tool_use ve tool_result çiftlerini idempotency key ile atomik tutun.
- Timeout politikası tanımlayın: araç çağrısı 30 saniyeyi aşarsa
is_error: truedönerek modele kontrol verin ve replan’a izin tanıyın. - Computer Use için ayrı bir VM havuzu işletin; her oturum sonunda Firecracker snapshot’a geri dönün ve disk/cookies sıfırlayın.
- Audit log’u yapılandırılmış JSON olarak tutun; SOC 2, ISO 27001 ve EU AI Act denetimleri için 12 ay saklayın, kritik kararlar için 7 yıla kadar arşivleyin.
- Prompt caching breakpoint’lerini sistem prompt + araç envanteri + RAG context şeklinde üç katmanlı yerleştirin; cache hit ratio’yu Prometheus metriklerine bağlayın.
- Model routing katmanını ekleyin: kullanıcı isteğini önce Haiku 4.5 ile sınıflandırın, sonra karmaşıklığa göre Sonnet 4.6 veya Opus 4.7’ye yönlendirin.
Maliyet Kontrolü ve Prompt Caching
Forrester’ın Nisan 2026 TEI çalışmasına göre Tool Use tabanlı müşteri hizmetleri ajanları, klasik kural motoru çözümlerine kıyasla 18 ayda %214 ROI üretti. Computer Use senaryolarında ise ROI %96 ile sınırlı kaldı; çünkü ekran tabanlı etkileşim hem token maliyetini hem de operasyon karmaşıklığını artırır. Prompt caching açıldığında araç tanım blokları %90’a varan oranda ucuzlar ve özellikle uzun araç envanterli ajanlarda toplam aylık API faturasının %40-60’ını geri kazandırır.

| Cache Stratejisi | Tasarruf | Cache TTL | İdeal Senaryo |
|---|---|---|---|
| Tool definitions cache | %90 input maliyet | 5 dk (ephemeral) | 50+ araç envanteri |
| System prompt cache | %88 input maliyet | 5 dk | Uzun rol/policy prompt |
| RAG context cache | %80 input maliyet | 5 dk | Tekrarlanan dokümanlar |
| Few-shot example cache | %90 input maliyet | 5 dk | 20+ örnekle in-context |
| 1-hour extended cache | %85 input maliyet | 60 dk | Saatlik batch ajan |
| Batch API | %50 ek indirim | — | Asenkron gece görevi |
Anthropic’in 2026 Şubat fiyat şeffaflık raporu, kurumsal müşterilerin %78’inin prompt caching ile bir önceki yıla kıyasla aynı trafik hacminde %52 daha düşük fatura ödediğini gösteriyor. LLMOps üretim yönetimi rehberindeki gözlemcilik metrikleri, cache hit ratio’yu birinci öncelikli SLO olarak konumlandırır.
Gözlemcilik, Hata Yönetimi ve Eskalasyon
Ajansal sistemlerin üretim olgunluğu, gözlemcilik kalitesiyle doğrudan orantılıdır. Anthropic’in 2026 Best Practices belgesine göre her tool_use ve tool_result bloğu OpenTelemetry span’ı olarak işaretlenmeli, parent span ise konuşma turuna bağlanmalıdır. Token tüketimi, latans, hata oranı ve cache hit ratio dashboard’da kullanıcı/tenant/araç segment’i bazında izlenir. Eskale edilen istekler için ayrı bir alarm akışı tanımlanır ve PagerDuty/Opsgenie entegrasyonu ile uyarılır.
- Max turn budget: Her ajan oturumuna örneğin 25 tur sınırı; aşıldığında graceful sonlandırma ve insan operatöre eskalasyon.
- Max cost budget: Oturum başına 50 sent veya $1 sert tavan; aşılırsa modeli özet üretmeye yönlendir.
- Hallucination guardrails: LLM hallucination azaltma rehberindeki grounding ve constrained decoding teknikleri tool_result mesajlarına uygulanır.
- Replay log: Her oturum, deterministik replay için tüm tool_use/tool_result çiftleriyle birlikte S3’e arşivlenir.
- Quality eval: RAG evaluation pipeline‘a benzer şekilde, ajan görevlerinin başarı oranı haftalık Ragas/TruLens benzeri özel metriklerle ölçülür.
Güvenlik, Yönetişim ve Compliance
OWASP LLM Top 10 2025 sürümü, ajansal sistemlerde “excessive agency” riskini birinci sıraya taşıdı ve 2026 sürümünde “tool injection” yeni bir başlık olarak eklendi. Claude API entegrasyonunda en az ayrıcalık ilkesini araç düzeyinde uygulamak zorunludur. Yazma araçları için ikinci faktör onay, Computer Use için ağ segmentasyonu ve DNS filtreleme şarttır. Claude 4.5 model card trust center belgelerine göre API verisi varsayılan olarak modeli eğitmek için kullanılmaz; yine de PII alanlarının token öncesi maskelenmesi en iyi uygulamadır.
EU AI Act’in Ağustos 2026 yürürlük tarihiyle birlikte yüksek riskli ajan uygulamaları için (insan kaynakları, kredi skorlama, kritik altyapı) açıklanabilirlik raporu ve insan denetim akışı zorunlu hale geldi. DevSecOps shift-left güvenlik rehberindeki CI/CD entegrasyonları, ajan kod tabanı için de SBOM üretimi, SAST taraması ve secret scanning aşamalarını kapsamalıdır.
Sık Sorulan Sorular
Tool Use üretim için yeterince olgun mu?
Evet. Tool Use, Anthropic tarafından Ekim 2024’ten beri GA seviyesinde sunulur ve 2026 itibarıyla Stripe, Notion, Replit, Block ve Sourcegraph gibi şirketlerin ölçekli akışlarında günde milyonlarca çağrı işler. Paralel araç çağırma, streaming tool_use, prompt caching ve batch API desteği vardır. Üretim için kritik gereksinim, araç şemalarını semantic versioning ile sürümlemek ve hata yollarını is_error: true ile modele geri beslemektir. Anthropic Devday 2026’da duyurulan extended caching ve forced tool seçenekleri ile olgunluk daha da arttı.
Computer Use’u şimdiden ürüne koyabilir miyiz?
Sınırlı koşullarda evet. Anthropic, Computer Use’u Ocak 2026 itibarıyla limited GA seviyesine taşıdı ve OSWorld benchmark’ta %72 başarı oranı sergiledi. Dahili otomasyon, QA testi, eski sistem köprüleri ve veri toplama gibi düşük riskli alanlarda Claude Sonnet 4.6 + Computer Use kombinasyonu önerilebilir. Müşteriye dokunan kritik akışlar için Tool Use ile birleşik hibrit mimari daha güvenlidir: model önce Tool Use ile MCP/API üzerinden çözmeyi denesin, yalnızca API yoksa Computer Use’a düşsün. Mikro-VM izolasyonu, DNS allowlist ve 10-20 tur sınırı zorunlu yapılandırmadır.
Token maliyeti nasıl yönetilir?
Üç ana kaldıraç vardır: prompt caching, model routing ve batch API. Prompt caching, araç tanımları ve sistem mesajı için %90 indirim sağlar ve 5 dakikalık ephemeral, 1 saatlik extended cache opsiyonları sunar. Model routing ile basit istekleri Haiku 4.5’e, karmaşık akıl yürütmeyi Sonnet 4.6 veya Opus 4.7’ye yönlendirmek toplam maliyeti %40-60 azaltır. Batch API, gerçek zamanlı olmayan iş yüklerinde ek %50 indirim getirir ve özellikle gece raporlamalarında, embedding üretiminde ve yıllık veri yeniden sınıflandırmasında kullanılır. Anthropic Console’un 2026 cost analytics dashboard’u tenant başına TPS, cache hit ratio ve dolar grafiklerini canlı sunar.
MCP gerçekten gerekli mi yoksa Tool Use yeterli mi?
İkisi farklı katmandadır; MCP, Tool Use’u tüketme şeklinizi standartlaştırır. Eğer ajanınız sadece 3-5 araç çağırıyorsa ham Tool Use ile JSON Schema yazmak daha hızlıdır. Ancak 20+ araç, çoklu ekip, çoklu dil ve dış sağlayıcı (Notion, GitHub, Slack) entegrasyonu söz konusuysa MCP’nin client-server topolojisi, sürümleme avantajı ve hazır sunucu ekosistemi geliştirme süresini ortalama %47 kısaltır. 2026 itibarıyla Anthropic Agent SDK, Cursor, Zed, Claude Code ve Windsurf MCP’yi native olarak destekler; OpenAI ve Google da kendi adaptörlerini yayınladı.
Hangi izolasyon mimarisi önerilir?
Computer Use için her oturuma özel Firecracker veya gVisor sandbox önerilir; ekran çözünürlüğü 1280×800, ağ tarafında varsayılan deny politikası ve yalnızca izin verilen alan adlarına çıkış sağlanmalıdır. Oturum sonunda snapshot rollback ile state kalıntısı temizlenir. Tool Use için araç runtime’ı ayrı bir Kubernetes namespace’inde ayrı servis hesabıyla çalışmalı, veritabanı erişimi araç bazlı row-level security politikalarına bağlanmalıdır. PII içeren tool_result’lar token öncesi maskelenmeli ve audit log’a hash’lenerek yazılmalıdır. EU AI Act yüksek riskli sınıfı için ek olarak insan denetim arayüzü ve human-in-the-loop onay akışı zorunludur.
Sonuç: Tool Use Ajan, Computer Use Köprü, MCP Standart
2026 itibarıyla Claude API’nin Tool Use ve Computer Use yetenekleri, kurumsal ajan mimarisinin iki tamamlayıcı direği haline geldi. Tool Use, yapılandırılmış sistemlere düşük latans ve düşük maliyetle bağlanan üretim hazır bir protokoldür ve %214 ROI ile klasik RPA’nın çok ötesindedir. Computer Use ise eski uygulamalar, görsel arayüzler ve API erişimi olmayan SaaS’lar için yeni bir köprü kurar; ancak izolasyon disiplini olmadan üretime alınmamalıdır. MCP, bu iki yeteneği standart bir client-server protokolü altında birleştirerek geliştirme süresini %47 kısaltır ve ekosistem etkisini sağlar. Karşılaştırma sorusuna gelince: Tool Use + MCP, RAG’in yerini almaz; RAG verinin getirilme katmanı, Tool Use ise eylemin yürütülme katmanıdır. Karmaşık bilgi soruları için RAG, durumsal eylemler ve sistem entegrasyonu için Tool Use ajan mimarisi tercih edilmelidir. Doğru kombinasyonu seçmek, prompt caching ile maliyeti %52 düşürmek ve model routing ile Opus 4.7 / Sonnet 4.6 / Haiku 4.5 üçlüsünü göreve göre yönlendirmek, hem ROI hem de güvenlik açısından sürdürülebilir bir entegrasyon sağlar. Anthropic’in 2026 yol haritası açıkça gösteriyor: ajansal LLM ekonomisinin temel API’si Claude olacak ve Tool Use + Computer Use + MCP üçlüsü bu ekonominin omurgasıdır.










Ömer ÖNAL
Mayıs 16, 2026Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.