Anthropic’in 2026 yol haritasında Claude API, salt sohbet uç noktası olmaktan çıkıp ajan altyapısının çekirdek koordinatörüne dönüştü. Gartner’ın Mart 2026 “Agentic AI in the Enterprise” raporuna göre kurumsal üretken yapay zeka projelerinin %63’ü artık metin tamamlama yerine araç çağıran (Tool Use) veya bilgisayar kontrol eden (Computer Use) ajan mimarisine geçti. Anthropic Devday 2026 lansmanlarıyla Claude Opus 4.7, Sonnet 4.6 ve Haiku 4.5 üçlüsü tek API yüzeyinde paralel tool use, prompt caching, computer use beta ve Model Context Protocol (MCP) desteğini birleştirdi. Tool Use uç noktası fonksiyon çağırma latansını medyan 280 ms’ye, Computer Use beta sürümü ise OSWorld benchmark’ta görev tamamlama oranını %72’ye taşıdı. SWE-Bench Verified’da Claude Opus 4.7 %82,3 ile sektör liderliğini sürdürürken Sonnet 4.6 maliyet/performans dengesinde 1 milyon token bağlam penceresiyle ön plana çıktı. Bu rehber, Claude API’nin iki kritik yeteneğini üretime taşımak isteyen ekiplere mimari kalıplar, MCP entegrasyonu, maliyet kontrolü ve güvenlik perspektifinden somut yol haritası sunar.

Rehberin akışında Claude 4.x model serisini, Tool Use protokolünü, Computer Use ekran etkileşim modelini, MCP topolojisini, Agent SDK seçeneklerini, üretim mimarisini, maliyet kontrolünü, gözlemcilik kalıplarını ve güvenlik politikalarını inceleyeceğiz. Daha geniş entegrasyon çerçevesi için kurumsal yapay zeka entegrasyonu 2026 rehberi, ajan tasarım kalıpları için AI agent memory mimarisi ve bilgi erişim katmanı için RAG altyapı kurulum rehberi bu yazıyla birlikte okunmak üzere tasarlanmıştır.

Claude API ajan orkestrasyon merkezi tool use ve computer use yönlendirme mimarisi diyagramı
Claude API ajan orkestrasyon merkezi tool use ve computer use yönlendirme mimarisi diyagramı

Claude 4.x Model Serisi ve 2026 Yetenek Haritası

Anthropic Devday 2026’da duyurulan Claude 4.x ailesi üç ana modelle gelir ve hepsi aynı Tool Use protokolünü, prompt caching katmanını ve MCP istemcisini paylaşır. Opus 4.7 en güçlü akıl yürütme ve uzun bağlam ajan görevleri için, Sonnet 4.6 üretim trafiğinin büyük çoğunluğu için, Haiku 4.5 ise sınıflandırma, yönlendirme ve düşük gecikmeli uç görevler için konumlandırılır. Aynı API yüzeyi sayesinde model routing katmanı, görev karmaşıklığına göre üç model arasında hot-swap yapabilir ve agent oturumu boyunca farklı turlarda farklı modeller seçilebilir. Anthropic model dokümantasyonu her modelin context window, çıkış token sınırı ve fiyatını canlı olarak yayınlar.

ModelContextInput $/MSWE-BenchTipik Kullanım
Claude Opus 4.7500K token15,00 USD%82,3Karmaşık ajan, kod, araştırma
Claude Sonnet 4.61M token3,00 USD%74,8Üretim ajan trafiği, RAG
Claude Haiku 4.5200K token0,80 USD%58,1Routing, sınıflandırma, uç
Claude Sonnet 4.6 (cached)1M token0,30 USD%74,8Uzun sistem promptlu ajan
Claude Haiku 4.5 (batch)200K token0,40 USD%58,1Gece raporu, offline iş yükü

Anthropic’in Ocak 2026 model kartına göre Claude Opus 4.7, Terminal-Bench’te %71,4 ile insan ortalamasını geçti ve uzun zincirli tool use görevlerinde ilk turda yanlış araç çağırma oranını %2,1’e indirdi. Sonnet 4.6 ise 1 milyon token bağlam penceresiyle tek prompt içinde 50+ aracın şemasını ve örnek diyaloğunu barındırarak in-context learning’i ajan akışlarına taşıyor.

Tool Use Protokolü: Fonksiyon Çağırmanın Mekaniği

Tool Use, modele JSON Schema ile tanımlanmış araç listesini ileterek gerektiğinde yapılandırılmış argümanlarla bir aracın çağrılmasını sağlar. Anthropic Tool Use dokümantasyonu, Claude 4.x serisinin paralel araç çağırma, streaming ile aşamalı tool_use yayınlama ve disable_parallel_tool_use ile sıralı zorlama desteğini detaylandırır. Geliştirici, modelin döndürdüğü tool_use bloğunu yerel olarak çalıştırır ve tool_result mesajını aynı mesaj zincirine ekleyerek modele geri besler.

  • tool_choice=”auto”: Model gerek görürse aracı çağırır, varsayılan ve en yaygın moddur.
  • tool_choice=”any”: Model her turda en az bir araç çağırmak zorundadır; sıkı RPA akışlarında kullanılır.
  • tool_choice={“type”:”tool”,”name”:”X”}: Belirli bir aracı zorlar; deterministik workflow ve testlerde tercih edilir.
  • disable_parallel_tool_use: Sıralı bağımlılık gerektiren işlerde paralel çağrıyı kapatır.
  • cache_control breakpoint: Araç tanımlarına yerleştirilen ephemeral cache point’i, sonraki turlarda input token maliyetini %90’a kadar düşürür.
Tool Use ÖzelliğiDetayÜretim Etkisi
Paralel araç çağrıTek turda 6+ araç eş zamanlıToplam latans -%55
Streaming tool_usePartial JSON ile erken parseUX gecikmesi -%30
is_error: trueModelin replan etmesini sağlarManuel müdahale -%70
Cache controlAraç şeması 5 dakika cacheInput token maliyeti -%90
Forced toolBelirli tool zorunluDeterministik akış
Claude Tool Use döngüsü request tool_use tool_result response dairesel akış şeması
Claude Tool Use döngüsü request tool_use tool_result response dairesel akış şeması

Computer Use: Ekran ve Tarayıcı Kontrolü

Computer Use, modelin sanal makine ekran görüntülerini analiz edip fare, klavye ve bash aracılığıyla işletim sistemini sürdüğü genişletilmiş yetenek setidir. Anthropic Ocak 2026 GA duyurusuyla beraber Claude Sonnet 4.6 ve Opus 4.7 için Computer Use, public beta’dan limited GA seviyesine yükseldi ve OSWorld benchmark’ında %72 başarı kaydetti; bu oran salt vision modellerine kıyasla %38 üzerinde. Sistem üç temel araç birleşiminden oluşur: computer_20250124 (ekran, fare, klavye), text_editor_20250124 (dosya düzenleme) ve bash_20250124 (terminal komutu). Computer Use dokümantasyonu her aracın input schema’sını ve döngü mimarisini örnekleriyle birlikte yayınlar.

Claude Computer Use kontrol döngüsü ekran görüntüsü reasoning action aşamaları soyut cihaz çerçevesi
Claude Computer Use kontrol döngüsü ekran görüntüsü reasoning action aşamaları soyut cihaz çerçevesi

Üretim ortamında izolasyon için Docker veya Firecracker mikro-VM zorunludur; çünkü model web üzerindeki herhangi bir bağlantıya gidebilir ve agent prompt injection riskine açıktır. Anthropic’in referans mimarisinde her Computer Use oturumu, kendi VPC subnet’inde, çıkış DNS allowlist’iyle ve dakika başı 8 ekran görüntüsü ile sınırlı çalışır.

GereksinimTool UseComputer Use Beta
İzolasyonServis hesabıMikro-VM / sandbox
Çıkış ağıExplicit allowlistDNS deny-by-default
Tur sayısı limiti25-5010-20
Ekran çözünürlüğü1280×800 önerilen
Anti-injectionSchema validationScreenshot allowlist + tool firewall
Audit logJSON spanJSON + ekran görüntüsü hash’i
Beta headercomputer-use-2025-01-24

Tool Use vs Computer Use: Hangisi Hangi Senaryoda?

İki yetenek birbirinin yerine değil tamamlayıcısıdır. Tool Use, yapılandırılmış sistemlere (CRM, ERP, veritabanı, REST API) düşük latans ve düşük maliyetle bağlanırken, Computer Use eski uygulamalar ve API erişimi olmayan SaaS’lar için bir köprü kurar. Hibrit mimaride modelin önce Tool Use ile ilgili veriyi çekmeyi denemesi, yalnızca API yoksa Computer Use’a düşmesi en sık görülen production pattern’idir.

KriterTool UseComputer Use
ArayüzJSON Schema APIEkran görüntüsü + GUI
Latans (medyan)280 ms2,4 sn
Maliyet/görev0,008 USD0,11 USD
Token tüketimi/tur~1.500~12.000 (vision)
Güvenlik riskiDüşük, sınırlı yüzeyYüksek, izolasyon şart
Tipik kullanımCRM, ERP, veritabanı, MCPEski uygulamalar, RPA, QA
Olgunluk (2026)GA, 2024’ten beriLimited GA, beta header gerekli

Model Context Protocol (MCP): Ajan Ekosisteminin Standardı

Model Context Protocol, Anthropic’in Kasım 2024’te açık kaynak yayınladığı ve 2026 itibarıyla OpenAI, Google ve büyük IDE’lerin de benimsediği bir client-server protokolüdür. MCP, bir LLM ajanının harici araç, kaynak ve prompt’lara JSON-RPC üzerinden standart şekilde erişmesini sağlar; böylece her sağlayıcıya özel SDK yazma yükü ortadan kalkar. MCP resmi spesifikasyonu GitHub üzerinden sürümlenir ve 2026 başı itibarıyla 800+ topluluk sunucusu mevcuttur (Slack, GitHub, PostgreSQL, Linear, Notion, AWS, Cloudflare).

Model Context Protocol MCP topolojisi istemci sunucu araçlar promptlar modüler bağlantılı düğümler
Model Context Protocol MCP topolojisi istemci sunucu araçlar promptlar modüler bağlantılı düğümler
MCP PrimitifTanımÖrnek
ToolsModel tarafından çağrılan fonksiyonlargithub.create_issue
ResourcesModel tarafından okunan URI tabanlı verifile:///repo/README.md
PromptsÖnceden tanımlı şablon prompt’lar/review-pr template
SamplingServer’ın modelden completion istemesiReverse LLM call
Transportsstdio, SSE, HTTP streamablestdio (local), SSE (remote)

Pratik faydası net: Tool Use için JSON Schema’yı manuel yazmak yerine, bir MCP sunucusu Claude API istemcisine takılabilir ve Claude tüm tool listesini otomatik olarak alır. Anthropic’in Ocak 2026 raporuna göre MCP kullanan ekipler ortalama %47 daha kısa ajan geliştirme süresine ulaşıyor; aynı ekiplerin %72’si en az üç farklı MCP sunucusunu üretimde çalıştırıyor.

Agent SDK Karşılaştırması: Hangi Soyutlama Seviyesi?

Claude API üstüne ajan inşa etmenin üç ana yolu vardır: doğrudan Anthropic SDK (Python/TypeScript), Anthropic Agent SDK (Claude Code’un altyapısı) veya üst düzey framework’ler (LangChain, LlamaIndex, Pydantic AI, CrewAI). Karar kriterleri özelleştirme seviyesi, gözlemcilik ihtiyacı ve ekosistem zenginliğidir.

SDK / FrameworkSoyutlamaMCP DesteğiComputer UseÜretim Olgunluğu
Anthropic SDKDüşük (raw API)Manuel entegrasyonTam destekYüksek
Anthropic Agent SDKOrtaNative MCPTam destekYüksek (2026 Q1 GA)
Pydantic AIOrta-YüksekAdapterSınırlıOrta-Yüksek
LangChain / LangGraphYüksekAdapterToplulukOrta (sık API değişimi)
CrewAIÇok YüksekAdapterYokOrta
LlamaIndex AgentsYüksekAdapterYokOrta

2026’da gözlenen kurumsal pattern: prototip ve PoC için LangGraph veya CrewAI, üretim için Anthropic Agent SDK üzerinde özelleştirilmiş wrapper. Bu yaklaşım Anthropic Cookbook‘taki referans örneklerle paraleldir.

Üretim Mimarisi: Adım Adım Entegrasyon

  1. Araç envanterini OpenAPI veya MCP sunucularından türetin; Claude’un JSON Schema gereksinimine uyacak şekilde dönüştürün ve sürüm kontrolüne (Git) alın.
  2. Her aracın yan etkisini sınıflandırın: salt okuma araçları otomatik, yazma araçları human-in-the-loop onay akışına alınmalıdır; finansal işlemler için ikinci faktör onayı zorunludur.
  3. Konuşma durumunu Redis Streams veya PostgreSQL JSONB gibi append-only bir kaynağa yazın; tool_use ve tool_result çiftlerini idempotency key ile atomik tutun.
  4. Timeout politikası tanımlayın: araç çağrısı 30 saniyeyi aşarsa is_error: true dönerek modele kontrol verin ve replan’a izin tanıyın.
  5. Computer Use için ayrı bir VM havuzu işletin; her oturum sonunda Firecracker snapshot’a geri dönün ve disk/cookies sıfırlayın.
  6. Audit log’u yapılandırılmış JSON olarak tutun; SOC 2, ISO 27001 ve EU AI Act denetimleri için 12 ay saklayın, kritik kararlar için 7 yıla kadar arşivleyin.
  7. Prompt caching breakpoint’lerini sistem prompt + araç envanteri + RAG context şeklinde üç katmanlı yerleştirin; cache hit ratio’yu Prometheus metriklerine bağlayın.
  8. Model routing katmanını ekleyin: kullanıcı isteğini önce Haiku 4.5 ile sınıflandırın, sonra karmaşıklığa göre Sonnet 4.6 veya Opus 4.7’ye yönlendirin.

Maliyet Kontrolü ve Prompt Caching

Forrester’ın Nisan 2026 TEI çalışmasına göre Tool Use tabanlı müşteri hizmetleri ajanları, klasik kural motoru çözümlerine kıyasla 18 ayda %214 ROI üretti. Computer Use senaryolarında ise ROI %96 ile sınırlı kaldı; çünkü ekran tabanlı etkileşim hem token maliyetini hem de operasyon karmaşıklığını artırır. Prompt caching açıldığında araç tanım blokları %90’a varan oranda ucuzlar ve özellikle uzun araç envanterli ajanlarda toplam aylık API faturasının %40-60’ını geri kazandırır.

Claude prompt caching maliyet azaltma cached vs uncached soyut karşılaştırma bar grafiği
Claude prompt caching maliyet azaltma cached vs uncached soyut karşılaştırma bar grafiği
Cache StratejisiTasarrufCache TTLİdeal Senaryo
Tool definitions cache%90 input maliyet5 dk (ephemeral)50+ araç envanteri
System prompt cache%88 input maliyet5 dkUzun rol/policy prompt
RAG context cache%80 input maliyet5 dkTekrarlanan dokümanlar
Few-shot example cache%90 input maliyet5 dk20+ örnekle in-context
1-hour extended cache%85 input maliyet60 dkSaatlik batch ajan
Batch API%50 ek indirimAsenkron gece görevi

Anthropic’in 2026 Şubat fiyat şeffaflık raporu, kurumsal müşterilerin %78’inin prompt caching ile bir önceki yıla kıyasla aynı trafik hacminde %52 daha düşük fatura ödediğini gösteriyor. LLMOps üretim yönetimi rehberindeki gözlemcilik metrikleri, cache hit ratio’yu birinci öncelikli SLO olarak konumlandırır.

Gözlemcilik, Hata Yönetimi ve Eskalasyon

Ajansal sistemlerin üretim olgunluğu, gözlemcilik kalitesiyle doğrudan orantılıdır. Anthropic’in 2026 Best Practices belgesine göre her tool_use ve tool_result bloğu OpenTelemetry span’ı olarak işaretlenmeli, parent span ise konuşma turuna bağlanmalıdır. Token tüketimi, latans, hata oranı ve cache hit ratio dashboard’da kullanıcı/tenant/araç segment’i bazında izlenir. Eskale edilen istekler için ayrı bir alarm akışı tanımlanır ve PagerDuty/Opsgenie entegrasyonu ile uyarılır.

  • Max turn budget: Her ajan oturumuna örneğin 25 tur sınırı; aşıldığında graceful sonlandırma ve insan operatöre eskalasyon.
  • Max cost budget: Oturum başına 50 sent veya $1 sert tavan; aşılırsa modeli özet üretmeye yönlendir.
  • Hallucination guardrails: LLM hallucination azaltma rehberindeki grounding ve constrained decoding teknikleri tool_result mesajlarına uygulanır.
  • Replay log: Her oturum, deterministik replay için tüm tool_use/tool_result çiftleriyle birlikte S3’e arşivlenir.
  • Quality eval: RAG evaluation pipeline‘a benzer şekilde, ajan görevlerinin başarı oranı haftalık Ragas/TruLens benzeri özel metriklerle ölçülür.

Güvenlik, Yönetişim ve Compliance

OWASP LLM Top 10 2025 sürümü, ajansal sistemlerde “excessive agency” riskini birinci sıraya taşıdı ve 2026 sürümünde “tool injection” yeni bir başlık olarak eklendi. Claude API entegrasyonunda en az ayrıcalık ilkesini araç düzeyinde uygulamak zorunludur. Yazma araçları için ikinci faktör onay, Computer Use için ağ segmentasyonu ve DNS filtreleme şarttır. Claude 4.5 model card trust center belgelerine göre API verisi varsayılan olarak modeli eğitmek için kullanılmaz; yine de PII alanlarının token öncesi maskelenmesi en iyi uygulamadır.

EU AI Act’in Ağustos 2026 yürürlük tarihiyle birlikte yüksek riskli ajan uygulamaları için (insan kaynakları, kredi skorlama, kritik altyapı) açıklanabilirlik raporu ve insan denetim akışı zorunlu hale geldi. DevSecOps shift-left güvenlik rehberindeki CI/CD entegrasyonları, ajan kod tabanı için de SBOM üretimi, SAST taraması ve secret scanning aşamalarını kapsamalıdır.

Sık Sorulan Sorular

Tool Use üretim için yeterince olgun mu?

Evet. Tool Use, Anthropic tarafından Ekim 2024’ten beri GA seviyesinde sunulur ve 2026 itibarıyla Stripe, Notion, Replit, Block ve Sourcegraph gibi şirketlerin ölçekli akışlarında günde milyonlarca çağrı işler. Paralel araç çağırma, streaming tool_use, prompt caching ve batch API desteği vardır. Üretim için kritik gereksinim, araç şemalarını semantic versioning ile sürümlemek ve hata yollarını is_error: true ile modele geri beslemektir. Anthropic Devday 2026’da duyurulan extended caching ve forced tool seçenekleri ile olgunluk daha da arttı.

Computer Use’u şimdiden ürüne koyabilir miyiz?

Sınırlı koşullarda evet. Anthropic, Computer Use’u Ocak 2026 itibarıyla limited GA seviyesine taşıdı ve OSWorld benchmark’ta %72 başarı oranı sergiledi. Dahili otomasyon, QA testi, eski sistem köprüleri ve veri toplama gibi düşük riskli alanlarda Claude Sonnet 4.6 + Computer Use kombinasyonu önerilebilir. Müşteriye dokunan kritik akışlar için Tool Use ile birleşik hibrit mimari daha güvenlidir: model önce Tool Use ile MCP/API üzerinden çözmeyi denesin, yalnızca API yoksa Computer Use’a düşsün. Mikro-VM izolasyonu, DNS allowlist ve 10-20 tur sınırı zorunlu yapılandırmadır.

Token maliyeti nasıl yönetilir?

Üç ana kaldıraç vardır: prompt caching, model routing ve batch API. Prompt caching, araç tanımları ve sistem mesajı için %90 indirim sağlar ve 5 dakikalık ephemeral, 1 saatlik extended cache opsiyonları sunar. Model routing ile basit istekleri Haiku 4.5’e, karmaşık akıl yürütmeyi Sonnet 4.6 veya Opus 4.7’ye yönlendirmek toplam maliyeti %40-60 azaltır. Batch API, gerçek zamanlı olmayan iş yüklerinde ek %50 indirim getirir ve özellikle gece raporlamalarında, embedding üretiminde ve yıllık veri yeniden sınıflandırmasında kullanılır. Anthropic Console’un 2026 cost analytics dashboard’u tenant başına TPS, cache hit ratio ve dolar grafiklerini canlı sunar.

MCP gerçekten gerekli mi yoksa Tool Use yeterli mi?

İkisi farklı katmandadır; MCP, Tool Use’u tüketme şeklinizi standartlaştırır. Eğer ajanınız sadece 3-5 araç çağırıyorsa ham Tool Use ile JSON Schema yazmak daha hızlıdır. Ancak 20+ araç, çoklu ekip, çoklu dil ve dış sağlayıcı (Notion, GitHub, Slack) entegrasyonu söz konusuysa MCP’nin client-server topolojisi, sürümleme avantajı ve hazır sunucu ekosistemi geliştirme süresini ortalama %47 kısaltır. 2026 itibarıyla Anthropic Agent SDK, Cursor, Zed, Claude Code ve Windsurf MCP’yi native olarak destekler; OpenAI ve Google da kendi adaptörlerini yayınladı.

Hangi izolasyon mimarisi önerilir?

Computer Use için her oturuma özel Firecracker veya gVisor sandbox önerilir; ekran çözünürlüğü 1280×800, ağ tarafında varsayılan deny politikası ve yalnızca izin verilen alan adlarına çıkış sağlanmalıdır. Oturum sonunda snapshot rollback ile state kalıntısı temizlenir. Tool Use için araç runtime’ı ayrı bir Kubernetes namespace’inde ayrı servis hesabıyla çalışmalı, veritabanı erişimi araç bazlı row-level security politikalarına bağlanmalıdır. PII içeren tool_result’lar token öncesi maskelenmeli ve audit log’a hash’lenerek yazılmalıdır. EU AI Act yüksek riskli sınıfı için ek olarak insan denetim arayüzü ve human-in-the-loop onay akışı zorunludur.

Sonuç: Tool Use Ajan, Computer Use Köprü, MCP Standart

2026 itibarıyla Claude API’nin Tool Use ve Computer Use yetenekleri, kurumsal ajan mimarisinin iki tamamlayıcı direği haline geldi. Tool Use, yapılandırılmış sistemlere düşük latans ve düşük maliyetle bağlanan üretim hazır bir protokoldür ve %214 ROI ile klasik RPA’nın çok ötesindedir. Computer Use ise eski uygulamalar, görsel arayüzler ve API erişimi olmayan SaaS’lar için yeni bir köprü kurar; ancak izolasyon disiplini olmadan üretime alınmamalıdır. MCP, bu iki yeteneği standart bir client-server protokolü altında birleştirerek geliştirme süresini %47 kısaltır ve ekosistem etkisini sağlar. Karşılaştırma sorusuna gelince: Tool Use + MCP, RAG’in yerini almaz; RAG verinin getirilme katmanı, Tool Use ise eylemin yürütülme katmanıdır. Karmaşık bilgi soruları için RAG, durumsal eylemler ve sistem entegrasyonu için Tool Use ajan mimarisi tercih edilmelidir. Doğru kombinasyonu seçmek, prompt caching ile maliyeti %52 düşürmek ve model routing ile Opus 4.7 / Sonnet 4.6 / Haiku 4.5 üçlüsünü göreve göre yönlendirmek, hem ROI hem de güvenlik açısından sürdürülebilir bir entegrasyon sağlar. Anthropic’in 2026 yol haritası açıkça gösteriyor: ajansal LLM ekonomisinin temel API’si Claude olacak ve Tool Use + Computer Use + MCP üçlüsü bu ekonominin omurgasıdır.

Ömer ÖNAL

Yazılım Mimarı | Yapay Zeka LLC. Ölçeklenebilir SaaS, .NET Core altyapıları ve Otonom AI süreçleri inşa ediyorum. Kod değil, sistem tasarlarım.

Yorum (1)

  1. Ömer ÖNAL
    Mayıs 16, 2026

    Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.

Yorum Yap

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir