Bir geliştirici olarak son birkaç haftada işinizin tanımı sessizce değişti. Yapay zekaya artık “bana bir fonksiyon yaz” demiyorsunuz; “git şu görevi baştan sona kendin hallet” diyorsunuz. Mayıs sonu ve Haziran 2026’nın başı, bu geçişin araçlarının aynı anda geliştiricinin eline geçtiği nadir bir dönem oldu. Google, Anthropic ve Microsoft neredeyse art arda, “ajan inşa etmeyi” haftalarca süren bir mühendislik projesi olmaktan çıkarıp tek bir API çağrısına indiren hamleler yaptı.
Bu yazıda, 5 Haziran 2026 itibarıyla geliştiricinin gündemindeki bu “ajan inşa dalgasını” somut rakamlar ve resmi duyurularla ele alıyorum: Google’ın Managed Agents’ı ve Gemini 3.5 Flash’ı, Anthropic’in Claude Opus 4.8’i ve bu rekabetin sizin için ne anlama geldiği. Tarihleri olduğu gibi veriyorum — çünkü bu trendin gücü, ne kadar yeni olduğunda.

Kırılma Noktası: “Ajan İnşa Etmek” Tek API Çağrısına İndi
Geçtiğimiz yıla kadar otonom bir AI ajanı kurmak ciddi bir altyapı işiydi: izole bir sandbox ayağa kaldırmak, bir “harness” (ajanın muhakeme-eylem döngüsünü yöneten katman) yazmak, tool orkestrasyonunu kurmak, güvenli bir çalışma ortamı sağlamak. Bu, küçük ekipler için haftalar, bazen aylar demekti.
20 Mayıs 2026’da Google I/O’da duyurulan Managed Agents bu denklemi tersine çevirdi. Google’ın resmi duyurusuna göre, Gemini API’ye yapılan tek bir çağrı, “ajanın muhakeme yapıp plan kurabileceği, harness kullanarak tool çağırabileceği, izole bir sandbox’ta kod çalıştırıp dosya yönetebileceği ve canlı veri çekmek için web’de gezinebileceği uzak bir Linux ortamı sağlıyor.” Yani daha önce sizin kuracağınız tüm o altyapı, artık çağrının kendisinde geliyor.
Bu küçük bir kolaylık değil, bariyerin çöküşü. Bir ajanı “denemenin” maliyeti neredeyse sıfıra indiğinde, kimlerin ajan inşa ettiği de değişir: artık sadece büyük AI ekipleri değil, tek kişilik girişimler ve KOBİ yazılım takımları da oyunda.
Motor: Gemini 3.5 Flash ve Doğrulanmış Rakamlar
Bu Managed Agents yapısını çalıştıran model Gemini 3.5 Flash — Google’ın deyimiyle “sınır zekâsını eylemle birleştiren yeni serinin ilki.” Pazarlama dilini bir kenara bırakıp Google’ın yayımladığı benchmark sonuçlarına bakalım:
| Benchmark | Gemini 3.5 Flash | Neyi ölçüyor |
|---|---|---|
| Terminal-Bench 2.1 | %76,2 | Terminal/komut satırı görev başarısı |
| MCP Atlas | %83,6 | Model Context Protocol tool kullanımı |
| GDPval-AA | 1656 Elo | Genel agentic yetenek (Elo skoru) |
Google, bu modelin “zorlu kodlama ve agentic benchmark’larda Gemini 3.1 Pro’yu geçtiğini” ve bunu “çoğu sınır modelin yarısından az maliyetle” yaptığını belirtiyor. Model şu an Google Antigravity, Gemini API, Google AI Studio ve Android Studio üzerinden genel kullanıma açık. Bir üst seviye olan Gemini 3.5 Pro ise Sundar Pichai’nin sahnedeki ifadesiyle “önümüzdeki ay” (Haziran 2026) gelecek.

Yalnız Değil: Haziran 2026 Agent Yarışının Üç Cephesi
Google’ın hamlesi tek başına olsa bir haber olurdu; ama aynı pencerede iki büyük rakip de masaya oturdu. 2026’nın bu erken yaz döneminde agent yarışının üç cephesi netleşti:
| Şirket | Hamle | Tarih | Odak |
|---|---|---|---|
| Managed Agents + Gemini 3.5 Flash | 20 May 2026 (I/O) | Tek-çağrı agent altyapısı | |
| Anthropic | Claude Opus 4.8 | 28 May 2026 | Computer-use / tarayıcı-ajanı + uzun-süren iş tutarlılığı |
| Microsoft | MAI-Thinking-1 / MAI-Code-1-Flash | Haz 2026 başı (Build) | Maliyet düşürme + OpenAI bağımlılığını azaltma |
Anthropic’in 28 Mayıs 2026’da duyurduğu Claude Opus 4.8, resmi tanımıyla “kodlama, agentic görevler ve profesyonel işlerde daha güçlü performans ve uzun-süren işleri yürütecek tutarlılık” getiriyor. Özellikle bilgisayar-kullanımı ve tarayıcı-ajanı senaryolarında öne çıkıyor — yani bir ajanın sizin yerinize gerçek bir bilgisayarı kullanması alanında. Bu, Google’ın “altyapıyı verelim” yaklaşımının tamamlayıcısı: Google ortamı sağlıyor, Anthropic o ortamda en iyi “çalışan” modellerden birini sunuyor.
Microsoft cephesinde ise odak biraz farklı. Build konferansında tanıtılan MAI-Thinking-1 (muhakeme) ve MAI-Code-1-Flash (kod üretimi) modelleri, hem maliyet verimliliğine hem de şirketin OpenAI’a olan bağımlılığını azaltmasına oynuyor. Üç dev de aynı yöne koşuyor: otonom, tool kullanan, çok adımlı işleri tamamlayan ajanlar.
Geliştirici İçin Pratik Anlam: Neyi Bugün Yapabilirsiniz?
Bu duyuruların soyut kalmaması için somutlaştıralım. Mayıs-Haziran 2026 dalgasının size verdiği pratik yetenekler:
- Sıfır altyapıyla agent prototipi: Tek API çağrısıyla sandbox’lı, web erişimli, kod çalıştırabilen bir ajan başlatın — kendi sunucunuzu kurmadan.
- Markdown ile özelleştirme: Google’ın yapısı, ajan davranışını
AGENTS.mdveSKILL.mdgibi markdown dosyalarıyla genişletmenize izin veriyor. Yani ajan “becerilerini” kodla değil, dökümanla tanımlıyorsunuz. - Düşük maliyetli ölçek: Frontier modellerin yarısından az maliyetli bir Flash modeliyle, deneyleri ucuza çoğaltabilirsiniz.
- Ücretsiz dağıtım: Google AI Studio, ilk 2 uygulamayı kredi kartı istemeden ücretsiz dağıtıyor — küçük ekipler için giriş bariyeri yok.
- Model seçme özgürlüğü: Aynı agent mimarisini farklı modellerle (Gemini, Claude, MAI) besleyip göreve göre en iyisini seçebilirsiniz.
Kısacası, bir yıl önce “AI ajanı kuralım” demek bir Ar-Ge projesiydi; bugün bir öğleden sonralık iş. Bu hızın yazılım geliştirme süreçlerinizi nasıl dönüştüreceğini şimdiden planlamak akıllıca.

Hangi Model Hangi İş İçin? Pratik Bir Seçim Rehberi
Bu kadar seçenek bir arada gelince, geliştiricinin kafasındaki ilk soru “hangisini kullanayım?” oluyor. Doğru cevap, modelleri rakip değil tamamlayıcı görmekten geçiyor: her işin profili farklı, dolayısıyla en iyi model de göreve göre değişir. Aşağıdaki tablo, Haziran 2026 manzarasında pratik bir başlangıç haritası:
| İş Profili | Önerilen Yaklaşım | Neden |
|---|---|---|
| Hızlı prototip / deneme | Gemini 3.5 Flash + Managed Agents | Tek çağrı altyapı, düşük maliyet, ücretsiz dağıtım |
| Bilgisayar/tarayıcı kullanan ajan | Claude Opus 4.8 | Computer-use ve browser-agent senaryolarında öne çıkıyor |
| Yoğun, uzun-süren kod görevleri | Opus 4.8 / Gemini 3.5 Pro (Haz) | Uzun-ufuk tutarlılık ve kodlama gücü |
| Maliyet-hassas, yüksek hacim | Gemini 3.5 Flash / MAI-Code-1-Flash | Frontier’ın yarısından az maliyet |
| Terminal/DevOps otomasyonu | Gemini 3.5 Flash | Terminal-Bench 2.1’de %76,2 |
Bu tablonun altındaki asıl ilke şu: ajan mimarinizi tek bir modele kilitlemeyin. Managed Agents gibi yapılar sayesinde aynı harness’i farklı modellerle besleyebilirsiniz; bu da hem maliyeti optimize etmenizi hem de bir modelin zayıf olduğu yerde diğerine geçmenizi sağlar. 2026’da rekabet o kadar hızlı ki, bugünün lideri üç ay sonra ikinci sıraya düşebilir — esnek kalmak, en değerli mimari karar.
Bir diğer pratik nokta: benchmark rakamlarına âşık olmayın. Terminal-Bench %76,2 etkileyici bir sayı, ama bu standart bir test ortamında. Sizin gerçek iş yükünüz — kendi kod tabanınız, kendi araçlarınız, kendi kısıtlarınız — bu sayıyı kolayca aşağı çekebilir. Doğru yaklaşım, küçük ama gerçek bir görevle kendi ortamınızda ölçmek; pazarlama slaytındaki Elo skoruna değil, kendi pilotunuzun çıktısına güvenmek.
Madalyonun Diğer Yüzü: Kolaylaşan İnşa, Zorlaşan Güven
Burada dürüst olmak gerekiyor. Tek API çağrısıyla bulutta Linux ortamı, web erişimi ve kod çalıştırma yetkisi veren bir ajan, aynı kolaylıkla ciddi bir saldırı yüzeyi de yaratır. Ajan inşa etmek kolaylaştı; ama o ajana güvenip canlıya almak hiç kolaylaşmadı — aksine sorumluluk arttı.
2026’da agentic sistemlerin bir numaralı güvenlik konusu prompt injection ve aşırı yetkilendirme. OWASP’ın LLM ve agentic uygulamalar için yayımladığı Top 10 listesinde prompt injection birinci sırada; NIST AI Risk Management Framework ise otonom sistemler için tehdit modellemesini zorunlu sayıyor. İzole sandbox, en az yetki ilkesi, tool erişim sınırları ve yüksek etkili eylemlerde insan onayı, artık “iyi olur” değil “şart” kategorisinde.
Burada altını çizmek istediğim bir paradoks var: araç ne kadar güçlüyse, kötüye kullanıldığında verdiği zarar da o kadar büyük. Bir yıl önce bir AI ajanı yapabileceği en kötü şey yanlış bir metin üretmekti; bugün aynı ajan, izinleri yanlış kurgulanmışsa gerçek bir Linux ortamında komut çalıştırabilir, dosya silebilir, dış servislere veri gönderebilir. Yani gücün artışı, hatanın bedelini de doğru orantıda artırdı. Hız size Google, Anthropic ve Microsoft’tan geliyor; disiplin ise hâlâ sizden bekleniyor. Bu konuyu derinlemesine ele aldığım AI ajan güvenliği yaklaşımı, bu dalgaya hazırlanırken iyi bir başlangıç noktası.
Tipik Sorunlar: Bu Dalgaya Atlarken Ekiplerin Yaptığı Hatalar
Yeni araçların heyecanı, sahada tekrar eden birkaç hatayı da beraberinde getiriyor. Danışmanlık verdiğim ekiplerde gözlemlediğim kalıplar:
- “Tek API çağrısı” kolaylığına kapılıp, ajana ihtiyacından çok daha geniş yetki ve tool erişimi vermek.
- Benchmark rakamlarını (Terminal-Bench %76,2 gibi) kendi gerçek iş yüküyle eşitlemek — oysa bunlar standart testler, sizin domaininiz değil.
- Sandbox’ın “izole” olduğuna güvenip web erişimi + kod çalıştırmayı denetimsiz açık bırakmak.
- Maliyet “yarısı” diye lanse edilince, ölçekte token tüketimini hesaplamadan production’a geçmek.
- Model seçimini moda üzerinden yapmak; göreve göre (computer-use için Opus, ucuz-hızlı için Flash) ayrıştırmamak.
- Pilotu doğrudan kritik iş akışına bağlamak; küçük, geri-alınabilir bir kapsamda test etmemek.
Sonuç: Araç Geldi, Strateji Sizden
Mayıs-Haziran 2026, yapay zeka tarihinde “modeli sorgulama” çağından “ajanı çalıştırma” çağına geçişin görünür olduğu an olarak hatırlanacak. Google Managed Agents altyapı bariyerini, Gemini 3.5 Flash maliyet bariyerini, Claude Opus 4.8 ve MAI modelleri ise yetenek bariyerini aynı anda düşürdü. Bir geliştirici ya da teknoloji lideri olarak artık sorunuz “ajan kurabilir miyim?” değil — kurabilirsiniz. Asıl soru: “Hangi işi, hangi yetkiyle, hangi güvenlik kapısıyla bir ajana devredeceğim?”
Araçlar demokratikleşti; fark yaratacak olan, onları nerede ve ne kadar disiplinle kullandığınız olacak. Bu dalgayı izlemekle yetinmeyin — küçük, kontrollü bir pilotla bugün başlayın, ama güvenliği baştan tasarlayarak.
Sıkça Sorulan Sorular
Managed Agents tam olarak ne ve normal API çağrısından farkı ne?
Google I/O 2026’da (20 Mayıs) duyurulan Managed Agents, Gemini API’ye yapılan tek bir çağrının uzak bir Linux ortamı sağladığı bir yapı. Bu ortamda ajan; muhakeme yapıp plan kurabiliyor, tool çağırabiliyor, izole bir sandbox’ta kod çalıştırıp dosya yönetebiliyor ve canlı veri için web’de gezinebiliyor. Normal API çağrısı sadece metin/çıktı dönerken, Managed Agents çalışan bir ortam ayağa kaldırıyor.
Gemini 3.5 Flash hangi konularda öne çıkıyor?
Google’ın açıkladığı benchmark’lara göre Gemini 3.5 Flash, Terminal-Bench 2.1’de %76,2, MCP Atlas’ta %83,6 ve GDPval-AA’da 1656 Elo sonuç veriyor; uzun-ufuklu agentic görevler ve kodlama için tasarlandı. Google, çoğu sınır modelin yarısından az maliyetle çalıştığını belirtiyor.
Claude Opus 4.8 bu tabloda nerede duruyor?
Anthropic, Claude Opus 4.8’i 28 Mayıs 2026’da duyurdu; kodlama, agentic görevler ve profesyonel işlerde daha güçlü performans ve uzun-süren işlerde tutarlılık vurgusuyla. Özellikle bilgisayar-kullanımı ve tarayıcı-ajanı senaryolarında öne çıkan bir model olarak konumlanıyor. Yani Haziran 2026’da Google, Anthropic ve Microsoft aynı anda agent yarışını kızıştırdı.
Bu araçlar küçük bir ekip için pratik mi, yoksa sadece büyük şirketlere mi?
Pratik. İşin özü, eskiden bir agent altyapısı (sandbox, harness, tool orkestrasyonu) kurmak için gereken haftalarca mühendislik emeğinin tek bir API çağrısına inmesi. Google AI Studio’nun ilk 2 uygulamayı kredi kartı istemeden ücretsiz dağıtması gibi adımlar, küçük ekiplerin de bu güce erişmesini sağlıyor. Maliyet bariyeri düştü.
Ajan inşası kolaylaştıysa en büyük risk ne?
Güvenlik ve yetki yönetimi. Tek API çağrısıyla bulutta Linux + web erişimi + kod çalıştırma veren bir ajan, yanlış kurgulandığında ciddi bir saldırı yüzeyi olur. Prompt injection, aşırı yetki ve denetimsiz tool erişimi 2026’nın bir numaralı AI güvenlik konuları. Hız kazanıldı ama en az yetki, sandbox izolasyonu ve insan onayı disiplini hâlâ geliştiricinin sorumluluğunda.










Ömer ÖNAL
Haziran 5, 2026Bu dalganın geliştiriciler için asıl anlamı şu: ajan inşa etmenin maliyeti bir ay içinde çöktü. Eskiden bir agent harness’i kurmak, sandbox ayağa kaldırmak, tool orkestrasyon yazmak haftalar alırdı; şimdi tek bir API çağrısı bunu yapıyor. Ama müşterilerime hep söylediğim bir uyarı var: kolaylaşan şey ‘başlatmak’, zorlaşan şey ‘güvenip canlıya almak’. Tek API çağrısıyla bulutta Linux veren bir ajan, yanlış kurgulandığında tek API çağrısıyla da başınıza iş açar. Hız geldi; disiplin hâlâ sizden bekleniyor.