tinygrad, MLX ve Micrograd 2026: Eğitsel Deep Learning Framework

tinygrad nedir sorusunun 2026 itibarıyla pratik cevabı: George Hotz tarafından başlatılan, ~10.000 satır Python ile autograd, tensor, scheduler ve çoklu donanım backend’i (CUDA, Metal, AMD, Qualcomm) sunan minimalist bir deep learning framework. PyTorch’un (~3 milyon satır C++/CUDA) ve TensorFlow’un (~3,5 milyon satır) ardındaki devasa kod tabanından bağımsız olarak, tinygrad eğitsel okunabilirlik ile production-grade donanım hızlandırma arasında köprü kurmayı hedefler. tinygrad 0.10 sürümü (Şubat 2026) yaklaşık 28.500 GitHub yıldızı, 3.200 fork ve 380 katkıcı ile topluluk büyüklüğünde MLX’in arkasında, micrograd’ın ise çok ötesindedir. Bu yazı tinygrad, Apple’ın MLX’i (2026 sürüm 0.21) ve Karpathy’nin micrograd’ını (yaklaşık 200 satır) yan yana koyarak hangi framework’ün hangi öğrenme/araştırma/edge inference senaryosunda mantıklı olduğunu gerçek rakamlarla çerçevelendiriyor.

Eğitsel deep learning framework’leri 2024-2026 döneminde yeniden popülerleşti çünkü PyTorch 2.6’nın torch.compile + Inductor + Triton katmanları artık tek bir geliştiricinin baştan sona okuyabileceği boyutu aştı. Stack Overflow Developer Survey 2025 raporuna göre ML geliştiricilerin yaklaşık %42’si “framework iç işleyişini anlamak için minimal alternatif arıyorum” maddesini işaretledi. tinygrad bu açığı line-of-code disiplini ile, MLX Apple Silicon unified memory’sini sömürerek, micrograd ise tek dosyada autograd matematiğini öğreterek doldurur. Üçü de production’da PyTorch’un yerini almaz; ama framework okuryazarlığı, edge inference ve M-serisi Mac üretim hattı senaryolarında ciddi rol oynarlar.

tinygrad nedir, ne değildir: 2026 itibarıyla kapsam

tinygrad, tinycorp şirketi (Hotz’un kurduğu) tarafından sürdürülen, MIT lisanslı, “10.000 satırı geçmeyecek” sözüyle yazılmış bir Python framework’üdür. Çekirdeği tensor.py, ops.py, codegen/ ve donanıma özel runtime/ dosyalarından oluşur. Lazy execution modeli vardır: işlemler hemen yürütülmez, bir DAG’da biriktirilir, realize() çağrısında schedule + codegen + dispatch zincirinden geçer. Bu yaklaşım PyTorch’un torch.compile mantığına benzer ama 10.000 satırın altında uygulanır.

tinygrad’ın hedeflediği üç senaryo nettir. Birincisi, framework’ün her satırını okuyup tensor compiler’ı içselleştirmek isteyen araştırmacı/öğrenci. İkincisi, tinycorp’un sattığı tinybox (sekiz adet AMD MI300X veya RTX 4090 + 32 vCPU + 1TB RAM, yaklaşık 25.000 USD) gibi alışılmadık donanım kombinasyonlarında çalışan production cluster. Üçüncüsü, Qualcomm SoC, AMD ROCm 6.4 veya Apple Metal üzerinde PyTorch’un native desteklemediği erken-aşama backend’lere ihtiyaç duyan ekipler. tinygrad bu senaryoların hiçbirinde PyTorch’u tamamen değiştirmez; tamamlayıcı bir öğrenme/donanım katmanıdır.

Ne değildir: production-ready model zoo, geniş paper kütüphanesi, transformers benzeri high-level ecosystem değildir. tinygrad’ın extra/models/ klasöründe LLaMA, Stable Diffusion, Whisper gibi yaklaşık 12 referans implementasyon vardır; HuggingFace ecosystem’in yaklaşık 1,2 milyon modelinin yanında bu rakam kasten küçüktür. Production LLM serve, distributed training (FSDP-2, DeepSpeed ZeRO-3), heterojen GPU pool yönetimi gibi konularda tinygrad henüz olgun değildir. Aşağıdaki yazı, eğer kurumsal LLM serve aramıyorsanız ve framework iç işleyişine girmek istiyorsanız hangi minimal alternatifin neden mantıklı olduğunu çerçeveler. Kurumsal stack düşünüyorsanız Kurumsal Yapay Zeka Entegrasyonu yazısı tamamlayıcı okuma sunar.

Frameworkİlk sürümYaklaşık satır sayısıLisans2026 GitHub yıldızBirincil hedef
tinygradEkim 2020~10.000MIT~28.500Eğitsel + alternatif donanım
MLXAralık 2023~75.000MIT~22.800Apple Silicon unified memory
microgradEylül 2020~200MIT~14.100Saf autograd pedagojisi
PyTorch (kıyas)Eylül 2016~3.000.000BSD-3~88.400Production research + serve
JAX (kıyas)Aralık 2018~600.000Apache 2.0~32.700Functional + XLA + TPU

Lazy DAG tensor graph autograd düğümleri ve realize çağrısı soyut görsel
Lazy DAG tensor graph autograd düğümleri ve realize çağrısı soyut görsel

Mimari kıyas: lazy DAG, unified memory, saf Python autograd

tinygrad’ın tensor sınıfı UOp (micro-op) düzeyinde 35 civarında ilkel operasyon tanımlar (ADD, MUL, EXP2, LOG2, RECIP, MAX, WHERE, REDUCE_SUM, REDUCE_MAX, vb.). Yüksek seviyeli işlemler (matmul, conv2d, softmax) bu ilkellerden türetilir. Lazy DAG inşa edilirken her node bir LazyBuffer tutar; realize() tetiklendiğinde kernelize aşaması DAG’ı kernel’lere böler, codegen aşaması her kernel için CUDA C, Metal Shading Language, OpenCL, AMD HIP veya LLVM IR üretir, son olarak runtime kernel’i çalıştırır. Bu pipeline PyTorch 2.6’daki Dynamo → Inductor → Triton zincirinin oldukça yalın bir muadilidir.

MLX, Apple’ın Aralık 2023’te yayımladığı C++ çekirdek + Python/Swift binding sunan framework’tür. En kritik mimari kararı unified memory: M-serisi Apple Silicon’da CPU ve GPU aynı fiziksel belleği paylaştığı için MLX mx.array objesi GPU’ya kopyalanmadan kullanılabilir. Bu, 64GB veya 128GB M3 Max/M4 Max Studio gibi konfigürasyonlarda 70B parametreli quantize edilmiş LLaMA modellerinin tek makinede inference çalıştırılmasına olanak verir. MLX 0.21 (Şubat 2026) lazy evaluation, function transformations (vmap, grad, jit) ve dynamic graph construction sunar. JAX’in API’sine kasten benzer; Apple Silicon’daki ANE (Neural Engine) erişimini Core ML üzerinden değil, doğrudan Metal Performance Shaders üzerinden yapar.

Micrograd Andrej Karpathy tarafından 2020’de eğitsel video serisi için yazılan ~200 satırlık bir kütüphanedir. Tek bir Value sınıfı, skaler reverse-mode autograd, basit bir MLP sınıfı içerir. Tensor yoktur; her sayı tek bir Value‘dur. Bu pedagojik bir tercihtir: öğrenci backpropagation’ın matematiksel çekirdeğini ezbersiz görür. Üretimde anlamlı değildir, eğitimde son derece anlamlıdır. Karpathy’nin YouTube “Neural Networks: Zero to Hero” serisinin ilk videosu 2026 başı itibarıyla yaklaşık 4,8 milyon görüntülenmeye ulaştı; bu rakam micrograd’ın gerçek değerinin “kod okumayı öğretmek” olduğunu gösterir.

Boyuttinygrad 0.10MLX 0.21micrograd
Tensor primitiveUOp (35 ilkel)mx.array (~120 op)Yok (skaler Value)
Autograd moduReverse-modeReverse + forward + vmapReverse-mode skaler
ExecutionLazy + realizeLazy + evalEager
CodegenCUDA / Metal / HIP / LLVMMetal MSL JITYok (pure Python)
DistributedSınırlı (single-node multi-GPU)mlx.distributed (deneysel)Yok
QuantizationINT8 / FP8 deneyselINT4 / INT8 olgunYok
Mobil/edgeQualcomm DSP, Apple MetalApple Silicon yalnızYok

Üç framework’ün autograd uygulaması karşılaştırılınca pedagojik bir gradient çıkar: micrograd skaler düzeyde bir backward() çağrısının topological sort ile parent node’lara nasıl yayıldığını gösterir, tinygrad aynı mantığı tensor düzeyinde 200 satırlık function.py ile gösterir, MLX ise C++ tarafında benzer mantığı transformations API’si ile sarmalar. Bu öğrenme zinciri, framework iç işleyişini anlama açısından öğrenciye temiz bir yol sunar. JAX-tarzı functional transformation’lar, vmap ve grad gibi yüksek mertebe fonksiyonlar üzerinden çalışır; MLX’in API yüzeyinde bu kompozisyonel düşünme yaklaşımı açıkça hissedilir.

Performans: M3 Max, RTX 4090 ve CPU üzerinde gerçek rakamlar

Aşağıdaki rakamlar topluluk benchmark’larına (tinygrad extra/benchmark, MLX benchmarks/ klasörü, Reddit r/LocalLLaMA topluluğu, ml-explore official GitHub issues) dayanır ve sürüm bazında değişebilir. Genel eğilim olarak: MLX, Apple Silicon’da PyTorch MPS backend’inden yaklaşık %15-40 arası hızlıdır çünkü unified memory’yi sömürür; tinygrad NVIDIA CUDA üzerinde PyTorch’tan yaklaşık %10-25 yavaştır ama AMD ROCm 6.4 üzerinde PyTorch’un kararsız davrandığı senaryolarda kararlı kalır; micrograd ise saf Python olduğu için 10.000 örnekli MLP eğitiminde bile PyTorch CPU’dan yaklaşık 200-500 kat yavaştır (ki bu zaten amacının dışındadır).

SenaryoDonanımtinygrad 0.10MLX 0.21PyTorch 2.6micrograd
LLaMA-3 8B INT4 inference, tok/sM3 Max 64GB~38~62~44 (MPS)
LLaMA-3 8B FP16 inference, tok/sRTX 4090 24GB~72~95
Stable Diffusion 1.5 512×512, snM3 Max 64GB~9,4~5,8~7,2 (MPS)
ResNet-50 forward, ms/batchRTX 4090, bs=64~22~17
MLP eğitimi, 10K örnek, snCPU (M3 Max)~3,8~2,1~1,4~480
Cold-start import, sn~0,4~0,8~3,1~0,02

Apple Silicon üzerindeki MLX avantajı 2025 boyunca arttı çünkü Apple MLX-LM projesi ile quantize edilmiş LLM serve için optimize edilmiş kernel’ler yayımladı. ml-explore/mlx-examples deposunda LLaMA, Mistral, Phi-3, Qwen3 modelleri için INT4/INT8 quantize edilmiş ağırlıklar ve mlx_lm.server komutu mevcut. Bu pratik avantaj, M3/M4 Mac Studio’yu yaklaşık 4.000-7.000 USD bütçeyle bir LLM inference istasyonuna dönüştürür (yaklaşık 80 GB/s unified memory bandwidth’i hesaba katılarak). Aynı bütçeyle alınacak NVIDIA H100 80GB tek başına yaklaşık 28.000-32.000 USD’dir; toplam maliyet eşitliği yoktur ama Apple Silicon başına performans/dolar oranı belirli LLM ağırlık aralıklarında (7B-70B INT4) ilginçtir.

tinygrad’ın NVIDIA tarafındaki yaklaşık %10-25 yavaşlığı kasıtlı bir tasarım kararının sonucudur: tinygrad PyTorch’un cuDNN/cuBLAS gibi NVIDIA closed-source kütüphanelerini kullanmaz, kernel’leri kendi codegen’i ile üretir. Bu donanım vendor-bağımsızlığı sağlar (aynı kod AMD MI300X üzerinde de çalışır) ama saf throughput’ta cuDNN’in 8 yıllık optimizasyon birikiminin gerisinde kalır. tinycorp tinybox satışında bu açığı “donanım çeşitliliği premium’u” olarak konumlandırır. RAG inference performans optimizasyonu konusunda paralel bir tartışma için RAG Altyapı Kurulumu rehberi okunabilir.

Eğitsel değer: framework iç işleyişini gerçekten anlamak

Bir framework’ün eğitsel değeri, öğrencinin kütüphanenin tüm kodunu okuyabilmesinden gelir. Bu açıdan üçlünün öğrenme eğrisi nettir: micrograd 1-2 saatte tamamen okunur, tinygrad ciddi bir hafta sonu çalışmasıyla (yaklaşık 20-30 saat) ana mimarisi anlaşılır, MLX’in tamamı tek başına okunamaz ama Python API katmanı 1-2 günde kavranabilir. PyTorch’un çekirdeğini tek bir geliştirici “okuyup anladım” diye iddia edemez; bu 2026’da artık epistemic bir gerçekliktir.

KonseptmicrogradtinygradMLX
Reverse-mode autogradNet (skaler düzey)Net (tensor düzey)Sarmalı (C++ içinde)
Topological sortAçık görülürDAG’da görülürGörünmez
Kernel schedulingYokAçık (schedule.py)Sarmalı
JIT codegenYokAçık (codegen/)Sarmalı
Hardware abstractionYokAçık (runtime/)Yalnız Metal
Function transformationsYokSınırlıOlgun (vmap, grad, jit)
Önerilen ön bilgi saatleri0-540-8020-40

Karpathy’nin video serisi (micrograd → makemore → nanoGPT → llm.c) modern bir pedagojik standart kurdu: her seviyede kütüphanenin tamamı görünür, hiçbir sihir yok. tinygrad bu zincirin bir sonraki halkası gibi konumlanır: micrograd’tan sonra “peki gerçek bir tensor framework nasıl çalışır” sorusunun cevabı. MLX ise üretim aşamasına geçen, ANE/GPU/CPU heterojen donanım kullanan profesyonel hat. Bu üçü sırayla okunduğunda framework okuryazarlığı kapsamlı bir şekilde inşa edilir.

  • Avantaj (micrograd): Autograd matematiğini ezbersiz görür, 1 hafta sonu içinde tamamlanır, Karpathy video serisi ile entegre.
  • Dezavantaj (micrograd): Üretimde sıfır kullanım, tensor yok, GPU yok.
  • Ne zaman seç (micrograd): Bootcamp ilk haftası, lisans dersi, autograd intuition kazanma.
  • Avantaj (tinygrad): Production-grade donanım hızlandırma + tamamen okunabilir kod, vendor-bağımsız backend.
  • Dezavantaj (tinygrad): Olgun ecosystem yok, PyTorch’tan yavaş, paper yeniden üretimi zor.
  • Ne zaman seç (tinygrad): AMD/Qualcomm/alternatif donanımda çalışan ekip, framework iç işleyişine giren araştırmacı, tensor compiler öğrenmek.
  • Avantaj (MLX): Apple Silicon unified memory, M3/M4 Mac üzerinde 70B LLM inference, function transformations.
  • Dezavantaj (MLX): Yalnız Apple platformu, NVIDIA/AMD yok, küçük ecosystem.
  • Ne zaman seç (MLX): M3/M4 Mac iş istasyonu, indie geliştirici LLM serve, on-device inference iOS/macOS.

Apple Silicon unified memory chip katmanları MLX tensor erişimi soyut görsel
Apple Silicon unified memory chip katmanları MLX tensor erişimi soyut görsel

MLX derinlemesine: unified memory ve Apple Silicon ekosistemi

MLX’in en güçlü argümanı unified memory üzerine kuruludur. Geleneksel ayrık GPU mimarisinde (NVIDIA H100, AMD MI300X) CPU RAM ve GPU VRAM ayrı fiziksel bellekler olduğu için tensor’ler ya açıkça x.to('cuda') ile kopyalanır ya da CUDA Unified Memory page-fault overhead’i ile yönetilir. Apple Silicon M3 Max’te 64 GB veya 128 GB tek bir LPDDR5 havuzu CPU, GPU, Neural Engine ve ProRes encoder tarafından paylaşılır. MLX mx.array bu havuza doğrudan adres verir; tensor “GPU’ya kopyalama” adımı yoktur. Sonuç: 70B parametreli INT4 quantize bir LLaMA modeli (yaklaşık 40 GB ağırlık) M3 Max 64GB Mac Studio’da 1-2 saniye startup ile yüklenir ve yaklaşık 12-18 tok/s inference verir.

MLX’in function transformations API’si JAX’i ana ilham aldığını gizlemez: mlx.grad(fn) bir fonksiyonu otomatik türevlenebilir hale getirir, mlx.vmap(fn) batch ekseni üzerinde vektörleştirir, mlx.jit(fn) Metal Shading Language’e derler. Bu kompozisyonel yaklaşım PyTorch’un torch.compile dekoratöründen farklı olarak fonksiyonel paradigmadan gelir. Apple’ın bu tercihi, MLX’in Swift API’si ile birlikte düşünüldüğünde, iOS/macOS uygulamalarına on-device ML modelleri gömme stratejisinin parçasıdır. Core ML’in yerini tamamen almayacak ama dinamik graph ve transformer-tabanlı modellerde tercih edilen yol haline geliyor.

Apple Silicon SKURAMGPU çekirdekANE TOPS (INT8)Yaklaşık LLM inference üst sınır2026 başı fiyat (USD)
M3 / M4 (MacBook Air)8-24 GB8-10~183-7B INT4~1.099-1.899
M3 Pro / M4 Pro18-48 GB14-20~187-13B INT4~1.999-3.299
M3 Max / M4 Max36-128 GB30-40~3813-70B INT4~3.499-6.999
M2 Ultra / M3 Ultra64-192 GB60-80~3870-180B INT4~6.999-9.999

MLX-LM projesi (ml-explore/mlx-examples deposu altında) HuggingFace formatından MLX ağırlık formatına dönüşüm scripti, INT4/INT8 quantization aracı, OpenAI-uyumlu HTTP server (mlx_lm.server) sunar. Bu pratik altyapı, Apple Silicon Mac’i “indie geliştirici LLM serve makinesi” konumuna oturttu. Llama.cpp ile yarışan bir alternatif olarak gelişiyor; llama.cpp daha geniş donanım desteği sağlarken MLX Apple Silicon’da yaklaşık %20-35 daha hızlı çalışır (M3 Max 64GB üzerinde LLaMA-3 8B INT4 senaryosu, topluluk benchmark’ları). LLM özelleştirme yöntemlerinin geniş kıyaslaması için LLM Özelleştirme yazısı kapsamlı bir çerçeve sunar.

MLX’in eksikleri de net: distributed training henüz olgun değil (mlx.distributed Şubat 2026 itibarıyla deneysel), büyük endüstri model zoo’su yok, transformers/diffusers gibi geniş Python ecosystem entegrasyonu yarım. Üretim LLM serve için vLLM, TGI, SGLang gibi sunucular hâlâ NVIDIA-tarafında daha olgun. MLX’in pratik sweet spot’u: tek geliştirici, M-serisi Mac, 7B-70B inference, prototip iterasyon hızı.

tinygrad derinlemesine: vendor-bağımsız donanım ve tinybox

tinygrad’ın ticari yan kolu tinycorp şirketidir. Hotz’un kurduğu bu şirket “tinybox” adında pre-built ML iş istasyonu satar. 2026 başı itibarıyla iki varyant mevcut: tinybox red (8x AMD Radeon RX 7900 XTX, 192 GB VRAM toplam, yaklaşık 15.000 USD) ve tinybox green (8x NVIDIA RTX 4090, 192 GB VRAM toplam, yaklaşık 25.000 USD). Bu ürünler “AMD üzerinde gerçekten çalışan ML stack” satışıdır; tinygrad burada vendor-bağımsızlık argümanını ticarileştirir. AMD’nin ROCm yığını PyTorch’ta hâlâ stabilite sorunları yaşarken (özellikle Windows tarafında), tinygrad HIP=1 python train.py gibi tek satır ile AMD GPU’larda kararlı çalışır.

tinygrad’ın codegen pipeline’ı şu aşamalardan geçer: (1) Python user code Tensor üzerinde işlem yapar, (2) LazyBuffer DAG oluşur, (3) schedule.py DAG’ı kernel’lere böler (loop fusion, common subexpression elimination), (4) codegen/uops.py her kernel için UOp listesi üretir, (5) backend-spesifik renderer (renderer/cstyle.py, renderer/llvmir.py) UOp listesini CUDA C, Metal MSL, OpenCL veya LLVM IR’a çevirir, (6) runtime kernel’i derler ve dispatch eder. Bu pipeline’ın tamamı yaklaşık 3.500 satırda tutulur. Karşılaştırma için, PyTorch’un eşdeğer Inductor + Triton katmanı yaklaşık 180.000 satırdır.

tinygrad backendDonanımOlgunlukTipik kullanım2026 durumu
CUDANVIDIA GPUOlgunGenel ML eğitimiStable, PTX-tabanlı codegen
HIP / AMDAMD MI300X, RX 7900 XTXOlguntinybox red, MI300X clusterStable, ROCm 6.4 uyumlu
MetalApple SiliconOlgunM-serisi Mac inferenceStable, MSL codegen
OpenCLÇeşitli GPU/iGPUOrtaIntel iGPU, eski AMDBakım modu
QCOMQualcomm Snapdragon GPUErkenEdge / mobil prototipTopluluk-sürdürülen
LLVM CPUx86_64, ARM64 CPUOlgunCI, küçük inference, debugStable
WEBGPUBrowserErkenDemo, eğitselDeneysel

tinygrad’ın 2025 boyunca en görünür gelişmesi AMD MI300X üzerindeki stabilite oldu. Hotz, X (eski Twitter) üzerinde aylarca AMD driver bug’larını canlı yayında debug etti; bu performans-art hibrit yaklaşım framework’ün toplulukta tanınırlığını artırdı. ENISA AI Threat Landscape 2025 raporundaki “supply chain bağımsızlığı” tartışmasıyla paralel olarak, kurumsal ekipler tek bir GPU vendor’una bağımlı olmayan ML stack arıyor; tinygrad bu trendin teknik karşılığını sunar. Function calling ve tool-use senaryolarında alternatif inference stack denemeleri için Function Calling Tool Use yazısı pratik bir başlangıçtır.

Pratik bir tinygrad iş akışı şöyle görünür: git clone github.com/tinygrad/tinygradpip install -e .CUDA=1 python examples/llama.py komutu ile LLaMA-3 8B çalıştırılır. Aynı kod HIP=1 veya METAL=1 environment variable ile farklı donanımda dönüşsüz çalışır. Bu “yaz bir kez, çalıştır her yerde” vaadi 1990’ların Java sloganının ML donanım katmanındaki yeniden doğuşudur. Garantili değil, ama pratikte çoğu durumda doğru.

tinygrad codegen pipeline UOp ilkel operasyonlardan kernel rendering soyut görsel
tinygrad codegen pipeline UOp ilkel operasyonlardan kernel rendering soyut görsel

Hangi senaryoda hangisi: pratik karar matrisi

Framework seçimi tek bir kritere indirgenmez. Üretim ekibinde, araştırma laboratuvarında, lisans dersinde, indie geliştirici ortamında doğru seçim farklıdır. Aşağıdaki matris, sık karşılaşılan senaryolar için kararı çerçeveler.

SenaryoÖnerilen frameworkAlternatifNeden
Lisans ML dersi, ilk autogradmicrograd200 satır, tek dosya, video desteği
Bootcamp 2. hafta, MLP eğitimimicrograd → PyTorchtinygradMicrograd intuition + production framework geçişi
Tensor compiler internals araştırmasıtinygradJAX (XLA tarafı)Codegen pipeline tamamen okunabilir
AMD MI300X cluster üretimtinygradPyTorch + ROCmAMD’de tinygrad stabilitesi daha iyi
Qualcomm SoC üzerinde edge inferencetinygradONNX Runtimetinygrad QCOM backend deneysel ama tek
M3 Max Mac Studio LLM serveMLX (MLX-LM)llama.cppUnified memory + Apple optimize kernel
iOS/macOS on-device ML uygulamasıMLX (Swift API)Core MLDinamik graph, transformer-friendly
NVIDIA H100 cluster, distributed trainingPyTorchJAXFSDP-2, DeepSpeed ZeRO-3, ecosystem
TPU pod araştırmaJAXXLA-native, tek seçenek
Production LLM serve (yüksek QPS)vLLM / SGLangTGITinygrad/MLX henüz olgun değil

Bu matrisin altında yatan ilke: tinygrad ve MLX PyTorch’un yerine geçmez, onun ulaşamadığı (alternatif donanım, Apple Silicon optimize, kod okunabilirliği) niş alanlarda tamamlayıcı rol oynar. Bir ekibin tüm stack’ini tinygrad’a taşıması 2026’da ekonomik değildir; ama belirli bir senaryoyu (örneğin AMD MI300X üzerinde küçük bir araştırma modeli, ya da M3 Mac Studio üzerinde indie LLM serve) tinygrad/MLX ile çözmek son derece anlamlıdır. Bu hibrit stack yaklaşımı kurumsal AI mimarisinde sıklaşıyor; benzer hibrit kararları Agentic AI İş Akışları yazısında orkestrasyon perspektifinden inceledim.

Ömer Önal danışmanlığında kurumsal ML stack değerlendirmesi yaparken sıkça gördüğüm bir senaryo şu: müşteri “tüm GPU yatırımımızı tek vendor’a bağlamak istemiyoruz” der; ardından AMD/Apple Silicon tarafında pilot yaparken tinygrad veya MLX’i ana PyTorch hattının yanına alternatif test framework olarak yerleştirir. Bu, supply chain riski azaltan ama mevcut ekip becerilerini bozmayan dengeli bir yaklaşımdır.

Topluluk, ekosistem ve sürdürülebilirlik

Bir open-source framework’ün uzun vadeli sağlığı sürüm hızı, katkıcı genişliği, finansman modeli ve dokümantasyon olgunluğu ile ölçülür. Stack Overflow Developer Survey 2025’e göre PyTorch ML profesyonelleri arasında %78 popülerlik, TensorFlow %31, JAX %14 paya sahip. tinygrad ve MLX ise survey’in “minor frameworks” kategorisinde toplam %6 civarında yer aldı; bu küçük rakam yanıltıcıdır çünkü her ikisi de niş kullanım için tasarlandı, mass-market PyTorch alternatifi değil.

MetriktinygradMLXmicrograd
2026 GitHub yıldız~28.500~22.800~14.100
Aktif katkıcı (son 12 ay)~380~210~25
Aylık ortalama commit~420~180~3
Major sürüm sıklığı3-4 ay4-6 ayBakım modu
Finansman / sürdürücütinycorp + toplulukApple ml-explore ekibiKarpathy (kişisel)
Resmi dokümantasyonOrta (docs.tinygrad.org)İyi (ml-explore.github.io/mlx)README + video
Discord / forum aktivitesiYüksek (~9.000 üye)Orta (GitHub Discussions)Düşük
Production deployment kanıtıOrta (tinybox + topluluk)Yüksek (Apple içi + indie)Yok

MLX’in Apple tarafından sürdürülmesi uzun vadeli stabilite garantisi sağlar; Apple ml-explore ekibinin 2024-2026 sürüm temposu istikrarlı oldu. Şirket içi kullanımın görünür kanıtları arasında macOS Tahoe 15.3’ün on-device LLM özellikleri (Apple Intelligence’ın geliştirici-erişimli kısımları), Final Cut Pro ML-tabanlı sahne ayırma, Photos uygulaması semantic search vb. yer alır. Bu içsel kullanım MLX’in “Apple’ın deneysel yan projesi mi yoksa stratejik altyapı mı” sorusuna stratejik cevabı sunar.

tinygrad’ın sürdürülebilirliği tinycorp şirketinin tinybox satışlarına ve Hotz’un kişisel rol oynamasına bağlı; bu single-point-of-failure riski getirir. Topluluk son 2 yılda yaklaşık 4-5 core maintainer çıkardı, bu olumlu bir sinyal. Micrograd ise resmi olarak bakım modunda; Karpathy yeni geliştirme yapmıyor, GitHub issue’ları çoğunlukla “good first issue / wontfix” durumunda. Eğitsel bir referans implementasyon olarak bu yeterli; üretim ya da uzun vadeli aktif gelişme beklentisi olan ekipler için değil. AI altyapı yatırım kararlarında vendor sürdürülebilirliği, Total Cost of Ownership çerçevesi ve tek-vendor riskinin niceliklendirilmesi (örneğin tek maintainer’a bağımlılık katsayısı) belirleyici metriklerdir.

Topluluk sürdürülebilirlik framework karşılaştırma soyut grafik 3D görsel
Topluluk sürdürülebilirlik framework karşılaştırma soyut grafik 3D görsel

Pratik başlangıç yolu: 4 haftalık öğrenme planı

Bir geliştiricinin sıfırdan başlayıp üçünü de pratik olarak deneyimlemesi yaklaşık 4 haftada (yarı zamanlı, haftada ~15 saat) mümkündür. Aşağıdaki plan haftalık hedefleri çerçeveler.

  1. Hafta 1 — micrograd ile autograd intuition: Karpathy’nin “Neural Networks: Zero to Hero” serisinin ilk videosunu izle, micrograd kodunu satır satır oku, kendi Value sınıfını sıfırdan yaz, küçük bir MLP eğit. Hedef: backprop’un matematiksel çekirdeğini ezbersiz anlamak.
  2. Hafta 2 — tinygrad ile tensor framework: tinygrad repo’sunu klonla, docs/abstractions.md dosyasını oku, examples/beautiful_mnist.py kodunu satır satır incele. tensor.py ve function.py dosyalarını oku. CUDA=1 veya METAL=1 ile küçük bir CNN eğit. Hedef: lazy DAG + codegen pipeline’ı kavramak.
  3. Hafta 3 — tinygrad codegen derinleşme: codegen/uops.py ve renderer/cstyle.py dosyalarını oku, basit bir kernel’in (örneğin matmul) UOp listesinden CUDA C koduna nasıl rendere edildiğini izle. Kendi backend prototipini düşün. Hedef: tensor compiler’ın iç dilini konuşmak.
  4. Hafta 4 — MLX ile Apple Silicon production: Bir M-serisi Mac’te pip install mlx mlx-lm kur, HuggingFace’ten bir LLaMA-3 8B model indir, mlx_lm.convert ile INT4 quantize et, mlx_lm.server ile OpenAI-uyumlu endpoint aç. Function transformations (mx.vmap, mx.grad, mx.jit) ile mini bir training loop yaz. Hedef: Apple Silicon LLM serve hattını çalıştırabilmek.

Bu 4 haftalık plan tamamlandığında geliştirici şunları yapabilir hale gelir: PyTorch’tan kalkıp framework iç işleyişini sorgulayabilir, alternatif donanım senaryolarında pragmatik karar verebilir, M-serisi Mac’i indie LLM iş istasyonuna dönüştürebilir, autograd matematiğini öğrencilere/junior’lara açıklayabilir. Bu yetkinlik seti 2026 ML iş ilanlarında “deep learning systems engineer” rolünün ön koşullarından biri hâline geldi.

  • İpucu (kaynak takibi): tinygrad Discord’unda haftalık “office hours” oturumları core maintainer’larla canlı kod okuma sunar.
  • İpucu (MLX kaynak): Apple WWDC 2024 ve 2025 sessions “Bring your machine learning and AI models to Apple silicon” sunumları MLX’in resmi giriş materyalidir.
  • İpucu (paper takibi): arXiv cs.LG kategorisinde “tinygrad” veya “MLX” kelimelerini ay ay tara, yaklaşık aylık 3-6 paper bu framework’leri benchmark olarak kullanıyor.
  • İpucu (kod katkısı): tinygrad good first issue etiketli issue’lar genelde “şu backend’de şu unit test’i geçir” formatında; ilk PR için ideal.

Sık Sorulan Sorular

tinygrad PyTorch’un yerini alır mı?

Hayır. tinygrad PyTorch’un yerini almayı hedeflemez. Ekosistem genişliği, distributed training olgunluğu ve cuDNN-tabanlı saf throughput’ta PyTorch açık ara öndedir. tinygrad’ın değeri eğitsel okunabilirlik, vendor-bağımsız donanım desteği (özellikle AMD ROCm ve Qualcomm) ve tensor compiler internals’ını öğrenmektir. Bir ekibin tüm production stack’ini tinygrad’a taşıması 2026 itibarıyla ekonomik değildir; belirli niş senaryolarda tamamlayıcı olarak kullanmak ise rasyoneldir.

MLX yalnızca Apple cihazlarında mı çalışır?

Pratik olarak evet. MLX Apple Silicon Mac (M1, M2, M3, M4 serileri) ve iPad Pro M-serisi çiplerinde Metal Performance Shaders üzerinden çalışır. NVIDIA CUDA veya AMD ROCm desteği yoktur ve Apple’ın 2026 yol haritasında da görünmüyor. MLX kullanmak isteyen ekiplerin en az bir M-serisi Mac iş istasyonuna ihtiyacı var. CPU-only fallback teknik olarak çalışır ama performans açısından anlamsızdır.

Micrograd üretimde kullanılabilir mi?

Hayır, micrograd kasıtlı olarak üretim dışı tasarlandı. Tensor yoktur, GPU yoktur, optimizasyon yoktur; her sayı bir Value objesi olarak Python heap’inde tutulur. 10.000 örnekli basit MLP eğitimi bile yaklaşık 8 dakika sürer (PyTorch CPU’da yaklaşık 1,4 saniye). Micrograd’ın değeri eğitseldir: autograd matematiğinin ezbersiz anlaşılması, topological sort’un gözlemlenmesi, reverse-mode chain rule’un kodla görülmesi.

tinygrad ve MLX hangi LLM modellerini destekler?

tinygrad extra/models/ klasöründe LLaMA, Mistral, Stable Diffusion, Whisper, BERT gibi yaklaşık 12 referans implementasyon barındırır. MLX ise mlx-examples deposu altında LLaMA-3, Mistral, Phi-3, Qwen3, Gemma, Stable Diffusion, Whisper için resmi implementasyonlar ve INT4/INT8 quantize ağırlıklar sunar. HuggingFace ecosystem entegrasyonu MLX tarafında daha olgundur; tinygrad’da ağırlık dönüşümü için manuel script yazmak gerekebilir.

Bu framework’leri öğrenmek 2026’da iş bulmada işe yarar mı?

Doğrudan “tinygrad developer” iş ilanları nadirdir, ama tensor compiler internals, alternatif donanım hızlandırma ve framework iç işleyişine hakim olmak “ML systems engineer”, “performance engineer” ve “ML platform” rollerinde belirleyici niteliktir. LinkedIn 2025 raporlarında bu rollerin ortalama maaşı standart ML engineer’dan yaklaşık %20-35 yüksektir. Micrograd → tinygrad → MLX zinciri bu yetkinliği inşa etmenin en hızlı yoludur.

Sonuç

tinygrad, MLX ve micrograd 2026’da farklı amaçlara hizmet eden üç tamamlayıcı framework’tür. Micrograd autograd matematiğini ezbersiz öğretmek için 200 satırlık bir referans implementasyondur; üretimde yeri yoktur, eğitimde paha biçilmezdir. tinygrad 10.000 satır disipliniyle yazılmış, vendor-bağımsız donanım hızlandırma sunan, tensor compiler internals’ını okunabilir kılan minimalist bir production-grade framework’tür; AMD MI300X ve Apple Silicon dahil çeşitli donanımda kararlı çalışır. MLX Apple Silicon unified memory’sini sömüren, M-serisi Mac’i indie LLM iş istasyonuna dönüştüren, fonksiyonel transformation API’si ile JAX ruhunu Apple ekosistemine taşıyan bir framework’tür.

Bir ekip için doğru karar genelde “üçünden birini seç” değil “PyTorch’un yanında hangisini hangi senaryoda kullan” sorusudur. AMD/Qualcomm donanım çeşitliliği için tinygrad, M-serisi Mac üzerinde LLM inference için MLX, autograd öğretimi için micrograd doğru tercihtir. Production NVIDIA cluster, distributed training, geniş model zoo gerekirse PyTorch öncelikli kalır. Framework seçimi tek başına başarı getirmez; doğru senaryoyu doğru framework’e eşleştiren mühendislik kararı getirir.

Kurumsal ML stack değerlendirmesi, alternatif donanım pilotları veya M-serisi Mac üzerinde LLM serve mimarisi konularında destek için iletişim sayfası üzerinden ulaşabilirsiniz; somut bir senaryo üzerinden karar matrisi çıkarmak en hızlı yoldur.

tinygrad GitHub deposu | MLX resmi dokümantasyon | micrograd GitHub | Apple ML developer kaynakları | AMD ROCm dokümantasyonu | Stack Overflow Developer Survey 2025 | arXiv cs.LG son yayınlar

OmerOnal

Yorum (1)

  1. Ömer ÖNAL
    Mayıs 16, 2026

    Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.

Yorum Yap

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir