Haziran 19, 2026OmerOnal1 Yorum

tinygrad, MLX ve Micrograd 2026: Eğitsel Deep Learning Framework

Q: tinygrad ve MLX hangi LLM modellerini destekler?

tinygrad extra/models/ klasöründe LLaMA, Mistral, Stable Diffusion, Whisper, BERT gibi yaklaşık 12 referans implementasyon barındırır. MLX ise mlx-examples deposu altında LLaMA-3, Mistral, Phi-3, Qwen3, Gemma, Stable Diffusion, Whisper için resmi implementasyonlar ve INT4/INT8 quantize ağırlıklar sunar. HuggingFace ecosystem entegrasyonu MLX tarafında daha olgundur; tinygrad'da ağırlık dönüşümü için manuel script yazmak gerekebilir.

Q: Bu framework'leri öğrenmek 2026'da iş bulmada işe yarar mı?

Doğrudan 'tinygrad developer' iş ilanları nadirdir, ama tensor compiler internals, alternatif donanım hızlandırma ve framework iç işleyişine hakim olmak 'ML systems engineer', 'performance engineer' ve 'ML platform' rollerinde belirleyici niteliktir. LinkedIn 2025 raporlarında bu rollerin ortalama maaşı standart ML engineer'dan yaklaşık %20-35 yüksektir. Micrograd → tinygrad → MLX zinciri bu yetkinliği inşa etmenin en hızlı yoludur.

tinygrad nedir sorusunun 2026 itibarıyla pratik cevabı: George Hotz tarafından başlatılan, ~10.000 satır Python ile autograd, tensor, scheduler ve çoklu donanım backend’i (CUDA, Metal, AMD, Qualcomm) sunan minimalist bir deep learning framework. PyTorch’un (~3 milyon satır C++/CUDA) ve TensorFlow’un (~3,5 milyon satır) ardındaki devasa kod tabanından bağımsız olarak, tinygrad eğitsel okunabilirlik ile production-grade donanım hızlandırma arasında köprü kurmayı hedefler. tinygrad 0.10 sürümü (Şubat 2026) yaklaşık 28.500 GitHub yıldızı, 3.200 fork ve 380 katkıcı ile topluluk büyüklüğünde MLX’in arkasında, micrograd’ın ise çok ötesindedir. Bu yazı tinygrad, Apple’ın MLX’i (2026 sürüm 0.21) ve Karpathy’nin micrograd’ını (yaklaşık 200 satır) yan yana koyarak hangi framework’ün hangi öğrenme/araştırma/edge inference senaryosunda mantıklı olduğunu gerçek rakamlarla çerçevelendiriyor. Konuyla ilişkili olarak Edge AI ve On-Device Inference 2026: TFLite, Core ML Rehberi rehberimiz detaylı incelemeyi içerir. Konuyla ilişkili olarak Edge AI: NVIDIA Jetson, Coral, Qualcomm AI Engine Karşılaştırması rehberimiz detaylı incelemeyi içerir. Konuyla ilişkili olarak On-Device AI 2026: Mobil ve Uç Cihazlarda Küçük Dil Modelleri rehberimiz detaylı incelemeyi içerir.

Eğitsel deep learning framework’leri 2024-2026 döneminde yeniden popülerleşti çünkü PyTorch 2.6’nın torch.compile + Inductor + Triton katmanları artık tek bir geliştiricinin baştan sona okuyabileceği boyutu aştı. Stack Overflow Developer Survey 2025 raporuna göre ML geliştiricilerin yaklaşık %42’si “framework iç işleyişini anlamak için minimal alternatif arıyorum” maddesini işaretledi. tinygrad bu açığı line-of-code disiplini ile, MLX Apple Silicon unified memory’sini sömürerek, micrograd ise tek dosyada autograd matematiğini öğreterek doldurur. Üçü de production’da PyTorch’un yerini almaz; ama framework okuryazarlığı, edge inference ve M-serisi Mac üretim hattı senaryolarında ciddi rol oynarlar.

📖 25 dakikalık okuma

İçindekiler

tinygrad nedir, ne değildir: 2026 itibarıyla kapsam
Mimari kıyas: lazy DAG, unified memory, saf Python autograd
Performans: M3 Max, RTX 4090 ve CPU üzerinde gerçek rakamlar
Eğitsel değer: framework iç işleyişini gerçekten anlamak
MLX derinlemesine: unified memory ve Apple Silicon ekosistemi
tinygrad derinlemesine: vendor-bağımsız donanım ve tinybox
Hangi senaryoda hangisi: pratik karar matrisi
Topluluk, ekosistem ve sürdürülebilirlik
Pratik başlangıç yolu: 4 haftalık öğrenme planı
Sık Sorulan Sorular
Sonuç

tinygrad nedir, ne değildir: 2026 itibarıyla kapsam

tinygrad, tinycorp şirketi (Hotz’un kurduğu) tarafından sürdürülen, MIT lisanslı, “10.000 satırı geçmeyecek” sözüyle yazılmış bir Python framework’üdür. Çekirdeği tensor.py, ops.py, codegen/ ve donanıma özel runtime/ dosyalarından oluşur. Lazy execution modeli vardır: işlemler hemen yürütülmez, bir DAG’da biriktirilir, realize() çağrısında schedule + codegen + dispatch zincirinden geçer. Bu yaklaşım PyTorch’un torch.compile mantığına benzer ama 10.000 satırın altında uygulanır.

tinygrad’ın hedeflediği üç senaryo nettir. Birincisi, framework’ün her satırını okuyup tensor compiler’ı içselleştirmek isteyen araştırmacı/öğrenci. İkincisi, tinycorp’un sattığı tinybox (sekiz adet AMD MI300X veya RTX 4090 + 32 vCPU + 1TB RAM, yaklaşık 25.000 USD) gibi alışılmadık donanım kombinasyonlarında çalışan production cluster. Üçüncüsü, Qualcomm SoC, AMD ROCm 6.4 veya Apple Metal üzerinde PyTorch’un native desteklemediği erken-aşama backend’lere ihtiyaç duyan ekipler. tinygrad bu senaryoların hiçbirinde PyTorch’u tamamen değiştirmez; tamamlayıcı bir öğrenme/donanım katmanıdır.

Ne değildir: production-ready model zoo, geniş paper kütüphanesi, transformers benzeri high-level ecosystem değildir. tinygrad’ın extra/models/ klasöründe LLaMA, Stable Diffusion, Whisper gibi yaklaşık 12 referans implementasyon vardır; HuggingFace ecosystem’in yaklaşık 1,2 milyon modelinin yanında bu rakam kasten küçüktür. Production LLM serve, distributed training (FSDP-2, DeepSpeed ZeRO-3), heterojen GPU pool yönetimi gibi konularda tinygrad henüz olgun değildir. Aşağıdaki yazı, eğer kurumsal LLM serve aramıyorsanız ve framework iç işleyişine girmek istiyorsanız hangi minimal alternatifin neden mantıklı olduğunu çerçeveler. Kurumsal stack düşünüyorsanız Kurumsal Yapay Zeka Entegrasyonu yazısı tamamlayıcı okuma sunar.

Framework	İlk sürüm	Yaklaşık satır sayısı	Lisans	2026 GitHub yıldız	Birincil hedef
tinygrad	Ekim 2020	~10.000	MIT	~28.500	Eğitsel + alternatif donanım
MLX	Aralık 2023	~75.000	MIT	~22.800	Apple Silicon unified memory
micrograd	Eylül 2020	~200	MIT	~14.100	Saf autograd pedagojisi
PyTorch (kıyas)	Eylül 2016	~3.000.000	BSD-3	~88.400	Production research + serve
JAX (kıyas)	Aralık 2018	~600.000	Apache 2.0	~32.700	Functional + XLA + TPU

Lazy DAG tensor graph autograd düğümleri ve realize çağrısı soyut görsel

Mimari kıyas: lazy DAG, unified memory, saf Python autograd

tinygrad’ın tensor sınıfı UOp (micro-op) düzeyinde 35 civarında ilkel operasyon tanımlar (ADD, MUL, EXP2, LOG2, RECIP, MAX, WHERE, REDUCE_SUM, REDUCE_MAX, vb.). Yüksek seviyeli işlemler (matmul, conv2d, softmax) bu ilkellerden türetilir. Lazy DAG inşa edilirken her node bir LazyBuffer tutar; realize() tetiklendiğinde kernelize aşaması DAG’ı kernel’lere böler, codegen aşaması her kernel için CUDA C, Metal Shading Language, OpenCL, AMD HIP veya LLVM IR üretir, son olarak runtime kernel’i çalıştırır. Bu pipeline PyTorch 2.6’daki Dynamo → Inductor → Triton zincirinin oldukça yalın bir muadilidir.

MLX, Apple’ın Aralık 2023’te yayımladığı C++ çekirdek + Python/Swift binding sunan framework’tür. En kritik mimari kararı unified memory: M-serisi Apple Silicon’da CPU ve GPU aynı fiziksel belleği paylaştığı için MLX mx.array objesi GPU’ya kopyalanmadan kullanılabilir. Bu, 64GB veya 128GB M3 Max/M4 Max Studio gibi konfigürasyonlarda 70B parametreli quantize edilmiş LLaMA modellerinin tek makinede inference çalıştırılmasına olanak verir. MLX 0.21 (Şubat 2026) lazy evaluation, function transformations (vmap, grad, jit) ve dynamic graph construction sunar. JAX’in API’sine kasten benzer; Apple Silicon’daki ANE (Neural Engine) erişimini Core ML üzerinden değil, doğrudan Metal Performance Shaders üzerinden yapar. Konuyla ilişkili olarak Swift on Server 2026: Vapor & Hummingbird Karar Rehberi rehberimiz detaylı incelemeyi içerir.

Micrograd Andrej Karpathy tarafından 2020’de eğitsel video serisi için yazılan ~200 satırlık bir kütüphanedir. Tek bir Value sınıfı, skaler reverse-mode autograd, basit bir MLP sınıfı içerir. Tensor yoktur; her sayı tek bir Value‘dur. Bu pedagojik bir tercihtir: öğrenci backpropagation’ın matematiksel çekirdeğini ezbersiz görür. Üretimde anlamlı değildir, eğitimde son derece anlamlıdır. Karpathy’nin YouTube “Neural Networks: Zero to Hero” serisinin ilk videosu 2026 başı itibarıyla yaklaşık 4,8 milyon görüntülenmeye ulaştı; bu rakam micrograd’ın gerçek değerinin “kod okumayı öğretmek” olduğunu gösterir.

Boyut	tinygrad 0.10	MLX 0.21	micrograd
Tensor primitive	UOp (35 ilkel)	mx.array (~120 op)	Yok (skaler Value)
Autograd modu	Reverse-mode	Reverse + forward + vmap	Reverse-mode skaler
Execution	Lazy + realize	Lazy + eval	Eager
Codegen	CUDA / Metal / HIP / LLVM	Metal MSL JIT	Yok (pure Python)
Distributed	Sınırlı (single-node multi-GPU)	mlx.distributed (deneysel)	Yok
Quantization	INT8 / FP8 deneysel	INT4 / INT8 olgun	Yok
Mobil/edge	Qualcomm DSP, Apple Metal	Apple Silicon yalnız	Yok

Üç framework’ün autograd uygulaması karşılaştırılınca pedagojik bir gradient çıkar: micrograd skaler düzeyde bir backward() çağrısının topological sort ile parent node’lara nasıl yayıldığını gösterir, tinygrad aynı mantığı tensor düzeyinde 200 satırlık function.py ile gösterir, MLX ise C++ tarafında benzer mantığı transformations API’si ile sarmalar. Bu öğrenme zinciri, framework iç işleyişini anlama açısından öğrenciye temiz bir yol sunar. JAX-tarzı functional transformation’lar, vmap ve grad gibi yüksek mertebe fonksiyonlar üzerinden çalışır; MLX’in API yüzeyinde bu kompozisyonel düşünme yaklaşımı açıkça hissedilir.

Performans: M3 Max, RTX 4090 ve CPU üzerinde gerçek rakamlar

Aşağıdaki rakamlar topluluk benchmark’larına (tinygrad extra/benchmark, MLX benchmarks/ klasörü, Reddit r/LocalLLaMA topluluğu, ml-explore official GitHub issues) dayanır ve sürüm bazında değişebilir. Genel eğilim olarak: MLX, Apple Silicon’da PyTorch MPS backend’inden yaklaşık %15-40 arası hızlıdır çünkü unified memory’yi sömürür; tinygrad NVIDIA CUDA üzerinde PyTorch’tan yaklaşık %10-25 yavaştır ama AMD ROCm 6.4 üzerinde PyTorch’un kararsız davrandığı senaryolarda kararlı kalır; micrograd ise saf Python olduğu için 10.000 örnekli MLP eğitiminde bile PyTorch CPU’dan yaklaşık 200-500 kat yavaştır (ki bu zaten amacının dışındadır).

Senaryo	Donanım	tinygrad 0.10	MLX 0.21	PyTorch 2.6	micrograd
LLaMA-3 8B INT4 inference, tok/s	M3 Max 64GB	~38	~62	~44 (MPS)	—
LLaMA-3 8B FP16 inference, tok/s	RTX 4090 24GB	~72	—	~95	—
Stable Diffusion 1.5 512×512, sn	M3 Max 64GB	~9,4	~5,8	~7,2 (MPS)	—
ResNet-50 forward, ms/batch	RTX 4090, bs=64	~22	—	~17	—
MLP eğitimi, 10K örnek, sn	CPU (M3 Max)	~3,8	~2,1	~1,4	~480
Cold-start import, sn	—	~0,4	~0,8	~3,1	~0,02

Apple Silicon üzerindeki MLX avantajı 2025 boyunca arttı çünkü Apple MLX-LM projesi ile quantize edilmiş LLM serve için optimize edilmiş kernel’ler yayımladı. ml-explore/mlx-examples deposunda LLaMA, Mistral, Phi-3, Qwen3 modelleri için INT4/INT8 quantize edilmiş ağırlıklar ve mlx_lm.server komutu mevcut. Bu pratik avantaj, M3/M4 Mac Studio’yu yaklaşık 4.000-7.000 USD bütçeyle bir LLM inference istasyonuna dönüştürür (yaklaşık 80 GB/s unified memory bandwidth’i hesaba katılarak). Aynı bütçeyle alınacak NVIDIA H100 80GB tek başına yaklaşık 28.000-32.000 USD’dir; toplam maliyet eşitliği yoktur ama Apple Silicon başına performans/dolar oranı belirli LLM ağırlık aralıklarında (7B-70B INT4) ilginçtir.

tinygrad’ın NVIDIA tarafındaki yaklaşık %10-25 yavaşlığı kasıtlı bir tasarım kararının sonucudur: tinygrad PyTorch’un cuDNN/cuBLAS gibi NVIDIA closed-source kütüphanelerini kullanmaz, kernel’leri kendi codegen’i ile üretir. Bu donanım vendor-bağımsızlığı sağlar (aynı kod AMD MI300X üzerinde de çalışır) ama saf throughput’ta cuDNN’in 8 yıllık optimizasyon birikiminin gerisinde kalır. tinycorp tinybox satışında bu açığı “donanım çeşitliliği premium’u” olarak konumlandırır. RAG inference performans optimizasyonu konusunda paralel bir tartışma için RAG Altyapı Kurulumu rehberi okunabilir.

Eğitsel değer: framework iç işleyişini gerçekten anlamak

Bir framework’ün eğitsel değeri, öğrencinin kütüphanenin tüm kodunu okuyabilmesinden gelir. Bu açıdan üçlünün öğrenme eğrisi nettir: micrograd 1-2 saatte tamamen okunur, tinygrad ciddi bir hafta sonu çalışmasıyla (yaklaşık 20-30 saat) ana mimarisi anlaşılır, MLX’in tamamı tek başına okunamaz ama Python API katmanı 1-2 günde kavranabilir. PyTorch’un çekirdeğini tek bir geliştirici “okuyup anladım” diye iddia edemez; bu 2026’da artık epistemic bir gerçekliktir.

Konsept	micrograd	tinygrad	MLX
Reverse-mode autograd	Net (skaler düzey)	Net (tensor düzey)	Sarmalı (C++ içinde)
Topological sort	Açık görülür	DAG’da görülür	Görünmez
Kernel scheduling	Yok	Açık (schedule.py)	Sarmalı
JIT codegen	Yok	Açık (codegen/)	Sarmalı
Hardware abstraction	Yok	Açık (runtime/)	Yalnız Metal
Function transformations	Yok	Sınırlı	Olgun (vmap, grad, jit)
Önerilen ön bilgi saatleri	0-5	40-80	20-40

Karpathy’nin video serisi (micrograd → makemore → nanoGPT → llm.c) modern bir pedagojik standart kurdu: her seviyede kütüphanenin tamamı görünür, hiçbir sihir yok. tinygrad bu zincirin bir sonraki halkası gibi konumlanır: micrograd’tan sonra “peki gerçek bir tensor framework nasıl çalışır” sorusunun cevabı. MLX ise üretim aşamasına geçen, ANE/GPU/CPU heterojen donanım kullanan profesyonel hat. Bu üçü sırayla okunduğunda framework okuryazarlığı kapsamlı bir şekilde inşa edilir.

Avantaj (micrograd): Autograd matematiğini ezbersiz görür, 1 hafta sonu içinde tamamlanır, Karpathy video serisi ile entegre.
Dezavantaj (micrograd): Üretimde sıfır kullanım, tensor yok, GPU yok.
Ne zaman seç (micrograd): Bootcamp ilk haftası, lisans dersi, autograd intuition kazanma.
Avantaj (tinygrad): Production-grade donanım hızlandırma + tamamen okunabilir kod, vendor-bağımsız backend.
Dezavantaj (tinygrad): Olgun ecosystem yok, PyTorch’tan yavaş, paper yeniden üretimi zor.
Ne zaman seç (tinygrad): AMD/Qualcomm/alternatif donanımda çalışan ekip, framework iç işleyişine giren araştırmacı, tensor compiler öğrenmek.
Avantaj (MLX): Apple Silicon unified memory, M3/M4 Mac üzerinde 70B LLM inference, function transformations.
Dezavantaj (MLX): Yalnız Apple platformu, NVIDIA/AMD yok, küçük ecosystem.
Ne zaman seç (MLX): M3/M4 Mac iş istasyonu, indie geliştirici LLM serve, on-device inference iOS/macOS.

Apple Silicon unified memory chip katmanları MLX tensor erişimi soyut görsel

MLX derinlemesine: unified memory ve Apple Silicon ekosistemi

MLX’in en güçlü argümanı unified memory üzerine kuruludur. Geleneksel ayrık GPU mimarisinde (NVIDIA H100, AMD MI300X) CPU RAM ve GPU VRAM ayrı fiziksel bellekler olduğu için tensor’ler ya açıkça x.to('cuda') ile kopyalanır ya da CUDA Unified Memory page-fault overhead’i ile yönetilir. Apple Silicon M3 Max’te 64 GB veya 128 GB tek bir LPDDR5 havuzu CPU, GPU, Neural Engine ve ProRes encoder tarafından paylaşılır. MLX mx.array bu havuza doğrudan adres verir; tensor “GPU’ya kopyalama” adımı yoktur. Sonuç: 70B parametreli INT4 quantize bir LLaMA modeli (yaklaşık 40 GB ağırlık) M3 Max 64GB Mac Studio’da 1-2 saniye startup ile yüklenir ve yaklaşık 12-18 tok/s inference verir.

MLX’in function transformations API’si JAX’i ana ilham aldığını gizlemez: mlx.grad(fn) bir fonksiyonu otomatik türevlenebilir hale getirir, mlx.vmap(fn) batch ekseni üzerinde vektörleştirir, mlx.jit(fn) Metal Shading Language’e derler. Bu kompozisyonel yaklaşım PyTorch’un torch.compile dekoratöründen farklı olarak fonksiyonel paradigmadan gelir. Apple’ın bu tercihi, MLX’in Swift API’si ile birlikte düşünüldüğünde, iOS/macOS uygulamalarına on-device ML modelleri gömme stratejisinin parçasıdır. Core ML’in yerini tamamen almayacak ama dinamik graph ve transformer-tabanlı modellerde tercih edilen yol haline geliyor.

Apple Silicon SKU	RAM	GPU çekirdek	ANE TOPS (INT8)	Yaklaşık LLM inference üst sınır	2026 başı fiyat (USD)
M3 / M4 (MacBook Air)	8-24 GB	8-10	~18	3-7B INT4	~1.099-1.899
M3 Pro / M4 Pro	18-48 GB	14-20	~18	7-13B INT4	~1.999-3.299
M3 Max / M4 Max	36-128 GB	30-40	~38	13-70B INT4	~3.499-6.999
M2 Ultra / M3 Ultra	64-192 GB	60-80	~38	70-180B INT4	~6.999-9.999

MLX-LM projesi (ml-explore/mlx-examples deposu altında) HuggingFace formatından MLX ağırlık formatına dönüşüm scripti, INT4/INT8 quantization aracı, OpenAI-uyumlu HTTP server (mlx_lm.server) sunar. Bu pratik altyapı, Apple Silicon Mac’i “indie geliştirici LLM serve makinesi” konumuna oturttu. Llama.cpp ile yarışan bir alternatif olarak gelişiyor; llama.cpp daha geniş donanım desteği sağlarken MLX Apple Silicon’da yaklaşık %20-35 daha hızlı çalışır (M3 Max 64GB üzerinde LLaMA-3 8B INT4 senaryosu, topluluk benchmark’ları). LLM özelleştirme yöntemlerinin geniş kıyaslaması için LLM Özelleştirme yazısı kapsamlı bir çerçeve sunar.

MLX’in eksikleri de net: distributed training henüz olgun değil (mlx.distributed Şubat 2026 itibarıyla deneysel), büyük endüstri model zoo’su yok, transformers/diffusers gibi geniş Python ecosystem entegrasyonu yarım. Üretim LLM serve için vLLM, TGI, SGLang gibi sunucular hâlâ NVIDIA-tarafında daha olgun. MLX’in pratik sweet spot’u: tek geliştirici, M-serisi Mac, 7B-70B inference, prototip iterasyon hızı.

tinygrad derinlemesine: vendor-bağımsız donanım ve tinybox

tinygrad’ın ticari yan kolu tinycorp şirketidir. Hotz’un kurduğu bu şirket “tinybox” adında pre-built ML iş istasyonu satar. 2026 başı itibarıyla iki varyant mevcut: tinybox red (8x AMD Radeon RX 7900 XTX, 192 GB VRAM toplam, yaklaşık 15.000 USD) ve tinybox green (8x NVIDIA RTX 4090, 192 GB VRAM toplam, yaklaşık 25.000 USD). Bu ürünler “AMD üzerinde gerçekten çalışan ML stack” satışıdır; tinygrad burada vendor-bağımsızlık argümanını ticarileştirir. AMD’nin ROCm yığını PyTorch’ta hâlâ stabilite sorunları yaşarken (özellikle Windows tarafında), tinygrad HIP=1 python train.py gibi tek satır ile AMD GPU’larda kararlı çalışır.

tinygrad’ın codegen pipeline’ı şu aşamalardan geçer: (1) Python user code Tensor üzerinde işlem yapar, (2) LazyBuffer DAG oluşur, (3) schedule.py DAG’ı kernel’lere böler (loop fusion, common subexpression elimination), (4) codegen/uops.py her kernel için UOp listesi üretir, (5) backend-spesifik renderer (renderer/cstyle.py, renderer/llvmir.py) UOp listesini CUDA C, Metal MSL, OpenCL veya LLVM IR’a çevirir, (6) runtime kernel’i derler ve dispatch eder. Bu pipeline’ın tamamı yaklaşık 3.500 satırda tutulur. Karşılaştırma için, PyTorch’un eşdeğer Inductor + Triton katmanı yaklaşık 180.000 satırdır.

tinygrad backend	Donanım	Olgunluk	Tipik kullanım	2026 durumu
CUDA	NVIDIA GPU	Olgun	Genel ML eğitimi	Stable, PTX-tabanlı codegen
HIP / AMD	AMD MI300X, RX 7900 XTX	Olgun	tinybox red, MI300X cluster	Stable, ROCm 6.4 uyumlu
Metal	Apple Silicon	Olgun	M-serisi Mac inference	Stable, MSL codegen
OpenCL	Çeşitli GPU/iGPU	Orta	Intel iGPU, eski AMD	Bakım modu
QCOM	Qualcomm Snapdragon GPU	Erken	Edge / mobil prototip	Topluluk-sürdürülen
LLVM CPU	x86_64, ARM64 CPU	Olgun	CI, küçük inference, debug	Stable
WEBGPU	Browser	Erken	Demo, eğitsel	Deneysel

tinygrad’ın 2025 boyunca en görünür gelişmesi AMD MI300X üzerindeki stabilite oldu. Hotz, X (eski Twitter) üzerinde aylarca AMD driver bug’larını canlı yayında debug etti; bu performans-art hibrit yaklaşım framework’ün toplulukta tanınırlığını artırdı. ENISA AI Threat Landscape 2025 raporundaki “supply chain bağımsızlığı” tartışmasıyla paralel olarak, kurumsal ekipler tek bir GPU vendor’una bağımlı olmayan ML stack arıyor; tinygrad bu trendin teknik karşılığını sunar. Function calling ve tool-use senaryolarında alternatif inference stack denemeleri için Function Calling Tool Use yazısı pratik bir başlangıçtır.

Pratik bir tinygrad iş akışı şöyle görünür: git clone github.com/tinygrad/tinygrad → pip install -e . → CUDA=1 python examples/llama.py komutu ile LLaMA-3 8B çalıştırılır. Aynı kod HIP=1 veya METAL=1 environment variable ile farklı donanımda dönüşsüz çalışır. Bu “yaz bir kez, çalıştır her yerde” vaadi 1990’ların Java sloganının ML donanım katmanındaki yeniden doğuşudur. Garantili değil, ama pratikte çoğu durumda doğru.

tinygrad codegen pipeline UOp ilkel operasyonlardan kernel rendering soyut görsel

Hangi senaryoda hangisi: pratik karar matrisi

Framework seçimi tek bir kritere indirgenmez. Üretim ekibinde, araştırma laboratuvarında, lisans dersinde, indie geliştirici ortamında doğru seçim farklıdır. Aşağıdaki matris, sık karşılaşılan senaryolar için kararı çerçeveler.

Senaryo	Önerilen framework	Alternatif	Neden
Lisans ML dersi, ilk autograd	micrograd	—	200 satır, tek dosya, video desteği
Bootcamp 2. hafta, MLP eğitimi	micrograd → PyTorch	tinygrad	Micrograd intuition + production framework geçişi
Tensor compiler internals araştırması	tinygrad	JAX (XLA tarafı)	Codegen pipeline tamamen okunabilir
AMD MI300X cluster üretim	tinygrad	PyTorch + ROCm	AMD’de tinygrad stabilitesi daha iyi
Qualcomm SoC üzerinde edge inference	tinygrad	ONNX Runtime	tinygrad QCOM backend deneysel ama tek
M3 Max Mac Studio LLM serve	MLX (MLX-LM)	llama.cpp	Unified memory + Apple optimize kernel
iOS/macOS on-device ML uygulaması	MLX (Swift API)	Core ML	Dinamik graph, transformer-friendly
NVIDIA H100 cluster, distributed training	PyTorch	JAX	FSDP-2, DeepSpeed ZeRO-3, ecosystem
TPU pod araştırma	JAX	—	XLA-native, tek seçenek
Production LLM serve (yüksek QPS)	vLLM / SGLang	TGI	Tinygrad/MLX henüz olgun değil

Bu matrisin altında yatan ilke: tinygrad ve MLX PyTorch’un yerine geçmez, onun ulaşamadığı (alternatif donanım, Apple Silicon optimize, kod okunabilirliği) niş alanlarda tamamlayıcı rol oynar. Bir ekibin tüm stack’ini tinygrad’a taşıması 2026’da ekonomik değildir; ama belirli bir senaryoyu (örneğin AMD MI300X üzerinde küçük bir araştırma modeli, ya da M3 Mac Studio üzerinde indie LLM serve) tinygrad/MLX ile çözmek son derece anlamlıdır. Bu hibrit stack yaklaşımı kurumsal AI mimarisinde sıklaşıyor; benzer hibrit kararları Agentic AI İş Akışları yazısında orkestrasyon perspektifinden inceledim.

Ömer Önal danışmanlığında kurumsal ML stack değerlendirmesi yaparken sıkça gördüğüm bir senaryo şu: müşteri “tüm GPU yatırımımızı tek vendor’a bağlamak istemiyoruz” der; ardından AMD/Apple Silicon tarafında pilot yaparken tinygrad veya MLX’i ana PyTorch hattının yanına alternatif test framework olarak yerleştirir. Bu, supply chain riski azaltan ama mevcut ekip becerilerini bozmayan dengeli bir yaklaşımdır.

Topluluk, ekosistem ve sürdürülebilirlik

Bir open-source framework’ün uzun vadeli sağlığı sürüm hızı, katkıcı genişliği, finansman modeli ve dokümantasyon olgunluğu ile ölçülür. Stack Overflow Developer Survey 2025’e göre PyTorch ML profesyonelleri arasında %78 popülerlik, TensorFlow %31, JAX %14 paya sahip. tinygrad ve MLX ise survey’in “minor frameworks” kategorisinde toplam %6 civarında yer aldı; bu küçük rakam yanıltıcıdır çünkü her ikisi de niş kullanım için tasarlandı, mass-market PyTorch alternatifi değil.

Metrik	tinygrad	MLX	micrograd
2026 GitHub yıldız	~28.500	~22.800	~14.100
Aktif katkıcı (son 12 ay)	~380	~210	~25
Aylık ortalama commit	~420	~180	~3
Major sürüm sıklığı	3-4 ay	4-6 ay	Bakım modu
Finansman / sürdürücü	tinycorp + topluluk	Apple ml-explore ekibi	Karpathy (kişisel)
Resmi dokümantasyon	Orta (docs.tinygrad.org)	İyi (ml-explore.github.io/mlx)	README + video
Discord / forum aktivitesi	Yüksek (~9.000 üye)	Orta (GitHub Discussions)	Düşük
Production deployment kanıtı	Orta (tinybox + topluluk)	Yüksek (Apple içi + indie)	Yok

MLX’in Apple tarafından sürdürülmesi uzun vadeli stabilite garantisi sağlar; Apple ml-explore ekibinin 2024-2026 sürüm temposu istikrarlı oldu. Şirket içi kullanımın görünür kanıtları arasında macOS Tahoe 15.3’ün on-device LLM özellikleri (Apple Intelligence’ın geliştirici-erişimli kısımları), Final Cut Pro ML-tabanlı sahne ayırma, Photos uygulaması semantic search vb. yer alır. Bu içsel kullanım MLX’in “Apple’ın deneysel yan projesi mi yoksa stratejik altyapı mı” sorusuna stratejik cevabı sunar.

tinygrad’ın sürdürülebilirliği tinycorp şirketinin tinybox satışlarına ve Hotz’un kişisel rol oynamasına bağlı; bu single-point-of-failure riski getirir. Topluluk son 2 yılda yaklaşık 4-5 core maintainer çıkardı, bu olumlu bir sinyal. Micrograd ise resmi olarak bakım modunda; Karpathy yeni geliştirme yapmıyor, GitHub issue’ları çoğunlukla “good first issue / wontfix” durumunda. Eğitsel bir referans implementasyon olarak bu yeterli; üretim ya da uzun vadeli aktif gelişme beklentisi olan ekipler için değil. AI altyapı yatırım kararlarında vendor sürdürülebilirliği, Total Cost of Ownership çerçevesi ve tek-vendor riskinin niceliklendirilmesi (örneğin tek maintainer’a bağımlılık katsayısı) belirleyici metriklerdir.

Topluluk sürdürülebilirlik framework karşılaştırma soyut grafik 3D görsel

Pratik başlangıç yolu: 4 haftalık öğrenme planı

Bir geliştiricinin sıfırdan başlayıp üçünü de pratik olarak deneyimlemesi yaklaşık 4 haftada (yarı zamanlı, haftada ~15 saat) mümkündür. Aşağıdaki plan haftalık hedefleri çerçeveler.

Hafta 1 — micrograd ile autograd intuition: Karpathy’nin “Neural Networks: Zero to Hero” serisinin ilk videosunu izle, micrograd kodunu satır satır oku, kendi Value sınıfını sıfırdan yaz, küçük bir MLP eğit. Hedef: backprop’un matematiksel çekirdeğini ezbersiz anlamak.
Hafta 2 — tinygrad ile tensor framework: tinygrad repo’sunu klonla, docs/abstractions.md dosyasını oku, examples/beautiful_mnist.py kodunu satır satır incele. tensor.py ve function.py dosyalarını oku. CUDA=1 veya METAL=1 ile küçük bir CNN eğit. Hedef: lazy DAG + codegen pipeline’ı kavramak.
Hafta 3 — tinygrad codegen derinleşme: codegen/uops.py ve renderer/cstyle.py dosyalarını oku, basit bir kernel’in (örneğin matmul) UOp listesinden CUDA C koduna nasıl rendere edildiğini izle. Kendi backend prototipini düşün. Hedef: tensor compiler’ın iç dilini konuşmak.
Hafta 4 — MLX ile Apple Silicon production: Bir M-serisi Mac’te pip install mlx mlx-lm kur, HuggingFace’ten bir LLaMA-3 8B model indir, mlx_lm.convert ile INT4 quantize et, mlx_lm.server ile OpenAI-uyumlu endpoint aç. Function transformations (mx.vmap, mx.grad, mx.jit) ile mini bir training loop yaz. Hedef: Apple Silicon LLM serve hattını çalıştırabilmek.

Bu 4 haftalık plan tamamlandığında geliştirici şunları yapabilir hale gelir: PyTorch’tan kalkıp framework iç işleyişini sorgulayabilir, alternatif donanım senaryolarında pragmatik karar verebilir, M-serisi Mac’i indie LLM iş istasyonuna dönüştürebilir, autograd matematiğini öğrencilere/junior’lara açıklayabilir. Bu yetkinlik seti 2026 ML iş ilanlarında “deep learning systems engineer” rolünün ön koşullarından biri hâline geldi.

İpucu (kaynak takibi): tinygrad Discord’unda haftalık “office hours” oturumları core maintainer’larla canlı kod okuma sunar.
İpucu (MLX kaynak): Apple WWDC 2024 ve 2025 sessions “Bring your machine learning and AI models to Apple silicon” sunumları MLX’in resmi giriş materyalidir.
İpucu (paper takibi): arXiv cs.LG kategorisinde “tinygrad” veya “MLX” kelimelerini ay ay tara, yaklaşık aylık 3-6 paper bu framework’leri benchmark olarak kullanıyor.
İpucu (kod katkısı): tinygrad good first issue etiketli issue’lar genelde “şu backend’de şu unit test’i geçir” formatında; ilk PR için ideal.

Sık Sorulan Sorular

tinygrad PyTorch’un yerini alır mı?

Hayır. tinygrad PyTorch’un yerini almayı hedeflemez. Ekosistem genişliği, distributed training olgunluğu ve cuDNN-tabanlı saf throughput’ta PyTorch açık ara öndedir. tinygrad’ın değeri eğitsel okunabilirlik, vendor-bağımsız donanım desteği (özellikle AMD ROCm ve Qualcomm) ve tensor compiler internals’ını öğrenmektir. Bir ekibin tüm production stack’ini tinygrad’a taşıması 2026 itibarıyla ekonomik değildir; belirli niş senaryolarda tamamlayıcı olarak kullanmak ise rasyoneldir.

MLX yalnızca Apple cihazlarında mı çalışır?

Pratik olarak evet. MLX Apple Silicon Mac (M1, M2, M3, M4 serileri) ve iPad Pro M-serisi çiplerinde Metal Performance Shaders üzerinden çalışır. NVIDIA CUDA veya AMD ROCm desteği yoktur ve Apple’ın 2026 yol haritasında da görünmüyor. MLX kullanmak isteyen ekiplerin en az bir M-serisi Mac iş istasyonuna ihtiyacı var. CPU-only fallback teknik olarak çalışır ama performans açısından anlamsızdır.

Micrograd üretimde kullanılabilir mi?

Hayır, micrograd kasıtlı olarak üretim dışı tasarlandı. Tensor yoktur, GPU yoktur, optimizasyon yoktur; her sayı bir Value objesi olarak Python heap’inde tutulur. 10.000 örnekli basit MLP eğitimi bile yaklaşık 8 dakika sürer (PyTorch CPU’da yaklaşık 1,4 saniye). Micrograd’ın değeri eğitseldir: autograd matematiğinin ezbersiz anlaşılması, topological sort’un gözlemlenmesi, reverse-mode chain rule’un kodla görülmesi.

tinygrad ve MLX hangi LLM modellerini destekler?

tinygrad extra/models/ klasöründe LLaMA, Mistral, Stable Diffusion, Whisper, BERT gibi yaklaşık 12 referans implementasyon barındırır. MLX ise mlx-examples deposu altında LLaMA-3, Mistral, Phi-3, Qwen3, Gemma, Stable Diffusion, Whisper için resmi implementasyonlar ve INT4/INT8 quantize ağırlıklar sunar. HuggingFace ecosystem entegrasyonu MLX tarafında daha olgundur; tinygrad’da ağırlık dönüşümü için manuel script yazmak gerekebilir.

Bu framework’leri öğrenmek 2026’da iş bulmada işe yarar mı?

Doğrudan “tinygrad developer” iş ilanları nadirdir, ama tensor compiler internals, alternatif donanım hızlandırma ve framework iç işleyişine hakim olmak “ML systems engineer”, “performance engineer” ve “ML platform” rollerinde belirleyici niteliktir. LinkedIn 2025 raporlarında bu rollerin ortalama maaşı standart ML engineer’dan yaklaşık %20-35 yüksektir. Micrograd → tinygrad → MLX zinciri bu yetkinliği inşa etmenin en hızlı yoludur.

Sonuç

tinygrad, MLX ve micrograd 2026’da farklı amaçlara hizmet eden üç tamamlayıcı framework’tür. Micrograd autograd matematiğini ezbersiz öğretmek için 200 satırlık bir referans implementasyondur; üretimde yeri yoktur, eğitimde paha biçilmezdir. tinygrad 10.000 satır disipliniyle yazılmış, vendor-bağımsız donanım hızlandırma sunan, tensor compiler internals’ını okunabilir kılan minimalist bir production-grade framework’tür; AMD MI300X ve Apple Silicon dahil çeşitli donanımda kararlı çalışır. MLX Apple Silicon unified memory’sini sömüren, M-serisi Mac’i indie LLM iş istasyonuna dönüştüren, fonksiyonel transformation API’si ile JAX ruhunu Apple ekosistemine taşıyan bir framework’tür.

Bir ekip için doğru karar genelde “üçünden birini seç” değil “PyTorch’un yanında hangisini hangi senaryoda kullan” sorusudur. AMD/Qualcomm donanım çeşitliliği için tinygrad, M-serisi Mac üzerinde LLM inference için MLX, autograd öğretimi için micrograd doğru tercihtir. Production NVIDIA cluster, distributed training, geniş model zoo gerekirse PyTorch öncelikli kalır. Framework seçimi tek başına başarı getirmez; doğru senaryoyu doğru framework’e eşleştiren mühendislik kararı getirir.

Kurumsal ML stack değerlendirmesi, alternatif donanım pilotları veya M-serisi Mac üzerinde LLM serve mimarisi konularında destek için iletişim sayfası üzerinden ulaşabilirsiniz; somut bir senaryo üzerinden karar matrisi çıkarmak en hızlı yoldur.

OmerOnal

Yorum (1)

Ömer ÖNAL
Mayıs 16, 2026
Yanıtla

Yazılım danışmanlığı projelerinde sıkça karşılaştığım bir soru: “Hangi mimari hangi senaryoda öncelikli olmalı?” Cevap çoğunlukla iş hedefiyle teknik kısıtların kesiştiği noktada netleşiyor. Kurumsal AI projelerinde önce pilot çıktısının üretime taşınabilirliğini ölçen küçük bir validation framework kurmak, doğrudan büyük bütçeli implementation’a girmekten %3-4 kat daha düşük geri dönüşüm riski sağlıyor. Yorumlarınıza açığım.

Our Gallery

Contact Info

tinygrad, MLX, Micrograd 2026: Eğitsel DL Framework Rehberi