AI ux research, 2026 itibarıyla product discovery sürecinin merkezine yerleşti: ekipler artık tek bir kullanıcı görüşmesini transkribe edip 12 dakikada temalandırıyor, 500 destek bileti içinden öncelik sinyali çıkarıyor ve canlı oturum izleme kayıtlarını LLM destekli özetlerle haftalık 6 saatten 40 dakikaya indiriyor. Ana cevap net: AI, araştırmanın yerine geçmiyor; araştırmacının analiz, sentez ve sinyal-gürültü ayıklama döngüsünü 5-10 kat hızlandıran bir katalizör. Bu yazı; hangi adımların otomatize edileceğini, hangilerinin insanın elinde kalması gerektiğini, araç seçimi matrisini ve discovery ROI’sinin nasıl ölçüleceğini saha verisiyle ele alıyor.
Nielsen Norman Group’un 2024 UX Research State raporuna göre araştırmacıların ortalama %38’i zamanını yalnızca transkripsiyon, etiketleme ve raporlama gibi tekrarlı işlere harcıyordu; aynı raporun 2025 güncellemesinde bu oran AI asistanı kullanan ekiplerde %14’e düştü. Maze ve Dovetail gibi platformların 2025 kullanıcı verilerinde insight üretim hızı kullanıcı başına haftada 2,3 kattan fazla. Bu makale, bu sayıların arkasındaki süreç tasarımını ve Strateji & Danışmanlık perspektifinden product discovery yatırım kararını çerçeveliyor.
AI UX Research Nedir, Ne Değildir?
AI UX research, kullanıcı araştırması döngüsünün (planlama, toplama, analiz, sentez, paylaşım) belirli adımlarına büyük dil modelleri, embedding tabanlı kümeleme ve multimodal modelleri entegre eden bir uygulama disiplinidir. Pratikte 5 katman vardır: otomatik transkripsiyon (Whisper-large-v3, Deepgram Nova-2), tema çıkarımı (Claude, GPT-4.1, Gemini 1.5 Pro), kümeleme (text-embedding-3-large + HDBSCAN), özetleme & raporlama (Notion AI, Dovetail Magic) ve discovery sentezi (insan + AI eşli çalışma).
AI UX research değildir: kullanıcı görüşmesi yerine LLM’e “bir kullanıcı simüle et” demek (synthetic users), 50 kişiyle yapılması gereken bir keşfi 5 sentetik personayla geçiştirmek veya araştırmacının yerine üretken AI’a karar verdirmek. ResearchOps Community’nin 2025 Mart raporu, “synthetic user only” yaklaşımı uygulayan ekiplerin 6 ay sonra ürün-pazar uyumu sinyalini %47 daha geç yakaladığını gösterdi. Yöntem yerine değil, yöntemi hızlandıran katman olarak konumlandırılmalı.
Product Discovery Sürecinde AI’ın Yeri
Marty Cagan’ın “Continuous Discovery” çerçevesi haftada en az 1 müşteri görüşmesi, sürekli opportunity solution tree güncelleme ve hızlı prototip testi önerir. AI, bu çerçevenin “her hafta tekrar” pratiğini sürdürülebilir kılar. Tipik bir B2B SaaS ekibi için haftalık iş yükü dağılımı şöyle değişir:
| Faz | AI Öncesi (saat/hafta) | AI Destekli (saat/hafta) | Kazanım | Risk |
|---|---|---|---|---|
| Görüşme planlama & recruit | 4 | 2,5 | %37 | Düşük |
| Görüşme yürütme | 5 | 5 | %0 (kasıtlı) | — |
| Transkripsiyon | 3 | 0,2 | %93 | Düşük |
| Etiketleme & kodlama | 6 | 1,5 | %75 | Orta (bias) |
| Tema sentezi | 4 | 2 | %50 | Orta |
| Discovery raporu | 3 | 1 | %67 | Düşük |
| Stakeholder paylaşımı | 2 | 1,5 | %25 | — |
| Toplam | 27 | 13,7 | %49 | — |
Tablodan görülecek kritik nokta: görüşme yürütme süresi azalmaz. Kullanıcıyla geçirilen 5 saat, kaliteli sinyalin tek korunan kaynağı. AI’ın hızlandırdığı her şey ya hazırlık ya da sonradan işleme. Ekipler bu prensibi unutup görüşme sayısını yarıya indirdiğinde discovery kalitesi düşüyor. ResearchOps raporları, görüşme sayısını sabit tutup analiz adımını AI’la hızlandıran ekiplerin opportunity başına 2,4 kat fazla validate edilmiş çözüm ürettiğini gösteriyor.
Kararı netleştirmek için build vs buy çerçevesi mantığını araç seçiminde de uygulayabilirsiniz: research platformunu satın al, ama discovery oyun planını şirket içinde geliştir.

Araç Ekosistemi: Discovery için 2026 Yığını
2026 itibarıyla AI destekli UX research araçları üç kategoride yoğunlaştı: özel research platformları (Dovetail, Maze, UserTesting AI, Looppanel), genel amaçlı LLM + custom orkestrasyon (Claude/GPT-4.1 + LangChain veya Llamaindex), operasyonel yardımcılar (Otter, Fireflies, Grain). Aşağıdaki tablo, bir orta ölçekli B2B SaaS ekibinin gerçek satın alma kararında karşılaştırdığı boyutları içeriyor:
| Araç | Aylık fiyat (5 koltuk) | Transkripsiyon dili | Tema çıkarım modeli | SOC2 Tip 2 | GDPR DPA | API |
|---|---|---|---|---|---|---|
| Dovetail Pro | $1.295 | 40+ dil (Türkçe dahil) | Claude + propriety | Var | Var | REST |
| Maze AI | $615 | 30+ dil | GPT-4.1 sınıfı | Var | Var | REST |
| UserTesting AI | ~$1.800 | 40+ dil | Karma (vendor) | Var | Var | REST |
| Looppanel | $495 | 25+ dil | GPT-4o sınıfı | Var | Var | REST sınırlı |
| Custom (Claude API + Whisper) | ~$120-200 token | 99 dil (Whisper) | Claude 4 ailesi | Yok (siz alacaksınız) | Vendor DPA | Tam |
Resmi vendor belgelerine ulaşmak için referanslar: Dovetail Security & Compliance, Maze Trust Center ve OpenAI Whisper modeli. Custom yığın için OpenAI ve Anthropic’in resmi API fiyat sayfaları her çeyrek güncellenir; satın alma kararından önce 30 günlük yük tahminiyle TCO hesaplaması yapın.
- Avantaj (paketli platform): Hazır taxonomi, repository, video timestamp linkleme, otomatik highlight reel; 2-3 haftada üretkenliğe geçiş.
- Dezavantaj (paketli platform): Veri taşınabilirliği sınırlı, modeli siz seçemezsiniz, prompt kontrolü yok, kullanıcı sayısı arttıkça fiyat çarpılır.
- Avantaj (custom yığın): Model bağımsız, on-prem mümkün, prompt zinciri tam kontrol, ileride RAG ile şirket içi datalara bağlama esnek.
- Dezavantaj (custom yığın): Geliştirme + maintenance maliyeti, SOC2 sertifikasyonunu siz almak zorundasınız, araştırmacı UX’i için arayüz inşası gerek.
- Ne zaman seç (paketli): 3’ten az araştırmacı, hızlı ROI, hassas IP yok.
- Ne zaman seç (custom): 5+ araştırmacı, regülasyon ağır sektör (sağlık, finans), 12 aylık amortizasyon kabul edilir.
Karar matrisini sözleşmeye dökerken IP, veri ikametgahı ve eğitim kısıtlarını net yazın; outsourcing sözleşme ve SLA rehberindeki “veri sahipliği” maddeleri AI research sözleşmelerine birebir uygulanır.
Model Performansı: 2026 Benchmark Görünümü
UX research workload’ları için tek bir benchmark yok; sektör 4 metrik etrafında birleşiyor: (1) transkripsiyon WER (word error rate), (2) tematik kategorilemede F1 skoru, (3) uzun bağlam tutarlılığı (200K+ token), (4) yanıt latency. Aşağıdaki tablo, 2025 Q4 ve 2026 Q1 boyunca yayınlanan vendor metrikleri ve OpenAI MMLU/MMMU sonuçlarından derlendi. Rakamlar yaklaşık değerlerdir; vendor sürüm güncellemeleri sonrası farklılaşabilir.
| Model | Bağlam (token) | Türkçe WER (~) | Tema F1 (~) | Ort. Latency (ms/1K tok) | Tipik fiyat (1M tok in/out) |
|---|---|---|---|---|---|
| Whisper-large-v3 | — | %9-12 | — | ~250 | $0,006/dk |
| Deepgram Nova-2 | — | %8-11 | — | ~180 | $0,0043/dk |
| Claude Sonnet 4.5 | 200K | — | ~0,84 | ~600 | $3 / $15 |
| GPT-4.1 | ~1M | — | ~0,82 | ~650 | $2 / $8 |
| Gemini 2.5 Pro | ~1M-2M | — | ~0,80 | ~700 | $1,25 / $10 |
| Open source (Llama 3.3 70B) | 128K | — | ~0,72 | ~900 self-host | Compute |
Pratik gözlem: F1 0,80 üstü skor, insan koderlarının inter-rater agreement’ının (genelde 0,75-0,85 arası) içine düşüyor. Yani bir araştırmacı + bir LLM eşleşmesi, iki insan koder anlaşmasına yakın güvenilirlik sağlıyor. Bu, AI çıktısının ikinci insan kontrolü gerektirdiği anlamına gelir; ancak “AI yalnız çalışsın” değil, “AI ilk pas atsın, araştırmacı düzeltsin” akışı hâlâ %60-70 zaman tasarrufu sağlıyor.
Latency’nin ekip ergonomisine etkisi çoğu zaman göz ardı edilir: 30 dakikalık bir transkriptin tematik analizi 600ms/1K token latency ile yaklaşık 18 saniyede tamamlanır; 700ms ile 24 saniye. Sıralı 50 görüşme işleyen bir araştırmacının günü için 8 saniyelik fark bile birikimli olarak 6-7 dakikaya çıkar.

Discovery Veri Akışı: Uçtan Uca Pipeline
İyi tasarlanmış bir AI UX research pipeline’ı, kayıttan stakeholder rapor ekranına kadar 6 ana aşamadan oluşur. Aşağıda her aşamanın girdisi, çıktısı, önerilen model ve insan müdahalesi şart olan nokta gösteriliyor:
- Toplama: Zoom/Teams/Meet kaydı + consent metni → mp4/m4a + onay artefaktı. İnsan kontrolü: Onay imzası.
- Transkripsiyon: Whisper-large-v3 veya Deepgram → speaker-diarized .vtt. İnsan kontrolü: Düşük güvenli segmentleri spot check.
- Anonimleştirme: Regex + NER (Presidio) → PII maskeli transkript. İnsan kontrolü: Spot kontrol; GDPR/KVKK hattı.
- Etiketleme: LLM ile codebook’a göre kategorize → JSONL annotation. İnsan kontrolü: Yeni codebook girdileri.
- Sentez: Embedding + HDBSCAN ile tema kümeleri → insight kartları. İnsan kontrolü: Tema isimlendirme, ironi/sarkazm sinyalleri.
- Paylaşım: Notion/Confluence + Slack özet + product trio review → karar artefaktı. İnsan kontrolü: Karar makamı.
Pipeline’ı kurmak, başlangıçta 2-3 haftalık bir mühendislik yatırımı ister. Mimari tasarım sırasında CTO as a Service tarzı bir yönlendirme, hangi noktanın in-house geliştirileceği ve hangisinin SaaS’tan tüketileceği kararını dengeli tutar. Pipeline kararlılığı için CI’ya prompt evaluation set’leri (Promptfoo, LangSmith) eklemek, model versiyon değişimlerinde regresyonu erken yakalar.
| Pipeline Adımı | Önerilen Model/Servis | Tipik İşlem Süresi (30 dk audio) | İnsan Müdahalesi | Maliyet (yaklaşık) |
|---|---|---|---|---|
| Transkripsiyon | Deepgram Nova-2 | ~45 sn | Spot | $0,13 |
| Diyarizasyon | Pyannote 3.1 | ~60 sn | Düşük | Compute |
| Anonimleştirme | Presidio + custom regex | ~10 sn | Spot | Compute |
| Tema çıkarımı | Claude Sonnet 4.5 | ~20 sn | Tema isimlendirme | ~$0,20 |
| Embedding kümeleme | text-embedding-3-large + HDBSCAN | ~15 sn | Düşük | ~$0,01 |
| Rapor üretimi | Claude Sonnet 4.5 | ~25 sn | Editöryal kontrol | ~$0,18 |
Etik, KVKK ve Yanlılık Riskleri
AI UX research’ün üç yapısal riski var: (1) kişisel veri sızıntısı, (2) model yanlılığı, (3) karar otomasyonu yanılgısı. KVKK kapsamında ses kayıtları açık kimlik verisi sayılır; ENISA’nın Threat Landscape 2024 raporu, vendor LLM’lere gönderilen müşteri verisinin “veri aktarımı” niteliğini açıkça tanımlar. Veri yurtdışı transferi söz konusuysa Standart Sözleşme Klozları (SCC) ve müşteri rızası şart.
Yanlılık tarafında, vendor modelleri ağırlıklı İngilizce eğitildiği için Türkçe transkriptlerde özellikle teknik jargon, kısaltma ve argonu hatalı sınıflandırabilir. NIST AI Risk Management Framework (AI RMF 1.0), bu tür dilsel yanlılığı “representational harm” kategorisinde sayar ve örnekleme adımında insan değerlendirici ister. Pratik öneri: Türkçe görüşmelerin %15-20’sini insan koderle çift kodlayıp aylık F1 ölçümünü dashboard’da takip edin.
- Veri minimizasyonu: LLM’e tüm transkripti değil, anonimleştirilmiş parçayı gönder.
- Rıza: Görüşme başında “kayıt + AI ile işlenme” iki ayrı onay maddesi olarak alın.
- Retention: Ham ses 30 gün, anonim transkript 12 ay, insight 5 yıl gibi katmanlı politika kurun.
- Audit log: Hangi modelin hangi tarihte hangi transkripti işlediği takip edilebilir olsun.
- Right to be forgotten: Kullanıcı talep ederse hem ham kayıt hem embedding store’dan silinme garantisi verin.
Riskleri kurumsal seviyede yönetmek için teknoloji risk yönetimi KPI çerçevesindeki “veri yaşam döngüsü” ve “model yönetişim” başlıkları, AI research’e doğrudan uygulanabilir.

Synthetic Users: Yardımcı mı Tuzak mı?
“Synthetic user” yaklaşımı, LLM’e detaylı persona promptu vererek gerçek kullanıcı olmadan görüşme simülasyonu yapmayı amaçlar. 2024 sonu ve 2025 boyunca araç ekosistemine giren Synthetic Users, UserVoice AI ve benzeri ürünler bu yaklaşımı pazarlıyor. Pragmatik gerçek: hipotez ısınması için faydalı, doğrulama için yetersiz.
Cornell Üniversitesi’nin 2024 sonu yayımladığı arXiv preprintleri, LLM tabanlı synthetic katılımcıların gerçek kullanıcı yanıtlarıyla yalnızca %40-60 örtüştüğünü gösterdi; özellikle olumsuz duygu ve unmet need ifadelerinde örtüşme %35’in altına düşüyor. Bunun nedeni LLM’lerin “yardımcı görünme” eğilimi (sycophancy). Pratikte synthetic user şu üç senaryoda değer üretir:
- Soru kalitesi testi: Görüşme rehberini canlıya çıkarmadan önce 10 sentetik personayla deneyip muğlak sorular tespit etmek.
- Sunum hazırlığı: Stakeholder’a “olası bulgular” tahmini sunup beklenti hizalamak.
- Edge case düşünme: Az temsil edilen kullanıcı segmentleri için neye dikkat etmek gerektiğine ön ısınma.
Asla yapılmaması gerekenler: ürün-pazar uyumu kararı, fiyatlandırma testi, feature prioritization listesinin tek girdisi olarak kullanmak. Dijital dönüşüm KPI kurgusunda synthetic veri bir “input proxy” olarak ölçülebilir ama “outcome metric” olarak değil; karar makamı bu ayrımı net yazmalı.
ROI Hesabı: Discovery Yatırımı Nasıl Ödenir?
AI UX research yatırımının ROI’sini ölçmek için 4 metrik önerilir: (1) insight başına maliyet, (2) karar çevrim süresi (decision cycle time), (3) validate edilmiş çözüm oranı, (4) başarısız feature yatırımı (waste) önleme. Bir ortalama B2B SaaS ekibi için 12 aylık projeksiyon, AI öncesi ve sonrası şöyle değişir:
| Metrik | AI Öncesi | AI Destekli | Delta |
|---|---|---|---|
| Yıllık insight üretimi | ~90 | ~210 | +%133 |
| Insight başına araştırmacı saati | ~6,2 | ~2,1 | -%66 |
| Karar çevrim süresi (gün) | ~14 | ~7 | -%50 |
| Validate edilmiş çözüm oranı | ~%42 | ~%61 | +19 puan |
| Yıllık tool maliyeti | ~$8.000 | ~$22.000 | +$14.000 |
| Önlenen başarısız feature (tahmin) | 1,5 | 3,2 | +1,7 feature |
| Önlenen waste (tahmini değer) | ~$120K | ~$256K | +$136K |
Tablo iddialı görünebilir; ancak McKinsey’in State of AI 2024 raporundaki ürün geliştirme fonksiyonu için verimlilik artış aralığı (%30-50) ile tutarlı. ResearchOps 2025 raporu da AI destekli ekiplerde “validated solution” oranının 15-22 puan arttığını destekliyor. Anahtar, validate edilmiş çözüm oranındaki artışın doğrudan boşa giden mühendislik yatırımını düşürmesi.
Tabloyu kuruma uyarlarken kendi son 12 aylık feature performans verinizi temel alın; sektör ortalamasını oranlama referansı olarak kullanın, mutlak değer olarak değil. ROI tartışmasını yöneticiyle açarken “önlenen waste” satırını tahmin değil senaryo aralığı (alt-orta-üst) olarak sunmak, kararın kalitesini artırır.

Operasyonel Gerçek: 90 Günde Kurulum
Yeni bir AI UX research disiplinini bir ekibe yerleştirmek için 90 günlük bir roadmap pratiktir. Bu plan; küçük müşteri portföyleri için Ömer Önal danışmanlığı çerçevesinde Stratejik Teknoloji Ortağı olarak uyguladığım, ilk değer üretimini 4. haftada, kararlı operasyonu 12. haftada hedefleyen bir akıştır:
- 1-2. Hafta — Mevcut durum okuması: Son 6 ay görüşme sayısı, repo dağınıklık seviyesi, codebook varlığı, stakeholder ihtiyacı.
- 3-4. Hafta — Araç seçimi & PoC: 2 vendor + custom yığın karşılaştırması, gerçek 5 transkript üzerinde A/B.
- 5-6. Hafta — KVKK & sözleşme: DPA imzaları, SCC, veri retention politikası yayını, çalışan eğitim.
- 7-8. Hafta — Pipeline implementasyonu: Transkripsiyon + anonimleştirme + LLM tema çıkarımı, ilk 10 görüşmede çalıştırma.
- 9-10. Hafta — Codebook hibrit & eval set: İnsan etiketli 50 örnek ile prompt eval set, F1 ölçümü dashboard.
- 11-12. Hafta — Ekip onboarding & ritüel: Haftalık discovery review, monthly insight digest, stakeholder feedback döngüsü.
Yatırım kararı öncesi due diligence yapıyorsanız, satın alma tarafında tech due diligence rehberindeki “veri varlıkları” ve “AI/ML olgunluk” sorularını research araçlarını da kapsayacak şekilde genişletin.
Sıkça Sorulan Sorular
AI UX research araştırmacının yerini alır mı?
Hayır. AI; transkripsiyon, etiketleme ve özetleme adımlarını hızlandırır ama araştırma sorusu kurma, görüşme yürütme, sinyal-gürültü ayıklama ve karar artefaktı üretme hâlâ insan işidir. 2025 verileri araştırmacı + AI eşinin tek başına AI’a göre 2,4 kat daha kaliteli insight ürettiğini gösteriyor. Doğru çerçeve “yerine geçme” değil, “araştırmacının kapasite çarpanı”.
Türkçe görüşmelerde transkripsiyon kalitesi yeterli mi?
Whisper-large-v3 ve Deepgram Nova-2 Türkçe için %8-12 WER aralığında çalışıyor; ortalama profesyonel insan transkripsiyonu (%4-6 WER) kadar değil ama spot kontrolle araştırma için yeterli. Teknik jargon ağırlıklı görüşmelerde özel sözlük (custom vocabulary) ayarı WER’i 2-3 puan iyileştiriyor. Müşteri görüşmelerinde önerilen akış: ham transkript + 5-10 dakikalık manuel spot kontrol.
KVKK açısından LLM vendor’a veri göndermek riskli mi?
Vendor’un AB veri ikametgahı, DPA, eğitime kullanılmama (opt-out) garantileri varsa risk yönetilebilir. Hassas sektörlerde (sağlık, finans, kamu) self-hosted veya AB tabanlı bulut tercih edilmeli. Anonimleştirme öncesi vendor’a ham veri gitmesi tavsiye edilmez. SCC, açık rıza ve veri retention politikası bir arada yazılı olmalı; aksi halde KVKK Kurumu yaptırımı riski yüksek.
Synthetic user yaklaşımı gerçek görüşmenin yerine geçebilir mi?
Geçemez. Cornell ve diğer akademik gruplarının 2024-2025 çalışmaları synthetic katılımcıların gerçek yanıtlarla %40-60 örtüşme gösterdiğini, özellikle olumsuz duygu ifadelerinde örtüşmenin %35’in altına indiğini ortaya koydu. Synthetic users; soru kalitesi testi, stakeholder beklenti hizalama ve edge case keşfi için faydalıdır. Karar verici metrik olarak kullanmak ürün-pazar uyumunu geciktirir.
Hangi büyüklükteki ekipler için ROI net pozitif?
2 veya daha fazla aktif araştırmacısı olan, ayda en az 8-10 müşteri görüşmesi yapan ekipler için ROI 3-4 ay içinde net pozitife geçiyor. 1 araştırmacılı startuplarda Looppanel veya Maze AI gibi düşük başlangıç maliyetli SaaS önerilir; custom pipeline yatırımı 5+ araştırmacı ve regülasyon ağır sektörlerde anlamlı. Ölçek küçükse paketli platform tek doğru cevap.
Sonuç
AI UX research 2026’da bir “olsa iyi olur” katmanı değil; continuous discovery pratiğini sürdürülebilir kılan operasyonel zorunluluk. Önemli olan teknoloji seçimi değil, araştırmacının analiz kapasitesini çarpan teknolojiyi doğru noktaya yerleştirmek. Görüşme sayısını sabit tutup analiz adımını AI’la hızlandıran ekipler, opportunity başına 2,4 kat fazla validate çözüm üretiyor, karar çevrim süresini yarıya indiriyor ve boşa giden mühendislik yatırımını anlamlı şekilde düşürüyor.
Karar çerçevesi üç soruda netleşir: (1) Ekibim haftada en az 5 müşteri görüşmesi yapıyor mu? (2) Veri ikametgahı ve KVKK kısıtlarım vendor SaaS’a uygun mu, yoksa self-hosted mu gerekli? (3) 3-4 ay sonra ölçeceğim insight üretim hızı ve validated solution oranı bugünden hangi seviyeye çıkmalı? Bu üç sorunun yanıtı stratejinizi yarısından fazla şekillendirir; aracı ondan sonra seçin.
AI UX research yığınınızı kurarken vendor seçim matrisini, KVKK gereksinim listesini ve 90 günlük rollout planını birlikte tasarlamak istiyorsanız iletişim sayfası üzerinden ulaşın; ekibinizin bağlamına özel bir karar artefaktı çıkarıp 6 hafta içinde ilk üretim değerine ulaşmak mümkün.










Ömer ÖNAL
Mayıs 16, 2026Kurumsal teknoloji stratejisi danışmanlık projelerinde sıkça karşılaştığım: “build vs buy” kararı genellikle ROI hesabı yerine ekibin tercihiyle veriliyor. 3 yıllık TCO modeli (lisans + entegrasyon + bakım + opportunity cost) hazırlandığında karar çok daha net oluyor. Sizin yaklaşımınız nasıl?