Eğitim sonrası katılımcıların bilgi düzeyini Klasik Test Teorisi (CTT) çerçevesinde mutlak puanlarla değerlendirmek (Örn: 100 üzerinden 80 almak), ölçüm hatasına son derece açıktır. Çünkü testteki her bir sorunun zorluk indeksi (Item Difficulty) ve ayırt edicilik gücü (Discrimination) farklıdır. Biz, değerlendirme tasarımlarını katılımcıyı değil, test maddesini merkeze alan Madde Tepki Kuramı (Item Response Theory - IRT) temeline oturtuyoruz.
- Tavan ve Taban Etkileri (Ceiling/Floor Effects): Testin çok zor veya çok kolay olmasından kaynaklanan ölçüm kısıtlamalarını engellemek için, madde karakteristik eğrilerini (ICC) kalibre ediyor; kolay soruları bilen bir çalışan ile zor soruları bilen bir çalışanı aynı mutlak puanda eşitleme yanılgısını (Test-wiseness Bias) önlüyoruz.
- Gizil Yetenek Tahmini (Latent Trait Estimation - $\theta$): Katılımcının yalnızca doğru sayısı değil, soruların parametrelerine dayalı olarak gerçek yetkinlik seviyesi (Latent Ability) logit/probit modellerle hesaplanır.