NitroGen'in temelinde, görsel veriyi doğrudan kontrol girdilerine dönüştüren bir "vision-to-action" yaklaşımı bulunuyor. Model, 40.000 saatten fazla halka açık oyun videosu kullanılarak eğitildi ve bu videolar 1000'den fazla oyunu kapsıyor. Eğitim sürecinde, yayıncıların ekranda gösterdiği gamepad yerleşimleri analiz edilerek joystick hareketleri ve tuş basımları ayrıştırılmış. Böylece yapay zeka, oyun içi görüntülerden hangi aksiyonun yapıldığını öğrenmiş oldu.
NitroGen'in kapsamı şimdilik ağırlıklı olarak kontrolcüyle oynanan oyunlarla sınırlı. Model, gamepad aksiyonlarını tahmin edecek şekilde tasarlandığı için klavye-fare odaklı oyunlarda doğrudan kullanılmıyor. Nvidia ise, açık kaynak yapısı sayesinde bu sınırların geliştiriciler tarafından genişletilebileceğine işaret ediyor.