Model, Nvidia’ya göre otonom sürüşe odaklanan ilk görsel-dil aksiyon modeli olma özelliği taşıyor. Bilindiği üzere görsel-dil modelleri, metin ve görselleri aynı anda işleyebiliyor. Bu sayede araçlar çevrelerini “görüp” algıladıkları bilgiler ışığında karar verebiliyor.
Araçlara insansı sezgi ve sağduyu geliyor
Alpamayo-R1, düşünce zinciri (chain-of-thought) yaklaşımıyla yol planlamayı birleştiriyor, böylece karmaşık trafik senaryolarında güvenli ve sezgisel kararlar alabiliyor. Model, her durumu adım adım analiz ederek olası rotaları değerlendiriyor ve en güvenli yolu seçiyor, yoğun yaya trafiği, çift park edilmiş araçlar veya yaklaşan şerit kapanmaları gibi durumları yönetebiliyor.
Alpamayo-R1, Nvidia’nın Ocak 2025’te piyasaya sürdüğü Cosmos-Reason model ailesi üzerine inşa edilmiş durumda. Cosmos-Reason, karar vermeden önce düşünen bir akıl yürütme modeliydi. Ağustos ayında ise model ailesine eklemeler yapılmıştı. Nvidia, bu tür modellerin seviye 4 otonom sürüş hedefleyen şirketler için kritik olduğunu belirtiyor. Şirket, Alpamayo-R1’in araçlara insan benzeri sezgi ve sağduyu kazandırarak karmaşık sürüş kararlarını daha iyi yönetmesini sağlayacağını aktarıyor.
Model, GitHub ve Hugging Face üzerinden erişime açıldı. Nvidia ayrıca geliştiricilerin Cosmos modellerini özel kullanım senaryolarına göre eğitmesine yardımcı olacak adım adım rehberler, çıkarım kaynakları ve eğitim sonrası iş akışlarını içeren Cosmos Cookbook’u da paylaştı.
Şirketin kurucu ortağı ve CEO’su Jensen Huang, yapay zekada bir sonraki dalganın fiziksel AI olacağını sıkça dile getiriyordu. Yapılan bu duyurular da Nvidia’nın fiziksel AI alanına hızla yatırım yaptığını gösteriyor.
Haberi DH'de Gör