Yeni model, video verileri ile metin tabanlı komutları bir arada kullanarak Neo robotlarına daha önce eğitim almadıkları yetenekleri kazandırmayı hedefliyor. 1X’e göre video içeriği, robotların yalnızca önceden tanımlanmış hareketleri tekrar etmesi yerine karşılaştıkları sahneleri analiz ederek yeni görevler hakkında çıkarım yapabilmesin sağlayacak.
Ev ortamı için kritik bir adım
Yeni model, 1X’in Neo insansı robotlarını evlere taşımaya hazırlandığı bir dönemde geldi. Şirket, geçtiğimiz ekim ayında Neo için ön siparişleri açmış ve robotların bu yıl içinde sevk edilmesini planladığını açıklamıştı. Net bilgiler verilmese de ön siparişlerin beklentilerin üzerinde olduğu da açıklanmıştı.
1X’in kurucusu ve CEO’su Bernt Bornich, yeni modelin şirket için taşıdığı önemi şu sözlerle ifade etti: “Yıllarca dünya modelimizi geliştirip Neo'nun tasarımını mümkün olduğunca insana yakın hale getirdikten sonra, Neo artık internet ölçeğindeki videolardan öğrenebilir ve bu bilgileri doğrudan fiziksel dünyaya uygulayabilir. Herhangi bir komutu, daha önce örnek görmemiş olsa bile yeni bir eyleme dönüştürebilme yeteneği, Neo’nun neredeyse akla gelebilecek her şeyi kendi kendine öğrenebilmesinin başlangıç noktasıdır.” dedi.
Yukarıdaki GIF, insan videsu ve NEO'nun kendi verileriyle eğitilmesi sonucu gösteriyor. Aşağıdaki GIF ise sadece NEO'nun kendi verileriyle anı işleme nasıl yaklaştığını gösteriyor. İki örnek arasındaki fark oldukça net şekilde görünüyor.
Her ne kadar “her komutu yeni bir eyleme dönüştürebilme” ifadesi dikkat çekici olsa da, bu yeteneğin sınırları olduğu da kabul ediliyor. Örneğin, Neo’ya bir aracı kullanması söylendiğinde anında paralel park yapmayı öğrenmesi mümkün değil. Yine de sistemin gerçek anlamda bir öğrenme süreci yürüttüğü belirtiliyor.
Şirketin yaptığı açıklamaya göre 1X World Model, bugün piyasaya çıkacak Neo robotlarının tek bir video ve komutla anında yeni bir görevi yerine getirmesini sağlamıyor. Bunun yerine robot, belirli komutlarla ilişkilendirilmiş video verilerini topluyor ve bu veriler dünya modeline aktarılıyor. Model üzerinden işlenen bilgiler daha sonra tüm robot ağına geri besleniyor. Dolayısıyla tüm filo aynı anda kademeli bir şekilde öğrenmiş oluyor.